实战 | 用Python爬取《云南虫谷》3.6万条评论( 三 )


3.4. 分时评论数
df['时间'] = pd.to_datetime(df.time).dt.hourdate_comment_num = pd.pivot_table(df,values='id',index=['时间'],columns=['日期'],aggfunc='count')time_line = date_comment_num.plot_bokeh(kind="line",legend="top_left",title="分时评论数")
分时评论数
通过分时评论数曲线,我们发现在首播当日8点的小时评论数冲击到最高,此后比较符合电视剧观看行为:中午、晚上及午夜较高 。
3.5. 评论员VIP等级分布
vip_comment_num = df.groupby('hwlevel').agg(用户数=('userid','nunique'),评论数=('id','nunique'))vip_comment_num['人均评论数'] = round(vip_comment_num['评论数']/vip_comment_num['用户数'],2)usernum_pie = vip_comment_num.plot_bokeh.pie(y="用户数",colormap=Spectral[9],title="评论员VIP等级分布",)
不得不说,评论的人大部分都是VIP用户,难怪腾讯视频要搞什么超前点播弄所谓VIP上的VIP 。。。
不同VIP用户人均评论数会有不同吗?
y = vip_comment_num['人均评论数']mapper = linear_cmap(field_name='人均评论数', palette=Spectral[11] ,low=min(y) ,high=max(y))vipmean_bar = vip_comment_num.plot_bokeh.bar(y = '人均评论数',ylabel="人均评论数", title="不同VIP用户人均评论数", color=mapper,alpha=0.8,legend=False)
基本呈现一个VIP等级越高 评价意愿越高!但是为什么呢?
3.6. 评论长度
写评论的网友大部分都是666,好看之类的词汇,比如才哥就是等更新三个字,那么一般都会评价多少个字符呢?
import numpy as npdf['评论长度'] = df['content'].str.len()df['评论长度'] = df['评论长度'].fillna(0).astype('int')contentlen_hist = df.plot_bokeh.hist(y='评论长度',ylabel="评论数", bins=np.linspace(0, 100, 26),vertical_xlabel=True,hovertool=False,title="评论点赞数直方图",color='red',line_color="white",legend=False,#normed=100,)
我们找几个评论内容老长的看看
(df.sort_values(by='评论长度',ascending=False)[['剧集','content','评论长度','nick','hwlevel']].head(3).style.hide_index())
我想说,这评论是在那抄袭的,还是真有才啊?
3.7. 评论点赞数
咱们就看看被点赞最多的几条吧
# pd.set_option('display.max_colwidth',1000)(df.sort_values(by='up',ascending=False)[['剧集','content','up','nick','hwlevel']].head().style.hide_index())
看地图 别迷路!是有什么梗吗?超8000的点赞~~
3.8. 评论最多的用户
user_comment_num = df.groupby('userid').agg(评论数=('id','nunique'),vip等级=('hwlevel','max')).reset_index()user_comment_num.sort_values(by='评论数',ascending=False).head()
评论数vip等级
33
5
24

实战 | 用Python爬取《云南虫谷》3.6万条评论

文章插图
1
18
3
17
2
14
5
评价33条,这用户也是很牛!!我们看看他都评啥了:
df.query('userid==640014751')[['nick','剧集','time','content']].sort_values(by='time')
有点无聊,是来刷好评的吧!!我们还是看看评价第二多的小伙伴吧!