我用6.5万条公开数据分析了一下人民眼中的人民的名义
最近在看人民的名义这部剧,但是有一点我不是很满意:如果错过了七点过的电视直播(我从来没准时看过),那么就只能等到凌晨十二点,视频网站才会更新。我理解电视台想保证收视率的这点小心思,但这么做也太折磨人了,因为这逼的人们非要做一个选择:要么就第二天起不来迟到,要么就不大容易睡的着。
对此我也没有什么好的解决方案,总不能偷偷录下来吧,这就侵权了。
在看剧的同时,我多了个心眼,我把剧中主要人物都做为关键词添加到我们开发的一个信息追踪系统之中,几天之后,虽然情节越来越拖沓,但我却搜集了很多与这部剧,尤其是剧中人物相关的数据(大约6.5万条),对此我非常开心,忍不住吃了两个鸡腿。
下面是我基于搜集到的公开信息的一些数据分析。
首先,我们来看看对于每个人物的网络声量变化曲线:
我是从4月2日开始追踪的,从数据来看,李达康的关注度从一开始就高居第一,并且领先出第二名不少,尽管波动也较大,但一直处于第一的位置。令人吃惊的是,祁同伟的关注度居然是第二名,但是从图中可以看出,对祁同伟的关注度在逐渐下降,并于4月8日被侯亮平超过。
基于对土豪老板的恶趣味,我一开始就把蔡老板添加了进来,蔡老板的人气不错,前期基本一直和沙瑞金基本持平,沙瑞金的讨论量是唯一没有下降的,虽然缓慢,但一直在上升。
接下来我综合了一下人们对于剧中主要人物的情绪,为了让大家看的更方便,我还贴心的找到了每个人物的图片,不用惊讶,好的数据分析师就是这么善解人意。
对高育良和祁同伟的情绪偏负面,这很可能是因为大家看出了他们不是什么好人,但祁同伟和高育良靠着长相依然有不少粉丝,这些粉丝说了不少好话,相比而言,陆亦可就比较惨了,是唯一一个负面情绪超过正面情绪的角色,对此我也不好作过多评价。沙瑞金的公众情绪最为正面,在对沙瑞金的信息来源分析中,我发现关于沙瑞金,8%以上的声量来自主流新闻媒体,这个比例在其他主要人物那里不到3%:
我认为这在某种程度上可以说明,主流新闻媒体更喜欢报道伟光正的人物,而李达康高育良等其他有一些「毛病」的角色,则在社交网络上被更活跃的讨论。
我们都知道,人们喜欢李达康,但是到底有多喜欢,又是如何表达的呢?
组织这些高频相关关键词,我们可以得出结论:一位表情丰富,实力很强的老戏骨,靠着双眼皮迅速走红,不仅圈粉了大批的迷妹,还受到了广大人民群众的喜欢,其爆红甚至刺激了国家的GDP增长。
很多人说这部剧老少皆宜,所以我一开始也琢磨统计一下受众的年龄,但我后来想到,我能统计到的只有公开数据,而愿意在社交网络上公开数据的,大都是年轻人,所以这种统计可能会存在很大的偏差,这里提这么一嘴的目的是,把我的经验分享出来:搜集数据的时候,最好要避免这种偏差出现。
虽然好评如潮,但是我们的系统也追踪到了一些负面意见,我利用典型意见分析,抽取出了对于这部剧的批评,算是提供另一个角度的观点吧,当然,这些意见并不代表我的个人看法,例如我就觉得陆毅演的还行,不吹不黑。
最后我要推荐一部老电视剧:「我爱我家」,虽然和人民的名义很不相同,但还是有一丝丝的微妙呼应。不得不说,我爱我家是我最喜欢的中国电视剧,希望我们以后还能拍出这么好的电视剧。
《我爱我家》是神剧,极好地诠释了无厘头和讽刺
博主牛逼,这些数据都是用的纽扣数据吗
不明觉历。
都是用的纽扣数据
2020/09/29 15:51