没想到,连翟天临的瓜田都暂时歇业了,从大年初一就开始发酵的另一个话题 —— 豆瓣评分公正性之争 —— 却还在持续。

事情要从春节档最具话题性的电影《流浪地球》说起。这部电影开分时评分是8.5,现在降到了7.9。

豆瓣评分有代表性吗(豆瓣评分到底可靠吗)(1)

波动过程中,有人发现很多一星短评是非理性打分,比如直接写“有吴京的一律一星”,于是得出结论:《流浪地球》被黑了。

豆瓣评分有代表性吗(豆瓣评分到底可靠吗)(2)

其中最惹眼的是一个ID叫“掉线”的豆瓣用户。他原本给《流浪地球》打了四星,写的短评获得了超过2万赞,被顶到了前排。过了几天他又把四星改成了一星,给出的理由是:

“这个一星给的不是电影,只是对某些狭隘的民族主义者的态度”。

豆瓣评分有代表性吗(豆瓣评分到底可靠吗)(3)

但是当时的打分机制存在一个bug:修改分数并没有让他之前用四星评论累计的点赞清零,于是就有人质疑,先给电影打高分骗赞,混到前排了再改低分,是一种新型的黑子套路。

然后传闻越传越夸张,不断有所谓微信水军群、QQ水军群、豆瓣私信的截图爆出来,证明有人在花钱收买豆瓣用户,让他们改低对《流浪地球》的评分。

这所谓“背后的资本”看不见摸不着,被挑动的情绪最后全冲着豆瓣来了。很多心疼《流浪地球》的人正义感无处抒发,就去各大APP Store 给豆瓣APP打一星,我写稿前去苹果应用商店看了一下,连续翻了十几屏都是整齐划一的一星。

豆瓣评分有代表性吗(豆瓣评分到底可靠吗)(4)

给出的理由有:豆瓣监管不力纵容水军横行、豆瓣自命不凡、豆瓣用户爱装逼……

其中夹杂着很多类似于“今天心情不好,给个一星高兴一下”、“原来的五星一看就是水军,打个一星平衡一下”的一星理由,一看就是在报复豆瓣电影打分里那些说“没看过但是给一星”的网友。

豆瓣为此修改了点赞规则,用户一旦修改对电影的评分,此前获得的点赞也会相应清零。然后发声明说明相关情况,但似乎并没有扭转舆论 —— 那些让我翻了十几页都没翻完的应用商店一星评分全是这两天新增的。

豆瓣评分有代表性吗(豆瓣评分到底可靠吗)(5)

这不是豆瓣评分第一次被质疑,《长城》和《摆渡人》得分不高时,《人民日报》就发过文章说《豆瓣、猫眼电影评分面临信用危机,恶评伤害电影产业》。《逐梦演艺圈》的导演毕志飞靠杠豆瓣最后捧红了自己。

那么,豆瓣评分到底可不可信?《流浪地球》在豆瓣上被大规模黑到底是不是事实?

要讨论这个问题,先要厘清一个前提:

对影视作品的大众评论,不存在绝对的就事论事,一定会受到很多场外因素的影响和干扰。

比如评《我不是药神》,不能不考虑它在题材和尺度上的突破,如果只论电影本身,这部电影评9分是高了。

豆瓣评分有代表性吗(豆瓣评分到底可靠吗)(6)

评《战狼》系列同样脱离不了关于“美分大战小粉红”的争议。意识形态、明星主演的历史口碑、影片类型(国人对科幻和动画尤其有情节)等等都是相关因素。

另外,完全非理性的情绪性打分,比如没看就打分、心情不好就打低分、喜欢主演给高分、讨厌主演打低分、看到别人都打一星非要给五星平衡一下等等等等,都是无法彻底杜绝的,就像《流浪地球》里人工智能MOSS说的那句话:让人类永远保持理性确实是一种奢求。

《流浪地球》这部电影身上贴着国产科幻、爱国主义、吴京这几个争议性标签,喜欢的人非常喜欢讨厌的人非常讨厌都是可以预见的。对这部电影本身的具体评价,我们过年期间发过文章在这里:《流浪地球》其实是一部青春片今天就不再展开了。

明确了这个前提再来看这次所谓的《流浪地球》被黑事件。

有人说《流浪地球》被大量一星刷分了。可是,柱状图显示一星比例只占2.2%,四星五星评论最多,三星、二星、一星的打分人数依次递减,是一个很合理健康的分布情况。

豆瓣评分有代表性吗(豆瓣评分到底可靠吗)(7)

我找了和《流浪地球》得分同样是7.9的《湄公河行动》对比,打分分布走势几乎没有区别。

豆瓣评分有代表性吗(豆瓣评分到底可靠吗)(8)

有人说有大量高赞评论都从四星五星改成了一星。这个豆瓣在声明里明确说了统计数字:前500个高票评论中只有4人改星,还有两个是低分改成了高分。

那个ID是“掉线”的用户自己也发广播澄清了,他的改分行为是自发的,并不是被收买的。

豆瓣评分有代表性吗(豆瓣评分到底可靠吗)(9)

而除了“掉线”之外,这么多天了,也的确没有看到市面上挖出来别的高分改低分的具体案例。至于那些所谓水军、黑子发布任务的群聊截图、私信截图,造假成本低到我不想讨论它们。

豆瓣评分有代表性吗(豆瓣评分到底可靠吗)(10)

豆瓣评分有代表性吗(豆瓣评分到底可靠吗)(11)

忍不住引申一下,没觉得失去卓伟们之后,市面上所谓的微信群爆料、朋友圈爆料越来越多了吗?吃瓜归吃瓜,这种“制作”起来毫无成本的所谓“爆料”还是不要随意相信为好,不要低估现在的营销公司为了引导风向会做出的努力。

再说回豆瓣身上的争议。

作为一个超过10年的豆瓣资深用户,我的观察是:豆瓣确实有水军,并且这几年随着电影行业的繁荣,越来越多。但水军对豆瓣评分的干扰,远远小于包括微博、知乎、淘票票、猫眼在内的互联网平台。对我来说,它一直是参考价值最大的电影评分平台。

早在2015年,豆瓣的创始人阿北就发过一篇标题叫《豆瓣电影评分八问》的文章,详细解释过豆瓣电影的评分规则。

豆瓣评分有代表性吗(豆瓣评分到底可靠吗)(12)

言简意赅总结一下,豆瓣评分并不是简单粗暴的算平均分,而是会综合打分用户的活跃度、行为方式,用一定的权重算法来生成最终的分数。

豆瓣有反水军机制,平时不活跃的僵尸用户突然大量打分,新注册的账号、被收购交易的账号异常活跃都会被怀疑是水军,打出的分数就算作无效。文章还提到他们也有算法识别那些明星粉丝组团进攻豆瓣刷分的行为。

是的,想要控评的群体除了愿意花钱的电影宣发,还有来自民间的自发力量——主演明星的粉丝,作为资深网民,我就眼睁睁看着知乎成了粉丝彩虹屁专区。

除了算法,豆瓣一直没有急于变现,相对于微博的话题发酵能力来说,它虽然早已经不是什么文青聚集地,但也没火到人人用天天用。看过不少讨论豆瓣商业化的文章,标题都是类似“用户比创始人还着急”的句式。这就决定了这里的所谓意见领袖、营销号并不多,一时兴起冲进来的水军和粉丝又不能马上参透它的玩法,给干扰评分引导舆论也增加了不小的难度。

正是因为难操控,才价值高。刘烨以前上《瓣嘴》的时候说过,豆瓣的评论是被所有做电影的人和公司很看重的,他们吃饭的时候都会讨论豆瓣说什么什么了。

豆瓣评分有代表性吗(豆瓣评分到底可靠吗)(13)

阿北在2015年那篇文章里也说过,因为分数本身难以操控,所以今后针对豆瓣的干扰会着力在“打击豆瓣评分整体的公信力”,现在看来,不得不说他有远见。

豆瓣评分有代表性吗(豆瓣评分到底可靠吗)(14)

就我主观的感觉,随着用户量不断增多,用户人群从文青向大众过度,豆瓣电影评分的平均分数这几年一直在缓慢上升,以前,我参考豆瓣评分的方式是:6分以上及格,7分以上的片子有可看性,8分以上是佳作,9分以上是神作,现在这个标准整体都要提高0.5分左右。

豆瓣评分有代表性吗(豆瓣评分到底可靠吗)(15)

豆瓣评分也不是没有短板。

它面临的最大争议一直是,没有看过电影的人也可以打分,而猫眼、淘票票是买了票的才有资格打分。不过话说回来,IMDb也是开放给用户随意打分,算法可以一定程度解决这个问题。猫眼和淘票票的问题在于受众是另一批人,评分普遍在8分甚至9分以上,好坏都拉不开差距,使得分数参考性降低。而且很多提供打分的网站、平台自己有影业或者背后站着互联网巨头公司,有又是选手又是裁判的弊端,大家各有短长。

另外,豆瓣评分的确有倾向性,其中有规律可循。

纪录片争议小得分高,《地球脉动》就9.7,这还是下降了,最高的时候是惊人的9.9。

豆瓣评分有代表性吗(豆瓣评分到底可靠吗)(16)

古早老片得分高。因为这些片子如果不是迷影人群,根本不会有兴趣翻出来看。

电视剧平均得分高于电影,电视剧得分受主演粉丝的影响更大。这是因为看电视不用花钱,路人观众没有形成为电视剧打分的习惯。

相对小众的日剧韩片得分偏高,因为它们的受众群体有自己的小圈子。

奥斯卡之选比如《国王的演讲》,也有人提出它们工整政治正确而无趣,评分偏高了。

豆瓣评分有代表性吗(豆瓣评分到底可靠吗)(17)

在国内上映的外国片整体看起来评分偏高。这是因为引进片在国内上映前已经经过了发行公司的一道筛选,太烂的挣钱无望就进不来。不过也有低分的,《变形金刚5》只有4.9分。

豆瓣评分有代表性吗(豆瓣评分到底可靠吗)(18)

恐怖片评分偏低,观影过程中的心理不适感会直接投射在分数上,另外这种片子也一直被认为上不了台面。

但这些倾向性都是用户人群决定的,不是水军操控的结果。

这么多年下来,我也慢慢研究出了几条如何让豆瓣评分更有参考性的小技巧,写出来给大家参考:

一部电影的评分一直是在波动的,开分时间越长,越接近它的真实水平。上映当天显示出来的第一批分数可能来自点映观众,或者所谓被收买的影评人,但时间越长越难靠这样的方法控场。很多电影分数可以持续十年一直在变化,周星驰的《功夫》最开始只有七分,经过漫长岁月,刚才查了一下,已经8.2了。

豆瓣评分有代表性吗(豆瓣评分到底可靠吗)(19)

值得参考的不仅有分数,还有打分人数。打分人数只有几百的话,参考性相对低一些,可是像今年春节档的几部话题片,《流浪地球》打分人数80万,《疯狂的外星人》26万,《飞驰人生》27万,《新喜剧之王》12万,2018年话题度最强的《我不是药神》打分人数都超过100万了,这样的基数很难被水军搅动。如果真有人能控制,就不会出现那么多口碑跳水维持不住的惨剧了。

豆瓣评分有代表性吗(豆瓣评分到底可靠吗)(20)

看短评的时候,不仅可以看热门短评,还可以选“最新”选项,这样评论会按时间线显示,多翻几页,就可以基本掌握一部电影的优缺点所在。

豆瓣评分有代表性吗(豆瓣评分到底可靠吗)(21)

另外,大家也可以在豆瓣上关注自己信得过的影评人,这样除了大众参考分,你还会收获一个“好友评分”,两个分数相互印证,参考性更强。

豆瓣评分有代表性吗(豆瓣评分到底可靠吗)(22)

判断友邻值不值得你信任的方法是,点开他的个人主页,查看你们俩打分历史的匹配程度,也就是这个“共同喜好”,如果共喜好多,证明口味相近,对你来说,参考价值更大。

豆瓣评分有代表性吗(豆瓣评分到底可靠吗)(23)

虽然豆瓣的服务器常常开小差,也不是每次改版都尽如人意,但不影响我认为它在国内互联网世界是一个很难得的可以形成高质量讨论的小天地,不希望它被污名化。

也希望看这篇文章的朋友,在网上任何平台针对一部电影也好,一个艺人也好,或者是一起新闻也好,发表评论的时候,都尽量减少情绪化的发泄,多一些有内容有价值的观点,对持有异见的人一样报以尊重和耐心,维护网络对话环境人人有责,和大家共勉。

,