旅游平台“马蜂窝”被自媒体捅出点评抄袭问题。(东方IC/图)
(本文首发于2018年10月25日《南方周末》)
在互联网造假产业链中,有需求的项目方出资,买来了大量虚假的繁荣,这恰恰也是很多平台喜闻乐见甚至亲自参与的。
2017年,《三生三世十里桃花》电视剧上线23天播放量突破189亿,有人大代表质疑,全体中国网民不分昼夜地看,也不能带来每天8亿的点击量。
2018年10月20日,自媒体“小声比比”爆料,估值175亿的旅游平台“马蜂窝”是一座“僵尸和水军构成的鬼城”,指出其点评内容中85%涉嫌抄袭其他平台。两天后,马蜂窝发表声明回应,将开展全网核查并查处涉嫌虚假的信息。
“水军”的存在,已经是互联网时代公开的秘密——他们用机器或者组织人工,刷点击率、刷评论、刷点赞、刷APP下载量……几乎可以渗透在所有用户产生内容的平台上。
只要是以数据衡量价值的互联网平台,数据造假就不是不可能。视频网站、微博、豆瓣、知乎、小红书、虎扑、淘宝,各家平台都有水军活跃的身影。
在互联网造假产业链中,有需求的项目方出资,买来了大量虚假的繁荣,这恰恰是很多平台喜闻乐见甚至亲自参与的。买数据的价格贵贱,完全在于平台的城墙垒得有多高。
纯人工的豆瓣很贵,能机刷的便宜些
南方周末记者近10天混迹QQ水军群中发现,在“刷量”的世界里,豆瓣是最贵之一。
如果要“买”豆瓣,一位“水军”的报价是,不保证显示点评的打分,5元一条,保证显示影评的,10元一条,点赞或打分1元一次。
这个价格,比买微博等其他平台要高出许多倍。
他说,因为豆瓣对水军防范严格,新号一般不给显示内容,注册半年的号最容易显示,所以“半年号”最受欢迎。但是这些号风险也很大,如果经常做、被发现是水军,就会被锁死ID,不显示它的影评。
别的平台,如果“量大”可以打折,但豆瓣不行。“因为豆瓣是纯人工的,有的平台能机刷,就便宜一些。”他说。
但真正“干活”的人能分到多少钱呢?
当南方周末记者扮作兼职水军时,接到的豆瓣任务是为电视剧《凉生,我们可不可以不忧伤》打分,打4或5星,并配上15字左右的短评,然后晒截图,通过QQ红包付酬劳。
接这样一条点评的价格为1元,买同一条点评的价格是10元,90%的差价被中间环节吞了。
在水军的世界里,“水军头子”是连接上下家的,负责找活,再在QQ群或微信群里发任务。直接操作的一般是“散兵游勇”,他们是学生、待业人员、全职妈妈和其他想赚点外快的人。南方周末记者所在的QQ群里有近2000人,几乎每分钟都有任务发在群里待领。
“水军头子”也有可能是兼职的。比如,跟南方周末记者联系的一个“上线”,女性,布置任务的间歇还要接送孩子,微信头像是李嘉诚的照片。
通过观察豆瓣打分的情况,也能发现某部电视剧中水军的痕迹。比如上个月全国收视率前三名的电视剧《月嫂先生》,在播放过半的2018年9月29日上午,南方周末记者发现,在有几十条点评的情况下,该剧却没有打分,因为“评分人数不足”。
南方周末记者询问了豆瓣方面,回应是,公开发行的影片,过滤掉“非正常评分”后,评分人数达到一定数量会显示评分。以此推理,该剧的点评人数早已达到显示评分的程度,那么只能是因为“非正常评分”占比过高。
此前,豆瓣创始人阿北曾经解释,他们把“老子还就不信了,我就要把这个平均分抬高/拉低”动力之下的打分行为统称为“非正常评分”。这大致有四类,注册和购买账号刷高分的、刷低分的、明星粉丝团的和铁杆用户的“反水行动”。
他们的原则是“所有能判断属于非正常评分的一概不算”,不分高低贵贱。为了“反刷分”,24小时都有大小程序在跑。
类似《月嫂先生》的情况现在仍然可以看到,比如湖南卫视的热播剧《你迟到的许多年》,2018年10月16日就没有显示评分,但短评最高有186个赞。
在豆瓣,也可以发现一些貌似水军的账号,他们的打分往往只有1星和5星,评语都是捧或骂演员。比如一个账号经常为热播剧打一星,评语诸如“江疏影演戏总是咬牙切齿的”“王凯演技烂”“马天宇娘”,也会一直为一些明星的剧打五星,写“靳东好帅好帅,有靳东的都是精品!”等。
刷量套路
跟豆瓣一样难刷的是知乎,同样只能纯人工。
一位“水军”跟南方周末记者透露,几个月以前,知乎还可以发大量夸或者黑某个明星的帖子、评论和点赞,但现在不行了,有宣传和广告性质的内容都容易被删,点赞也容易“掉”,点10个赞可能留下一两个。
从前他下面有一批老号,点赞太频繁了,被封了。他就注册了新号,但新号点赞更容易被发现,如果不点赞这个号也没有用,就形成了“恶性循环”,点赞被发现、封号、注册新号、点赞、再封、再注册……“养个知乎号太难了,所以价格就蹭蹭往上涨,现在一个赞涨到2.5元了”。
不过,这里面的差价和豆瓣一样惊人,在QQ群里,一条知乎点赞价格是0.25元,卖出去同样涨了10倍。
在QQ群里,知乎买赞的内容形形色色,除了娱乐圈,还有净水器、种植眉毛、英国短毛猫、英语培训,甚至乌克兰代孕的内容。
知乎方面对南方周末记者表示,他们不断在迭代反作弊系统,事前拦截明显作弊行为,事中针对没那么明显的作弊行为进行不同层级的处理,要么送审、要么限制、要么处罚,事后对非常低频的账号进行模型检测和控制。此外,他们还做了针对“阴阳怪气文本”的识别,进行折叠处理。
水军常出现的平台除了微博、豆瓣和知乎以外,还有小红书和虎扑。
南方周末记者联系了一个水军团队,微信头像是红色的“水”字,他们说豆瓣很严,微博很松,小红书也可以做,评论做不了,点赞可以,30块100个赞。
在所有内容平台中,最简单的是微博。
上述头像为“水”的水军报价是,微博一律五毛,提供“评论+转发+点赞”全套服务。另一位水军报价是,买微博“热搜”,6万左右一次,保证挂一天左右。另外,一万次转发200元,一万次点赞200元,一万次评论500元。
微博的价格可以商量,因为“评论和点赞可以机刷也可以人工,机刷很便宜”。他们有专门的程序可以做出来。
捧一位明星,在微博上已经做出了整套套路:微博加粉、转发、点赞、评论、明星实力榜都可以买,还可以实时“霸屏”,即用大量的实时号发明星内容;可以压制负面信息,这个按条计算,一条几十元,一般来说明星公司都会提供文案、照片和视频用来“霸屏”;还有微博热门、做下拉框(搜索时出现关键词)、删除负面下拉框,这三个都比较贵,因为只能人工操作;也可以“黑”别人,5块钱一条评论,内容自由发挥,“最近就黑了LC。”一位水军神秘地说。
机器取代人
微博动辄数以万计的“水”法,主要是基于机器。一个名为“一个程序员的日常”的博客,曾经爆出微博机器刷量的做法。
博主发现,一个程序员,在电脑屏幕上可以控制多个服务器窗口,不同窗口执行不同的任务。流程是,不停监控新浪微博大号是否发出了新内容,一旦发了新微博,则根据该微博的主题特征,从评论库里提取评论,自动评论在原微博下面,然后从市场上买成千上万的微博账号,批量自动给这条评论点赞,再另外买一批微博账号自动转发、点赞该微博。
“就这样,一个人用一台电脑,再加上从市场上买到的成千上万的账号,完成了整个流程。”
该博主对南方周末记者说,可以用文本聚类分析来排查水军,通常来说,水军的行为特征是短时间内超多用户、评论内容文字简单重复,而且资料一般比较简单。
自动评论的内容出自评论库,他说,这个评论库的内容也都是采集的。从技术上来看,所有平台的数据都可以机刷,只是技术难度以及平台方是否管理的问题。想看哪些是机器刷的,基本把评论往后翻几页就能看出来了。
他说,平台应该是能识别水军的,但难以处理的原因有两个,一是怕误伤用户,很多水军的行为和普通用户区别不大;第二是有些平台默认水军的存在,营造繁荣的假象。
大量水军账号是从已有的号码中盗用的。比如一位53岁的男性用户告诉南方周末记者,他只是早年注册过微博,但目前他的微博在大量转发“火箭少女101_孟美歧”的微博,并且评论“淡定强力围观!”。他本人并不知道孟美歧是谁。回看孟美歧最新的一条微博,评论、点赞、转发人数都达到了50万-60万次。
可以机刷的除了微博,还有视频网站的点击量和弹幕。
一位“水军”对南方周末记者说,50块钱可以买腾讯视频一万次点击量,优酷和爱奇艺也可以做,三个平台价格差不多。弹幕如果是一行多屏的,每条1元,如果刷几万、几十万次的弹幕价格也可以谈,最低5毛一条。
他说,这已经是行规了,“除非是很好的电影或者电视剧,不然很多都是刷出来的”。
另一个水军报价更低,1万播放量12块钱,都是机刷。弹幕如果不卡时间、文案随机的话,0.8-1元一条。
对此,一位互联网数据统计公司的负责人说,常见点击量的算法其实是按照“VV”指标,也就是打开率来算的,只要你在任何平台,打开了相关网页,就算是一次点击率,片花也算。刷单也确实存在,电商网站都可以直接买到,后来网上少了,大家在线下也形成了灰色链条,“都不用心做事了,因为这个太容易了,造假是会形成闭环的”。
另一位数据统计平台的创始人对南方周末记者说,视频点击量是没有第三方监测的,但是广告商会雇第三方进行数据审计。除此之外,播放量由平台说了算,没有第三方佐证。
真正准确的监测方法叫加码监测,相当于在需要监测的视频上加一个代码,每次触发都会返回信息到第三方服务器上,这样来计算点击量。但目前这样的监测只应用在视频网站的广告上,因为广告主要求加,但视频内容的数据监测是不对外开放的。
与收视率不同,收视率数据是广告商前期参考和后期结算的标准,但网站点击率对于广告商来说主要是前期参考作用,因为决定结算的数据是相对独立的、第三方加码的。
“视频网站之间的竞争,导致他们互相把这个点击量越吹越大,吹到中国人都不够用了。”上述数据统计平台创始人说。
2017年,《三生三世十里桃花》电视剧上线23天播放量突破189亿,有人大代表质疑,全体中国网民不分昼夜地看,也不能带来每天8亿的点击量。随后,《中国电影报道》揭露,《孤芳不自赏》一天之内网站点击量猛增14亿,数据监测机构发现其播放量注水程度高达90%。
“反刷量”抗争
2017年,中国首例因视频网站“刷量”而引发的不正当竞争案开庭。2017年2-6月,杭州某公司三人,在视频网站爱奇艺上针对某视频,制造了不低于9.5亿次的虚假访问。原告爱奇艺最终获赔50万元。
2018年9月3日,爱奇艺发表声明,告别唯流量时代,关闭显示前台播放量。
爱奇艺数据研究院院长葛承志对南方周末记者说,以后爱奇艺将用“内容热度值”的方式衡量一个作品的热度,它包括观看数据、互动数据和分享数据等多种维度。因为单纯的播放量并不能体现一个剧的热度,比如在爱奇艺,播放量最高的不是最近流行的《延禧攻略》,而是《小猪佩奇》,大人很少一集看三遍的,但是孩子经常能把一集看上十几遍。
爱奇艺创始人、CEO龚宇在近日的活动中说,“关闭播放量是我们非常不情愿做的一件事,但与其让市场混乱,还不如自己痛下决心,做第一个吃螃蟹的人,不希望无论是内容制作方、广告主还是我们自己,多花精力在这个无聊的事情上纠结,我们应该研发更科学的指标。”
灵河传媒CEO白一骢也公开表示,该公司是最早一批传统电视剧转做网剧的,2014年时觉得网播过亿是非常困难的事。真过亿的那天,所有团队的人都高兴疯了。但是现在,如果上线两小时不过亿变得非常奇怪,“三四年时间真的能有几百倍的增长吗?我们播放量是有问题的”。
南方周末记者联系腾讯视频,对方表示近期这个方向的话题不参与讨论。
一个刷量水军在贴吧说,水军的本质就是公关公司,你干的活只有两种,表扬和批评。作为一个水军,你不需要分对错,只要看利益,然后用成千上万个虚假的身份说出客户想说的话。
水军的波及范围其实早已超出了互联网内容平台。在APP刷量领域,针对广告方普遍采信的友盟数据,已经衍生出一批“友盟刷量”公司。南方周末记者看到有一个叫做“有梦数据”的平台,可以全真模拟各种手机信息刷量下载APP,官网上写道,“APP刷量和友盟刷量已成为最快获得融资方法”。
一位公关公司资深人士对南方周末记者说,很多企业都爱买水军,刷正面稿件,对冲负面信息,保证百度搜索前三页没有负面报道就算完成任务。
可是,在这些“洪水”冲刷下,谁还能知道真实世界究竟是什么样子?
,