BuzzFeed是由赫芬顿邮报的创始人Jonah Peretti于2006年创办的新闻聚合网站,总部位于纽约。该网站从数百个新闻来源那里获取订阅源,通过搜索、发送信息链接,让用户可以浏览当天网上最热门的事件,被称为是媒体行业的颠覆者。BuzzFeed 以善于挖掘眼球著称,其中奥秘在于它是一家以数据为驱动的公司,BuzzFeed拥有强大的数据分析处理能力,从而能够基于数据创作出在社交媒体上令人疯转的内容。目前,BuzzFeed每个月拥有数千万人分享的内容,以及超过2亿的独立访客,视频月浏览量也达到了15亿次。而在这所有的背后,起到强大支撑作用的是一项叫Pound的技术。

在BuzzFeed Tech的博客上,BuzzFeed的出版商Dao Nguyen和数据专家Kelleher兄弟向外界对Pound技术进行了介绍。Pound是一种捕捉BuzzFeed内容如何在社交网络上传播的新的专利技术,可以分析内容的传播路径和方式,从而帮助网站更好地确定内容投放和传播途径,Pound是Process for Optimizing and Understanding Network Diffusion(网络传播优化及理解流程)的缩写。Pound对内容在不同分享者之间的传播进行跟踪,传播的平台可以是各种社交网络, 如Facebook和Twitter,也可以是点对点的通信平台,如Gchat和电子邮件。

在BuzzFeed每月2亿的独立访客中,有接近四分之三来自社交媒体平台,这就为更好地洞察内容在社交网络中的扩散提供了一个独特的机会。假如,一个用户在Facebook分享了一组图片,有Twitter用户将其转发到自己的Twitter主页,又有Pinterest用户将这组图片从Twitter转发到Pinterest。整个过程发生了什么?从这个过程中又能学习到什么?这就是Pound所解决的问题。

收集并存储这些网络传播的数据是一个巨大的工程挑战。面对这个问题,Pound能够每秒处理超过10,000个网页请求。导致的结果是,现在一个月存储的Pound数据比BuzzFeed成立以来为内容优化收集的所有其他数据都要多。

在如此大的数据集中蕴含着丰富的知识,充分地挖掘它们能够帮助更好地理解数据、更好地理解用户,以及更好地理解社交网络。在这基础上,能够吸引更多的用户,并对他们实施更多的影响。从Pound数据中能够学习到什么?Buzzfeed将其总结为三点:

发现的是森林,而不是树木

最初,Buzzfeed认为数据可以表示为一个单一的树状图。但后来发现,每一条内容都有成百上千的初始分享者,他是他自己这棵树的根节点。每条内容的Pound图看起来更像是一片森林,而不是一棵树木。在这片森林中,树木可以看上去完全不同。有些是胖的(有很多下游节点),有些是瘦的;有些是深的(有很多层次),有些是浅的;有些是跨网络传播(不同的平台)的,有些则不是。整个传播的森林结构蕴含着内容传播的细节。

社交网络和商业推广应该由他们的整个下游渠道进行估值

在今年二月份,BuzzFeed发布了一则“dress”内容。它已经被浏览超过3800万次。这个Pound数据显示了病毒内容是如何通过各种社交网络、邮件系统、新闻网站和博客上的数千万分享者进行传播的。

阿里云反爬虫策略(BuzzFeed的网络传播优化与理解流程)(1)

上图是BuzzFeed在Facebook主页上发布这则内容的网络扩散图,图中展示了分享“dress”内容的所有下游浏览者。不同的颜色代表了不同来源的浏览者,深蓝色代表Facebook,浅蓝色代表Twitter,白色代表其它网站,如博客或新闻网站。可以看出,大多数的节点是深蓝色的,这意味着他们点击是通过Facebook,这是可以解释的,因为“初始分配者”是一个Facebook账号。

阿里云反爬虫策略(BuzzFeed的网络传播优化与理解流程)(2)

上面的可视化是BuzzFeed在Twitter主页上发布这则内容的网络扩散图。有些许淡蓝色的是Twitter占统治地位的集群,但更多的深蓝色的Facebook占统治地位的集群。也有相当大的白色集群,代表了那些通过博客或出版物阅读这则内容的人。这是正常的,因为来自Twitter的点击量仅仅占到了从BuzzFeed的Twitter账号扩散到下游其他网站总浏览量的四分之一。

阿里云反爬虫策略(BuzzFeed的网络传播优化与理解流程)(3)

上面的GIF通过缩放可以看到一个主要的Twitter集群内部在不同尺度上的网络扩散。

赞助内容会像编辑内容一样被分析、再分享

BuzzFeed表示他们已经意识到这个现象很长一段时间,恰恰Pound数据帮助他们证明了这一点。下面给出一个例子,BuzzFeed的创意服务团队在愚人节前夕写下一个标语,“I Tried The Fanny Basket And It Saved My Life!”。这则内容非常成功地获得了超过40万次的浏览量。下图给出了其Pound的可视化。

阿里云反爬虫策略(BuzzFeed的网络传播优化与理解流程)(4)

从图中可以看出社会分享有一个令人印象深刻的深度,从最初的分享开始算起,这则内容有7个附加层次的传播,最大可以达到8层(相比之下,Twitter集群对“Dress”内容的传播深度最大达到11层)。

阿里云反爬虫策略(BuzzFeed的网络传播优化与理解流程)(5)

放大这个集群可以捕捉分享了这条内容的网络化群组的层次结构。这就是社会口碑营销。Pound使得口碑能够被度量,而一旦它可以度量,就可能被优化。

Pound的下一步

Pound的下一步应该是怎样的?BuzzFeed给出了他们的几点想法:

  1. 推送的在线内容除了吸引你,是不是还能够吸引你的朋友和粉丝?
  2. 能否用Pound的数据来支持A/B测试?我们是否可以借此改进我们的网站和APP,不单单吸引网站的读者,更能够吸引读者的朋友从而扩大网站的影响力?
  3. 把BuzzFeed和所有下游的分享和流量都算上的话,特定推广的效果到底有多强?
  4. 基于在线内容的所有特征,是否可以预测它的传播能有多广?
  5. 是否可以过滤掉主流网站和名人推广的作用,仅仅学习普通用户对在线内容的偏好,从而为每个人提供更多正确的内容?

最后,BuzzFeed表示,目前正在寻找测试阶段的合作伙伴,思考如何使Pound更好地同时服务于广告商和受众,基于这项技术创作更多满足用户个性化需求的数据驱动型内容。

事实上,在这方面BuzzFeed已经取得了进展。8月27日,Jonah Peretti宣布BuzzFeed和全球最大的广告传播集团WPP达成了一项协议。前者将在近一年的时间里跟后者旗下的媒介代理公司GroupM合作。GroupM将可以使用Buzzfeed的数据,并且获得使用Pound的权限,以此更有效率地帮助广告投放,这也将为GroupM公司提供更直接的利益。而对于BuzzFeed来说,这将帮助其广告卖的更好,营收增加。可以说这是数据内容与品牌平台的一次有力结合。

via:infoq

,