11月7日,第五届世界互联网大会在浙江乌镇拉开帷幕。当天下午,搜狗与新华社合作开发、全球第一个全仿真智能合成主持人——“AI合成主播”正式亮相。 在发布会现场的体验中,观众只要输入一句既有的新闻文本,屏幕上就会出现一位合成的新华社新闻主播,他不仅会用和真人一样的声音进行播报,连唇形、面部表情也能完全吻合。这样的视频效果,无论看上去还是听起来,都与现实中的新华社主播的本人播报没有太大差别。
狭义的虚拟主播以原创的虚拟人格设定、形象在视频网站、社交平台上进行活动。形象多以MMD或Unity的3D模型或Live2D制作的2D模型出现,并以真人声优配音,但声优一般情况下并不公开。视频形式多种多样,vlog和游戏实况较多。广义的虚拟主播是指以虚拟形象在视频网站上进行投稿活动的up主,并不对是否为虚拟人设进行限制。以此标准进行衡量,Ami Yamato可视作世界上第一个虚拟YouTuber。但其仅是以动画形象替代自身形象进行投稿,其背后具有真实身份,可以认为是广义的虚拟YouTuber。
虚拟主播爱酱
而本次虚拟主播的诞生,是在虚拟主播的开发过程中,搜狗公司的相关技术人员同新华社的新闻主播一同进行了各种探索尝试,在“搜狗分身”技术的支持下,通过人脸关键点检测、人脸特征提取、人脸重构、唇语识别、情感迁移等多项前沿技术,并结合语音、图像等多模态信息进行联合建模训练后,“AI合成主播”正式诞生。
成名较早的虚拟主播初音未来
在直播行业大行其道的今天,千奇百怪的直播方式层出不穷。尤其是虚拟主播的火爆。某些人设十分成功的虚拟主播,甚至可以获得高于真人主播数倍的人气,虚拟主播的火爆一部分来自于观众的好奇心。网上的虚拟偶像知名的也就只有一个初音未来,而观众们早已对千篇一律的真人主播产生了厌倦感。后来很多团队看到了这点以及虚拟偶像的挖掘潜力,便趁着直播与短视频兴起的这股浪潮,搞起了虚拟主播。
而本次产品就创造性的使用新华社中、英文主播的真人形象,配合“搜狗分身”的语音、合成等技术模拟真人播报画面,使大众享受到逼真度极高的图像效果。这种播报形式,突破了以往语音图像合成领域中,只能单纯创造虚拟形象,并配合语音输出唇部效果的约束,极大地提高了观众信息获取的真实度。同时,利用“搜狗分身”技术,“AI合成主播”还能实时高效地输出音视频合成效果。在“搜狗分身”技术的支持下,使用者通过文字键入、语音输入、机器翻译等多种方式输入文本后,将获得实时的播报视频。这种操作方式将极大减少新闻媒体在后期制作的各项成本,让新闻视频的制作效率有了极大的提高。相比于真实的主持人,虚拟主持人具备以下优势:
(1)虚拟主持人具有稳定高效的工作状态。不会像真人一样有生理和心理状况的高低波动,只要提供足够的技术支持,他们就能始终“神采奕奕”地以最高效率投入到节目制作中去,这就保证了节目稳定的水准和质量。
(2)虚拟主持人具有强大的信息处理能力。虚拟主持人能“上通天文,下知地理”,随着技术的不断发展,虚拟主持人在临场应变和互动交流等方面的能力也将得到不断提升。
(3)虚拟主持人具有极强的可塑性,他们能最大限度地为观众提供个性化服务。他们不仅在外形和风格上可以随心所欲、任意变换,使用信息收集和处理系统,还能方便自如地满足观众的各种信息需求,同时根据观众的反应迅速做出调整和修正。
(4)节目不再过分依赖主持人的外在魅力,有助于电视节目内涵的丰富和质量的提高。
(5)一个成功的虚拟主持人将成为优质节目的形象代言人和品牌标识,却不必像真实主持人一样为成名后的种种烦恼以及如何进一步提升、超越自我等问题而忧心忡忡。
世界第一位虚拟主持人安娜·诺娃(annanova)
2000年,由英国PA新媒体公司制作的世界第一位虚拟主持人安娜·诺娃(annanova)的出现,犹如一颗耀眼的明星,立即就获得 了世人的瞩目,人们对她的关注丝毫都不逊于我们现实生活当中的任何一位名人或明星。紧接着她之后又出现了一系列的虚拟主持人,如中国Gogirl、言东方和伊妹儿,美国的vivian,韩国的丽丽等等,令人目不暇接。虚拟主持人令我们耳目一新,它们所代表的是科技的进步,是科技向日常生活的应用渗透。尤其是我国的这次“搜狗分身”技术,通过“AI合成主播”这一创新的信息传播形式,帮助媒体在融媒体转型、新闻时效性和跨语种传播能力等方面再上台阶,实现了在不同场景下更为自然的人机交互,除了在媒体融合领域的应用外,未来还将在娱乐、医疗健康、教育、法律等多个领域提供个性化的内容。
可以说,网络主持人是对于网络人际交流优势的极大加强,使得人类有可能第一次在非亲身传播条件下体验到相当程度的在场效应,从而把握住不同的网民心理,在最大限度的点对点传播中实现高绩效传播;而在电视中的运用,则有利于加强主持人的作用。在某种程度上,虚拟主持人是电视主持人对人际交流弥补的一种增强。与此同时,其还可以对电视所具有的通俗、易懂、声画并茂等传统优势予以加强。
虚拟主持人的出现在某种意义上可以说是栏目品牌化建设的一个有效组成部分,是向栏目内容本体回归的一种走向。如果采用虚拟主持人的目的是以新奇来吸引受众,这种短视行为只会使得节目无法确立长久发展的目标与基础。而利用虚拟主持人的独特优势来增强栏目本身的内容特色,利用形式特色来打造品牌内容才应该是真正的目的。同时,这对真人主持也是一个激发。
总之,虚拟主持人作为一个新兴事物,其应用范围的扩展、使用频率的提高是一个必然的趋势,在网络电视、交互电视时代具有明显的优势。伴随着硬件技术与传播理念的不断演进,虚拟主持人在分类、潜在优势挖掘、跨媒体使用等方面将会大有长进,终有一日,如同机器人必将走进我们的生活当中一样,它会给我们现有的主持人格局带来一个全新的诠释
,