机器之心原创

机器之心编辑部

这次,数字人走进 APP,和我们直接对话。

最近,百度 APP 上线了国内第一个可在 APP 端内与用户交互的明星数字人,以明星龚俊为 IP,并支持语音搜索和对话互动。

今年,随着元宇宙概念大热,随之而来的是潮水般涌现的各种数字人,从时尚娱乐到文化商业,数字人全面开花。

它们依托差异化特质在各类细分赛道中大显身手。例如以图片为主时尚流数字人 AYAYI,虽然做不到高质量直播,但已经实现商业变现;而初音未来、绊爱等歌舞流数字人的兴起则掀起一波虚拟偶像浪潮。

随着互联网大厂入局,更是出现了很多引发热议的数字人,比如腾讯游戏 NExT Studios 联合新华社打造的数字航天员小诤、华为首位虚拟数字人云笙、百度智能云打造的冬奥 AI 手语主播。

可以看到,现阶段数字人一方面趋向了虚拟主持、虚拟偶像、数字人明星等泛娱乐场景,另一方面是互联网巨头发力的金融、文旅、教育等实用场景。

如今,由于依托建模、驱动、渲染技术的数字人行业已经形成完善的产业链,数字人成为新风口,在游戏、影视、传媒、直播、金融、教育、医疗等领域不断涌现。

数字人超生潮来袭,一个不可回避的问题是,这些数字人之间有什么区别?什么才是真正的数字人?近乎逼真的皮囊和外壳下,它们是否具备图灵完备的能力?当技术不断进化,我们到底需要怎样的数字人?

超生潮来袭,数字人「向左还是向右」

关于数字人是什么,目前并无统一的定义。我们尝试从技术和应用场景上聚焦,建立较为清晰的共识,以便数字人行业更好地发展。

中国人工智能产业发展联盟总体组联合中关村数智人工智能产业联盟数字人工作委员会发布的《2020 年虚拟数字人发展白皮书》中曾提到:虚拟数字人指具有数字化外形的虚拟人物,需要具备三个主要特征:拥有人的外观、人的行为和人的思想。

『数字人简单说就是一个计算机表达的人。目前行业内大多数数字人基本是个玩偶,虽然它们在外形和动画等方面已经做得非常好了。但还应看到,他们在人设和行为方面,也就是它的大脑,目前还严重依赖人的设定。』一位业界知名专家向机器之心表示。

实际上,现阶段的数字人更多的是计算机生成的、具有三维形象的人物 IP,停留在逼真的外壳阶段,在技术和交互上仍有很大进步空间。以目前的大多数时尚数字人为例,他们的存在形式仍以图片为主,主要原因是视频呈现极难控制,且制作成本极其高昂,更不要说实现拟人化的动态直播和对话。

上海科技大学信息科学与技术学院执行院长虞晶怡教授在接受机器之心采访时也表示,可以围绕着四点来看待数字人,即「能感知感受、会思考交流、可进化演变和有温度情感」。

简言之,一个相对成熟的数字人,除了拥有真实漂亮的类人皮囊,还需要实现人机交互,即习得如何与人对话、拥有拟人化的表现,建立与真实人类的关系。

目前,数字人从发展上看,有增强现实和削减现实两个趋势。虞晶怡认为,与传统的社交网络相比,新型的数字人产品应当致力于全面「增强现实」,即增强现实世界里人与人之间互信互助的交往,而不是「削减现实」,即通过贴标签的方式简化、模式化、分化人群,导致削减人与人之间的互信互助。

虞晶怡所说的「削减现实」与刘慈欣曾对元宇宙未来表达的悲观不谋而合:人类面前有两条路。一条是向外,通往星辰大海;一条向内,通往虚拟现实。

如果一味地削减现实,沉溺在虚拟世界中,刘慈欣认为,那将是一条自娱自乐的死路。未来的元宇宙将变成极具诱惑、高度致幻的「精神鸦片」。在《时间移民》中,刘慈欣就写道,无形世界的生活如同毒品一样,一旦经历过那生活,谁也无法再回到有行世界。

向左走还是向右走,数字人的方向选择虽然由总体需求来决定,但能感知感受、会思考交流、可进化演变和有温度情感的数字人技术,将丰富完善现实世界的体验。

虞晶怡教授也特别强调:数字人不是为了让人脱离真实世界,而是为了增加人与真实世界、人与人的交流。它应该使人类更懂得多元与互信,而非割裂的二元。

数字人往何处走?其实国内一些互联网大厂比如百度很早就在向实用型数字人方向探索,让数字人更智能化更服务化。

早在 2019 年百度就开始布局数字人业务,携手央视推出的时事 AI 主播「小智」、数字人虚拟小编「小 C」、AI 虚拟主持「晓央」和冬奥 AI 手语主播。腾讯和华为最近也动作频频,比如腾讯此前发布了涵盖金融、文旅和智能家居等个领域的数智人产品矩阵;华为在 HDC2021 上也首次采用数字人全程手语直播。

数字人如何脱虚向实?

今年 8 月 18 日的百度世界大会上,百度推出了以明星 IP 为主体打造的龚俊 AI 数字人,现场,龚俊数字人唱跳着周杰伦的《夜曲》片段登场。

数字识人技巧大全(数字人超生潮来袭)(1)

它动作流畅,声音口型也几乎没有偏差,这一切都归功于百度深耕已久的数字人技术支撑。外形上,采用 4D 扫描技术捕捉真人说话及面部表情细微变化,超写实地还原了龚俊真人;声音上,依托强大的 TTS(Text to Speech)技术,龚俊数字人唱歌与说话的声音无限接近于原声,营造真实感

但如果只是如此,龚俊数字人似乎与其他泛娱乐的虚拟偶像并无二致。那么如何为数字人找到实用内核,更有温度和情感地与人交流?

11 月 25 日,龚俊数字人入端百度 APP,成为国内首个可以在 APP 端和人真正互动的超写实数字人,而端内服务与场景也为龚俊数字人的实用功能提供了契合的土壤。

数字识人技巧大全(数字人超生潮来袭)(2)

数字识人技巧大全(数字人超生潮来袭)(3)

用户只需在百度 APP「语音设置」中的「语音搜索助理」中选定龚俊数字人,然后点击主页面下方的小话筒标志,即可唤出龚俊数字人,实现面对面的实时互动。

一方面,龚俊数字人实现了便捷的端功能控制,实现开 / 关夜间模式、打开书架、清理缓存、影视小说网站等的一语直达。

数字识人技巧大全(数字人超生潮来袭)(4)

另一方面,还能够满足用户多场景搜索需求,比如「明天天气怎么样」,数字人随即语音播报明天天气情况,并给出穿衣建议。

数字识人技巧大全(数字人超生潮来袭)(5)

智能搜索一直是百度 APP 的标志性功能。从语音搜索到视觉搜索,百度 APP 不仅致力于连接人与信息,还深入探索连接人与服务、人与人,未来将更便捷地连接万物。

龚俊数字人入端百度 APP,正是对搜索拟人化的具体实践,由以往度晓晓这类二次元卡通虚拟助手升级到了明星 IP 类超写实数字人助理,不仅声音与外形的高度拟人化,还支持近乎真人般的互动与服务,为用户带来沉浸感。

未来,百度还将提供更加智能化的数字人服务,数字人将被支持设置到手机桌面,最终在端内外与用户形成全方位的交互生态,实现在端外也能实时唤起数字人智能生活助理。

随着数字人应用场景越来越多,百度的入局势在必行。从 2019 年介入数字人业务以来,百度就已在技术、产品、市场和生态等方面积累了大量的经验和优势。

除了在数字人动作声音等技术处于领先水平,百度还拥有数 10 项数字人领域核心专利,更有从项目规划、资产监制、工程开发到客户服务的数字人全流程服务能力。

数字识人技巧大全(数字人超生潮来袭)(6)

在产品生态层面,百度拥有直播、短视频等多种形态的支持以及高达 6.07 亿的月活用户基础,端内也可以联动好看视频、搜索、百科和小程序进行全方位内容推荐。

在运营层面,百度具有成功打造虚拟 IP 的经验,如多次登上百度、微博和抖音热搜的虚拟 IP 张小寒。百度更拥有强大的虚拟 IP 矩阵资产和孵化 IP 的能力,如虚拟小编小 C、虚拟主持人晓央等。

正是依托这些优势,百度 APP 才将数字人放入端内,并在这片「土壤」中打磨数字人的交互与响应能力,为以后端内外更智能化的功能的释放「打好了前站」。

此次,龚俊数字人入端百度 APP,通过无障碍的交流互动,让用户真切地感知到了数字人的实用价值。数字人也不再虚无缥缈,真正脱虚向实,成为了现实世界你我皆可触及的伙伴。

参考链接:

news.mydrivers/1/777/777429.htm

article.pchome/content-2137050.html

abi/news/htmfiles/2021-8/246033.shtml

finance.sina/tech/2021-08-04/doc-ikqcfncc0906933.shtml

pg.jrj/acc/Res/CN_RES/INDUS/2020/12/19/cdb07e97-aa5f-4f6a-bf9a-7c001bb43b26.pdf(2020年虚拟数字人发展白皮书)

cloud.baidu/news/detail.html?type=news&newsId=882cc72e-e1fd-4a7e-a426-9e2b1f43cfc6&status=ONLINE

,