人工智能绘画比赛一等奖(AI数字人潜能有多大)(1)

眼下,2022年上海高考刚刚结束。一个多月前,一篇出自“数字人考生”的高考作文刷屏——由百度推出的数字人度晓晓,作答了全国新高考Ⅰ卷题为《本手、妙手、俗手》的议论文,曾担任北京高考语文阅卷组组长的申怡老师给出了48分的成绩。据介绍,根据历年情况,获得48分及以上作文成绩的考生,仅占不到25%,也就是说,度晓晓的作文分数已赶超约75%高考考生。

业内普遍认为,高考作文这类长文本写作对于AI挑战很大,不仅要求逻辑连贯、主题清晰,还需具备较高的可读性、创造性。因此,度晓晓的作文“成绩”意味着AI技术的“高考通关”, AIGC(AI创造内容)元年已至。

这不是度晓晓第一次在大众面前展现自身能力。在今年的西安美术学院本科生毕业展上,度晓晓受邀建立了自己的专属展区,展出了自己用AI创作的六幅绘画作品,西安美术学院院长影视动画系系主任史纲教授认为数字人的画作水平“已经达到了本科美术毕业生的基本要求”。同样是在不久前,百度与荣耀联合打造的国内首个AI数字人唱作歌曲《每分 每秒 每天》刷屏,作品由AI“操刀”作词、编曲,由度晓晓和龚俊数字人联合演唱,乐评人耳帝也点赞了这首歌曲。

人工智能绘画比赛一等奖(AI数字人潜能有多大)(2)

从上数几个例子不难发现,眼下AI已经涉猎多种领域。百度集团副总裁肖阳表示:“百度AIGC生产效果和效率的不断提升,为实现创意内容生产提供了更多可能。在文心大模型的支持下,AI已经具备了很强的理解和生成能力,能够实现创意作品的自动生成,包括AI作画、AI写歌、AI剪辑等。未来,基于大模型的AIGC将会开放赋能到更多的内容生产领域。”

应战高考作文40秒写40篇水平超75%考生

“度晓晓作文紧扣主题、立意明确,结构完整、语言流畅,而且还善于引经据典、使用修辞手法”,曾担任北京高考语文阅卷组组长的申怡认为,百度AI数字人度晓晓的语文作文可以给到48分左右的成绩。

不过,让申怡感到意外的是,度晓晓在作文里犯了个小错误——使用网络热词。“这篇作文里有一个非常有趣的‘丢分点’,就是使用了‘YYDS’这样的网络流行语,一般我们人类的考生是不会犯这样的错,度晓晓应该是误用了。”

“AI被玩坏了”“有点可爱”“做了我想做不敢做的”……很多网友反倒认为这是AI的可爱之处。百度集团副总裁肖阳表示,作文里出现了YYDS这样的网络词,可能是因为度晓晓学习了一些热门网络数据。从前后文看,度晓晓也领会了YYDS的“精髓”,用得很贴切,但的确是不合规则,还需要继续学习、进步。

人工智能绘画比赛一等奖(AI数字人潜能有多大)(3)

除了作文质量高,数字人的作文生产效率也很可观。据悉,度晓晓仅需40秒就能根据作文题创作40多篇文章。既快又好的“秘诀”在于度晓晓的“大脑”。据介绍,度晓晓此次写作文获得了百度文心大模型的加持。具体来说,是最新推出的ERNIE 3.0 Zeus千亿大模型。

通俗点讲,文心大模型就像是一个见多识广的“尖子生”“学霸”,它的理解能力和创作能力会比普通学生更强。首先度晓晓能够紧扣主题,并围绕立意组织文字来论证自己的观点,这背后就是文心大模型超强的语言理解能力和生成能力。它首先要能够理解给定的作文题目,然后再选择符合立意的论据,从开篇引入到结尾扣题,结构完整并做到始终不跑题。此外,文心融合学习了大规模知识和海量数据,可以实现在“博览群书”后广泛自如地“引经据典”, 输出优质作文内容。

百度研究院曾乐观预测,2022年AIGC技术借助大模型的跨模态综合技术能力,可以激发创意,提升内容多样性,降低制作成本,将会实现大规模应用。

画作现西安美院毕业展:几十秒完成,已达毕业生水平

在今年的西安美术学院本科生毕业展上,有几幅特殊的毕业生作品,引起了众多师生的驻足围观。这几幅作品的特殊之处在于,作者不是西安美院的普通学生,而是百度数字人度晓晓。

人工智能绘画比赛一等奖(AI数字人潜能有多大)(4)

在这场主题为“无界”的毕业展上,度晓晓受邀建立了自己的专属展区,展出了自己用AI创作的六幅绘画作品。除了四幅与“无界”主题强相关的作品(《自然与虚拟》《火星上的月亮》《沙漠中的孤岛》《颜色与星空》)外,还有两幅有关西安大雁塔的特别作品。值得一提的是,每幅作品仅需要数十秒就绘制完成。

西安美术学院院长朱尽晖教授一行也来到度晓晓展区驻足欣赏,他看完后表示很受震撼,“人工智能与艺术相结合,展现出的丰富的画面、内容以及质感,给我们带来了冲击”。影视动画系系主任史纲教授则认为度晓晓的画作水平“已经达到了本科美术毕业生的基本要求”。

据悉,这些画作也已被制作成数字藏品,在百度百家号上公开发售,这也是国内首个数字人创作的艺术数字藏品。

人工智能绘画比赛一等奖(AI数字人潜能有多大)(5)

度晓晓在本次毕业展画作和高考写作文的事件中,展现出了高超的AI作画和AI写作能力。这些“超能力”的背后,是百度产业级知识增强大模型文心和国内首个开源开放、功能丰富的产业级深度学习平台飞桨(PaddlePaddle)。

度晓晓创作的“无界”系列作品使用了文心大模型跨模态图文生成模型ERNIE-ViLG,它具备了领先的跨模态理解和生成能力,只需要输入一段语言描述,AI系统就可以在数十秒内生成一幅充满想象力和艺术审美的高清画作。它不仅可以根据个性化需求自动化生成油画、水墨画、中国画等多种风格的不同分辨率图像,还能实现“看图说话”的效果。

如此强大的AI能力,与百度持续的投入息息相关。百度从2010年便开始深耕AI技术,打造了中国第一个自主研发、开源开放的产业级深度学习平台飞桨,相当于人工智能时代的操作系统。基于飞桨,百度进一步攀登预训练大模型的技术高地,打造具备“知识增强”能力的文心大模型,其中多个模型达到世界领先水平。

从度晓晓的成功“出圈”来看,数字人行业的确具备强劲的驱动力和广阔的前景。据市场研究机构量子位《2021年虚拟数字人深度产业报告》预计,到2030年我国虚拟数字人整体市场规模将达到2700亿元。以百度AI技术做支撑,用百度多元业务做试验场,以及多场景的经验沉淀,度晓晓的前途将不可限量。

唱作歌曲刷屏背后:用AI陪伴亿万用户

不仅仅会写作、作画,作为国内首个可交互虚拟偶像,度晓晓还能在百度App中为用户提供全程AI陪聊功能,升级搜索体验。数字人具体还能做些什么?度晓晓通过由AI“操刀”作词、编曲,由度晓晓和龚俊数字人联合演唱的歌曲《每分 每秒 每天》唱出答案。

人工智能绘画比赛一等奖(AI数字人潜能有多大)(6)

“你有什么心事,都可以讲给我听”,用户与之聊天时,度晓晓会基于自身“人设”进行互动,理解用户上下文中的关系,生成相关回复,且支持文本、音频、图片、表情包等丰富多样的聊天形态;

“所有的不开心,我帮你全部清零”,除了AI陪聊,度晓晓还能讲故事、说土味情话,为用户提供各类娱乐玩法;

“保持好奇,这世界光怪陆离”,当用户有搜索信息的意图时,拥有强大知识图谱支撑的度晓晓会在对话中直接回复答案,或为用户呈现百度App内相关问题的搜索内容;

“不如看场电影,座位就由我来定”,当用户有看电影等服务类需求时,度晓晓会直接通过百度智能小程序提供相应服务。

“用户直接在百度App通过搜索框或底部语音按钮发起聊天类需求,即可召唤负一楼的度晓晓或者龚俊数字人进行实时对话。”度晓晓产品负责人介绍称,目前百度的AI数字人主要可以实现四大功能,即个性化聊天陪伴、辅助搜索、服务分发和互动玩法。

人工智能绘画比赛一等奖(AI数字人潜能有多大)(7)

据悉,今年高考期间,度晓晓作为首个高考数字人助理,为考生提供全流程服务,包括智能高考推荐、重要节点提醒、智能聊天陪伴等功能。百度在数字人和AI技术上的打磨,使得其成为了考生备考、报考的有利工具。

人工智能已经从技术突破走向落地应用的纵深处。着眼未来,百度将持续提升AI“头雁”领航能力,以科技力量惠及千行百业、大众生活。作为拥有6.32亿月活跃用户的百度APP,也将成为百度AI技术落地的重要窗口。

作者:姜方

编辑:王筱丽

,