一、最像人——中科院自动化所的全球首个三模态大模型:“以图生音”“以音生图”首次实现
“紫东太初”是中国科学院自动化研究所研发的全球首个三模态预训练大模型。该模型基于昇腾AI基础软硬件平台打造,开拓性地实现了图像、文字、语音和视频等不同模态数据之间的统一表示和互相生成,形成了完整的智能表示、推理和生成能力,更加接近人类真正的感情和思考。
“紫东太初”首次使“以图生音”和“以音生图”成为现实,可以灵活支撑图、文、音全场景AI应用,使AI应用更贴合人类行为习惯与现实需求,是从限定领域的弱人工智能迈向通用人工智能路径的重要探索。一般的人工智能模型可能只开发了视觉、听觉中的一种或两种感观,而“紫东太初”已打通了三种甚至更多感观,实现了混合表达。记者了解到,基于“紫东太初”打造的虚拟人“小初”,具备视频生成、视频描述、图像生成、智能问答、语音识别等多个功能,甚至能在纺织生产线上通过声音就能“听”出纱线断头的质检缺陷。
据悉,该项目多项算法指标性能全球第一,并在多项下游任务中超越业界最好性能,构建了全自主人工智能技术体系。目前,“紫东太初”作为多模态大模型代表作,正在全力助推AI研发规则和产业应用模式变革,加速各行业智能化转型实践。
二、最贴近产业——百度文心大模型:各行各业开发者数量超6万
文心大模型是百度自主研发的产业级知识增强预训练大模型。它既包含基础通用的大模型,也包含面向重点任务领域和行业的大模型,以及丰富的工具与平台,能支撑企业与开发者进行高效便捷的应用开发。
相关负责人介绍,文心大模型有两大特色:一是知识增强,从大规模知识和海量数据中融合学习,效率更高,效果更好,并具有更好的可解释性;二是产业级,文心大模型源于产业实践,服务于产业实践,在实践中建设、发展、壮大,是真正的产业级知识增强大模型。目前,文心大模型已大规模应用于搜索、信息流、智能音箱等互联网产品,并通过飞桨开源开放平台、百度智能云赋能工业、能源、金融、通信、媒体、教育等各行各业,个人、企业开发者数量超6万。
文心大模型在媒体、医疗、金融等行业都产生了巨大价值。例如在媒体行业,文心大模型的理解和生成创作能力激发创意,提升内容多样性,降低了制作成本;在保险领域应用中,文心大模型的智能解析能力,能使文本处理效率提升30倍;在人力资源领域应用中,文心大模型能实现候选人信息智能分类,模型识别准确率达到99%;在医疗领域应用中,文心大模型将每份病历的检查时间,从30分钟缩短到了秒级别。
三、最有安全感——蚂蚁科技的隐语可信隐私计算技术栈:实现数据“可用不可见”“可算不可识”
隐语可信隐私计算技术栈,由蚂蚁集团打造,是一套融合了千余项专利,自主研发,功能全面、安全易用的工业级全栈可信技术栈。技术栈是为了实现某种目的,而结合在一起的一系列技术组合的统称。
展台现场工作人员介绍,隐语可信隐私计算技术栈是蚂蚁集团沉淀了6年隐私计算技术与应用的集成之作,集千余项隐私计算专利,覆盖所有主流隐私计算技术,首创可信密态计算技术等重大突破,可实现一小时内亿级密态样本的建模和分析,并实现数据的“可用不可见”“可算不可识”。随着人工智能在产业侧应用的爆发,对多来源、多模态的数据需求越来越强,数据频繁跨平台流通和使用等,引出一系列数据安全和隐私保护相关的问题。如何以安全科技守护数据安全,实现数据密态流通,保护用户隐私,就成了人工智能产业高速发展同时也必须面临的问题。
可信隐私计算是实现数据要素密态化的关键技术基础设施。通过可信隐私计算,有助于实现数据流转、计算、数据分析、机器学习直至销毁的全链路数据密态安全可控,真正做到数据价值与数据安全的平衡。据悉,蚂蚁集团的隐语可信隐私计算技术栈通过技术解决方案,已在业界验证了其技术领先性和实战效果,实现了在金融、医疗、保险等领域的大规模应用。
四、最通用——天数智芯7纳米高性能人工智能通用GPU推理芯片:不同模型中均能充分释放算力
7纳米推理通用GPU产品“智铠100”,由上海天数智芯半导体有限公司推出,于今年5月点亮,也是该公司首款云端推理通用GPU产品。芯片点亮指电流顺利通过芯片,通常意味着芯片可用,后续测试修正后即可量产。
天数智芯相关负责人介绍,“智铠100”最大的特点在于它的性能高、通用性强。比如该产品支持多种精度数据类型,使本地存储带宽、视频解码功能得到明显提升;支持国内外主流AI生态和各种深度学习框架,能够快速响应众多应用场景需求;通过不同的板卡设计可与不同设备连接,能适应各种类型的硬件。相比其他一些芯片只适合特定的模型和学习框架,“智铠100”在不同模型中均能充分释放算力。
天数智芯2021年3月发布了7纳米云端训练通用GPU产品“天垓100”,截至2022年3月底,“天垓100”实现销售订单近2亿元,落地200多个应用场景。推出“智铠100”后,意味着天数智芯成为同时拥有GPU架构下云端训练 推理完整解决方案的公司。
五、最能算——壁仞BR100系列GPGPU芯片:国产算力正崛起
8月9日,壁仞科技发布首款通用GPU芯片BR100,号称创全球算力新纪录,多项指标媲美甚至超越国际旗舰产品。本届世界人工智能大会上,它终于露出庐山真面目,首次向公众展出。通用GPU即“通用图形处理器”,它是一个从GPU(图形处理器)衍生出的概念。与GPU相比,通用GPU优化设计后更适合高性能计算,在性能和通用性上更加强大。因此,通用GPU是未来重要趋势之一,也被视为弯道超车的机会。
显然,面对稍纵即逝的机会,壁仞牢牢把握在了手里。BR100的正式发布,标志着全球通用GPU算力纪录第一次由一家中国企业创造,中国的通用GPU芯片正式迈入“每秒千万亿次计算”新时代。
BR100采用成熟的7纳米制程工艺,面积超过1000平方毫米,集成了770亿个晶体管。BR100具有高算力、高通用性、高能效三大优势,现场工作人员说:“未来可广泛应用于包括智慧城市、数据中心、大数据分析、自动驾驶、医疗健康、生命科学等领域,正在为数字经济社会发展,提供强大、灵活的国产算力支撑。”
六、最灵巧——微创医疗图迈Toumai腹腔内窥镜手术系统:天下没有难做的手术
医生在江苏,患者在新疆——不是云端问诊,一场远程手术正在“隔空”进行。今年6月,微创图迈腔镜手术机器人连接横跨近5000公里的新疆克州和江苏南京,顺利完成两例泌尿外科超远程手术,实现迄今为止世界最远距离的5G远程机器人手术。
5G技术与机器人技术的融合,展现了我国在5G超远程手术领域的突破和领先。记者在现场看到了这台机器的样子,它主要由三部分组成:医生控制台、患者手术平台和图像平台,用于辅助完成腔镜外科手术,特别是对于开放术式或常规腹腔镜术式具有挑战的复杂手术,具有明显的优势。其腕式手术器械高度灵活,3D腔镜系统可提供立体真实的手术视野,操作灵敏易上手,相当于医生的“第三只手”,不仅能够简化手术操作,还大大缩短了手术时间,具有极高的临床优势。
作为镇馆之宝,其优势还不仅仅在于实现了“最远的距离”,结合机器人技术优势,可实现更微创、精准、稳定、安全的手术操作,“让天下没有难做的手术”。值得一提的是,图迈腔镜手术机器人是国内首家获批上市的、应用于泌尿外科领域的国产腔镜手术机器人,填补了国内空白,打破了国外技术垄断。
七、最未来——高通的首次基于5G切片的端边协同 XR 分离渲染技术:通往元宇宙的桥梁
进入本届世界人工智能大会会场,高通公司研发的一款5G芯片是所有观众看到的第一件展品,它就被摆在门口正中间位置。“这是高通公司发布的全球首个支持5G的扩展现实(XR)平台,可以理解为通往元宇宙的桥梁。”高通展台相关负责人表示。
当下,VR(虚拟现实)、AR(增强现实)、MR(混合现实)等概念越来越火,而XR,则是这些技术的“集大成者”。XR是指通过计算机、人工智能等技术以及可穿戴设备产生的一个真实与虚拟结合、可人机交互的环境,XR包含了VR、AR和MR等技术,被称为未来虚拟现实交互的最终形态。而这款被称作“基于5G切片的端边协同分离渲染技术提升无界XR新体验”的“镇馆之宝”,是业内首个支持5G的扩展现实(XR)平台,目前已经在VR一体机上实现应用。
高通公司创新性地将先进的骁龙XR产品技术解决方案和全面的XR生态系统支持措施相结合,面向中国XR行业上下游企业提供了全方位支持,赋能了整个中国XR生态的协同建设和发展,为开启元宇宙未来,推动元宇宙产业基础设施和内容生态建设提供了重要支持。
八、最酷炫——Unity HMI解决方案:游戏引擎来造车
HMI中文名为“人机接口”,也叫人机界面。银行里的ATM机,可以说是生活中最常见的HMI之一。不过,随着智能终端产品在生活中加速普及,HMI已经不再是在屏幕上放一个按钮那么简单。比如汽车,其定义已经超越了“四个轮子加一个沙发”,传统的仪表盘更是被酷炫的中控大屏代替。中控大屏,其实就是车端HMI。世界人工智能大会将车端HMI解决方案作为“镇馆之宝”之一,显然也体现了人机界面之于未来汽车产业的重要意义。
Unity在游戏引擎技术方面处于绝对的行业领先地位,作为国际知名的实时3D内容创作和运营平台,Unity早已入局汽车领域,为车企提供覆盖HMI全生命周期的嵌入式开发工具。作为一套“解决方案”,这件“宝贝”很难描述是什么样子,但是目前,Unity已经和智能网联汽车产业链的各个上下游企业达成了落地合作,如梅赛德斯奔驰、宝马、奥迪、日产以及中国新势力车企蔚来、理想、小鹏、威马、零跑、极氪等,已经全面在使用Unity来开发3D HMI系统。
当游戏引擎帮助智能网联汽车从2D转向3D,带来全方位多维度的升级与优化,提高驾驶的安全性、娱乐性、沉浸性、舒适性,人们对于未来驾乘体验的全部想象,也终将在这一历史性变革中变成现实。
栏目主编:李晔 题图来源:海沙尔 摄 图片编辑:邵竞
来源:作者:王力 俱鹤飞
,