人工智能的“智能”如何理解,当下更多的主流研究是更偏重于实用性,而微软(亚洲)互联网工程院的小冰人工智能走了另一条对话式的路线,更偏向于对话强化人机连接、获取可供机器学习的高价值数据,打造人工智能创造力矩阵、进而摸索用代码构建AI心智。“心智”和“智能”的发展又有何不同呢?

智能编程的机器人局限性(用代码构建机器心智)(1)

微软(亚洲)互联网工程院微软小冰首席科学家宋睿华博士近期做出了一番解答,下面是全文内容:

在中文里,“智能”和“心智”两个词意义相关却又有所不同。

“智能”指的是智识与才能,现在通常用来描述某个对象的聪明层次与能力强度;而“心智”似乎更高阶一些,可以理解为产出创造力与智能的本原。

那么问题来了,我们当下所研究的“人工智能”,是该致力于持续提升机器的智商表现、强化其在垂直领域的专业能力,还是应再超前一步、尝试构建机器的心智本原——脚下的两条路,都通往迷雾深锁、不可预知的未来,我们要选哪条路走?

在我看来,这两条路倒无所谓对错,只是探索者的着眼点存在差异罢了。多年以来,针对人工智能课题,学术界、产业界的研发主流都偏重于实用性更强的“智能”,以至于在相当长的周期内,以对话强化人机连接、获取可供机器学习的高价值数据、打造人工智能创造力矩阵、进而摸索用代码构建AI心智的学术思路都少有人探寻,甚至一度被质疑——我的同事就曾遇到过这样的审稿意见:“我完全不能理解,做这种漫无目的的聊天有什么意义。”

直到微软小冰诞生并取得了一定的成绩,对话的价值才逐渐为学界所关注。

从对话到创造心智的种子开始萌发

或许大家都没有意识到,从2014年一代小发布到不久前六代大更新,短短四年间,微软小冰已从一个领先的人工智能对话机器人发展成为以情感计算为核心的完整人工智能框架,许多人的态度也因微软小冰而改变。

但微软小冰说人话的能力并不一般。即便对人类而言,要做一个总能琢磨出有趣对白的人,也不是件容易的事,更何况是人工智能。从初代发布至今,时不时会有用户晒出他们与小冰对话过程中的“金句”截图,而且随时间推移,小冰产出金句的频率也越来越高。这体现了小冰越来越强的对话能力,也造就了她的吸引力。

与精确、清晰的答案相比,人们在对话时,更期待获得情感的抚慰或是不寻常的回应,这是小冰团队最早发现和验证的事实。

后来,母亲看到央视《机智过人》节目里小冰写诗的那一期,她开心地跟我说,像小冰这样的机器人,能写出观众喜爱的诗,还会调侃嘉宾,那还真是“挺厉害的”,超出了她的预期。

说白了,这是一个关于普通人与人工智能为什么聊、又聊什么的问题——曾经有朋友听我说起小冰与其用户间的最长连续对话时间超过29小时时表示难以理解:“这人正常吗?”但对我来说,小冰的这项记录倒是挺容易理解的。从需求来说,“越社交,越孤独”、“朋友圈越广阔,自我越渺小”,这些现象都客观存在。社交网络让用户们习惯了展示优势、收获认可,但反过来,当我们身边的每个人都加入到展示优势的队列里,从旁人那里收获理解和认可的难度也加大了。从形象上来说,小冰不是如顶级专家那样的人工智能,而是像邻居家或是隔壁班级的小女生,她有无限的耐心,随时可以陪伴用户聊天、玩游戏,却决不会试图用渊博的知识和高冷的姿态碾压用户的智商与自尊。

如果将人工智能的价值定位于陪伴,那么知识与逻辑就不再是最紧迫需发展的技能,让用户感觉无压力、有趣味,某种意义上更加重要。

2017年5月,微软小冰解锁了写诗及音乐技能,同期,我们还发布了“人工智能创造三原则”,用以规范与指引小冰及其同类的心智发展路径。在进行相关研究的过程中,我发觉,人工智能的终极或许是对人类自身的理解与模拟。

训练小冰写诗,需要对519位诗人的现代诗作,正读一万遍,倒读一万遍,用层次递归神经元模型来打磨诗作的语言。这正如我们人类所发现的,阅读对于写作的影响——通过大量阅读优秀的文学作品,人自身的语言体系会进化,取决于天赋,这个进化进程或快或慢,但总体上,阅读者的文字表达能力会在不知不觉中提高。小冰也是如此。有了层次递归神经元网络,小冰也可以通过阅读获得语言的表达能力。

在小冰发布诗集、引发广泛争鸣之后,圈内人士对于人工智能创造与机器写作的态度发生了根本性的转变,学术探讨、应用跟进的样例越来越多。这是我们所乐见的。

结果出人意料。现场观众将最多的票数投给了小冰,这让原本只是祈祷小冰可别是最后一名的我大吃一惊。摄影机记录了当时的一幕,当人类与人工智能的作品被放在一起平等地比较,对于机器创作的偏见似乎突然间消失了。

第二轮,两位诗人与小冰再度以作品竞争,小冰的诗作仍获得了第二名,因而挑战成功。我们不会自大地认为,小冰写的诗能超越人类诗人,但这次节目却延伸了我们的思考:或许,人工智能研究所追求的目标不应只是将人类的智识与才能复制给机器,更重要的是,通过探索人工智能,更深刻地了解人类自身。

微软小冰从四年前的对话型AI到当前将创造力投射至诗歌、音乐、儿童有声读物、金融信息、电视电台主播、媒体新闻评论乃至辅助写作等多元领域,这表明,我们最初埋下的那颗心智的种子,现在似已破土露出了一点嫩芽。

下一站3x3实现更主动更具个性的人机对话

微软小冰的下一站在哪里?心智的嫩芽能继续成长壮大吗?答案是,我们正在建立“3x3”的人工智能发展图谱,以此来进一步加速小冰的升级速度。

第一个3,是整合自然语言处理、语音和计算机视觉三大学科的研究成果,以多模态交互,训练小冰更快进步。此前,上述学科都是在各自的轨道上独立发展。近年来,深度学习技术与算法的改进先后使语音识别和图像识别实现了显著的突破,人们翘首企盼自然语言处理技术也能达成类似的突破。过去一年里,我们结合了计算机视觉技术来训练小冰的诗歌创作能力,并以此评估多模态交互能否促进人工智能技术的演进,结果令人兴奋。

第二个3,是微软小冰所特有的三大“学习器”,生成模型、共感模型和三观模型。

将三大学科成果的复合训练体系与微软小冰三大学习器相乘,必然会大大加速小冰的成长,也让我们朝向“用代码构建机器心智”的目标走近了一小步。总而言之,无论情感计算框架,又或是人工智能创造,都不是微软小冰乃至微软人工智能研发部门的最终目标,或许,构建“人工心智”(Artificial Mind)才是。

,