大美宇宙,一切可“算”
数学反映自然的本质。数学不仅结论是美的,方法是美的,结构也是美的,数学就是自然美的抽象画。数学本是求真的工具,却也成了世界美善的化身。
算法的过人之处在于用简洁、快速的方式揭示事物的万般复杂。文学家把一句话扩展成一本书,数学家及其应用者把一句话浓缩为一个符号。数学算法关注万事万物的数与形,高度的抽象无妨内涵的丰富、轨迹的准确、应用的广泛。在静止中看到运动,在变化中洞悉规律,算法充满“真魔力”。
数学让宇宙更呈雅致、严谨、和谐之态,算法让宇宙更加“肉眼可见”,更加可触可感。数学算法常常带给我们不可思议的结论,不符合感性常识,但在很长一段时间里人们必须把它“当真”,严肃对待,直到它被完全肯定或彻底推翻。
本期读 专访谈算法,谈大数据技术的进展和妙用。算法是数学的一个重要应用,正在大踏步全面“进入”现代生活,与无数人近距离、零距离甚至负距离发生接触。这种全面进入,产生了初始阶段常见的摩擦,也引起了一些不适和反感。但是无论如何,这个大势所趋恐怕再难逆转——因为算法带来的美,带来的生活便利,毕竟是更积极更主要的方面。(刘功虎)
《算法之美》
[美]布莱恩·克里斯汀 汤姆·格里菲思 著
万慧 胡小锐 译
中信出版集团
《算法之美》作者、美国人工智能专家布莱恩·克里斯汀:
计算机出现之前,人类已将算法用到生活中
从“算法歧视”到“大数据杀熟”,再到“信息茧房”,“算法”在当下常引起一些争议。但技术作为一种工具,关键是使用得当,就可朝着更健康、更美好的方向发展。
美国人工智能专家、《算法之美》作者布莱恩·克里斯汀近期应国内安远AI和机器之心之邀做了远程讲座,并接受了长江日报读 提问。在他看来,算法可以解决人类生活中的许多具体问题,并预测,未来十年最重要的研究之一,就是让人工智能精准地实现人类想要的目标。
布莱恩·克里斯汀。
“算法”在爱情问题上也行得通
“算法”(algorithm)这个词得名于波斯数学家花拉子密。公元9世纪,这个数学家写过一本书,讨论用纸笔解决数学问题的技巧。
不过,最早的数学算法早于花拉子密。巴格达附近曾出土了4000年前苏美尔人泥板文献,上面就刻有一幅长除法示意图。
但是,“算法”又不仅限于“数学”。
在按照食谱介绍烤面包时,食谱上的所有步骤就是一个“算法”。
按照图样编织毛衣时,这份图样就是一个“算法”。
使用鹿角的末端连续精确地敲打,使石器形成锋利的刃的过程,也遵循着一个“算法”。
从石器时代开始,“算法”就已经是人类生活的一部分了。
那么现代社会呢?我们身边总有一些朋友有所谓的“选择困难症”,比如炒股时何时套现脱身?看过多少套房子才可以出手买下?接触多少人之后,才可以确定自己的理想伴侣?一边怕自己冲动,一边又怕自己错过。
布莱恩·克里斯汀认为,这些人是在自寻烦恼:“他们需要的不是治疗师,而是一种算法。”因为这类问题至少可以通过数学方法来解决。在冲动与不错过之间找到一个平衡点,算法告诉他们,答案其实很简单,就是37%。
他举了个例子。旧金山是整个美国最难找房子的城市,房租甚至比纽约还高。房源一放出,房子就会被一抢而空。消费者一般都斟酌半天,但旧金山的租客没这个特权。
怎么避免“看过的好房子被人挑走”“还有好房子没来得及看”这两种遗憾呢?克里斯汀提到了“37%法则”。意思是,如果你希望选中最合适公寓的可能性达到最大,那么在看前37%的房子时不要做出任何决定;如果你准备花一个月的时间挑选房子,那么在前11天不要做出决定。但是,一旦过了这个时间点,你要做好随时签约的准备。
这可不是直觉,而是已经得到证明的“最优解”,属于数学上被称作“最优停止”的一类问题。“37%法则”就是来解决这些问题的简化步骤,计算机科学称之为“算法”。
至少从17世纪开始,爱情问题就已经让数学家头疼了。没关系,“37%法则”在情感问题上也行得通。有一位教授年轻时曾为寻觅真爱而苦恼,当时他还是一名研究生。他突然想起37%法则,假设从18岁开始,至40岁结束,那么根据37%法则,在26.1岁时他就应该结束观察期,随时果断出手。碰巧的是,当时的他正处于那个年龄。当他发现某一名女性比之前所有约会对象都优秀的时候,他果断行动了。
人类的“小算盘”有多复杂,算法就有多复杂
“算法”的处境有些尴尬:它在各学科的夹缝中找立足之地,最初,它在人们看来是数学与工程技术糅合而成的怪异混合体。
现在,为人类设计算法的工作也面临相同的境遇——找不到一个现成的归属学科。“今天的算法设计不仅需要借助计算机科学、数学和工程技术,还需要得到统计学、运筹学等相关领域的帮助。此外,我们不仅需要考虑计算机算法设计与人类思维活动之间的关系,还需要认真研究认知学、心理学、经济学等学科。”布莱恩·克里斯汀本科学习的是计算机科学和哲学,研究生阶段学习的是英语,毕业之后从事的是与这三个学科都相关的工作。
之所以涉及的学科多,是因为人类问题很复杂。大学毕业后的夏天,布莱恩曾和两个朋友去西班牙旅行。他们在飞行途中商定了旅行路线,有一点很清楚,他们没有时间去看之前计划过的斗牛表演。
三个人都试图安慰另外两人,就在这时,他们突然发现,事实上他们中没有一个人想要看斗牛。每一个人都只是虚伪地热情一下,这导致其他人也积极表现出相同的热情。而且,看似无害的语言比如“哦,我无所谓”或者“你今晚想做什么”实则含有黑暗的计算弱点。它表面上是善意的,却传递了潜台词:“由你来负责。”不说自己的喜好,而让其他人猜测,这是很大的计算负担。
真正让大家轻松的方式,是礼貌表达你的喜好:“我个人倾向于某某,你认为是什么?”提供2到3家餐馆的选择,大家再消除他们最不喜欢的选项,那就会使任务变得更容易。就算是不太礼貌的拒绝,也在明显降低计算成本。
这个案例可见,人类的“小算盘”有多么复杂,面对的难题有多么复杂,算法就有多复杂、多容易出错。
【访谈】
算法很古老,早于计算机出现
读 :为什么我们一定需要算法,靠自己做决定不行吗?
布莱恩:算法就是解决问题的一系列步骤,不是有计算机才有算法,恰恰相反,在计算机开始使用算法之前,人类早就将算法应用到生活当中了。人类的生活很复杂,经常遇到难题,找不到现成的答案。很多问题,从本质上看,都是一些计算问题。“算法”就是把问题简单化,帮助人们获得直觉。该怎么整理办公桌、如何合理地填充橱柜、如何合理安排日程,这些都能靠算法解决。换句话说,人们是在借助计算机科学回答“如何度过一生”这个最古老的问题。
对人类来说,“如何把握今天”可能不是一件易事,但是计算机可以轻轻松松地把握每一毫秒。显然,计算机有很多值得我们借鉴的地方。如今,算法与大数据、政府、企业有密切的联系,正在逐渐变成现代社会基础架构中一个越来越重要的部分。
很多人等公交车时,如果有一个实时显示器提示说,下一辆车“10分钟后到达”,这种算法无疑是很贴心的,你可以决定是否继续等待,而不是左顾右盼,不停张望。这10分钟内你可以目视前方,少了很多焦虑,这是计算的善意。
衣服太多没处放,从计算机角度看,你的衣柜是一级缓存,地下室是另一级,自助存储柜是第三个,你也可以再添加一个比壁橱体积更小、速度更快、距离更近的缓存,比如说在床边放一个衣物架。虽然衣物架现在已经不多见了,但它可以挂夹克、领带和裤子,是你的家庭缓存必备的完美物件。这个例子表明,计算机科学家不仅可以节省你的时间,还可以帮你做家务。
读 :在很多人看来,让计算机来告诉我们如何思考、应该采取哪些行动,是不是太儿戏了?所以对算法会有些抗拒。
布莱恩:部分原因是我们把计算机看成了机械呆板的系统,觉得计算机科学把问题过于简单化了,觉得具有误导性。读一读讲人工智能和机器人的科幻小说就会发现,那样的生活似乎不是我们向往的。人们觉得,把算法与人类生活相提并论似乎很奇怪,“算法”这个词听起来像是神秘莫测的谋划与操作。
阿兰·图灵是第一个设想出计算机的人,他通过类比的方式给出计算的定义,计算机学习的原型就是人类数学家。数学家通过长长的计算步骤,最终得出绝对正确的答案。普通人以为计算机是机械呆板的,但现代计算机处理难题的方式并不是那样。
谷歌有两位研究人员,他们在学生时代曾研究过机器人足球比赛。本来,足球机器人在球场上随机徘徊,不知道该做什么,而研究人员给了机器人微小的数字激励,大约0.01分,奖励机器人获得球权。他们发现,机器人学会了小心翼翼地接近球,然后尽可能快地振动它的“脚”,一秒钟取得球权50次。如果你和任何强化学习的研究人员聊,他们都有自己的一套类似的“恐怖”故事。
我的一个朋友是普林斯顿大学的一名认知科学家,也是一位父亲。有一天,他五岁的女儿在厨房里扫了一些垃圾到垃圾桶里。他夸女儿:“哇,干得好,宝贝,你扫得真好。”他的女儿微笑着,非常自豪,然后拿出垃圾桶,把垃圾全部倒在地板上,好再次开始扫地,从而得到更多的表扬。这两个例子非常有趣,机器人能做到和人类的思考模式几乎相似。
80年前的童话预示了人工智能的未来
读 :靠算法推荐的东西,可能并不全是我们心里想要的,这是不是说明算法并不可靠?
布莱恩:目前还没有永远不会犯错误的有效算法,即使是最前沿的计算机科学也没开发出来,在完成想象、语言、因果推理在内的大量认知任务时,4岁儿童的能力仍然超过成本高昂的超级计算机。
在过去的一二十年里,行为经济学对人类进行了非常具体的研究,结果发现,人类不理性,很容易犯错误,问题的源头是大脑。人类不断面对高难度问题,因为干扰因素太多,比如不确定性、时间有限、信息不全、情况瞬息万变等。
大脑是容易出错,但问题也太难了。计算机科学面临的最难解决的问题是人机对话、修复破损文件、下围棋取胜。这些问题的规则都不明确,所需要的信息也不全,有的还需要考虑无数种可能性。要解决这些,就必须处理好这些“可能”,利用粗略估算,在时间与精确度之间做出某种妥协。
读 :既然不是完全可靠,我们能相信它们做的是我们想要的事情吗?
布莱恩:这远远不是一个新的担忧。事实上,它可以追溯到1960年,当时麻省理工学院控制论教授诺伯特·维纳写了一篇我认为非常有前瞻性的文章,叫做《关于自动化带来的一些道德与技术后果》。维纳用1940年上映的米老鼠动画片《幻想曲》之《魔法师的学徒》做了一个比喻。米老鼠是一个业余的魔术师,他给扫帚施了魔法,并给它简单的命令,比如“从井里打水把大锅灌满”。然而,米老鼠在制定命令时不够精确——看过这部动画的人都知道,他最后差点淹死自己,而这时大魔术师出现并救了他。
维纳写道,这不仅仅是童话故事,这就是我们与人工智能关系的未来。他有一句非常著名的话:“如果为了实现我们的目标,我们使用这样的一种机械机构:一旦启动就无法对其操作进行干预,那么我们最好确定,我们输入机器的目标是我们真正想要的。”
今天,这个问题已经成为了人工智能领域的核心问题之一,我们把它称为“对齐”问题。其实“对齐”并不仅仅是人工智能领域的问题,比如教育系统为考试成绩进行优化,但学生只是变得非常擅长考试,他们不一定能学得更好;甚至在全球范围内,我们为经济增长进行优化,但也对气候产生了可怕的影响。我相信,解决“对齐”问题将是未来十年对科学和人类来说最重要的研究之一。
诺伯特·维纳和米老鼠动画片《幻想曲》之《魔法师的学徒》。
整个世界逐渐置于“自动驾驶”状态
读 :就你观察,在人工智能领域有哪些“不对齐”的表现?
布莱恩:比如有些社交软件最大化每周滑屏的次数,但让每个人都很不开心,因为他们不断滑屏,停不下来,引起上瘾的问题。自动驾驶汽车如果路上遇到障碍物,也许一半的司机会向左转,一半的司机会向右转。如果取平均,车就会直线行驶。我看到有学者正在思考如何对多个用户的偏好或异质偏好进行强化学习。
当你用智能手机拍一张照片,这么简单的动作,包含了大约11、12个环节,它包办了从自动曝光到焦距、白平衡、色彩校正、去噪和将多次曝光融合在一起的一切。这些都是无声无息发生的。同时,手机也在决定你能拍和不能拍的照片类型。我的一个朋友和我说,他很难用他的苹果手机拍摄夜间落雪的照片,因为苹果手机会认为雪是噪点,并将雪从他的照片中去掉。手机拍照的例子说明了人类与机器学习的关系,它是广泛的,同时也是隐蔽的,而且并不一定用我们认可的方式。
2018年优步汽车在亚利桑那州撞死一名行人,我读过美国国家运输安全委员会关于该事件的报告,我很震惊。报告显示,该系统基本上没有任何关于乱穿马路者的训练数据。它只看过人们在有标志的人行横道上过马路的例子。更重要的是,该系统建立在一个有着非常严格的分类系统的物体识别系统上,分类包括行人和骑自行车的人,而且这些分类各有成千上万的例子。但是在这起事件中,这位女性正推着自行车过马路,这是系统从来没有见过的,所以最终造成了不幸的结果:它撞到了这位女性。
我们绝对生活在一个变革时期。我从朋友那里听过一个非常有趣的说法,他多年来在汽车企业负责人工智能开发,他把机器学习软件比喻为一种真菌,正在侵蚀着他和他的团队多年来辛苦编写的C 代码。
我提到这一点是因为有一种说法,说机器学习正在取代人类的专业知识和判断。机器学习系统也正日益参与到我们公共机构的决策中。总的来说,机器学习正在取代人类专家和传统软件,它正在改变我们日常互动的方式,也有可能决定我们的生活轨迹。
在我看来,整个世界正逐渐置于“自动驾驶”状态。所以,我认为,我们有很多理由对此抱有一丝担忧。
最不受待见的想法成为计算机科学发展的“黑马”
读 :你2020年出版了《对齐问题》一书,这两年来,人工智能领域应该又有一些变化,你是否能预见未来五到十年的发展?
布莱恩:这个领域的变化非常快,那本书出版到今天,短短两年时间里,也已经有了一些重大变化。在过去的两年里,一些想法已从学术研究进入到实际的行业实践。有些东西在两三年前还只出现在白板上和会议论文中,而现在它们已经成为一些人工智能公司工作中的主要部分。
我看到了一些非常有趣的景象,不仅大学里有人工智能安全实验室,像谷歌等大公司也有了。我也看到做人工智能安全的初创公司开始出现。一两年前,这些都还不存在。
关于我如何预见未来五到十年的发展,我认为最显著的一点就是这个领域的快速发展。一些起初在计算机科学界不受待见的想法,却迅速变成了计算机科学领域里发展最快的。
有一位研究人员曾告诉我,他2016年参加一个会议时,他说他从事的是人工智能“对齐”,没人知道他在说什么。而到了2017年,出现了一个研讨会专门讨论“对齐”。到现在,“对齐”有了大型分会场,围绕“对齐”的行业也出现。我认为,解决对齐问题可能是2020年代,甚至整个世纪决定性人类工程。
在未来,可能会有越来越多的人的工作是引导或操纵人工智能系统。我甚至怀疑,即使是没有计算机科学学科背景的人,也很有可能去从事这项工作。
读 :算法已经在许多领域取代了许多人,甚至在创造性工作和决策相关的工作中。那么,你对人工智能的大规模自动化可能对人们的生活和价值观的潜在影响有什么看法?
布莱恩:这是一个非常重要的问题。有太多东西试图引导我们的注意力。我有一天读到了一些数据,也许记得不准,说是百分之八十以上的视频是人们通过推荐点击的,而不是刻意搜索的。也就是说,你带着意图来到系统,与你根据建议而点击的比例大约是一比四。
我们的手机有点咄咄逼人地建议我们的说话方式,所以我鼓励人们在头脑中想好发送的文本再输入,因为这些系统虽然没有任何意图甚至说邪恶的意图,但却在引导大家走向一种相似的说话方式。
我举个例子,在英语中,有一个稍微不太寻常的词“生病”(ill)。每次我打出“我感觉不舒服(I’m felling ill)”的时候,我的手机就会把它纠正为“I’ll”——即“I will”的缩写。这是一个完全不同的词,但它是一个更常用的词。因此,我的反应是放弃拼写ill。但如果我使用“sick”这个词,那手机就不会出任何问题。这虽然是一个非常小的例子,但我认为人类应维持核心角色,模型应该向我们学习,我们应处于主导地位。我们可以借用电影《大白鲨》的一句台词:我们需要一艘更大的船以及更好的算法。
读 :目前算法有这么多的不足,但是人工智能领域发展迅速,肉眼可见地进步,我们该如何正确评价算法?
布莱恩:计算机科学是充满智慧的,从算法中我们也能观察出人类自己的思维模式。很多问题本质上是计算性的,这使计算机不仅成为我们的工具,也成为我们的伙伴。计算机科学家和数学家已经确定了很好的算法方法,这些算法可以简单地转移到人类问题上,而且,即使你没有得到你想要的结果,但你也要明白,你正在使用最优选择之一。
据我对计算机科学家的了解,他们常认为的“足够好”真的已经足够好了。任何一种好的算法的指令都是把思考的劳动最小化,让人们避免不必要的紧张、摩擦和精神劳动。
它告诉我们:不要总是考虑所有的可选方案;不必每次都追求最佳结果;偶尔犯点儿错误;放下包袱,轻装前进;放松自己,忠于自我。用计算机科学的智慧指引自己的人生之路,这似乎是一条不错的建议。
(长江日报记者秦孟婷)
【编辑:王戎飞】
更多精彩内容,请在各大应用市场下载“大武汉”客户端。
,