谷歌在2月8号举行新技术发布会。第二个是,春天到来,草莓供应即将进入旺季。
先来看今天的第一条。2月8号,谷歌举办了一场发布会,宣布了在AI搜索方面的新进展,普遍都是原有技术的升级。比如智能搜索、智能翻译,等等。并没有太多的新花样。而且更重要的是,大家关注的重点,其实并不在这个发布会本身。而是就在发布会前一天,谷歌在自己的官网上,发布了他们的智能语言AI,叫Bard的测试报告。注意,这个Bard可不简单。ChatGPT都知道吧?而这个Bard,就相当于谷歌版的ChatGPT。就是这个报告,出问题了。
这个报告里,涉及这么一个问题。詹姆斯·韦伯太空望远镜有哪些新发现,可以讲给我9岁的孩子?Bard的其中一条回答是,韦伯太空望远镜,首次拍摄到了太阳系外的行星照片。但很快就有人发现,这个答案是错的。第一张太阳系外行星的照片,并不是韦伯望远镜拍的,而是2004年,智利的甚大望远镜阵列拍摄的。
而就在这件事之后没多久,就有新闻爆出谷歌的股价,大跌了8%,据说市值蒸发了7000亿。好多人就猜,这是不是谷歌的技术不行了导致的?你看,这么重要的场合,犯这么低级的错误,股价可不得大跌吗?
相关的,还有很多评论在网上出现。比如,这一代智能AI好像也没有那么厉害。说什么职业被替代是不是耸人听闻?等等。
今天,为了搞懂这些问题,我专门找了一个帮手。杨溥老师。请他来给这场发布会划划重点。重点一共有三个。
第一个是,谷歌股价大跌,并不能全怪Bard犯错。谷歌的股价之所以跌,还在于两个关键原因。一是追兵的势头太强劲,对它的市场份额造成了威胁。就在谷歌发布会召开的前一天,微软刚刚发布了由ChatGPT支持的最新版本必应搜索引擎。要知道,之前在搜索市场,谷歌占据90%的份额。而这回微软拿出的技术和魄力,可一点都不含糊。这直接对谷歌造成了冲击。二是即使在自己原来的地盘里,谷歌的营收模式,也受到了冲击。要知道,谷歌重要的收入之一,是搜索的中插广告。比如,我要搜索,怎么在一个月里减肥10斤,可能有一堆结果。然后广告就穿插在这些结果中间。但是,采用AI回答问题之后,我直接问AI,它就会直接告诉我一个完整的答案。你看,广告没地方放了。这就对谷歌的营收模式造成了一定的冲击。
换句话说,谷歌的股价大跌,不是因为这回的AI技术不行,大家都不看好。相反,是因为这回的AI技术太厉害了,厉害到能直接冲击谷歌的业务模式。甚至有人说,这一定程度上恰恰是大家看好这一轮AI技术的表现。
而且要知道,现在大家用的,还只是这一轮AI技术中,比较初级的版本。比如OpenAI的ChatGPT,目前是3.5版本,而更新版本的GPT4,就在这个月上线。这个版本厉害在哪?之前的所有版本,都只能通过一部分的图灵测试,而GPT4,很有可能是第一个,能够通过全部图灵测试的AI。这也许是一个质变。到时不仅能力提升,而且对模型的训练成本,也大幅度降低。它的商业应用,想象空间将更大。现在国内的一些大厂,已经开始跟进。比如,阿里准备做自己的类ChatGPT产品。百度也准备做自己的类ChatGPT产品,叫文心一言。
那么,在这一轮的技术中,中国公司的技术,大概在一个什么水平呢?新浪微博的新技术研发负责人张俊林做过一个分析,认为目前OpenAI,也就是ChatGPT的技术是最强的,大概领先谷歌半年,领先国内两年。
第二个重点是,既然这个技术进展这么快,这回谷歌的Bard为什么会出错呢?要知道,你的每一个提问,AI都会调动千亿级的参数运算做出回答。这很可能是因为,这一代AI的回答,普遍遵循一个原则,叫当前语境下的最佳选择。
什么意思?比如,网上有人做过测试,先问AI,你觉得《满江红》这部电影怎么样?AI回答了一大堆。然后又问,你是不是没看过《满江红》?回答居然是,我没看过,但我期待去看。
好多人一看,这打脸也太快了。没看过你瞎说什么?人与AI之间还能不能有点信任了?但事实上,这两次提问在AI看来,其实是两个语境。第一次提问时,你问的是《满江红》怎么样?AI会在它力所能及的范围里,搜索到它认为最可信的影评信息。而第二次提问,问的是它看没看过。它确实没看过。
因此,假如想让AI做出尽可能准确的回答,需要约束语境。用专业术语讲,叫给出足够的提示。比如,《满江红》怎么样?这个问题可以转化成,请你根据目前国内发表过100篇以上文章的影评人对《满江红》的评价,给出一个综合评价。但是,假如你没有看过,也告诉我你没看过。
你看,这个提示就非常完整。这时你获得的回答将是,我没看过,但是我结合了很多影评人的观点,可以告诉你《满江红》是一部怎样的电影。
从这个角度看,这回谷歌的Bard犯错,很可能是在被问到这个问题的时候,它搜索到了相关的支持这个回答的资料。可能是这些资料里有的难度很高,不适合讲给9岁的孩子听。而适合讲给9岁孩子的资料里,恰好有这么一条。说白了,这也许是它当时能做出的最好回答。至于具体是不是这么回事,谷歌还没有给出说法。
第三个重点,这一轮AI,到底对人有多强的替代性?首先我们得知道,这回不管是谷歌、微软还是OpenAI,他们训练机器人用的语料,都非常优质。普遍是新闻或者是专业文章。因此,这一轮AI的可靠性,是之前任何一代所谓的人工智能都不能比的。
至于它对人的替代性,在这里,我想引用一张图。这是机器人专家汉斯·莫拉维克提出的,叫人类能力地形图。
汉斯·莫拉维克人类能力地形图
这张图代表的,是人类职业被机器人替代的顺序。把人工智能比作洪水,从谷地到山峰,会一点一点被淹没。从图里能看到,象棋和围棋,已经沉了。翻译和投资,处在被淹没边缘。艺术和基础科学,距离被淹没还比较远。但是,这个过程中,有两个关键。第一,每一行的高手肯定不会被替代。第二,过程中一定有新职业诞生。这个道理不复杂,我们就不多说了。
最后,简单总结一下。第一,谷歌这回确实出错了,但对AI的发展几乎没有影响。第二,这一轮技术升级关系非常重大,它意味着人和机器最底层的交互方式将发生改变。机器将能够理解人的语境。第三,每一行的高手不会被替代,但是初级爱好者这一层,有被替代的可能。
再来看今天的第二条。我们说点轻松的。
春天来了,到了草莓大规模上市的时候。就在前几天,北京还举办了今年的草莓之星评选。有点像米其林给餐厅评级,草莓评级越高,说明质量越好。
但这毕竟是个季节性水果,没有草莓的时候,怎么办?很简单,有草莓味的食品啊。比如酸奶、蛋糕、冰激凌。但是,你想过一个问题没有。就是水果味的东西有很多,但味道的还原度却参差不齐。橙子、柠檬、柚子,还原度就很高,跟直接吃水果很像。但是,草莓的还原度就相对较低。
最近,我正好看到一个有意思的研究,是《好好生活事务所》上发表的,专门回答了一个问题,就是草莓味的食品,为什么这么难吃?其实也说不上难吃,但至少还原度,远不如柠檬之类的那么高。
那么,为什么好多人觉得草莓味的食品,味道不是那么好呢?
首先,是草莓味食品的原料,并不是草莓。因为草莓这个东西,没有皮。你看,我要想做橙子或者柠檬香精。好办,我可以直接用橙子皮或者柠檬皮啊。但问题是,草莓哪来的皮?除非直接用草莓。这个成本就太高了。因此,草莓香精只能靠人工合成,味道自然没那么天然。
说到这,你可能会说,人工合成,那不是更简单,只要我能分析出这个味觉的配方,人工还原不就行了。
事情没那么简单。首先,合成香精,主要靠一个职业,叫食品调香师。据说一个厉害的调香师,鼻子能分辨出上千种味道。而且要知道,我们平时尝到的味道,是嗅觉和味觉,共同作用的结果。因为舌上的味蕾,只能辨别基础的酸、甜、苦、咸,而鼻子里的嗅觉感受器就厉害多了,可以分析很多挥发性物质的气味,让我们感受到的味道更饱满。挥发性物质越多,这个东西就越耐品,比如咖啡有1000多种挥发性物质,茶也有600多种。你喜欢喝咖啡和茶,就是这个原因。
而食品调香师要做的,就是通过嗅觉,把草莓的味道分解。比如里面有多少甜味、多少果香,等等。然后,再针对每一种味道,找到一种香精,最后再把它们合成到一起。比如想要还原清香韵,就用反-2-己烯醛和叶醇。想要还原甜香韵,就用苯乙醇。还有己酸乙酯、草莓醛,都是常见的还原草莓香气的物质。
你可能会说,这不是挺科学的吗?怎么就还原不了草莓的味道呢?这是因为,草莓的味道,比别的水果要复杂得多。而且它的标志性气味并不强。你看柠檬,气味很强烈,一闻就知道。再比如菠萝、苹果、香蕉,气味都相对单一,标志性比较明显。
但是草莓,是香味物质最丰富的水果之一。一颗成熟的草莓里,有几十种挥发性物质。差不多每种味道,它都沾一点,但是又不强烈。这就难办了。你得在这么多种味道中找到一个微妙的平衡。这就是为什么,草莓的味道这么难以还原。因此,你看好多草莓味的东西,都一定会特地做成粉红色,在包装上加很多草莓元素。这就是在用视觉元素,弥补味觉体验的不足。
你看,既然这个味道这么难还原,趁着春天到了,还不赶紧多吃点草莓?
最后,总结一下,我们今天说了智能AI和草莓食品这两个话题。而关于这一轮的智能AI,我还在文稿里专门为你准备了一份节目清单。我们往期的相关讨论都在里面。假如你身边有人想对这一轮以ChatGPT为代表的AI技术,做个整体性的了解,只要一个转发就够了。
,