• 诺曼·温那斯基(Norman Winarsky)现任斯坦福研究院(SRI Ventures)顾问,前SRI Ventures总裁,Siri联合创始人及董事会成员。同时还是30多家企业的孵化人,涉及人工智能、自然语言处理、图像识别等领域。

  • 9月8日~9日,造就将在上海举办「REMIX·共享」大会。诺曼·温那斯基应邀将出席本次大会,并在主题为“向前迈进”的第五场活动中登台演讲。(点击文末“了解更多”可收看视频直播)

苹果最新的siri长什么样(苹果大会发布前)(1)

诺曼·温那斯基

在产品设计与完善的漫长过程中,通常会出现这样一刻:一位潜在顾客的反馈,帮助一项创造性事业冲出了迷雾。对于虚拟个人助理Siri来说——如今它已是iPhone不可分割的一部分——这一刻发生在2009年的一架航班上。

当时航班延误,我刚在飞机上落座,就听一位乘客问:什么时候才能抵达?作为当时Siri的几十名测试者之一,我掏出手机,对着手机问道:“Siri,美联航98航班预计何时抵达?”Siri随即报出最新抵达时间。

这时,那位乘客一脸惊奇。他说:“我只有一个疑问:你怎么在经济舱?你应该是亿万富豪才对啊!”

在那以前,我一头扎在企业的商业、技术、战略和财务挑战之中,对于Siri技术有多么酷炫,我竟浑然不觉。在一位陌生人惊诧的表情中,我才意识到:我们开发了一款了不起的智能手机应用,它能理解以自然语言提出的问题,并作出回答。我们即将把人工智能带给数百万消费者。

走到这一步,道路漫长,而且充满了意想不到的曲折。

死亡之谷

作为SRI Ventures总裁,我在SRI International负责部门的创建与分拆。SRI International创立于1946年,前身为斯坦福研究院,1970年开始独立运营。

我的工作很有意义。每一天,我都看着一批突破性技术的发展,这些技术有望使人们的生活更安全、更健康、更高效。

但发明与创新之间,横亘着一道死亡之谷。

这是创业界的一个常用比喻,因为多数发明未及面市就会夭折,要么是缺乏大规模的增长型市场,要么是不具备强有力的价值主张,抑或是缺乏完备的商业计划和充分的资源。

我的职责就是推动机遇,使之跨越这道死亡之谷。有时候,成功来得太突然,我们做梦也没想到。

Siri就是这样的一次突破。

苹果最新的siri长什么样(苹果大会发布前)(2)

引出Siri的那个市场洞见缘起于2003年,当时,手机的主要应用程序还仅限于铃音和短信。我们认识到,随着手机功能日益强大,终有一天,每个人的口袋里都会有一部会交流的超级计算机。而且我们认为,面对这种不可避免的技术以及随之而来的市场变革,SRI International很适合充当领导者角色。

我们组建了一支团队,命名为Vanguard,专门开发市场概念。一些早期概念是为智能手机引入智能,用户可通过文本或语音让手机执行任务,比如安排多方通话、拨打电话,或是订购日用品。

在Vanguard团队组建前后,美国国防部高级研究计划局(DARPA)赞助了一个1.5亿美元的项目,旨在开发一种“认知型”软件助理。这个DARPA项目的一些概念启发了Vanguard,最终促成了Siri的诞生。

后来的四年时间里,我们都无意创建一家独立运营的企业:我们谈了有几十家电信运营商和手机供应商,目的是启动一个合资项目,授权我们的技术,并在商业领域部署我们的智能助理。

结果发现,这样做难度很大。反对声不绝于耳:

  • 不可能:要实现这种技术,还得等上20年

  • 太贵了(我们开出的条件是500万-1000万美元的开发经费,外加许可费用)

  • 不符合我们的商业模式

  • 初期无法带来收入

  • 我们自己就在做这个

最后,只有几家公司与我们开展了合作,而且仅在很小程度上实施了我们的想法。不过最终,我们还是决定从SRI内部独立出来,创建一个全新的产品类别。

四大元素

几乎每天,SRI的商业与技术主管都要碰头,讨论市场与产品的各种可能性。我们知道,成功需要四大主要元素:

  • 一个针对重大问题(或称痛点)的解决方案,该方案要能适应市场的快速增长

  • 一项能傲视群雄的差异化技术

  • 一支拥有出色执行能力的团队

  • 一份表明企业战略与价值的价值主张和商业企划

四者缺一,成功的概率都几近于零。

我们也深知,能用来进入市场、拿下市场的时间和资源都是有限的。时间一长,资金就会耗尽,竞争者也会蜂拥而起。

痛点

团队用几个月时间,锁定了市场机遇所在:智能手机各项任务所需的键盘点击操作,实在让人觉得麻烦。(2007年那会儿,在智能手机上点击操作,尚未成为顺理成章之事。)市场调研发现,每次要从屏幕一边点到另一边,就有20%的人会放弃打开某个应用,或是放弃购买意图。

Siri背后的突破性理念简单而又强大:相对于搜索引擎而言,Siri将是一个语音驱动的“任务引擎”。它可以理解你的请求,自动访问所需信息,并从中提炼出一个答案。

所有麻烦都从用户那里转移到了Siri身上——它将成为一个虚拟个人助理,只需一两次点击,就能帮人们购买球赛门票,向餐馆订位,播报天气,或是找到可看的电影。

差异化技术

苹果最新的siri长什么样(苹果大会发布前)(3)

即便已有几十年的发展作为基础,解决痛点所需的技术依然很难实现。将语音转化为数字文本尚属简单:SRI 1994年发布的Nuance,在语音解决方案领域处于世界领先水平。

难的是分析语句,理解用户意图,然后进行推理,作出响应。计算机必须辨别概念,并将相应的词语与之联系起来。大多数人认为,这种对人类而言轻而易举的任务,对计算机来说是不可能实现的。

用技术理解自然语言,这一任务的实现离不开SRI 语音技术与研究实验室以及SRI人工智能中心的DARPA合作项目,研究资金来自SRI的内部投资。

亚当·切尔(Adam Cheyer)和迪迪埃·古扎尼(Didier Guzzoni)负责具体实施过程,使Siri来到数百万人的手中。在近二十年的时间里,切尔作为SRI最富远见的计算机科学家之一,设计并实施了委托计算和“基于代理的系统”,使得人类能够与网络程序及设备互动。他和自己的博士生古扎尼一道,设计出了自然语言理解与推理的途径,简化了响应难度。

团队

我们有幸招募到优秀的创业者达格·基特劳斯(Dag Kittlaus),来担任新企业的CEO。切尔选择离开SRI,加入新企业。几个月后,智能用户界面领域的杰出创新者汤姆·格鲁伯(Tom Gruber)加入,成为首席技术官。

SRI信息与计算机科学总裁比尔·马克(Bill Mark)和我是另两位创始人。我俩留在SRI,我成为新企业董事会的一员。

苹果最新的siri长什么样(苹果大会发布前)(4)

价值主张

之后的六个月内,进入视线焦点的是整体价值主张:我们将以一款强大的产品,为数百万消费者解决一个重大难题,并由此催生数十亿美元的营收。

具体而言,Siri能解决点击次数过多的麻烦;它能节省人们的时间与精力;它能通过语音识别、自然语言理解和人工智能,提供一种差异化的突破性技术;它能提供“杀手级”应用;为消费者带来惊喜与欢乐。

我们确定了Siri的商业模式:协助网站销售产品或服务,从中收取费用。我们认识到,Siri能为酒店、餐厅和航空公司带来潜在顾客,由此产生的营收或许非常可观。

2007年底,对价值主张精心打造了六个月之后,我们决定为分拆出来的企业寻求外部投资。我们知道,找到投资方很难,因为Siri要想成功,市场与技术都要取得突破才行。很多风投都见识过AI炒作与现实之间的落差,因此疑虑重重。

对于我们价值主张和商业企划的每一个细节,包括市场、技术和竞争对手,他们都充满了顾虑。

  • 我们能否培养出庞大的消费者群体?

  • 智能手机的处理能力能否跟上?

  • 这种AI技术好用吗?

  • 通信与处理速度会不会太慢?

  • 基于潜在用户开发的商业模式能否带来足够的营收?

  • 谷歌、微软等潜在竞争者会不会很快推出类似的产品?

最终,这些顾虑只能说是得到了缓解,而无法彻底消除。Siri毕竟是一项大胆的高风险投资。凭借其颠覆性的技术——它是全球几大趋势融合的结果,包括智能手机的崛起,计算能力和存储能力的提高,通信速度的加快,网络服务与界面的发展,以及新型AI系统的开发——它显然会对移动产业造成冲击。时机已经成熟。

我们筹集到了850万美元——足以维持18个月的运营。不过,融资为我们带来的,远不仅仅是资金。有勇有谋的投资人成为了我们的合伙人,帮助我们确立商业模式、发展战略,构建用户关系,不一而足。

我们依然面临诸多挑战:由于服务器-用户的响应速度缓慢,加之语音识别技术的问题,项目耽搁了半年之久。与此同时,谷歌等企业也在研发自己的产品,并且进展迅速。一些公司向我们表达了收购意向。与供应商和网络服务公司的合约条款十分复杂。无线运营商带来的机遇也削减了最初产品的势头。

苹果最新的siri长什么样(苹果大会发布前)(5)

真的是乔布斯

最终,经过2009年11月至2010年2月的用户测试期(我在飞机上炫耀Siri就是那个时候),我们已经准备好在苹果的应用商店中上线了。(“Siri”与“SRI”虽然在拼写上十分相近,但这纯属巧合。这个名字是各方面综合考虑的结果,包括它只有四个字母,而且在任何语言中都不带负面含义。)

我们备妥了Scobleizer、TechCrunch等网站上知名博主的演示与测评。演示大获成功,经过媒体宣传,消费者表现出了浓厚的兴趣。免费提供的Siri被疯狂下载,一下子就跻身苹果商店所有应用前50名,在生活方式类应用中,更是排名第一。

苹果最新的siri长什么样(苹果大会发布前)(6)

上线两周后,CEO基特劳斯接到了一个意想不到的电话:“你好,我是史蒂夫·乔布斯。”

基特劳斯以为是恶作剧,径直挂了电话。接着,电话再一次响起。

“真的,我真是史蒂夫·乔布斯。”

没错。两人攀谈起来,乔布斯说,Siri如此成功,他要祝贺基特劳斯。随后,他将基特劳斯、切尔和首席技术官格鲁伯请到自己家中,一起讨论了Siri的技术。

乔布斯了解这种AI的价值和这种技术的本质,他也明白,在自然语言识别等过程中,错误在所难免。但他并没有因此退缩。这有些不可思议,要知道,几乎所有苹果产品都是“为完美”而生的。

之后几周,乔布斯和基特劳斯商定了Siri的收购价。当时,我们并不急于出售,因为考虑到试水成功,外加新谈成的分销合约,这项业务的价值上涨几乎是板上钉钉的事。但乔布斯开出的条件令投资人和管理团队都无法拒绝。(由于合同约束,价格无法披露。)此外,与乔布斯和苹果共事的机会,也吸引了整个团队。

一年后,iPhone 4S面市,Siri成为了一项热门服务的核心平台。2011年10月4日,苹果全球营销副总裁菲尔·席勒(Phil Schiller)在推介Siri时,称之为“iPhone 4S中最酷的功能”。

翌日,史蒂夫·乔布斯去世。他是看到产品演示后才走的,这一点让我感到一丝宽慰。在iPhone 4S发布后的最初几周,分析师报告称,Siri将帮助苹果以更快的速度实现数十亿美元的销售额。至今,Siri仍是苹果所有iOS设备中的核心元素之一。

苹果和其他诸多企业,包括SRI在内,都在争相开发既能推进技术、又能服务于新市场的产品。努力的余地非常之大。语音和自然语言识别以及机器学习尚处在初始阶段。在词语与语言理解方面,新的虚拟个人助理将更胜一筹。它们能保留语境,使真正的对话成为可能,同时研究用户习惯,并帮助消费者访问健康记录、银行账户等信息。

虚拟个人助理的未来已然来临,这一点无需置疑。

翻译:雁行

来源:hbr

造就:剧院式的线下演讲平台, 发现最有创造力的思想

9月8日~9日,造就「REMIX·共享大会」现场,你将看到科技的力量如何搭建起共享的基石;引领创新的弄潮儿们如何绽放商业的火花;而共享社会的到来将如何引导文化和生活方式的变迁。

(点击文末“了解更多”,收看Siri之父的演讲直播)

,