#本文为人人都是产品经理《原创激励计划》出品。

提到语音助手你会想到什么?是小爱同学、天猫精灵、亚马逊Alexa、还是蔚来NOMI?想必对于你来说,车载语音也不陌生。语音识别技术的发展日新月异,如今的我们,只要唤醒语音助手,就能实现一系列的操控指令,满足我们身处驾驶舱内的需求。

语音交互优势场景设计图(车载语音之形象设计别有洞天)(1)

一、VUI概念解读

1. VUI释义及简史

VUI(Voice User Interface)意为语音用户交互界面,可以解释为计算机或移动设备上的语音控制应用程序。其发展历史大概可以划分为两个阶段/时期。

VUI第一个时期的出现标志是交互式语音应答(Interactive Voice Response, IVR)系统的诞生,IVR系统可以通过电话线路理解人们的谈话并执行相应的任务。

比如:我们拨打移动通信运营商10086或10010时,可以与出现的语音客服系统直接沟通,继而查询话费或套餐业务。语音客服系统除了在移动通信运营商中广泛应用,各类航空公司、银行、酒店也纷纷普及。

我们现在所处的时期是VUI的第二个时期。现今市面上存在Amazon Echo、小米智能音箱、天猫精灵等语音助手,其部分型号仅能提供语音信息,与此同时,Siri、Google Now、Cortana等综合了语音和视觉信息的App也同样占据市场份额。

在我们所处的第二时期,虽然很多事情已经可以被当前的语音助手处理,但同时还有很多事情语音助手无法完成,所以目前我们同时也处于下一阶段的初期,可以尽情期待VUI发展的未来:当我们开着车行驶在路上,驾驶舱内的车载语音助手根据我们每个人的喜好主动告知我们哪里的商场今天正在进行打折,哪家罗森目前还能买到经常断货的小蛋糕;又或是当我们情绪不好,主动做出缓解我们情绪的行动或提供建议。

2. VUI设计师的工作内容

一如互联网UX设计师专注于用户和App/手机之间的流畅体验一样,VUI设计师专注于与用户和语音程序之间的交互体验。

《语音用户界面设计》一书中这样说道:“VUI设计师思考的是在系统和终端用户之间从开始到结束的整个对话过程。他们思考正在解决的问题以及用户需要什么来达成他们的目的。”

VUI设计师的工作流程与UX通用设计流程类似,同样包含:用户研究、角色创建、原型设计、用户流程创建、可用性测试和迭代设计。

但VUI设计和界面设计有很大的不同,语音交互设计师必须考虑语音的复杂性,需要了解人们对声音的情感反馈和不同声音之间的区别,涉及心理学、社会学、语言学等领域。

总结来说,VUI设计师的工作内容分为四个部分,依次分别是:用户研究、设计阶段、场景数据收集、迭代优化。

语音交互优势场景设计图(车载语音之形象设计别有洞天)(2)

二、车载语音形象

没有人格的语音用户界面是不存在的。

——Cohen, Giangola and Balogh , 2004

正如Cohen, Giangola 和 Balogh 在《语音人机界面》中所说,如果你不给你的VUI设定人格化特征,那么你的用户就会(脑补)。所以更好的做法是,我们在设计的初期就确定好自己的VUI人格。

好的VUI体验,本质上就是一次好的交谈。而一场好的交谈自然离不开交流的对象、内容、语气、音色等复杂性因素。车载语音形象可分为可视化部分(视觉部分)和听觉部分。在大多数车载语音里,车载语音视觉通道是车载语音听觉通道的理想载体,二者相互结合,相辅相成。

语音交互优势场景设计图(车载语音之形象设计别有洞天)(3)

1. 语音视觉形象

1)车载语音视觉形象类型

语音形象分为传统型(具象型)、抽象型、拟人型。

语音交互优势场景设计图(车载语音之形象设计别有洞天)(4)

移动端手机、家庭音箱类语音多为抽象型形象,新势力车多为拟人型形象,概念车多为传统型形象。

这三种类型类型之间有分界线,但也会有一些融合。下面,我来介绍一下三种类型的具体特征和例子。

① 传统型(具象型):二维、扁平、颜色简单、动效简单、声音波型 、麦克风造型。

语音交互优势场景设计图(车载语音之形象设计别有洞天)(5)

② 抽象型:三维、形状不规则、色彩丰富、流动感、光效、球体、炫酷(例:Google语音助手Cortana)。

语音交互优势场景设计图(车载语音之形象设计别有洞天)(6)

③ 拟人型:卡通、五官明显、表情丰富、IP化、生动活泼(例:小鹏语音助手小P)。

语音交互优势场景设计图(车载语音之形象设计别有洞天)(7)

2)车载语音视觉形象风格演化

语音交互优势场景设计图(车载语音之形象设计别有洞天)(8)

车载语音视觉形象风格由传统型向抽象型/拟人型演化。

通过下图Siri的视觉变化过程图,我们能够明显看到Siri的视觉形象由一开始的拟物化麦克风造型,逐步变为抽象型的伴随着光效变化波动的圆。Siri是一个典型的由传统型向抽象型演化的例子。

语音交互优势场景设计图(车载语音之形象设计别有洞天)(9)

3)视觉类型占比

通过下图我们可以看到传统型、抽象型、拟人型语音视觉形象在移动端和车极端的大致占比。

可以发现:在移动端目前占比最高的是抽象型视觉形象,在车载端,目前占有最高比例的是传统型语音形象,随着新能源车占有比例升高和科技的发展,这一数据也会在未来随之变化。

语音交互优势场景设计图(车载语音之形象设计别有洞天)(10)

拟人化的视觉形象是VUI的常见表现形式,但不是所有的VUI都需要拟人化视觉设计,比如Sir和Cortana的视觉形象就是一个活动的发光的圆圈。对于一个好的语音交互来说,拟人形象并不是必不可少的条件。

4)语音形象的多样性

语音形象不仅限于展示语音的基础状态(唤醒聆听态等),同时也体现播报态语音形象的多样性。拓展方向为:

  1. 语音形象与不同形象结合;
  2. 语音形象与不同情绪、个性化(如生日)结合;
  3. 语音形象与不同智能场景结合(天气、小憩模式)。

2. 车载语音形象设计流程

语音交互优势场景设计图(车载语音之形象设计别有洞天)(11)

车载语音形象设计流程包含人格特征、表现层、基础状态、声音设计几个方向,每个方向又包含若干设计模块。

  • 表现层:形象设计、动效设计、颜色、表情;
  • 声音设计:音色、语调、语气、话语节奏;
  • 基础状态:识别解析、唤醒聆听、结果反馈。

3. 如何得到语音的人格特征

当我们着手VUI设计时候,我们需要得到符合自己项目品牌的语音助手人格关键词。

我们可以在公司内部开展workshop或去品牌4S店进行调研,得到语音关键词,再根据用户的使用场景逐个分析推导。VUI设计师创造的听觉形象需要符合自身产品属性。

语音交互优势场景设计图(车载语音之形象设计别有洞天)(12)

4. 语音听觉形象(两组调研)

普罗大众喜欢什么样的语音听觉形象呢?此处我们来看两个国内外团队的研究结果。

第一份是来自于百度智能驾驶团队投放在百度地图活动专区的的调研结果,来自于3745份有效样本,该团队将听觉形象细分为基础属性、性格特质和声音特质三个维度,根据三个维度的调研喜爱结果,组成了四种具体语音形象,分别是:甜美女生、温和御姐、活泼女孩和爽朗男性。

根据其调研结果,在基础属性中,喜欢女性声音形象的人占据最多的人数,大于80%的用户青睐18-32岁的偏年轻的语音形象。超半成的用户希望语音产品成为自己的助手,低于半数的用户希望语音产品为主播/主持形象。

语音交互优势场景设计图(车载语音之形象设计别有洞天)(13)

在性格气质层面,用户偏好活泼、开朗的多血质形象(依据心理学体液气质理论)。

在声音特质方面,用户更喜欢甜美的音色和随和亲切的语气。其次稳重、细腻的性格特质也被多数用户所喜欢。

语音交互优势场景设计图(车载语音之形象设计别有洞天)(14)

看了百度智能驾驶团队有趣的调研结果,再让我们看一下德国Michael Braun博士团队的调研思路。

前期研究阶段:Michael Braun设计了8种语音助手人格,包含“主导 / 顺从”和“敌对 / 友好”几个人际交流间的基本维度,并在 6 个驾驶场景(3 个与驾驶相关,3 个与娱乐相关)下,邀请 19 名非 HCI 专业人员分别与 8 名助手进行对话,了解他们对语音助手人格特征的需求偏好。

基于以上研究,Michael Braun对语音助手的人格特征设计进行调整,设计出 4 种新的人格模型,分别为朋友、倾慕者、阿姨、仆人。

语音交互优势场景设计图(车载语音之形象设计别有洞天)(15)

现实场景驾驶实验:实验共邀请了 55 名年龄在 23-60 岁的被访者者,其中有 45 名男性和 10 名女性,被访者中超过一半的人在日常生活中使用过语音助手。

被访者驾驶中级轿车在慕尼黑的某路段上开始测试,按照驾驶场景的顺序,被访者者分别与匹配到的个性化助手和默认人格助手交互完成两次驾驶实验。在每次驾驶实验后,被访者口头评价本次交互体验的好坏。

实验结果分析:在用户与助手人格匹配过程中,55 个被访者里有 21 个与朋友人格匹配,16 个与仆人人格匹配,15 个与阿姨型人格匹配,3个与倾慕者人格匹配。

结论:

  1. 语音助手人格与用户个性的正确匹配至关重要,如匹配到适合自己的助手人格时,能够获得更高的满意度和喜爱度,相反则容易引起不满。
  2. 非驾驶场景下(如娱乐场景),用户更喜欢适合自己的个性化人格;安全相关驾驶场景下,默认人格更受青睐。

语音交互优势场景设计图(车载语音之形象设计别有洞天)(16)

习典有言:“履不必同,期于适足。”意思就是说,每一个人的鞋子大小不必相同,关键是要适合自己的脚。

语音听觉形象亦是如此,适合用户的,才是最好的。每款汽车都有自己的用户定位,作为VUI设计师,应当根据自己产品的用户人群,来选择最合适的语音人格调研方法,才能得到最适合的语音听觉形象。

此外,可能会有同学好奇,语音助手声音是如何合成的

方法之一是找声优录上百条关键话术,根据声音的关键信息,提取出来,然后合成的。

三、谨防用户“跌落恐怖谷”

当用户在使用语音助手的时候,容易触发一些不良体验,例如:恐怖谷状况。我们在进行VUI设计时,要避免陷入这一境地。那么,什么是恐怖谷理论呢?

恐怖谷理论:

语音交互优势场景设计图(车载语音之形象设计别有洞天)(17)

恐怖谷理论由日本机器人专家森昌弘在1970年提出。恐怖谷理论的解释为:当我们看到一个和人类极为相似但不完全相像的事物时,我们会由衷地感到恐惧。例如上图中位于谷底的僵尸,虽然同为人类外形,但本质大有区别,于是引发我们的恐惧。

避免恐怖谷状况的方法之一是在我们的设计中减少人类特征设计,或者使用卡通/动物形象。

四、结语

未来已来,将至已至。脑机接口、元宇宙,各类新名词充斥着我们的生活,科技的发展速度超乎想象。

语音技术亦是如此,各家公司持续迭代自己的语音系统,针对下一个世代的智联网进行布局。我们应做好准备,迎接智能时代新的设计挑战。

References

  • 《语音用户界面设计:对化式体验设计原则》
  • https://zhuanlan.zhihu.com/p/78890262
  • https://www.researchgate.net/profile/Michael-Braun-20
  • https://zhuanlan.zhihu.com/p/78890262
  • https://mp.weixin.qq.com/s/8Y8vj4NCeIJ2Oq5dWX626Q

作者:刃鱼;公众号:HMI设计马克笔

本文由 @刃鱼 原创发布于人人都是产品经理,未经许可,禁止转载。

本文为人人都是产品经理《原创激励计划》出品。

题图来自Pexels,基于CC0协议

,