车载设计万字干货！超全面的 HMI 「语音设计」基础知识科普

前沿：

开头必须来一句，我相信语音一定是未来，我非常确认

这篇 HMI 的语言探索以介绍语音交互内容为基础，结合我的实际工作项目经验，输出总结关于语音设计的内容，最后结合案例，在对话设计中会进行深度的探索，并提出个人的想法和思路，因为有的时候深度去思考觉得我们项目还可以有很多优化的点。

进入我们今天的正题。

在说语音交互之前，先给大家讲一下题外话，关于人机交互（Human Computer Interaction）简称 HCI，可能日后我想去攻读这个硕士学位，简单来说就是指人与计算机之间通过使用某种对话语言，以一定的交互方式，为完成确定任务的人与计算机之间的信息交换过程。

车载设计万字干货！超全面的 HMI 「语音设计」基础知识科普

语音助手最初的载体是手机 APP，通过与用户之间的对话方式，能够帮助用户来解决问题的，随着我们现在人工智能的研发技术不断发展，包括让机器学习，语音识别、图像识别、自然语言处理、智能搜索等一系列。语音交互运用的很普遍了，不仅仅只是智能手机，现在涉及到的领域是越来越多了，如智能家居、汽车、可穿戴设备、就连商场普遍也有机器人语音对话。

车载设计万字干货！超全面的 HMI 「语音设计」基础知识科普

HMI 语音介绍

我这边就不打算讲语音的发展历史了，不然又是水了一大堆内容，我可是一个讲干货的小作家呢，如果我的小粉丝们需要的话，就私信我，我会在微信公众号更文。

语言是传递信息重要方式，对于我们用户来说，语音交互也是学习成本相对较低、容易掌握的，语音交互设计简称为 → VUI。

新能源汽车不断的发展，智能车载系统也是我们最看重的。随着语音交互的的普及，语音识别开始走入人们生活，凭借其实用性和准确性得到了用户的认可，因此在发展的过程中摒弃了传统的、繁杂的手动操作，提高安全驾驶属性和更高效的处理问题的能力，但是，在现阶段的新能源汽车发展过程中还不能完全替换掉手动操作。

车载设计万字干货！超全面的 HMI 「语音设计」基础知识科普

现在为什么用户在驾驶车的过程中，还是不会常用到语音交互，首先提到的就是用户习惯，根据数据调查，在使用语音交互的人群中，年轻人占了主力军，其余年龄段的人由于常年驾驶都是通过硬按键来操控车内空调、电话、音乐、电台、内置导航。其实就算是苹果手机中的 siri 都很少用到，在使用初期因为技术的不成熟，再加上冰冷的对话方式使得用户不对这个买单，像我现在生活中，用到的 siri 频率也会很少，最多就是定一个闹钟，app 实在找不到就会使用到，还有无聊的时候和他进行无聊的对话，嗯就这样子。

车载设计万字干货！超全面的 HMI 「语音设计」基础知识科普

国内做语音头部公司有我们熟悉的科大讯飞，还有和多家车企合作的思必驰、云知声，对内服务的百度，搜狗，腾讯，阿里这些大咖都有自己的语音技术。

车载设计万字干货！超全面的 HMI 「语音设计」基础知识科普

再讲一下语音的基础原理内容，这一块比较难懂一点，首先你要说出你需要解决的需求、要处理什么事情，通过车载系统设备收到指令的语音 → 自动语音识别 (ASR) → 将指令转化为文本 → 自然语言处理 (NLP) → 了解用户需要解决什么问题 → 通过Skill （普及一下知识：Skill 是一种程序的语言，有notepad++，UltraEdit等，好了不啰嗦了） → 将处理好的结果处理成回复文本 → 最后再通过TTS 播报形式 → 形成回复音频 → 通过车载系统回复给用户解决结果，听起来是不是有点复杂了，我相信我是全网说的最细的了。

车载设计万字干货！超全面的 HMI 「语音设计」基础知识科普

如何去定义一个产品的语音的好坏？我觉得吧，能够让用户对于这个语音系统的满意度达到一个高标准，首先能够让系统能够听懂你所说的内容，并且给出相对应的解决方案，语音系统运用的简而易用即可，如何做到以上的要求，我会在下面对话设计中会着重讲解深挖的。

车载语音交互（VUI）基本原则

车载场景下的语音交互核心基本原则有三点：

1. 首先是安全

驾驶过程中，司机的眼睛、耳朵和手占据了大部分多任务操作，如果一些功能还需要通过眼睛和手来操作的话，会降低安全驾驶的系数，所以车载语音交互更有助于辅佐司机安全驾驶，减少注意力的分散。

车载设计万字干货！超全面的 HMI 「语音设计」基础知识科普

2. 其次是便利

语音交互设计之初，一定要考虑便利、快捷，尽量的减少每一个任务的对话次数、快速响应、将对话流程简单化，从而打破 VUI 对于用户的一个心理障碍（便利这块内容我会在后面对话设计中着重讲解）。

车载设计万字干货！超全面的 HMI 「语音设计」基础知识科普

3. 最后是愉悦

为什么要谈到愉悦，因为市场上最初的语音对话交谈，都是冷冰冰的，几乎没有情感可谈，像极了和机器人对话，并且有的时候无法处理任务就会说，超出能力范围，这是一个很不好的用户体验。现在市场上可以看到，导航软件也有语音包可以选择，这也是增加了情感化设计，这是其中的一个点。还有一个小点就是自然的对话交流，很流畅的完成用户提出的每一项任务，尽可能的规避对话中的错误，让整体的对话过程达到一个愉悦的感觉。

车载设计万字干货！超全面的 HMI 「语音设计」基础知识科普

用户语音的目的

用户在语音交互的时候，绝大多数都是带有明确指示任务指令的，也有可能是闲聊状态。

1. 任务状态下：

任务式对话中，用户需要尽快的得到想要反馈和解决方案，并且快速的完成，此类任务的反馈要求还需要清晰、简单明了。

2. 闲聊状态下：

我们经常也会问 Siri 一些无聊的问题，比如：“siri 给我来一段 Rap” 通常这类的任务带有的目的性不是很强，但是对于趣味性要求会高。

车载设计万字干货！超全面的 HMI 「语音设计」基础知识科普

市场现状（VUI+GUI）

语音是最舒服的交互形式，但是他不能完全取代 GUI，相互协作才是更佳的方案，所以现在市场上的车载系统大多数都是以语音（VUI）和图形用户界面（GUI）相组合的，也有少部分车加入其他交互方式譬如手势交互。

车载设计万字干货！超全面的 HMI 「语音设计」基础知识科普

语音与图形的交互是交叉处理，从而形成了多模，多模态在我第二篇文章也有讲到，第一次看我文章的同学们可以回顾一下，用户在对车载系统发送一个指令的同时，设备会有多种的反馈方式，首先你可以听到系统虚拟形象给你做出回答，其次你看到图形界面的变化，举一个例子，你说：“我要听周杰伦的七里香”系统就会处理讲页面跳转到音乐界面，并且播放周杰伦的七里香，如果声音小了，你可以说：“声音大一点”

车载设计万字干货！超全面的 HMI 「语音设计」基础知识科普

大家是不是发现一个问题呀？我在前面说系统首先会做出回答，然后界面才会发生变化，但是实际情况，系统语音形象没有做出任何多余的回答，而是直接听取到用户的需求，直接反馈出结果，播放了周杰伦的 #七里香#，这就是我准备在下面会重点讲到的“对话设计”

在说对话设计之前，我们先了解一下 VUI 设计师，想必大家头一次听说，还有语音（VUI）设计师嘛，国内不太注重培养 VUI 设计师，大家可以去招聘平台搜索一下语音交互设计师，很少有公司专门针对这个职位去招聘的，就算有，也是招聘算法等研发岗的职位，VUI 设计师的工作任务一般都是公司的产品经理或者交互设计师代劳了，这会肯定就有产品经理或者交互设计师想出来吐槽了，哈哈哈

车载设计万字干货！超全面的 HMI 「语音设计」基础知识科普

语音交互方式给用户听和说两个动作，相信大家也有听过 7±2 法则，因此在听到的信息设计发面需要考量，因为用户听到一遍内容之后就消失了，除非这款车机语音系统，有再次复述上一段话的功能，不然在语音设计的时候，千万不要让用户产生的认知负荷，更不要挑战用户的短时间的记忆力，最强大脑除外，我们大多数人可不是什么最强大脑是不是。再次强调一下，就算拥有复述这个功能，也要注意设计的语音内容，该功能点只是加分项而已，不能打破底线，将语音设计的原则抛之脑后。

几乎所有设计师都在用的7±2法则到底是什么？

了解 7±2 法则，并应用到日常设计中可以准确的传递主体内容，并使用户对其产生一定的印象。

阅读文章 >

车载设计万字干货！超全面的 HMI 「语音设计」基础知识科普

VUI & GUI 的优缺点

再分析一下图形设计（GUI）和语音设计（VUI）之间的优缺点，那我们先从优点开始说起。

车载设计万字干货！超全面的 HMI 「语音设计」基础知识科普

(1)前面我们有提到 VUI 只需要听 and 说，而 GUI 则需要触控屏幕内容，在效率和安全方面没有 VUI 好，触控操作比语音操作要相对会慢，语音交互方式中驾驶者无需离开方向盘。

(2)在对于整套车机系统而言，GUI 学习的成本远高于 VUI，因为 VUI 只要会交流即可，无须像 GUI 一样学习触控交互手势、在哪里点击等一系列问题。

(3)还有一点，图形设计是一种已经预设好了操作路径和交互方式，页面之间存在这层级交互的基本关系，用户需要根据指定的操作进行，而 VUI 则突破了 GUI 的限制，交互更快捷了，举个例子：“导航去虹桥机场”，VUI 则一步到位，而 GUI 首先需要找到导航应用的入口，然后再点击搜索输入框，输入#虹桥机场，确认完毕之后，再点击导航，我的天呐我写的都很烦了，说真的还不如语音一步到位呢。

说完优点后，我们在反思一下 VUI 还有哪些没有 GUI 做的好的点.

车载设计万字干货！超全面的 HMI 「语音设计」基础知识科普

(1)语音交互涉及到 3 块内容，语音识别，识别用户所说的内容，其次语言理解，这边会关乎到方言理解的问题，毕竟我国语言博大精深，难以参透哈哈哈，最后是语音的合成，这三块内容如果有一块出了问题，最后反馈的结果可能并不是用户想要的答案。而图形设计有这统一的执行操作指令，不会出现什么 bug 问题，如果有，那肯定就是这款车机在测试的时候测试人员遗漏的问题，可以投诉。

(2)整套车载的 GUI 设计都会有一套严谨的操作逻辑，有明确的信息分布和页面的层级关系，但是 VUI 的功能不可见（除非你看那个使用手册，哈哈哈哈哈）所有的场景 VUI 都需要去探索，在引导性方面会弱很多，所以在买车的时候抓住销售员使劲的问哈，毕竟你花了一大笔钱来买车了，在试驾的过程中也要多去询问，就先点到这里了。

(3)GUI 是可以全场景交互，不限制于任何场景，而 VUI 则会受到的场景因素较大，有较多场景中不适用语音交互，最直接的就是设置中的内容。

(4)语音设计对于用户的一个记忆力是一个考验，如果一个很长的 TTS 反馈，用户不知道哪里才是自己所需要的信息，因此在做 VUI 设计的时候尽量简短高效的句子，而 GUI 信息都会呈现在页面中，所以这个点要相对优胜于 VUI 了。

总结一下

以自然交互为主的，声音，显然是最自然的交互形式，但不能完全取代图形 GUI，而是更好的协作，尽量减少界面的形式设计，加强情感化的交互形式体验，将智能化更好的融入到车载系统中去，让每一位用户能够更好，更便捷，更安全的驾驶着汽车，是我们全体设计师的初衷。嗯，感慨了一下。

想用一个成语总结一下：相辅相成，就是这个意思

语音设计需要考虑几个要点

1. 一定要想好从哪里开始，到哪里结束

我们首先假设一个场景，调节空调温度的语音设计，那 VUI 设计师需要将这个场景的对话要贯穿该流程中去，那接下去要考虑这段对话可能出现的任何状况，以及相对应的解决反馈内容，再第二点设计 VUI 语法中，我给大家演示一下空调全方案案例。

车载设计万字干货！超全面的 HMI 「语音设计」基础知识科普

2. 设计 VUI 语法

语法就是用户输入给机器的指令，VUI 的设计师需要了解对话设计的意图，尽量要考虑用户可能表达的所有方式，将最常用的表达方式提取出来，作为指令的模版，当然越多越好，这样给用户体验带来的感受会更好，能够解决用户的问题概率也会提高，别到时候语音助手反馈：“已经超出我能力范畴 or 您换个说法试试”，我一听到这些就炸毛了，后面就不可能再去使用它了，因此 VUI 设计师一定要多考虑一下指令。语法我会在我工作实际案例有特别详细的讲解（在实际案例篇幅 - 使用语音场景分析里面），这个特别重要，大家要细细的品。

车载设计万字干货！超全面的 HMI 「语音设计」基础知识科普

3. 空调案列分享：

用户一开始的输入指令可能有 “打开制冷模式”、“打开加热模式”这些都会有点官方定义的语法感觉会很正式。

下面再延展一下用户轻松的说辞 “我有点热了帮我开一下空调”、“今天太冷了，车温度好低啊” 其实用户的说法有很多，但是空调的模式就这么几种，所以需要抓住关键词 #热、#冷、#高、#低 ...，什么意思呢？因为这些关键词是起到决定性因素的内容，其他的修饰词语可能会千变万化，所以语音助手一旦检索到该词汇，就可以做出判断，到底是制冷、还是制热、还是通风等功能。先简单就介绍这一个，后面还有很多案列，大家好好看奥。

4. 如何设计好回答用户的问题

在语音基础介绍中也有提到过 TTS，他是语音交互中最主要的回答方式，就是将 VUI 设计者撰写好的对话设计脚本，通过 TTS 转化为语音去播报。回答能够给用户带来最直接的感受，回复是好是坏，会直接影响到这款语音产品的体验，想要设计好我想谈两个大方向，设计脚本尽量简洁明了，全局系统语言特点保持统一，后续有案列可以叙述讲解的。

国内外语音设计差异点

国内的语音设计和国外也会存在差异点的，首先是地方语言的差异，国内语言多达 80 种以上，汽车智能语音在方言这一块相对堪忧，能够支持的方言相对较少，这也成为了中文语音识别的一个难题。

在设计语音之初我们就得定义好，需要支持哪些方言，比如粤语、河南话、四川话等，现在的车载版本微信可以支持 20 多种方言，但是整体的车机系统可能难以做到这一点，这块内容是需要攻克的一个壁垒，据我查看国外报道，关于方言解决方案，宝马、三星和松下三家公司与语音识别公司 Nuance 合作开发新智能辅助技术，这项技术使得汽车语音系统在处理特定的方言时，可以更加容易。

车载设计万字干货！超全面的 HMI 「语音设计」基础知识科普

还有一点就是中西方语言文化差异，那就举一个例子，单从一个社会礼仪就可以展现出两者之间的差距，国人路过遇见熟人总爱嘘寒问暖 “吃饭了吗？”、“到哪儿去”、“最近怎们样呀？”等，在我们看来，这是一种有礼貌的打招呼用语，但你要跟西方人这样打招呼 “Have you had your meal?”、“Where areyou going? ”，他们则会认为，你想请他吃饭，或者干涉其私事，会引起误解，而西方人见面通常打招呼 “Hello”、“How do you do! ”、“Nice day, isn't it? ”

实际案列讲解篇幅

1. 语音唤醒设计

车载语音唤醒分为免唤醒和需要唤醒，免唤醒的定义就是无需说出唤醒关键词或者其他任何操作，就直接可以进行与语音助手交谈并处理任务。如需要唤醒的话，触发动作可分为点击、按压、语音等，目前市场上主流的车机唤醒方式有三种：

实体按钮，好处就是能够给到用户触觉上的反馈，用户感知性强

车载设计万字干货！超全面的 HMI 「语音设计」基础知识科普

虚拟按钮：此类的按钮一般都会在中控屏幕上面，唤醒的方式是点击

车载设计万字干货！超全面的 HMI 「语音设计」基础知识科普

语音唤醒：在驾驶场景中双手被占用，不能远距离的操作中控屏幕，最佳的交互操作方式就是语音唤醒

车载设计万字干货！超全面的 HMI 「语音设计」基础知识科普

语音助手形象

在语音助手形象设计方面，会分为两种，一种是卡通化语音助手形象，而另外一种是抽象化语音助手，下面用实际案例展示一下，卡通形象我们就拿未来汽车的 NOMI，抽象化 Google 的 Android Auto 语音形象

车载设计万字干货！超全面的 HMI 「语音设计」基础知识科普

基于工业设计 2021 年 01 期的调查数据分析来看，卡通化的语音形象在亲和力上有很大的优势，能够被用户快速的接受，但是辨识度上可能存在同质化严重问题，所以在效果表现力上面有欠缺，也较难表达车企的品牌理念。抽象化的语音形象则通过造型的多变和动效丰富，从而在设计感和效果上相对突出，在传达性上也不满意，用户不容易知道当前语音是处在一个什么状态下，在亲和力上远也不如卡通化形象。

车载设计万字干货！超全面的 HMI 「语音设计」基础知识科普

使用语音场景分析(重点）

关于车内可以延展很多应用的场景，要知道用户在驾驶过程中需要完成什么样的任务，接下来我们就围绕这几个核心的功能点 → 多媒体（娱乐）、车辆控制、导航、电话，顺带将每个模块语音基础话术指令带过一下外加TTS反馈，也是让初学者熟悉一下命令，这块内容很重要奥，都是我在实际项目工作中总结出来的，大家要上点心好好看，答应我好嘛

1. 多媒体（音乐、电台）

播放音乐、电台或者是播客这些都是一辆车最为常见语音交互的功能之一吧，开车的时候都会听一些音频类内容，对于这个功能播放、暂停和切换歌曲等功能外，电台快速选择，针对这些功能我们可以划分一些子功能对应的典型话术。

音乐-话术

车载设计万字干货！超全面的 HMI 「语音设计」基础知识科普

播放音乐

按歌手 → 我想听霉霉的歌、播放周杰伦的歌

歌曲名称搜索 → 播放天外来物、来一首七里香

歌手名称+歌曲名称组合精准定位（因为有很多翻唱的曲目） → 播放周杰伦的七里香

按照语种 → 我想听粤语歌、放一些英文歌

按照曲风 → 来点爵士音乐、播放摇滚音乐

根据音源播放语

在线音乐 → 播放qq、网易云、酷我音乐等等（因为每一家车厂合作的音乐供应商不一样）

蓝牙音乐 → 播放蓝牙音乐、跳转到蓝牙音乐、放蓝牙歌曲、切换到蓝牙音乐、我要听蓝牙音乐

U 盘音乐 → 播放U盘音乐、听U盘音乐的歌、跳到U盘音乐

音乐播放控制命令

切换当前播放列表上一首歌 → 切到上一首、上一首歌

切换当前播放列表下一首歌 → 放下一首音乐、切下一首

换一首歌播放 → 换一首歌、换一个音乐、换个歌

暂停歌曲 → 暂停音乐、音乐暂停、停止播放音乐、不想听歌了

继续播放 → 继续播放音乐、播放音乐

针对于音乐这个模块的基础语言先讲到这边了，因为在线音乐的功能相对比较多，所以后续我会对于 QQ 音乐、网易云、酷我音乐等在线音乐额外的语言控制命令再写一篇续集。

电台-话术

车载设计万字干货！超全面的 HMI 「语音设计」基础知识科普

播放电台

打开电台 → 打开/开启收音机、听广播、播放电台/收音机/广播/Radio

按频率收听 → 调频<104.5>、播放调频<104.5>、收听调频<104.5>、广播<891>

按频段+频率搜索收听 → 我想听FM<104.5>、FM<104.5>、收听/播放/我要听FM<104.5>、收听AM<1045>

按电台频道搜索收听 → 我想听音乐类电台、我要听上海<民生聊聊>电台、收听<交通>/<新闻>广播

按在线音源+音频类型搜索并播放 → 播放喜马拉雅的相声

按艺术家+音频类别搜索并播放 → 我想听郭德纲的相声

播放源

喜马拉雅 → 收听/打开/我想听喜马拉雅

FM → 打开/收听/我想听/播放/我要听 FM

AM → 打开/收听/我想听/播放/我要听 AM

电台扫描

扫描电台 → 扫描电台、搜索电台、重新搜台、搜寻电台、搜索频道、扫描频道

电台轮播

轮播电台 → 浏览电台、电台浏览、电台轮播、轮播电台、快速浏览

电台播放控制命令

上一个电台 → 上个频道、上一个台

下一个电台 → 下一个台、切到下一个台

换台 → 换一个台

暂停电台 → 暂停电台播放

收藏/订阅节目 → 收藏、收藏这个、添加收藏、加入收藏

取消收藏/订阅节目 → 取消收藏、收藏取消

车辆控制-话术

基本功能包括车内空调温度调节、控制车窗开关、后视镜角度的调节，还可以切换驾驶模式、变换档位等等。

车载设计万字干货！超全面的 HMI 「语音设计」基础知识科普

空调控制

空调控制 ON/OFF → 打开空调、关闭空调

空调 Auto → 打开自动空调、自动空调开启

空调打开+模式 → 太冷了、好热啊（检索到关键词，制冷/热进行切换模式）

空调风量增减 → 风量大/小一点、风大/小一点

设置风量级别 → 风量设设为2级、风量调成2级、风量最大/小

空调温度增减 → 温度高/低一点、温度调高/低一档

设置温度级别 → 温度调到xx度、温度设置xx度、温度调到最高/最低温度（空调温度调整到对应指）

空调吹风模式 → 吹脸/脚、吹脸吹脚、吹脚前除霜、前除霜（前除霜：处理前挡风玻璃的）

后窗除霜 → 打开后除霜/雾、打开后窗加热、后挡风玻璃除霜/雾

车窗

开启/关闭车窗 → 开/开启/打开/关/关闭车窗（未指定某一个窗户，打开/关闭所有车窗户）

指定开启/关闭车窗 → 开/开启/打开/关/关闭 - 左前/右前/左后右后窗、打开/关闭主驾旁边车窗、打开/关闭前排窗、打开/关闭后排窗、打开/关闭全部窗户

车窗开启/关闭到具体数值 → 车窗开/关一半（1/2）（车窗调节范围0-100%，根据不同车厂设定值为准）

情景模式

前文中有提到 TTS 反馈，那我就在车辆控制中情景模式详细举例子给大家讲解一哈。

清凉模式 → 打开/开启/关闭清凉模式 TTS反馈清凉模式已打开/关闭、清凉模式已处于打开状态

温暖模式 → 打开/开启/关闭温暖模式 TTS反馈温暖模式已打开/关闭

雨雪模式 → 打开/开启/关闭雨雪模式 TTS反馈雨雪模式已打开/关闭、即将关闭车窗，请注意安全

抽烟模式 → 打开/开启/关闭抽烟模式、我想抽烟 TTS反馈抽烟模式已打开/关闭

导航-话术

导航是我们最常用的功能之一，对于用户而言输入地址是一件头疼的事情，所以在导航去目的地的时候，直接语音输入后，匹配所需要导航的目的地，让语音助手帮你直接导航，还可以询问语言助手到达目的地时间和距离播报，有的车机导航系统还可以支持语音缩放地图大小，省得两只手指在触控屏幕进行放大缩小操作手势，在导航中的使用语音主要的目的就是便捷与高效。导航中的执行逻辑我这边就不做过多叙述，因为相对要更专业点，后续有机会我再深挖讲解。

车载设计万字干货！超全面的 HMI 「语音设计」基础知识科普

导航

公司 → 我要去公司、导航到公司、去公司、上班了

回家 → 我要回家、导航回家、回家了

注：如果没有设置公司/家的地址需要进入设置公司/家的具体地址流程，设置完毕之后，方可语言导航去公司/家

附近加油站 → 导航到附近/周围/周边加油站、帮我找个最近的加油站

当前位置→导航到模糊的POI（会产生多个结果） → 导航到火车站（拿上海举例子：上海有虹桥火车站、上海火车站、上海南站、松江站、上海西站，因此产生了多个结果后，语音助手还会继续问到你需要导航到具体那个火车站，如果时间超过定义时间将默认为第一个）

当前位置→导航到POI简称 → 导航到人广（人民广场，要不要和我一起去吃炸鸡🐔 哈哈哈）、带我去交大（交通大学）

增加途径点

附近其他 → 导航附近三甲医院

搜索指定位置+指定类型 POI → 帮我找一下南京西路的日式餐厅

搜索指定距离+指定类型 POI → 两公里以内的停车场、一公里中式快餐店

搜索指定位置+指定品牌 POI → 南京西路的古驰店

导航距离/时间的播报

查询途径点的距离播报 → 距离南京西路还有多远、距离下一个途径点距离还有多少

查询途径点到达耗时播报 → 到南京西路还需要多久、距离下一个途径点还要多长时间

电话-话术

在驾驶过程如果需要拨打电话，是一件不太容易的事情，而且是极其危险的，所以需要结合语音进行来辅助，接听/挂断不管是屏幕触控还是方向盘的硬按键都可以直接操作，体验还不错，对于不习惯语音的的人来说该功能点可以替代，但总体来说，语音接通/挂断会优于屏幕触控，硬按键对于长期使用来说可能会有优过语音，对于用户来说，在安全驾驶前提下，哪种使用方式习惯就用哪种。

车载设计万字干货！超全面的 HMI 「语音设计」基础知识科普

拨打电话

联系人姓名 → 打电话给老妈、呼叫老爸、联系哥哥、给姐姐打电话

拨打电话号码 → 打电话给12315、打电话给18015888888

拨打常用黄页名 → 打电话给中国电信、给上海银行打电话

接听/挂断/重拨/回拨

接听 → 接听/接电话/接通电话/接听电话

挂断 → 挂断/挂电话/挂断电话/挂掉电话

重拨 → 重拨电话

回拨 → 回拨电话

对话设计

对话设计是基于人们的对话的设计语言，它集合多个设计的内容，其中包括语音用户界面设计、交互设计、视觉设计、动画设计、语音对话脚本设计、乃至还有音频设计增加语音助手的灵动性。

车载设计万字干货！超全面的 HMI 「语音设计」基础知识科普

对话设计的是否成功与否最重要的就是个性，现在市场上的许多车载语音系统对话听起来还是基本很相似，是因为很多公司都没有专业的对话设计师，要么是程序员、产品经理、好一点的公司组建一个语音组，都是从其他行业转化过来，然后将各个大厂的语音对话研究一下，就上岗了，国内优秀的 VUI 设计真的很稀缺，也是很缺少的人才，我可不想再用语音交互的时候语音助手和我说“对不起，我没懂你的意思”

对话设计师在规划用户在具体每个功能模块区域内做什么，同时还要考虑用户的需求和技术限制，对话的策略，是代表着该语音系统完整的用户体验，也包含这详细的规范定义流程和底层逻辑。

这边需要着重的讲一个小知识点：

我们会有一个误区，认为“对话”仅只是说 or 听到的内容，其实对话本质上是多模态的，对话的核心内容是对话的流程和底层逻辑，图形界面的逻辑一般都不太会用在对话内容的设计方面，基本上他们两是一个独立的个体。

对话设计需要注意点

1. 语音简短化

车载语音的对话做的是否 OK？是基于对话内容时间的长短，因为用户没办法像查看 UI 界面内容那样，去查看语音的内容。根据人的平均记忆力，如果车载语音虚拟形象说了，关于这个话题很多内容，用户可能无法记全所有的内容，这对于对话将大打折扣，因此在对话过程中需要严格遵循 → 简短明了，让每一个文字都有意义，避免重复的短语，可以让用户快速的做决定。

车载设计万字干货！超全面的 HMI 「语音设计」基础知识科普

2. 响应等待设计

当用户在用导航功能的时候，语音对话说“导航去火车站”，如果在上海的话，就有好几个火车站，需要用户再次去选择，1 虹桥火车站、2 上海火车站、3 上海南站、4 上海西站，我们在做项目的时候，体验设计师给他的定义是如果用户超过 8 秒还没有进行选择的话，默认是选择第一个，如果第一个目的地不是我想要的，那么我需要重新通过语音再次输入信息。我觉得默认选择这个选项可能会有些不妥，如果这期间来一个电话或者是微信的语音电话，那么我是不好通过语音去选择的，如果汽车不是在驾驶的状态，可以手动触控屏幕进行选择 OK 没问题，如果是驾驶状态下，就需要优化前面默认选择项了。

车载设计万字干货！超全面的 HMI 「语音设计」基础知识科普

我的想法

(1)超过 8 秒钟后，默认选择第一个没有问题，但是在用户结束自己之前任务状态后，可以说重新选择目的地，将之前的搜索出来的火车站结果都再次调出来，提供用户重新去选择。

(2)这块就更智能化一些了（这个有一点前瞻性的意思，研发要是看到这个需求估计要揍死我），当语音助手检测用户正在忙的状态时候，在 8 秒钟都没有做出选择，那么语音助手可以从第一个目的地开始播报，用户可以通过方向盘 OK 硬按键去选择自己所需要导航的目的地，在驾驶过程中，方向盘的硬按键安全性远高于中控屏幕的点击。

3. 避免过多的选择

给用户提供选择的选项列表的时，最好不要超过三个选项，给用户较少的选择，能够让用户更明确去抉择，减少过多选项对于用户的干扰，刚刚上面导航那个案例排除，上海火车站真的太多了没办法，其他城市应该还好都是 1-3 个左右。

车载设计万字干货！超全面的 HMI 「语音设计」基础知识科普

我的想法

上面实际案例就是强行逼迫用户去选择一个，这种体验很差，有一种场景，如果这三个选项都不是我想要的，你就得重新说，帮我推荐一下附近的餐厅，想想这种体验就不是我想要的，我觉得可以增加一些情感化的设计在里面，如果这三个选项都不是我想要的。

我可能会说“这些我都不想去、能不能帮我再推荐其他的”语音助手说“你可真挑食、好的，那我就再帮你找找其他美食”（我的意思就是要让机器多去自我学习，更加智能化、情感化贴近于用户的交流，这样用户才会更愿意使用语音交互）

上诉的场景是对于这块区域不熟悉的用户来搜寻美食，如果用户有直接目的需要吃什么类型的餐饮的时候，语言助手只需要推荐相关美食就好。

用户说“帮我找一下附近的海底捞”语音助手说“附近有三家海底捞，您是要去哪一家...（播报三家信息）”

(播报三家海底捞的位置和距离，甚至我想是不是可以增加排队人数的播报，如果排队人很多就可以换一家，接下来就可以和语音助手直接说帮我预约好位置，省的用户到店面还要进行排队等候)

4. 不要假设用户知道该做什么

在做对话设计的时候千万别考虑用户的思考逻辑，每个人的思考逻辑都不一样的，所以不用去猜想用户的想法，只需要提供有用的信息让用户自己选择好了，前面有提到对话设计是讲究有逻辑性的，你在设计对话剧本的时候不可能就只考虑一条线。

举个简短的例子，你在设计一个订购飞机票语音对话流程，你想法是，首先先确定目的地，哪里起飞去哪里，然后再选择时间点起飞。假设用户直接说：“帮我预定早上八点的飞机，飞往深圳。”那问题来了一开始是用户是说的时间，最后只说了目的地，没有有说出发地，因此在语音设计剧本的时候，你需要将所有能出现的状况都考虑进去。

车载设计万字干货！超全面的 HMI 「语音设计」基础知识科普

5. 语言文案设计一致性

在图形设计之前 UE 也需要将动词、名词之间的搭配提前定义好，需要全局保持一致性，这块内容有在我第二篇文章提到过，因此在对话设计过程中也要格外注意。

车载设计万字干货！超全面的 HMI 「语音设计」基础知识科普

6. 不要信息轰炸用户

现实中我们正常处理事物的时候，也是将事物划分成几块，然后按照计划步骤进行，而不是一股脑子乱做，车载语音设计也是如此，作为一个正常的用户来说，我们一次性说出的需求并不会很多，不会像专业的车机测试人员一样，去叙述一大堆信息去检测机器的运转效率，和一个处理信息的准确性，每次出差去南京走查，都会听到测试人员巴拉巴拉一直说，我脑袋都大了，所以我们正常用户都是逐步的去说消息的，举个列子

车载设计万字干货！超全面的 HMI 「语音设计」基础知识科普

7. 避免使用专业术语

举一个场景的例子，当你在道路上开车，需要停在路边接朋友，朋友还没有到达指定位置，或者该位置是不可以停留的，语音助手正确说法“这边不可以停车，不然交警叔叔会罚款的，赶紧溜，我帮你找一个附近可以停车的地方吧” 错误的说法：“你触犯了了我国《交通法》第 XXX 条,......此处省略法律条文这边是禁止停车的”

车载设计万字干货！超全面的 HMI 「语音设计」基础知识科普