4400字干货！如何做好生成式 AI 设计的体验设计？

编者按：虽然这是一篇大概 1 年前的旧文，但是 AI 在用户体验层面的发展并没有如同我们预期一样发生快速的、根本性的发展，所以这篇来自 Tony Jin 的文章，价值还在提升。值得一提是，Tony Jin 供职于 Google Assistant 团队，在用户体验、语音交互、AI 领域有足够深入的了解和经验。

4400字干货！如何做好生成式 AI 设计的体验设计？

现如今，有关生成 AI 的新闻到处都是。用户谈论 ChatGPT 如何在创纪录的 5 天内达到 100 万用户，高盛如何预测 AI 将影响 3 亿个工作岗位，以及新版必应的 "失控"......

抛开所有的热搜话题不谈，作为一个设计数字助理、拥有人机交互背景并热衷于为新兴技术进行设计的设计师，这对我个人来说是一个激动人心的时刻。

生成式 AI 的突破，就像我们发现电的那一刻一样重要——虽然整个技术可能还需要几年的时间才能真正成熟（虽然速度正在加快），但我们知道，我们可能刚刚踏上了一块重要的基石，开启了许多可能性，业内的每个人都在努力探索着这些可能性。

事实上，到底有哪些可能性？我们又该如何更好地利用生成式 AI 的特性，并回避其缺点呢？

在这篇文章中，我将尝试解读我作为一名设计师，在使用了数十种生成式 AI 工具之后的心得体会。我将讨论良好的输入方式，对于生成式 AI 的重要性，以及语言作为输入介质的局限性，以及我们如何利用最佳实践，来弥补这些局限性，并使生成式 AI 对用户的日常使用真正产出价值。

虚假的承诺

我们已经看到了人工智能的爆炸式发展，它们可以生成语言、艺术作品、音乐、完整的演示文稿、代码，甚至是公众人物的播客访谈（也可以试试史蒂夫-乔布斯式的风格？）

看着这些几个月前还让人匪夷所思的新功能，我们可能很容易产生这样的错觉：不久之后，我们只需说几句话，生成式 AI 就会施展魔法，创造出无懈可击的解决方案，完全符合我们的想法。

然而，事实并非如此。

是的，如果你想为自己的企业创建一个 LOGO，又不想聘请专业的 LOGO 设计师，你也许可以通过 Midjourney 中的一些提示和迭代，来创建一个还凑合的 LOGO。但它只适用于你想潦草完成的情况。

但是，如果你对 LOGO 的外观和风格有具体要求，那么你可能需要对提示词进行多次润色，才能使其接近你想要的感觉。

这相反需要大量的人工测试和来回编辑，不是三言两语就能完成的。

输入质量的重要性

这是因为在我看来，使用生成式 AI 的最重要规则之一是：输入质量决定输出质量。下面的例子是我给 ChatGPT 的一个通用提示：

4400字干货！如何做好生成式 AI 设计的体验设计？

由 ChatGPT 生成的邮件，提示词是“告知我的团队我正在做事情”

ChatGPT 天马行空地发挥想象力，竭力把事情具体化，却只输出了一封充满陈词滥调废话的邮件，这其实很有趣。这让我想起了我在 reddit 上看到的一个帖子：

4400字干货！如何做好生成式 AI 设计的体验设计？

AI 成为我们的废话生成器和废话解码器，这真是一个辛辣的讽刺。

“AI 将我这个简短的总结转化成一份超长邮件，并且假装是我写的。”
“AI 可以将这份超长的邮件总结为一句话，这一我可以假装看过了。”

这不能怪 ChatGPT，因为我给出的提示词确实很糟糕，其中没有包含太多的信息。我没有说明邮件的风格、长度、我和团队之间的关系，我也没有提到和现有项目相关的任何细节，等等。我脑子里可能有这些背景和信息，但如果我不说出来，ChatGPT 永远也不会知道。

而这正是具有挑战性的部分——用户需要知道如何传达足够的上下文信息，以便 AI 能利用好这些信息，这才能节省我的时间，并提供我需要的输出内容。

来自语言本身的挑战

要知道如何 "设计 "提示词，向 AI 模型准确传达我们的想法，其实是一件很难的事情。我们自己的语言，比如英语，天生就不擅长给出精确的指令。这也是我们创造具有严格语法的编程语言的初衷之一，以便将我们的想法明确、高效地传达给计算机。

"代码是我们设计的界面，用来给计算机编程。这是我们所需要的。它客观、清晰、明确、（相对）静态、内部一致且稳健。

英语不具备这些特性——它是主观的，意义往往是隐晦、模棱两可的，它总是在变化，甚至自相矛盾矛盾，文本的结构经不起推敲"。

——道森-埃利亚森："英语是一种糟糕的编程语言"

因此，即使是人类，每天也会误解对方。我们可能需要多次解释自己的想法，如此反复，才能让别人完全理解。很多时候，我们还需要借助外部工具，如白板图或者非常详细的文件，来解释我们的整个思维过程，以达到同频一致的目的。

我们需要对 AI 进行同样的处理。

通往终极合作者和副驾驶员之路

我们可以通过一些方法来设计和微调 AI 工具，避免出现问题。与其让用户误以为 AI 工具可以 "读懂你的想法"，我们不如把它视作为一个强大的合作者，或者像微软所说的那样，一个可以辅助你完成工作的 "副驾驶"。设计和构建 AI 工具的人也应该提供手段，帮助用户在日常使用中，精确而高效地与他们的 "副驾驶 "沟通。

在为生成式 AI 进行设计时，需要注意以下几点。

1.提示词工程

提示词工程可以很有趣，甚至提示词工程师已经成为一份年薪可以达到 33.5 万美元的工作。不过，我认为，这些工作的存在，只是为了让“专业”的提示词工程师，能够替代普通用户完成艰苦的提示词创建地工作，从而避免普通用户需要专门学习一门“AI语言”。

相反，我们可以让普通用户通过预设地问题/类别，来输入和描述他们正在寻找的内容和答案。有了这些信息，系统就能代表他们生成更完善的提示，从而最大限度地提高 AI 产出有效结果的几率。

这对专注于垂直领域的产品，尤其有帮助，我们可以建立一套预设地问题，这在大多数情况下都很有帮助。

例如，HomeByte 可帮用户生成待售房屋的装修效果图，让用户构思新家具和新风格装饰下的硬装和软装地效果。它让用户使用预设的 UI 元素来选择风格、房间类型和色彩主题，然后生成生成 AI 模型的最终提示词。它还会向用户公开提示词细节，以便进阶用户自己进行微调。

4400字干货！如何做好生成式 AI 设计的体验设计？

来自 HomeByte

2.提供框架和制约因素

这是第一点的延伸。提供限制是唐-诺曼（Don Norman）提出的七大设计原则之一。这听起来可能有违直觉，但很多时候，限制用户的选择，而不是给他们一个空白页（让用户从零开始撰写他们自己的提示词）可能会更有效。

Story AI 就是一个很好的例子，它在为用户生成故事创意之前，会询问用户一些输入地信息。其中包括故事风格、主角信息、故事背景、主要冲突以及对故事的其他特殊要求。

4400字干货！如何做好生成式 AI 设计的体验设计？

摘自 Story AI

这些选项促使用户考虑输入内容地方方面面，以确保输入提示词足够全面，从而确保 AI 能够高质量地输出。

3.利用现有内容作为输入的基础

提供详细、高质量输入的另一种方法，是利用现有的内容作为输入，然后让 AI 对其进行细化、格式化和风格化。

Google Workspace 和 Microsoft Office 最近发布的视频都强调了这种情况。

例如，你可以在手机上写一封邮件的草稿，无需考虑格式，让 Gmail 为你正式处理。

4400字干货！如何做好生成式 AI 设计的体验设计？

基于几个要点，撰写正式的电子邮件 - Google Workspace 中的 Gmail

或者把昨天的原始会议记录（记录了团队的所有想法）用 Microsoft Word 转换成提案。

4400字干货！如何做好生成式 AI 设计的体验设计？

根据会议记录起草提案 - Microsoft Office 365 中的 Word

在我看来，这是人类与 AI 之间的一次伟大合作，但是人类仍然负责内容。毕竟，生成式 AI 是一个推理引擎，而不是一个知识库。如果没有内容作为基础，它所能做的只是幻觉和编造。但是，有了人类提供的内容，即使是原始形式的内容，AI也能将其风格化，使其变得更棒。

4.数量重于质量

即使有约束条件和良好的内容输入，AI 可能仍然很难一次就完全准确捕捉到用户的意图。因此，在设计 AI 工具时，最好能提供几个选项，让用户挑选自己喜欢的来进一步完善。

4400字干货！如何做好生成式 AI 设计的体验设计？

"没有想象力的世界 "由 Midjourney 生成

4400字干货！如何做好生成式 AI 设计的体验设计？

谷歌 Bard 生成的多个草稿

"数量重于质量 "也是头脑风暴的原则之一。因此，"生成式 AI "的妙用之一就是提供各种选项，激发用户的灵感，而不是一蹴而就地创造出最终解决方案。AI 生成的内容应该被视为灵感参考，而非必须遵循的神谕。

这也是我们可以利用 AI 模型的 "缺点" 又价值的地方：由于语言的局限性，我们很难期望 AI 完美无瑕地执行我们的想法，相反，我们可以利用 AI 模型生成所带来的随机性。AI 模型对信息的 "误读 "可能会带来偶然的创造，不完美的产出会拓展我们的视野，鼓励我们探索未知的新道路。

5.允许用户控制和微调

即使可以生成多个结果，AI的生成通常仍是一个起点。最终，用户具备控制和微调的能力（控制也是 Jakob Nielsen 提出的 10 个可用性启发式之一）。

在 ChatGPT 中，你可以要求它使用新的约束条件重新生成回复。不过，由于 AI 模型生成内容的概率属性，以及语言缺乏精确性的问题，导致这可能是一个挑战。

4400字干货！如何做好生成式 AI 设计的体验设计？

由 ChatGPT 生成

在上面的例子中，ChatGPT 可能没有理解我所说的 "保留隐喻 "的意思（我说得也很含糊）。在我第二次提示后，它重新生成了整个内容，而我只是稍微改动一下措辞。

仅通过提示词很难让模型一次又一次地生成令人满意的内容，这可能会导致用户在 21 次迭代后最终放弃，这个体验是极度令人沮丧的。

但另一方面，我们也可以设计一个工具，让用户自己编辑回复，或选择部分回复，通过直接操作，来隔离需要修改的内容，甚至在 AI 的帮助下进一步完善回复。

4400字干货！如何做好生成式 AI 设计的体验设计？

Notion 允许用户对生成的故事进行微调

这对生成文本来说很容易，因为它们可以随时编辑。不过，Adobe Firefly 的早期预览显示，它也可以隔离图像的某些部分，让用户根据自己的需要对结果进行微调。

4400字干货！如何做好生成式 AI 设计的体验设计？

Adobe Firefly 的早期效果图

6.从用户习惯和偏好中学习

即使是在与其他人合作时，这些来来回回的修改也很常见，尤其是在合作的早期阶段。随着时间的推移，我们会逐渐了解对方的工作风格和喜好，更容易建立共识。

设计精良的 AI 系统也应如此，通过隐式和显式输入了解用户的习惯和偏好。

目前的 AI 工具通常只允许用户就输出的内容质量进行评价，目的是改进模型本身，而不是为用户的需求，进一步个性化和提升大模型。

4400字干货！如何做好生成式 AI 设计的体验设计？

Bard 的用户反馈选项

目前，为每个用户创建个人模型的成本可能相当高，但在未来，我们可能会逐渐看到这样的模型：它们从与用户之前的互动中学习，并随着时间的推移学习用户的偏好和风格，从而生成更加个性化的回复，更少尝试的次数，更好满足用户的需求。

结语

生成式 AI 是热门话题，媒体的狂热吹捧可能会让用户对它的功能，产生不切实际的期望。然而，重要的是要记住这几点：

对于生成式 AI，输入质量决定输出质量。在可能的情况下，为用户提供选项/限制，并提供高质量的提示词给用户做参考。以人们已经创建好的现有内容为基础，借助 AI 的超能力来对其进行完善。
语言是不精确的，AI 大模型生成内容又是具有概率性的。如果用户有疑问，可以提供多个草案，供用户在此基础上进行构建——更多的选择甚至可能会以偶然的方式，激发用户的灵感。允许用户通过直接操作来编辑结果，以弥补语言的局限性。
从长远来看，要学习并适应用户的习惯，使协作更加无缝。