4400字干货!如何做好生成式 AI 设计的体验设计?

编者按:虽然这是一篇大概 1 年前的旧文,但是 AI 在用户体验层面的发展并没有如同我们预期一样发生快速的、根本性的发展,所以这篇来自 Tony Jin 的文章,价值还在提升。值得一提是,Tony Jin 供职于 Google Assistant 团队,在用户体验、语音交互、AI 领域有足够深入的了解和经验。

4400字干货!如何做好生成式 AI 设计的体验设计?

现如今,有关生成 AI 的新闻到处都是。用户谈论 ChatGPT 如何在创纪录的 5 天内达到 100 万用户,高盛如何预测 AI 将影响 3 亿个工作岗位,以及新版必应的 "失控"......

抛开所有的热搜话题不谈,作为一个设计数字助理、拥有人机交互背景并热衷于为新兴技术进行设计的设计师,这对我个人来说是一个激动人心的时刻。

生成式 AI 的突破,就像我们发现电的那一刻一样重要——虽然整个技术可能还需要几年的时间才能真正成熟(虽然速度正在加快),但我们知道,我们可能刚刚踏上了一块重要的基石,开启了许多可能性,业内的每个人都在努力探索着这些可能性。

事实上,到底有哪些可能性?我们又该如何更好地利用生成式 AI 的特性,并回避其缺点呢?

在这篇文章中,我将尝试解读我作为一名设计师,在使用了数十种生成式 AI 工具之后的心得体会。我将讨论良好的输入方式,对于生成式 AI 的重要性,以及语言作为输入介质的局限性,以及我们如何利用最佳实践,来弥补这些局限性,并使生成式 AI 对用户的日常使用真正产出价值。

虚假的承诺

我们已经看到了人工智能的爆炸式发展,它们可以生成语言、艺术作品、音乐、完整的演示文稿、代码,甚至是公众人物的播客访谈(也可以试试史蒂夫-乔布斯式的风格?)

看着这些几个月前还让人匪夷所思的新功能,我们可能很容易产生这样的错觉:不久之后,我们只需说几句话,生成式 AI 就会施展魔法,创造出无懈可击的解决方案,完全符合我们的想法。

然而,事实并非如此。

是的,如果你想为自己的企业创建一个 LOGO,又不想聘请专业的 LOGO 设计师,你也许可以通过 Midjourney 中的一些提示和迭代,来创建一个还凑合的 LOGO。但它只适用于你想潦草完成的情况。

但是,如果你对 LOGO 的外观和风格有具体要求,那么你可能需要对提示词进行多次润色,才能使其接近你想要的感觉。

这相反需要大量的人工测试和来回编辑,不是三言两语就能完成的。

输入质量的重要性

这是因为在我看来,使用生成式 AI 的最重要规则之一是:输入质量决定输出质量。下面的例子是我给 ChatGPT 的一个通用提示:

4400字干货!如何做好生成式 AI 设计的体验设计?

由 ChatGPT 生成的邮件,提示词是“告知我的团队我正在做事情”

ChatGPT 天马行空地发挥想象力,竭力把事情具体化,却只输出了一封充满陈词滥调废话的邮件,这其实很有趣。这让我想起了我在 reddit 上看到的一个帖子:

4400字干货!如何做好生成式 AI 设计的体验设计?

AI 成为我们的废话生成器和废话解码器,这真是一个辛辣的讽刺。

“AI 将我这个简短的总结转化成一份超长邮件,并且假装是我写的。”
“AI 可以将这份超长的邮件总结为一句话,这一我可以假装看过了。”

这不能怪 ChatGPT,因为我给出的提示词确实很糟糕,其中没有包含太多的信息。我没有说明邮件的风格、长度、我和团队之间的关系,我也没有提到和现有项目相关的任何细节,等等。我脑子里可能有这些背景和信息,但如果我不说出来,ChatGPT 永远也不会知道。

而这正是具有挑战性的部分——用户需要知道如何传达足够的上下文信息,以便 AI 能利用好这些信息,这才能节省我的时间,并提供我需要的输出内容。

来自语言本身的挑战

要知道如何 "设计 "提示词,向 AI 模型准确传达我们的想法,其实是一件很难的事情。我们自己的语言,比如英语,天生就不擅长给出精确的指令。这也是我们创造具有严格语法的编程语言的初衷之一,以便将我们的想法明确、高效地传达给计算机。

"代码是我们设计的界面,用来给计算机编程。这是我们所需要的。它客观、清晰、明确、(相对)静态、内部一致且稳健。

英语不具备这些特性——它是主观的,意义往往是隐晦、模棱两可的,它总是在变化,甚至自相矛盾矛盾,文本的结构经不起推敲"。

——道森-埃利亚森:"英语是一种糟糕的编程语言"

因此,即使是人类,每天也会误解对方。我们可能需要多次解释自己的想法,如此反复,才能让别人完全理解。很多时候,我们还需要借助外部工具,如白板图或者非常详细的文件,来解释我们的整个思维过程,以达到同频一致的目的。

我们需要对 AI 进行同样的处理。

通往终极合作者和副驾驶员之路

我们可以通过一些方法来设计和微调 AI 工具,避免出现问题。与其让用户误以为 AI 工具可以 "读懂你的想法",我们不如把它视作为一个强大的合作者,或者像微软所说的那样,一个可以辅助你完成工作的 "副驾驶"。设计和构建 AI 工具的人也应该提供手段,帮助用户在日常使用中,精确而高效地与他们的 "副驾驶 "沟通。

在为生成式 AI 进行设计时,需要注意以下几点。

1.提示词工程

提示词工程可以很有趣,甚至提示词工程师已经成为一份年薪可以达到 33.5 万美元的工作。不过,我认为,这些工作的存在,只是为了让“专业”的提示词工程师,能够替代普通用户完成艰苦的提示词创建地工作,从而避免普通用户需要专门学习一门“AI语言”。

相反,我们可以让普通用户通过预设地问题/类别,来输入和描述他们正在寻找的内容和答案。有了这些信息,系统就能代表他们生成更完善的提示,从而最大限度地提高 AI 产出有效结果的几率。

这对专注于垂直领域的产品,尤其有帮助,我们可以建立一套预设地问题,这在大多数情况下都很有帮助。

例如,HomeByte 可帮用户生成待售房屋的装修效果图,让用户构思新家具和新风格装饰下的硬装和软装地效果。它让用户使用预设的 UI 元素来选择风格、房间类型和色彩主题,然后生成生成 AI 模型的最终提示词。它还会向用户公开提示词细节,以便进阶用户自己进行微调。

4400字干货!如何做好生成式 AI 设计的体验设计?

来自 HomeByte

2.提供框架和制约因素

这是第一点的延伸。提供限制是唐-诺曼(Don Norman)提出的七大设计原则之一。这听起来可能有违直觉,但很多时候,限制用户的选择,而不是给他们一个空白页(让用户从零开始撰写他们自己的提示词)可能会更有效。

Story AI 就是一个很好的例子,它在为用户生成故事创意之前,会询问用户一些输入地信息。其中包括故事风格、主角信息、故事背景、主要冲突以及对故事的其他特殊要求。

4400字干货!如何做好生成式 AI 设计的体验设计?

摘自 Story AI

这些选项促使用户考虑输入内容地方方面面,以确保输入提示词足够全面,从而确保 AI 能够高质量地输出。

3.利用现有内容作为输入的基础

提供详细、高质量输入的另一种方法,是利用现有的内容作为输入,然后让 AI 对其进行细化、格式化和风格化。

Google Workspace 和 Microsoft Office 最近发布的视频都强调了这种情况。

例如,你可以在手机上写一封邮件的草稿,无需考虑格式,让 Gmail 为你正式处理。

4400字干货!如何做好生成式 AI 设计的体验设计?

基于几个要点,撰写正式的电子邮件 - Google Workspace 中的 Gmail

或者把昨天的原始会议记录(记录了团队的所有想法)用 Microsoft Word 转换成提案。

4400字干货!如何做好生成式 AI 设计的体验设计?

根据会议记录起草提案 - Microsoft Office 365 中的 Word

在我看来,这是人类与 AI 之间的一次伟大合作,但是人类仍然负责内容。毕竟,生成式 AI 是一个推理引擎,而不是一个知识库。如果没有内容作为基础,它所能做的只是幻觉和编造。但是,有了人类提供的内容,即使是原始形式的内容,AI也能将其风格化,使其变得更棒。

4.数量重于质量

即使有约束条件和良好的内容输入,AI 可能仍然很难一次就完全准确捕捉到用户的意图。因此,在设计 AI 工具时,最好能提供几个选项,让用户挑选自己喜欢的来进一步完善。

4400字干货!如何做好生成式 AI 设计的体验设计?

"没有想象力的世界 "由 Midjourney 生成

4400字干货!如何做好生成式 AI 设计的体验设计?

谷歌 Bard 生成的多个草稿

"数量重于质量 "也是头脑风暴的原则之一。因此,"生成式 AI "的妙用之一就是提供各种选项,激发用户的灵感,而不是一蹴而就地创造出最终解决方案。AI 生成的内容应该被视为灵感参考,而非必须遵循的神谕。

这也是我们可以利用 AI 模型的 "缺点" 又价值的地方:由于语言的局限性,我们很难期望 AI 完美无瑕地执行我们的想法,相反,我们可以利用 AI 模型生成所带来的随机性。AI 模型对信息的 "误读 "可能会带来偶然的创造,不完美的产出会拓展我们的视野,鼓励我们探索未知的新道路。

5.允许用户控制和微调

即使可以生成多个结果,AI的生成通常仍是一个起点。最终,用户具备控制和微调的能力(控制也是 Jakob Nielsen 提出的 10 个可用性启发式之一)。

在 ChatGPT 中,你可以要求它使用新的约束条件重新生成回复。不过,由于 AI 模型生成内容的概率属性,以及语言缺乏精确性的问题,导致这可能是一个挑战。

4400字干货!如何做好生成式 AI 设计的体验设计?

由 ChatGPT 生成

在上面的例子中,ChatGPT 可能没有理解我所说的 "保留隐喻 "的意思(我说得也很含糊)。在我第二次提示后,它重新生成了整个内容,而我只是稍微改动一下措辞。

仅通过提示词很难让模型一次又一次地生成令人满意的内容,这可能会导致用户在 21 次迭代后最终放弃,这个体验是极度令人沮丧的。

但另一方面,我们也可以设计一个工具,让用户自己编辑回复,或选择部分回复,通过直接操作,来隔离需要修改的内容,甚至在 AI 的帮助下进一步完善回复。

4400字干货!如何做好生成式 AI 设计的体验设计?

Notion 允许用户对生成的故事进行微调

这对生成文本来说很容易,因为它们可以随时编辑。不过,Adobe Firefly 的早期预览显示,它也可以隔离图像的某些部分,让用户根据自己的需要对结果进行微调。

4400字干货!如何做好生成式 AI 设计的体验设计?

Adobe Firefly 的早期效果图

6.从用户习惯和偏好中学习

即使是在与其他人合作时,这些来来回回的修改也很常见,尤其是在合作的早期阶段。随着时间的推移,我们会逐渐了解对方的工作风格和喜好,更容易建立共识。

设计精良的 AI 系统也应如此,通过隐式和显式输入了解用户的习惯和偏好。

目前的 AI 工具通常只允许用户就输出的内容质量进行评价,目的是改进模型本身,而不是为用户的需求,进一步个性化和提升大模型。

4400字干货!如何做好生成式 AI 设计的体验设计?

Bard 的用户反馈选项

目前,为每个用户创建个人模型的成本可能相当高,但在未来,我们可能会逐渐看到这样的模型:它们从与用户之前的互动中学习,并随着时间的推移学习用户的偏好和风格,从而生成更加个性化的回复,更少尝试的次数,更好满足用户的需求。

结语

生成式 AI 是热门话题,媒体的狂热吹捧可能会让用户对它的功能,产生不切实际的期望。然而,重要的是要记住这几点:

  • 对于生成式 AI,输入质量决定输出质量。在可能的情况下,为用户提供选项/限制,并提供高质量的提示词给用户做参考。以人们已经创建好的现有内容为基础,借助 AI 的超能力来对其进行完善。
  • 语言是不精确的,AI 大模型生成内容又是具有概率性的。如果用户有疑问,可以提供多个草案,供用户在此基础上进行构建——更多的选择甚至可能会以偶然的方式,激发用户的灵感。允许用户通过直接操作来编辑结果,以弥补语言的局限性。
  • 从长远来看,要学习并适应用户的习惯,使协作更加无缝。
收藏 27
点赞 25

复制本文链接 文章为作者独立观点不代表优设网立场,未经允许不得转载。