如何让可用性测试像剧本杀一样容易?来看高手的总结!

前言

可用性测试是一种测试方法,用于评估产品、系统或服务在用户使用过程中的易用性、用户体验和用户满意度。但是常规的可用性测试费用以及需要的条件比较苛刻,那如何低成本搭建可用性测试就成了一个比较难的问题。接下来分享一下我们团队如何建立简易可用性测试的。

更多可用性测试方法:

一、3点暴论

1。 一定要做测试

实际工作中即使是有同理心基础的设计师,,也因为不是实际使用用户不知道使用过程中到底出现了什么问题。根本原因就是不是每个人都像你一样,和你熟悉度一样,很多事情是项目成员觉得想当然的事情,但是对于用户而言并不是那么的"理所应当"。

2。 做不不做好一万倍

做测试一定有效果的,哪怕是一个错误的用户做一次做比较糟糕的的测试也能发现现有产品的问题。每一场可用性测试都会对于产品的的优化以及项目组成员对于产品的认知逐步加深一步。做多次可用性测试之后,项目成员能够产生更多有价值的想法和看法。

3。 越早测试越好

这里有个常识性的误区:就是当把系统设计的很复杂之后,做测试的价值会有更大的价值。这个常识性的误区考虑的并不全面,再实际的项目运行之中时候,一旦产品或者是优化功能上线,修改时候就不是那么的容易。而且在用户养成固定的操作习惯之后是很难进行改变,如果强行并且频繁改变的话很有可能会引起用户的反感。

这里的反感涉及往小了说是表单或则是字段的位置,大到了一个功能模块都会产生巨大的影响,所以越早测试这种影响越能早发现/影响越小。

二、为什么要做简易可用性测试?

1。 招募形式

常规可用性测试是需要花时间和精力来进行精准用户目标。而简易可用性测试则不需要精准的使用用户,就是随便找一些人进行测试,如果经常进行测试可能比真实用户更有效果。

2。 主要目标不同

常规的可用性测试的目的是是需要尽可能的找到全部的问题,然后进行分类和需求的优先级排序。但是简易性可用性测试是为了找到最严重的问题,并且在下次测试前解决问题。

3。 现金成本不同

之前通过第三方请过 1 个农业生产方面的专家(6 千/小时),如果没有到 1 个小时就按照比例进行计算(通常是在 35 多分钟到 45 分钟),一次最起码要付出 3 千多到 4 千多。而简易可用性测试只需要几百元或者一些纪念品就可以给测试的用户。

三、测试的时间选择

常规的选择时间是安排在每个月第一个周一的上午。

原因:

  1. 保持简单些:越简单团队才越能坚持的下去,越复杂越忙的时候很有可能就没办法做安排。
  2. 固定 SOP 就不用提前敲定时间:确定固定时间就可以按照工作流程进行安排,就减少团队讨论的时间。
  3. 8 个人发现的的问题足够一个月了:8 个人已经发现 85%以上的问题了,而且足够忙一个月了

四、可用性测试流程

  1. 前期准备
  2. 用户选择
  3. 怎么筛选标准

理想情况下是邀请精准用户:

举个例子:男性,仓管,34-45 岁,8-10 年的系统使用经验,之前使用过这类的系统。

理想筛选标准一般是包含了:

  1. 性别
  2. 年龄
  3. 竞品使用经验
  4. 使用产品时间
  5. 有没有特殊的操作习惯
  6. 日常的操作习惯

上面讲的是理想情况下,但是在实际工作中因为要花的时间和精力十分的多,而且也很难找到如此精准的使用用户,那还有一种方式叫做:条件放宽

换句话说就是就是去寻找到与目标用户类似的用户,这里其实会出现一个比较大的误区:非目标用户无法寻找到产品中的问题?但是这里你要进行思考一下,我们的用户出现了这个问题,是因为参与人员专业度不够导致的这个问题吗?

招募不是目标用户有 2 点好处:

  1. 如果只是针对某个专业的领域进行设计的话,就是默认这个领域的所有从业者都明白这些术语。但是这是属于理想状态下的猜测,但是在实际场景中不是所有这个领域的行择业从业者都明白所有的术语,拉高新人的学习成本未必是一件好事。
  2. 即使参与人员是一名专家,他也是跟大部分用户类似的事勉强应付任务,只不过是比普通的用户高一点点的层次。

1。 什么方式找到

找到用户的的方式有很多,主要是分为对内和对外:

  1. 对内的方式:成本和精力比较多的时候可以通过客户成功找到精准的使用用户。如果是条件放宽的条件下可以通过系统发放问卷还有微信客户群里面寻找到合适的使用用户。
  2. 对外的方式:可以在社交平台上发布招募需求,自主招募用户。也可以通过第三方软件发布招募问卷进行招募。

请用户进行测试,别忘了准备 100-200 准备给测试用户,或者是准备一些纪念品,来表示尊重

2。 环境准备

通常是需要 1 个安静不被打扰的办公室或者是会议室,同时还需要共享软件,一般使用的是腾讯会议或者是飞书会议进行屏幕共享。另外一间办公室里由测试组员进行观察。复盘时候需要视频来复盘,是一个很好的依据。

3。 测试人员

通常分为 2 种:

  1. 主持人:主持人一般是引导用户完成任务的职责,往往也有鼓励用户努力去尝试和发声。
  2. 记录者:常常是进行操作选记录以及防止问题遗漏进行的补充,还兼顾这观察用户的表情的职责。

4。 观察人员选择

人越多越好!!!

在做可用性测试的时候,让参与到的团队成员能有一个冲击感。他们都会改变对于用户行为的认知,摆脱以自我职业为中心的认知,这个时候会意识到我们不是“用户”。

我们作为设计师应该邀请所有跟项目有关的成员进入到测试环节,这里除了常规的成员:技术和产品外以及业务方,还需要邀请到决策层以及上层的主观进入到测试环节中(把决策层和主管拉进来也是为了后面能拉到更多的资源)。

小技巧:如果预算足够的,可以买一些零食,个人推荐巧克力和薯片还是不错的。

5。 如何选择测试任务

测试任务取决于现有产品需要需要测试什么流程或者是功能,需要提前拆分功能的流程,就像是就设计剧本杀一样一关一关。将流程进行拆分,然后以卡片的方式在白板上进行展示,并给与所有成员进行讲解。

以一个常规的新建用户为例:

  1. 录入信息
  2. 核对资料
  3. 验证密码

6。 提前准备时间

一般从邀请用户到中期的测试流程,一般都要提前 1 周 2 周完成。大纲整理差不多 1 天 2 天时间就可以完成了。

① 中期执行

欢迎(大概 4 分钟)

处于开始测试环节并且讲述测试的规则,让测试用户有个心理准备:

台词部分

需要提前将准备的台词读出来,需要跟测试用户进行确认

安慰部分

这部分是很容易被忽略的部分,这里如果做不好的好的话容易得罪测试用户。这里需要声明 2 个点:

  1. 主要是做产品的测试,而不是测试用户个人的能力。
  2. 要鼓励用户发声
  3. 测试结束之后,一定要还有问测试用户还有什么问题,尽力解答这些问题

情况说明

如果有录像或者是录音的存留必须要要跟测试用说明,不强求用户的测试,即使用户退出也应该给与一些补偿。

并跟用户签署授权/豁免协议。

提问(2 分钟左右)

主要是询问几个与测试赞誉这相关的问题,主要是让测试用户放松一些还有了解一下时候有之类的产品的经验,以便于进入下一个阶段。

提问部分涉及到了 3 个注意点:

  1. 让测试者有主角感,而不是一个单纯做任务的人。
  2. 不要注重问题回答的准确度,主要是用户习惯。
  3. 2 分钟内需要迅速拉回来。

观光(3 分钟左右)

提前打产品页面,让用户浏览即将要测试的页面,请参与者讲讲具体看到了什么,以及哪里看不懂的地方。视觉问题在这一步就可以检查出一部分的问题。

然后把操作设备的主动权交给测试者。

任务测试(大约 35 分钟)

这是本次测试的核心环节,主要是让测试用户操作指定的任务,并且通过用户一些的操作以及用户的发声找到产品中的问题。

在整个任务测试过程中,全程让测试者自己走完全程,作为主持人不要引导/影响到用户的判断与决策,在发出提问的时候避免掉会引导用户操作的的问题。除非测试这个时候已经停止操作以及处于绝望的时候,不要给与帮助与接下来步骤的引导。如果发现测流程多次出现测试的求助,则记录下来并且询问具体的原因,还要跟测试者沟通好如果主持人不在的场景下怎么处理?

测试流程中有 2 个要关注的的点:

  1. 发生原则:尽可能的鼓励用户的去说出他/她现在所处的流程以及现在碰到的难点还有疑惑的点,尤其是是测试者开始停止操作且不再说话的时候,可以试探的问一下:你在想什么?遇到了什么问题?
  2. 时效性:一定要去学会控制时间,测试全流程要控制到 45 分钟,一旦拖到了一个小时测试用户和主持人就会陷入疲态

探查(4 分钟左右)

任务测试完了之后,有些场景下主持人或者是记录者需要补充询问道一些问题,还可以向观察室里面的成员搜集他们想问的问题询问到测试者。

结束(3 分钟左右)

最后感谢测试者加入到测试当中,给予测试者之前承认的报酬(金钱或者是其他报酬),并恭敬地将测试者送出门

交付物

一般情况下是:

  1. 视频
  2. sus 测试表格

常见的遇到什么问题

常见的可以分成 3 种:

  1. 不理解产品:由于不熟精准的用户目标,又有大的概率没用这一类的产品所以多少会迷茫。
  2. 功能找不到:如果单页多次发现这种功能找不到的情况下,要考虑下是不是在设计的时候要突出视觉层次
  3. 专业词汇不理解:专业词汇过多的页面针对非这个行业的测谁这来讲理解成本很高,所以会早造成操作流程的卡顿与停止,这里产生的原因极有可能是因为设计的时候没有考虑到新人的认知成本以及操作成本。

后期复盘

① 分类排序与问题评级

首先按照是职责区分:

  1. 功能增减-产品
  2. bug-开发
  3. 体验问题-UX 设计师

然后讲每个问题进行分级:最严重的是 P0,P3 是最轻的,并进行任务的排期

② 以及忽略“皮划艇”问题

先解释下什么是“皮划艇”,就是用户在短时间发生了错误之后,在没有任何帮助提示下就能修改过来的问题。就像皮划艇在水流中一样,有的时候水流冲击下会向左或者是向右偏离一下,但是能够快速调整回来,一般遇到这种问题直接忽略就好难免会发生的事情。

五、其他测试方法

1。 远程测试

这个使我们团队在疫情期间使用的一种可用性调研方式,测试用户不用来办公室进行测试,只要通过视屏共享就可以进行流程。这模式主要针对工作繁忙的用户,但是在疫情期间反而起了奇效。

2。 无主持人的远程测试

就是在规定时间内让用户使用产品/任务流程过程中进行录制视频,从而让操作完成之后团队成员通过视频进行分析即可。

收藏 24
点赞 34

复制本文链接 文章为作者独立观点不代表优设网立场,未经允许不得转载。