在典型的可用性测试过程中,大多数参加者不仅需要完成任务和填写调查问卷,还可能有许多其他行为反应。他们可能大笑、抱怨、大叫、扮鬼脸、微笑、坐立不安、漫无目的地四处张望,或者用手指敲击桌子。这些都是在产品可用性测试中可以被测量到的行为,它们能够为产品的可用性提供很多信息。大多数身体语言和动作都能够被细心的测试人员观察并记录到,但是一些细微的或者短暂的行为则很难被发现。例如,面部表情改变得非常迅速,因此,用高质量的视频记录参加者的面部表情十分有用。此外,仍然还有大部分人不会注意到的行为(比如,心跳加速、瞳孔扩张以及少量出汗),这些都需要特殊的监控设备进行记录。所有这些行为,包括可以直接被观察到的以及需要特殊仪器才能观察到的。
观察和编码外显的行为
在可用性评估中,研究参加者的外显行为可以分为两类:言语行为和非言语行为。
言语行为包括参加者实际讲述的任何内容;
非言语行为包括参加者可能做的除了语言之外的其他一系列行为。
这两类行为对诊断给用户造成问题的部分界面或者产品都有帮助,或者相反也有助于甄别吸引用户的界面或产品。
1. 言语行为
言语行为可以为理解用户使用产品时的情绪和心理状态提供很有价值的信息。
言语行为最有意义的度量是正面的评论和负面评论的比值。进行这类分析时,首先需要将所有的言语行为记录下来,然后将每一个行为编码为正面评论、负面评论或者中性评论。最后,只需要分析正面评论和负面评论的比值,如下图所示:
仅仅知道正面评论和负面评论的比值是2:1并不能得到许多有用的信息。但是,比较不同设计方案或者不同产品的比值则会更有意义。例如,如果每个新的设计所获得的正面评论和负面评论之比值都显著增加,这说明设计得到了改进。
区分不同类型的言语行为:
- 强烈的正面评论(如“这棒极了”)
- 其他正面评论(如“那个相当好”)
- 强烈的负面评论(如“这个网站太糟糕了”)
- 其他负面评论(如“我不太喜欢它工作的方式”);
- 改进建议(如“如果……,那将会更好)
- 询问(如“它是如何工作的?”)
- 与期望的差别(如“这与我期望得到的不一样”)
- 表示迷惑或者不理解(如“这一页的内容没有任何意义”)
- 表示挫败感(如“在这时候,我会直接关掉它!”)
可用性测试的行为观察编码表:
可用性测试行为观察编码表 | |||
日期 | 参加者编号:_______ | 任务编号:________ | |
开始时间:_________ | 结束时间:_________ | ||
言语行为 | 记录 | ||
□□□强烈的正面评论 | _________________________________________ | ||
□□□其他的的正面评论 | _________________________________________ | ||
□□□其他的负面评论 | _________________________________________ | ||
□□□改进建议 | _________________________________________ | ||
□□□询问 | _________________________________________ | ||
□□□与预期的差别 | _________________________________________ | ||
□□□表示迷惑或者不理解 | _________________________________________ | ||
□□□表示挫败感 | _________________________________________ | ||
非言语行为 | 记录 | ||
□□□皱眉/厌恶/不高兴 | _________________________________________ | ||
□□□微小/大小/高兴 | _________________________________________ | ||
□□□惊奇/出乎意料 | _________________________________________ | ||
□□□紧皱眉头/集中注意力 | _________________________________________ | ||
□□□显示出不耐烦 | _________________________________________ | ||
□□□向屏幕倾斜身体 | _________________________________________ | ||
□□□出乎意料的非言语行为 | _________________________________________ | ||
□□□坐立不安 | _________________________________________ | ||
□□□胡乱地移动鼠标 | _________________________________________ | ||
□□□抱怨或者深深地叹气 | _________________________________________ | ||
□□□挠头/揉眼睛/扭脖子 | _________________________________________ | ||
其他非言语行为 | _________________________________________ | ||
任务完成情况 | 记录 | ||
未完成: | 完成: | ||
□参加者放弃 | 全部独立完成 | ||
□测试主持人“叫停”任务 | □在有帮助的情况下完成任务 | ||
□误认为完成 | □部分完成 | ||
2. 非言语行为
非言语行为可以非常有效地揭示出用户使用产品时的体验。这些非言语行为可以包括面部表情(皱眉、笑、惊奇、紧皱眉头)或肢体动作(坐立不安、向屏幕倾斜身体、挠头)。从这些非言语行为中获得任何有意义的度量都存在不同程度的困难,而且可能只对某种特定类型的产品研究有意义。如果您在评估网站、软件或者其他不需要太多肢体动作的产品,那么这些度量的价值是有限的。但是对于有些研究,言语行为可以反映出部分用户对产品的挫折感或者不耐烦程度,这些度量是非常重要的。几年前,我们对一个基于Web的网络应用做了可用性评估。这个产品对用户的部分请求需要非常长的响应时间。一些参加者用语言表达他们对响应时间的不满,另一些参加者则只是用非语言行为表达,例如用手指敲击桌子、抱怨或者在等待程序响应时挠头。
转载请注明:陈童的博客 » 在可用性研究中度量行为和生理指标