可用性和错误问题本质上不是同一回事。一个可用性问题是问题表层下的原因,而一个或多个错误则是一个可能的结果。本质上,错误是一些不正确的动作,而这些动作可能会导致任务的失败。
1. 何时测量错误
- 当某个错误将会导致效率上的显著降低。比如,当某错误会导致:数据的丢失、需要用户重新输入信息或明显使用户在完成某任务时变得缓慢。
- 当某个错误将会导致成本上的显著增加。比如,如果出现某个错误将会导致:客户支持(服务)电话量的上升或产品退回的增加。
- 当某个错误将会导致任务失败。比如,如果出现某个错误将会引起:病人服用错误的药物、投票人意外地选了错误的候选人或者网络用户买了错误的产品。
2. 什么构成了错误
错误可以建立在多种不同类型的、由用户进行的操作动作之上,比如下列这些:
- 在表格区域输入了不正确的数据(比如在登录过程中输入了错误的密码)
- 在菜单或下拉表中做出了错误的选择(比如应该选择“修改”选项时选择了“删除”选项)
- 执行了不正确的操作序列(比如当试图播放带式DVD节目时却格式化了它们的DVD光驱)
- 未能执行关键性的操作(比如在页面上要点击一个重要的链接)
3. 收集和测量错误
测量错误并不总是那么容易,与其他绩效度量相比,你需要知道正确的操作应该是什么样子或者正确的操作组合应该如何。比如,如果你正在研究密码重置表,则需要知道什么是成功重置密码的正确操作序列及什么不是。对于正确和不正确操作的范围,你定义得越好,就越容易测量错误。
一个重点考虑的问题是,一个既定的任务只存在单个错误机会还是存在多个错误机会。一个错误机会本质上是一个出错的可能性。
整理错误数据的最常用方法是按任务整理。很简单,只需要记录每个任务和用户的错误数量。如果只有一个错误机会,则错误数量将为1和0:
0=没有错误,1=一个错误
如果可能有多个错误机会,则错误数量将在0和最大的错误机会数量之间变化。错误机会越多,用表格来整理这些数据就越难和越耗时间。实验室研究中,你可以在观察用户的同时对错误数量进行统计,也可以在测试单元结束后通过回看录像进行统计,或者使用自动化或在线的工具收集该数据。
4. 分析和呈现错误
(1)有一个错误机会的任务
对只有一个错误机会的任务来说,分析错误数据的最常用方法是考察每个任务的错误频率。这可以显示出哪些任务错误更多而存在最为严重的可用性问题。这可以用以下两种途径中的一种予以完成:
- 按任务归纳错误频率并绘制出错误数量。
- 对于每个任务,用参加者的总数量去除错误数量。这将会告诉你每个任务上出现错误的参加者比例是多大。
对于只有一个错误机会的任务而言,另一种分析和呈现任务错误度量的方法是从总计的角度进行。你可以不必总是关心某个特定的任务,只要关注总体上参加者的操作情况即可。这里有几个可供选择的做法:
- 可以把每个任务的错误率平均成一个总的错误率。这就是告诉你该研究的总体错误率的情况。
- 可以计算所有任务的平均值,这样就可以获得一个特定的错误数量。
- 对于每个任务,你可以确定一个最大的、可以接受的错误率。
(2) 有多个错误机会的任务
- 这里有几个常用的方法,可以用来分析那些含有多个错误机会的任务。
- 从考察每个任务的错误频率开始是个好的定位。你将能够看到哪些任务出现最多的错误。
- 对于每个任务,你可以计算每个参加者所犯的平均错误数。这可以告诉你哪些任务产生了最多的错误。
- 在有些情况下,可能更有兴趣知道哪些任务落在某个阈值之上或之下。最直接的分析是给每个任务或每个参加者先确定一个可接受的阈值。接下来,计算某个特定任务的错误率或参加者的错误数是在这个阈值之上或之下。
- 在有些情况下,你需要考虑到不是所有的错误都是以同等程度出现的。以不同的数值确定每类错误的严重程度,即以数值1(微小)、2(中等)或3(严重)赋予每个错误一个权值。
5. 使用错误度量时需要考虑的问题
- 确保没有重复计算错误。
- 有时,你需要知道更多的信息,而不仅仅是一个错误率;你需要知道为什么不同的错误会出现。
- 在有的情况下,错误与未能完成某项任务是同一个事情。重要的是,要确保你的受众能清晰无误地理解你的度量。
转载请注明:陈童的博客 » 在可用性研究中测量错误