启发式评估还没有一套标准的操作流程，但一般来说，启发式评估的实施包含以下几个步骤：

1. 向评估者介绍和解释用于评估的启发式系列

在开展启发式评估之前，首先有必要向评估者介绍和解解用于评估的启发式系列中的各项启发式，其目的是让评估者能够熟悉各项启发式的内容并理解其含义，以避免评估者产生可能的疑问或误解从而影响评估效果。如果评估者原先对所给的启发式系列已经非常了解并具有一定的评估经验，则该步骤可省略。如果评估者是非专家评估者，则有必要对其进行相关的培训。

2. 向评估者介绍评估的对象

如果评估对象是面向大众设计的走来即用(Walk Up and Use)的系统（或产品），或者评估者是产品所在领域的专家时，就没有必要对评估者进行指导。如果系统针对的是评估者不熟悉的领域，就有必要对评估者加以指导，使他们能够使用系统和了解系统的用途。

3. 评估界面

在进行评估的时候，每个评估者要对界面进行独立的评估，以保证评估是独立的和无偏向的。Nielsen建议，评估者原则上应该自己决定如何与被评估的界面进行交互，但通常建议评估者至少要浏览界面两次。第一遍大概了解交互流程和系统概貌；第二遍专注于具体的界面元素。

在评估过程中，评估者身边应该要有一个主试。当评估者碰到了困难而无法进行下一步操作，并且已经表明了这个困难所涉及的可用性问题的时候，主试应该给予帮助。

4. 结果记录及整理

一般来说，对评估结果的记录及整理有两种方式：由每一个评估者单独完成一份书面报告，或在评估过程中让评估者进行出声报告，由主试进行记录。

根据现有的技术，可以采用录像系统对评估者的评估过程进行全程的录制，这样即可以使结果比较可靠，也便于存档和以后的查看。

5. 严重性等级评定

由于启发式评估所找到的可用性问题同时包含主要问题和次要问题，也包含虚假的可用性问题（不是真正的可用性问题），因此，有必要对评估中每位评估者所发现的每个问题进行严重性等级的评定。

在评估过程中，评估者都专注于寻找新的可用性问题，很难对发现的可用性问题的严重性等级进行恰当评定。因此，在评估结束后，每个评估者必须独立完成一份包括所有评估者所发现的可用性问题的间卷（包括可用性问题的相关信息，如发现该问题的评估者人数、违反的可用性准则等），让每位评估者独立地对问卷上的这些可用生问题进行严重性等级的评定。对一个可用性问题进行评定可以采用这样的方式： 0=不是一个真正的可用性问题（我不认为这是一个可用性问题）；1＝只是一个表面性的可用性问题（不一定要处理，除非有额外的时间);2=次要的可用性问题（需要解决但优先级低);3=主要的可用性问题（重要的，因此需要给予的优先级）；4＝灾难性的可用性问题（在软件发行之前必须要解决的可用性问题）。

在评定严重性等级时一般考虑以下三个因素：1．可用性问题发生的频率（很少出现还是经常出现）；2．可用性问题的影响程度（用户是否能够轻易地克服这个问题);3．可用性问题的持续性（当用户知道该问题时就能够加以克服还是用户反复地受该问题的干扰）。最后，计算每个可用性问题严重性等级的平均值，这个平均值就是这个可用性问题的最终的严重性等级。

6. 讨论

在严重性等级评定之后，要进行一次小型的讨论。讨论的参加者包括评估者、评估过程中的主试以及设计人员的代表。讨论以自由讨论的方式进行，并集中讨论如何针对主要的可用性问题和一些普遍的设计问题来对界面进行重新设计。随着启发式评估实践和研究的深入，研究者们也提出了一些针对启发式评估流程的改进措施以提高评估效率和效果。如在步骤4)中，评估者可以使用相关的软件来完成记录可用性问题的相关工作。

Hvannberg等研究者认为，与在纸上进行记录相比，在评估过程中使用软件工具进行记录有以下一些优势：1．对具体的可用性问题可以更方便地选择相应的启发式进行解释；2．更容易地对已经发现的可用性问题进行查找、回顾、修改，以及更方便地与相关的材料进行连接；3．能够对可用性问题进行快速地记录，提高评估的效率。

此外，在评估完成后，使用软件工具可以提高可用性问题的管理效果与效率：1．可以把每个评估者发现的可用性问题进行合并以取得一个完整的可用性问题系列；2。可以对所发现可用性问题的信度进行测量，即有多少个评估者发现了同一个可用性问题；3．可以根据一些指标对可用性问题进行优先级的排序，如根据严重性和处理的成本等；4．可以对出问题的情境或者任务进行定位，为以后使用用户测试来评估发现的可用性间题设计相应的任务情境；5．可以把可用性问题与先前的已经证的解决办法联系起来，

但是，研究者同时也认为，使用软件工具也同时会带来一些面的影响：

在被评估的对象和软件工具之间进行反复地切换会使评估者对被评估对象使用情境的感觉降低；
使用软件工具使报告可用性问题变得方便，这可能会增加误报的可能性；
软件工具中的默认值或者菜单默认的排序使得评估者在进行分类的时候可能会偏向某一特定值。

在Hvannberg等人的一项研究中，研究者分别采用Nielsen启发式系列和Gerhardt-Powals启发式系列，分别采用纸上记录阳软件工具记录的方式进行启发式评估，并对评估的结果进行对比。这是一个2X2的实验设计，实验采用被试问设计，每组被试为5人。实验结果表明，不论是采用Nielsen启发式系列还是Gerhardt-Powals启发式系列，采用软件工具所记录的可用性问题数量都要大于采用纸上记录的方式所记录的可用性问题的数量。

分享&收藏

转载请注明：陈童的博客 » 用户研究——启发式评估的流程