1. 预算和时间表

使用度量进行一个可用性研究的时间和费用取决于评估的方法、可用性度量和现有的工具。

如果在进行一个小样本参加者（10个或10个以内）的形成式可用性研究度量的收集应该对整体的时间表或预算没有什么影响，即使有的话也非常小。

进行一个较大样本（通常超过12人）的实验室测试来说，所选择的可用性度量可能会对预算和时间表产生更大的影响。最显著的费用影响可能是招募更多参加者及支付参加者报酬而带来的额外费用。这些花费取决于参加者是什么类型的人以及参加者是如何招募的。

2. 评估方法

选择一种测试方法来获取可用性度量，最终取决于需要多少个参加者和采用什么样的度量。最常用的可用性方法是实验室测试，这需要相对较小的样本量（通常4-10个参加者）。

实验室测试是一种一对一的形式，即一个测试人员（可用性专家）与一个参加者。测试人员对参加者提问，让参加者在问题产品上完成一系列既定任务。参加者通常在完成这些任务过程中进行出声思维（think aloud）。测试人员记录参加者的行为和对问题的反馈。

实验室测试在形成式研究中使用最适合。因为形成式研究的目标是进行迭代式的设计改进。所要收集的最重要度量是关于可用性问题的。包括问题发生频次、类型和严重性。而且，采集诸如任务成功、错误和效率等绩效数据也会有帮助。

可用性测试也会进行更多参加者（大约10-50个用户）的测试。进行较多参加者测试的主要好处是，随着样本量的增加，对所得数据结果的把握也随之增加。

在线调查是在相对短的时间内收集大量数据的方法，同时也适合针对微小设计改动获取实验数据。

焦点小组（focus group）是了解人们对任何特定产品或概念的感知和态度的一种方法。

3. 参加者

确定招募的标准：招募标准应该详细而精确，以减少不符合要求的可能性。

数量：一个可用性测试到底需要多少个用户，是本领域内最有争议的话题之一。影响的因素包括用户群体的多样性程度、产品的复杂度以及研究的具体目标。经验是6-8人是合适的。

招募的策略：可以从顾客数据中生成参加者名单；还可以通过E-mail发送招募邀请；也可以让第三方协助用户招募。

4. 数据收集

就较小样本的实验室测试而言，用Excel软件收集数据就足够了。建议最好尽可能地以数字的形式进行记录。例如，将成功标记为“1”、失败标记为“2”。

5. 数据整理

筛选数据：检查是否有极端值，过滤掉哪些不符合的目标用户或有其他外界因素干扰的数据。

创建新变量：也许需要为自我报告式评分创建一个得分排名处于前两位的新变量。

检验应答：例如，有很大比例的参加者都给出相同的错误答案。

检查一致性：一致性检查可以包括对任务完成时间和成功与自我报告式度量进行比较。如果许多参见者在相对短的时间内成功地完成了任务，但是针对这个任务却给出一个很低的评分，那么要么数据处理时有问题，要不参见者对问题的不理解。

转换数据：用Excel记录和整体数据。

进行一个包含可用性度量的可用性研究需要有些规划。以下是一些需要记住的关键点：

首先需要决定的是，采用形成式的方法还是采用总结式的方法。形成式的方式是在设计投放或发布之前收集数据来帮助改进该设计。这种方式最适合用在有机会对产品设计施加正面影响的情况。总结式的研究方式适用于想要了解某些既定目标达到何种程度的情形。总结式测试有时候也适用于竞争性可用性研究。
在确定最合适的可用性度量时，需要考虑用户体验的两大方面是绩效和满意度。绩效度量以用户做了什么为特征，且包括诸如任务成功、任务时间和达到一个理想结果所需的努力程度等测量。满意度度量关系到用户认为或感觉他们的体验如何。
当进行任何涉及度量的可用性研究时。预算和时间进度都需要提前计划好，如果要进行样本量较小的形成式研究，所采集的度量应该对整体的时间进度或预算没有什么影响，即使有的话也要非常小。否则，必须特别注意估算大规模研究的费用和时间。并将之与相关人员积极沟通。
通常有三种类型的评估方法会用于采集可用性数据。小样本的实验室测试最适合形成式测试。这些研究通常关注基于问题的度量。大样本（超过12人）的实验室测试最适用于同时采集定量和定性的数据。这些类型的研究通常测量绩效的不同方面，例如成功、完成时间和错误等。大样本量（超过一百人）的在线研究最适合检验微小设计改变的影响和偏好。
清晰明确地确定招募可用性测试参加者的标准。确保他们都真正代表目标用户群。一个形成式可用性研究中，对于每次设计迭代，测试6-8个参加者通常是足够的。如果有截然不同的用户群组，最好从每个群体中至少选择四个参加者。对于总结式可用性研究，我们建议如果可能的话，要收集50-100个典型用户的数据。
提前计划好将如何获取研究所需要的所有数据。确保在测试中有一份模板可以用来快速记录数据，确保每一个辅助收集数据的人都熟悉所有的编码规则。在大规模研究中考虑使用数据记录工具。
数据整理是对数据进行某种方式的处理，以确保它们可用且可靠。例如，过滤数据是指去除极端值或删除有问题的数据记录，一致性检查和检验应答是用来确保参加者的真实意图与他们的回答是否相符合的重要步赚。

分享&收藏

转载请注明：陈童的博客 » 可用性研究中的一些重要研究细节