可用性研究中的数据类型

数据是可用性度量的基础。可以以多种形式存在。在可用性领域中，数据类型包括任务完成率、网络流量、满意度调查的评价或参加者在实验室测试中遇到的问题数量。为了分析可用性数据，需要了解四种基本的数据类型：称名数据（nominal）、顺序数据（ordinal）、等距数据（interval）和比率数据（ratio）。每种数据类型都有自身的用途和局限。

1. 称名数据

称名数据（nominal data）是指一些简单无序的组或者类别。例如苹果、桔子和香蕉。适用于称名数据的统计方法是一些筒单的描述统计，如计数和频率。例如，45%的参加者是女性，或者200名参加者的眼睛是蓝色的，或者95%的参加者完成了某个特定任务。

2. 顺序数据

顺序数据（ordinal data）是一些有序的组别或者分类。数据是按照特定方式组织的，但测量值之间的距离是没有意义的。

在可用性领域，最常见的顺序数据是来自于问卷中的自我报告数据。例如，一个参加者可能将网站评定为“极好、好、一般或差”。这些是相对的等级：“极好”与“好”之间的距离并非等于“好”与“一般”之间的距离。可用性问题严重性评价是另外一个顺序数据的例子。一个可用性专家可能将参加者遇到问题的严重程度评定为“高、中、低”，但是，“高”与“中”之间距离并非必须等于“中”与“低“之间的距离。

3. 等距数据

等距数据（interval data）是没有绝对零点的连续数据，而且测量值之间的差异是有意义的。在可用性领域，系统可用性量表（SUS）是一个等距数据的例子，它的分数范围是0到100，SUS分数越高，表示可用性越好。量表上各点之间的距离是有意义的。

对于收集和分析主观评价的数据，人们一直在争论:这些数据应被当作纯粹的顺序数据还是可以作为等距数据。请看这样两种评分标度：

○ 差 ○ 一般 ○ 好 ○ 极好

差 ○ ○ ○ ○ ○ 极好

第一个标度具有外显的标签，使得数据具有顺序特征。第二个标度仅给两个端点赋予标签，使得数据更具有等距性。

使用者对这种标度的合理理解是;标度上所有数据点之间的距离都是相等的。当犹豫能否将类似这样的数据作为等距数据处理的时候，需要考虑一个问题：任意两个定义的数据点的中间点是否有意义。如果这个中间点有意义，那么这种数据就可以作为等距数据进行分析。

4. 比率数据

比率数据（ratio dada）与等距数据相似，而且具有绝对的零点。对于比率数据，测量值之间的差异可以解释为比率。年龄、身高和体重都是比率数据的例子。

在可用性领域中，完成时间是最明显的比率数据的例子。比率数据可以表示某一事物是另一事物快两倍或慢一半。

度量和数据

根据不同的数据类型和可用性度量选择正确的统计方法

数据类型	常用度量	统计程序
称名（类别）	人物成功（二分），错误（二分）	频率，列联表，卡方检验
顺序（等级）	严重性评分，等级（设计）	频率，列联表，卡方检验，Wilcoxon符号等级检验法，Spearman等级相关
等距	Likert量表数据，SUS分数	所有的描述统计，t检验，方差分析，相关分析，回归分析
比率	完成时间，时间（视觉注意），平均任务完成率	所有的描述统计（包括几何平均数），t检验，方差分析，相关分析，回归分析