数据是可用性度量的基础。可以以多种形式存在。在可用性领域中,数据类型包括任务完成率、网络流量、满意度调查的评价或参加者在实验室测试中遇到的问题数量。为了分析可用性数据,需要了解四种基本的数据类型:称名数据(nominal)、顺序数据(ordinal)、等距数据(interval)和比率数据(ratio)。每种数据类型都有自身的用途和局限。
1. 称名数据
称名数据(nominal data)是指一些简单无序的组或者类别。例如苹果、桔子和香蕉。适用于称名数据的统计方法是一些筒单的描述统计,如计数和频率。例如,45%的参加者是女性,或者200名参加者的眼睛是蓝色的,或者95%的参加者完成了某个特定任务。
2. 顺序数据
顺序数据(ordinal data)是一些有序的组别或者分类。数据是按照特定方式组织的,但测量值之间的距离是没有意义的。
在可用性领域,最常见的顺序数据是来自于问卷中的自我报告数据。例如,一个参加者可能将网站评定为“极好、好、一般或差”。这些是相对的等级:“极好”与“好”之间的距离并非等于“好”与“一般”之间的距离。可用性问题严重性评价是另外一个顺序数据的例子。一个可用性专家可能将参加者遇到问题的严重程度评定为“高、中、低”,但是,“高”与“中”之间距离并非必须等于“中”与“低“之间的距离。
3. 等距数据
等距数据(interval data)是没有绝对零点的连续数据,而且测量值之间的差异是有意义的。在可用性领域,系统可用性量表(SUS)是一个等距数据的例子,它的分数范围是0到100,SUS分数越高,表示可用性越好。量表上各点之间的距离是有意义的。
对于收集和分析主观评价的数据,人们一直在争论:这些数据应被当作纯粹的顺序数据还是可以作为等距数据。请看这样两种评分标度:
○ 差 ○ 一般 ○ 好 ○ 极好
差 ○ ○ ○ ○ ○ 极好
第一个标度具有外显的标签,使得数据具有顺序特征。第二个标度仅给两个端点赋予标签,使得数据更具有等距性。
使用者对这种标度的合理理解是;标度上所有数据点之间的距离都是相等的。当犹豫能否将类似这样的数据作为等距数据处理的时候,需要考虑一个问题:任意两个定义的数据点的中间点是否有意义。如果这个中间点有意义,那么这种数据就可以作为等距数据进行分析。
4. 比率数据
比率数据(ratio dada)与等距数据相似,而且具有绝对的零点。对于比率数据,测量值之间的差异可以解释为比率。年龄、身高和体重都是比率数据的例子。
在可用性领域中,完成时间是最明显的比率数据的例子。比率数据可以表示某一事物是另一事物快两倍或慢一半。
度量和数据
根据不同的数据类型和可用性度量选择正确的统计方法
数据类型 | 常用度量 | 统计程序 |
称名(类别) | 人物成功(二分),错误(二分) | 频率,列联表,卡方检验 |
顺序(等级) | 严重性评分,等级(设计) | 频率,列联表,卡方检验,Wilcoxon符号等级检验法,Spearman等级相关 |
等距 | Likert量表数据,SUS分数 | 所有的描述统计,t检验,方差分析,相关分析,回归分析 |
比率 | 完成时间,时间(视觉注意),平均任务完成率 | 所有的描述统计(包括几何平均数),t检验,方差分析,相关分析,回归分析 |
转载请注明:陈童的博客 » 可用性研究中的数据类型