可用性研究中的数据类型

用户体验 everyinch 11429℃ 0评论

数据是可用性度量的基础。可以以多种形式存在。在可用性领域中,数据类型包括任务完成率、网络流量、满意度调查的评价或参加者在实验室测试中遇到的问题数量。为了分析可用性数据,需要了解四种基本的数据类型:称名数据(nominal)、顺序数据(ordinal)、等距数据(interval)和比率数据(ratio)。每种数据类型都有自身的用途和局限。

1. 称名数据

称名数据(nominal data)是指一些简单无序的组或者类别。例如苹果、桔子和香蕉。适用于称名数据的统计方法是一些筒单的描述统计,如计数和频率。例如,45%的参加者是女性,或者200名参加者的眼睛是蓝色的,或者95%的参加者完成了某个特定任务。

2. 顺序数据

顺序数据(ordinal data)是一些有序的组别或者分类。数据是按照特定方式组织的,但测量值之间的距离是没有意义的。

在可用性领域,最常见的顺序数据是来自于问卷中的自我报告数据。例如,一个参加者可能将网站评定为“极好、好、一般或差”。这些是相对的等级:“极好”与“好”之间的距离并非等于“好”与“一般”之间的距离。可用性问题严重性评价是另外一个顺序数据的例子。一个可用性专家可能将参加者遇到问题的严重程度评定为“高、中、低”,但是,“高”与“中”之间距离并非必须等于“中”与“低“之间的距离。

3. 等距数据

等距数据(interval data)是没有绝对零点的连续数据,而且测量值之间的差异是有意义的。在可用性领域,系统可用性量表(SUS)是一个等距数据的例子,它的分数范围是0到100,SUS分数越高,表示可用性越好。量表上各点之间的距离是有意义的。

对于收集和分析主观评价的数据,人们一直在争论:这些数据应被当作纯粹的顺序数据还是可以作为等距数据。请看这样两种评分标度:

○ 差 ○ 一般 ○ 好 ○ 极好

差 ○  ○  ○  ○  ○  极好

第一个标度具有外显的标签,使得数据具有顺序特征。第二个标度仅给两个端点赋予标签,使得数据更具有等距性。

使用者对这种标度的合理理解是;标度上所有数据点之间的距离都是相等的。当犹豫能否将类似这样的数据作为等距数据处理的时候,需要考虑一个问题:任意两个定义的数据点的中间点是否有意义。如果这个中间点有意义,那么这种数据就可以作为等距数据进行分析。

4. 比率数据

比率数据(ratio dada)与等距数据相似,而且具有绝对的零点。对于比率数据,测量值之间的差异可以解释为比率。年龄、身高和体重都是比率数据的例子。

在可用性领域中,完成时间是最明显的比率数据的例子。比率数据可以表示某一事物是另一事物快两倍或慢一半。

度量和数据

根据不同的数据类型和可用性度量选择正确的统计方法

数据类型 常用度量 统计程序
称名(类别) 人物成功(二分),错误(二分) 频率,列联表,卡方检验
顺序(等级) 严重性评分,等级(设计) 频率,列联表,卡方检验,Wilcoxon符号等级检验法,Spearman等级相关
等距 Likert量表数据,SUS分数 所有的描述统计,t检验,方差分析,相关分析,回归分析
比率 完成时间,时间(视觉注意),平均任务完成率 所有的描述统计(包括几何平均数),t检验,方差分析,相关分析,回归分析
分享&收藏

转载请注明:陈童的博客 » 可用性研究中的数据类型

喜欢 (7)
发表我的评论
取消评论

表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
'; } if( dopt('d_footcode_b') ) echo dopt('d_footcode'); ?>