卡片分类(card-sorting)至少出现于20世纪80年代,它是一种把信息系统中的元素组织得让用户能够理解的技术。比如Tullis(1995年)就用这种技术来架构操作系统中主框架上的菜单。最近,这项技术更是深受欢迎,被用于网站信息架构的决策(比如Maurer & Warfel,2004年)。在过去的几年里,这项技术又从使用真的索引卡片进行卡片分类发展成使用虚拟卡片进行在线分类。虽然很多的可用性从业人员都熟悉卡片分类的基本技术,但很少有人知道在分析卡片分类的数据时可以采用多种不同度量。
两种主要的卡片分类方式是:
(1)开放式卡片分类,在这种卡片分类方式中提供给参加者要分类的卡片,但用户需要自己来定义这些卡片所属的组别。
(2)封闭式卡片分类,向参加者提供要分类的卡片和他们所属组的名称。虽然有些度量适用于这两种分类方式,但另一些则只适用于其中的一种分类方式。
1. 开放式卡片分类数据的分析
一种分析开放式卡片分类数据的方法是;将研究中所有卡片两两之间的“感知距离”组成一个矩阵。比如,假设在一项卡片分类研究中有十种水果:苹果、桔子、草莓、香蕉、桃子、李子、西红柿、梨、葡萄和樱桃。可以假设其中的一位参加者对这些水果做了如下的分组:
- 大且圆的水果:苹果、桔子、桃、西红柿
- 小水果:草莓、葡萄、李子
- 长得很逗的水果:香蕉、梨
接下来就可以依据下面的规则将每一位参加者对十个水果所做的两两之间的“感知距离”组成一个矩阵:
- 如果用户将某一对水果放在同一组中,它们之间的距离就是0。
- 如果用户将某一对水果放在了不同的组中,它们之间的距离就是1。
一位参加者进行卡片分类后的距离矩阵 | ||||||||||
苹果 | 桔子 | 草莓 | 香蕉 | 桃 | 李子 | 西红柿 | 梨 | 葡萄 | 樱桃 | |
苹果 | — | 0 | 1 | 1 | 0 | 1 | 0 | 1 | 1 | 1 |
桔子 | — | 1 | 1 | 0 | 1 | 0 | 1 | 1 | 1 | |
草莓 | — | 1 | 1 | 0 | 1 | 1 | 0 | 0 | ||
香蕉 | — | 1 | 1 | 1 | 0 | 1 | 1 | |||
桃 | — | 1 | 0 | 1 | 1 | 1 | ||||
李子 | — | 1 | 1 | 0 | 0 | |||||
西红柿 | — | 1 | 1 | 1 | ||||||
梨 | — | 1 | 1 | |||||||
葡萄 | — | 0 | ||||||||
樱桃 | — |
下面给出了总体矩阵结果的例子。在这个例子中,只有2位参加者把桔子和梨放在了不同的组,而所有的20位参加者都把香蕉和西红柿放在了不同的组:
一位参加者进行卡片分类后的距离矩阵 | ||||||||||
苹果 | 桔子 | 草莓 | 香蕉 | 桃 | 李子 | 西红柿 | 梨 | 葡萄 | 樱桃 | |
苹果 | — | 5 | 11 | 16 | 4 | 10 | 12 | 8 | 11 | 10 |
桔子 | — | 17 | 14 | 2 | 12 | 15 | 11 | 12 | 14 | |
草莓 | — | 17 | 16 | 8 | 18 | 15 | 4 | 8 | ||
香蕉 | — | 17 | 15 | 20 | 11 | 14 | 16 | |||
桃 | — | 9 | 11 | 6 | 15 | 13 | ||||
李子 | — | 12 | 10 | 9 | 7 | |||||
西红柿 | — | 16 | 18 | 14 | ||||||
梨 | — | 12 | 14 | |||||||
葡萄 | — | 3 | ||||||||
樱桃 | — |
在分析总体矩阵时可以使用两种统计方法:层级聚类分析(hierarchical cluster analysis)和多维标度法(multidimensional scaling,MDS)
(1)层级聚类分析
层级聚类的目的是建立一个树状图,将参加者视为最相似的卡片放在相近的枝节上。
上图说明切出来了四个组:垂直线与四条水平线交叉在一起,形成4个组:(1)香蕉;(2)西红柿;(3)李子、樱桃、葡萄和草莓;(4)梨、桃、桔子和苹果。
(2)多维标度法
多维标度法会绘制出一张近似地图,并标示出它们的相对位置。
在多维标度分析中,香蕉和西红柿相离的较远,而葡萄、草莓、樱桃和李子聚集在左侧,而苹果、桃、梨和桔子则聚集在右侧。
2. 封闭式卡片分类数据的分析
在封闭式卡片分类中,不仅要给用户提供卡片,还要提供对这些卡片进行分组时的组名。封闭式卡片分类不像开放式分类那样常用。通常情况下,会首先通过做开放式卡片分类来了解用户在自然分类状态下会创建什么样的组以及他们对此可能会使用到的相应名称。有时候做完一个开放式分类后紧跟做一个或多个封闭式分类会,这会很有帮助。
下表中的数据说你名了在封闭式卡片分类中把10章卡片分别放到了3个组中的用户比例。
在封闭式卡片分类中将每张卡片放在3个组的用户比例(%) | ||||
卡片 | 组A | 组B | 组C | 最大比例 |
1 | 17 | 78 | 5 | 78 |
2 | 15 | 77 | 8 | 77 |
3 | 20 | 79 | 1 | 79 |
4 | 48 | 40 | 12 | 48 |
5 | 11 | 8 | 81 | 81 |
6 | 1 | 3 | 96 | 96 |
7 | 46 | 16 | 37 | 46 |
8 | 57 | 38 | 5 | 57 |
9 | 20 | 75 | 5 | 75 |
10 | 4 | 5 | 92 | 92 |
平均数 | 73 |
下表对封闭式卡片分类进行了一些修正。这里的数据和上表基本一致,只是多个第二位置,即百分数仅次于最大比例的组,差别指的是最大分数与第二位置之间的差值。对于卡片7那样更为分散的卡片来说,得出来的值会有相当大的低落。
在封闭式卡片分类中将每张卡片放在3个组的用户比例(%) | ||||||
卡片 | 组A | 组B | 组C | 最大比例 | 第二位置 | 差别 |
1 | 17 | 78 | 5 | 78 | 17 | 61 |
2 | 15 | 77 | 8 | 77 | 15 | 62 |
3 | 20 | 79 | 1 | 79 | 20 | 60 |
4 | 48 | 40 | 12 | 48 | 40 | 8 |
5 | 11 | 8 | 81 | 81 | 11 | 70 |
6 | 1 | 3 | 96 | 96 | 3 | 93 |
7 | 46 | 16 | 37 | 46 | 37 | 8 |
8 | 57 | 38 | 5 | 57 | 38 | 18 |
9 | 20 | 75 | 5 | 75 | 20 | 55 |
10 | 4 | 5 | 92 | 92 | 5 | 87 |
平均数 | 73 | 52 |