受控词汇表(controlled vocabulary)就是一种控制所用词汇含义并跟踪相关词的方法。在对开胃菜这个词的优选术语是“first course “,而客人们可能用到的词包括“starter、first course、hors d’oeuvres和appetizer”,可谓多种多样。
受控词汇表有多种不同类型,可能是由等价关系构成的简单词汇表:“对,gravlax和cured salmon是一样的。”也可能是一个复杂的辞典:“gravlax是一种蛙鱼,等同于cured salmon,这是百吉圈和熏鲑鱼的一种配料。”
等价关系
最简单的受控词汇表是一组等价关系:cured salmon和gravlax对于搜索来说含义相同。这种关系可以很简单,例如cat和kittycat(猫)、Lion与lyon(狮子)。这些都认为是一种变体,拼写可能稍有差别,但对于搜索而言,结果是一样的。
等价关系的示例
优选词语 | 变体 |
Smoked salmon(熏鲑鱼) | Fish, gravlax, lox, cured salmon, smoked fish, preserved fish, nova |
层次关系
分类系统是一种更复杂的受控词汇表。除了等价关系外,它还显示了层次关系。
层次关系示例
优选词语 | 变体 | 父词(广义词) | 子词(狭义词) |
Smoked salmon | Gravlox, lox
Cured salmon |
Fish,smoked fish,cured meats,preserved fish | Smoked salmon flatbread with creme fraise,linguini with smoked salmon and asparagus |
关联关系
关联词就是同属一个范畴但却并不相同的一些词,而且这些词也不是更广义或更狭义的词。并非简单地写作“她说”(said),利用分类辞典,你可以写为:她大声叫嚷(yelled),她讲(spoke),她低声耳语(whispered),她旁敲侧击地暗示(insinuated) ,她明白地说(articulated ),她说出(uttered) ,她坚持说(insisted)等等。
分类词典雏形
优选词语 | 变体 | 相关词 | 父词 | 兄弟词 | 子词 | 关联词 |
Smoked salmon | Gravlax,
Lox,Cured salmon |
Preserved fish | Smoke trout,bacalao,salt-cured sardines, pickled anchovies | Smokes salmon flatbread with creme fraise, linguini with smoked salmon and asparagus | Jewish cuisine, kosher foods | Creme fraise, bagels, capers, dill, crackers, fish knife, caviar |
建立一个受控词汇表
(1)收集内容
第一个问题应当是:“我想要组织的到底是什么?”我们发现,对此最有效的方法就是建立一个内容目录。内容目录(content inventory)是对网站上现存的所有东西以及你希望网站能够增加的所有东西的一个记录。
接下来可能还希望完成一个内容审计,这样一来不仅要统计每一个内容,还必须根据某些准则对各个内容做出评价,如冗余度、时效性和有效性。完成内容审计后,你就能全面地了解目前有些什么,将会有什么以及哪些内容真正具有价值。
(2)从尽可能多的来源收集词汇
可以先从内容入手,挑出当前主题独有的术语。还可以查看现有的分类辞典。
主题词示例
优选词语 | 同义词 | 缩写 | 首字母缩写 | 候选拼写方法 |
Rock music | Rock and Roll | Rock | R&R | Rawk |
(3)定义优选词语
优选术语(preferred term)是一种在内部控制词汇表并保证所有人都能达成共识的工具,同时它也是一种了解标记过程的方法。
(4)链接同义词和近义词
(5)按主题对优选术语分组
使用卡片分类方法,抽出优选术语,组织到同类的组中。
(6)找出广义术语和狭义术语
确定每个术语最适合放在层次结构的位置。
(7)完成关联链接
问问自己,用户下一步可能想去哪里,只选择最明显和最重要的关系:
- 奶酪链接饼干
- CD链接音乐会门票
- 锤子链接钉子
- 驱动程序下载链接支持文档
(8)对选择及相应原因建立文档
为你的后来者考虑,应当以某种方式写下你已经做了什么,以便后来者可以借助你的这些经验。
转载请注明:陈童的博客 » 信息架构:受控词汇表