元数据是指信息的信息。元数据是所有组织系统的基础,从搜索到购物网站上的分面导航系统都依赖于元数据。信息可以有多种不同形式,可以是一篇文章、一本电子书、一张照片或者是一个目录。有些信息没有文字,如Flash影片、MP3格式的声音或者照片。如果信息中固有的文字很少(比如照片和音乐就是如此),那么元数据将有助于这些信息的查找。
元数据就是关于每一项内容的所有信息。例如,对于一首歌曲,元数据可能包括:“Brown Sugar,第2版,花絮,作词作曲分别是Mick Jagger和Keith Richards,演唱者为滚石乐队,唱片名为Itchy Fingers, bootleg,时长3分50秒,分类是摇滚乐,蓝调布鲁斯”……
如今,常用的3类主要元数据包括:
- 固有性元数据:与事物构成有关的元数据。JPEG图片、20KB大小。
- 管理性元数据:与事物处理方式有关的元数据。文档的编辑是谁?已经获准发表了吗?
- 描述性元数据:与事件本质有关的元数据。是Web上最常用的元数据。这篇文章的主题是什么?相关主题是什么?
上图的元数据:
固有性元数据:20KB、JPEG格式(说明这个物品是什么)
管理性元数据:摄影师:Noel Franus 。用途:圣诞卡(说明它的用途是什么)
描述性元数据:狗、小狗、犬科、金毛拉布拉多猎犬、金毛拉布拉多犬,圣诞帽,圣诞老人,圣诞节,圣诞,照片,可爱,伤感,让人想抱的(可以这样来描述这个物品)
如果开发过网站,就会接触到HTML的meta标签。例如Dean and DeLuca网站的meta标签中给出的描述元数据:
<meta name=”description” content=”Dean and DeLuca gourmet food stores. Offering a wide selection of California wines, custom gift baskets, cakes, cheeses, hard to fi nd spices, coffee, caviar, truffl es, holiday and seasonal foods.” />
<meta name=”keywords” content=”dean; deluca; gift; gourmet; food; online; store; caviar; cheese; steak; coffee; holiday; artisan cheeses; artisan cheese; spices; california; napa valley; baskets; corporate sales; olive oil; vinegar; chocolate; seafood; shellfi sh; wine; herbs; cooks tools; cookware; cake; cakes; wines; cookies; pies; truffl es; seasonal; bakery; salmon; shrimp; lobster; gifts; balsamic” />
在HomeBistro.com上,可以看到以下管理性元数据:
<meta name=”ROBOTS” content=”ALL”>
<meta name=”revisit” content=”15 days”>
<meta name=”robots” content=”index,follow”>
美国纽约公共图书馆(New York Public Library,NYPL)收藏了自发明照相机以来的各种照片,存储空间达57TB。元数据有助于在这个照片的海洋里找到想看的照片。例如,右键照片,查看它的属性就尅看到这些元数据:这是一个JPEG照片,大小303.29KB,609×760像素。
但是知道这些信息对于希望再次找到照片几乎没有什么帮助。描述性元数据可能是搜索和浏览时最重要的信息,因为人类容易记住故事和影像。
卖热狗的人(West st. North Moore, Manhattan)的有关属性:
元数据类型示例
如果手工地增加了元数据,下表中的各项更有可能被查找者找到: