疾病控制预防中心(Centers for Disease Control and Prevention,简称CDC)决定修改和更新他们的网站——cdc.gov,这次再设计的主要目标是优化网站首页和几个新的二级页面的可用性。主要的可用性工作包括:
- 检视CDC过去有关可用性研究的结果
- 访谈用户、利益相关者、合作伙伴及网站制作人员
- 详细分析网站、搜索和访问日志
- 分析从“美国消费者满愈指数”得到的用户调查数据
- 调查CDC管理层、雇员和网站制作人员的惫见和态度
- 进行卡片分类(card-sort)
- 开展并行设计(parallel design session)
- 制作一系列线框图
- 制作图形化导向的原型
(1)可用性测试级别
应用Bailey的可用性测试级别模型(Models of Usability Testing Levels),这个模型提出了5个可用性测试级别:
第一级:传统的检查型评估(inspection evaluation),比如启发式评估和专家检视等
第二级:利用场景进行规则式检视(Algorithmic Review with Scenarios)
第三级:适度控制的可用性测试,需要相对少量的测试参与者(大约8名)
第四级:严格控制的可用性测试,只需要适量的测试参加者以对整个用户群进行较弱的推断
第五级:严格控制的可用性测试,需要足够适量的测试参加者以对整个用户群进行充分的推断
(2)基线测试
最初的基线测试是用于确定现有网站的人的操作绩效(human performance)和用户满意度。
测试参加者包括联邦政府雇员及与政府没有从属关系的人员。一共测试了68名参加者,其中包括:公共卫生专家、保健工作者(外科医生、护士等)、普通消费者、学者和科学家、记者、立法人员和学生。所招募的参加者符合CDC.gov网站典型用户的特征、包括不同性别、年龄、教育背景、种族以及互联网的使用经验。
每个可用性测试大约持续一小时。
测试中使用了两种软件工具:Keynote公司的WebEffective和Techsmith公司的Morae
用户体验团队设计了36了反映cdc.gov网站最常用任务的场景。
每个参加者需要处理10个任务场景,所有参加者被告知要通过浏览网页找到正确答案,并不能使用该网站的搜索功能。随后,要求用户完成“只做搜索”的测试来确定不让用户用搜索功能的影响。结果如下表所示:
“浏览”和“搜索”任务的整体绩效比较 | ||
浏览 | 搜索 | |
成功率 | 54% | 49% |
平均时间 | 2.4分钟 | 2.8分钟 |
平均浏览的网页数 | 7.1页 | 7.7页 |
满意度(百分制) | 46 | 49 |
所有36个任务的总体成功率是54%,下图列出了11个任务的成功率:
(3)定性分析的发现
值得注意的是:用性测试中定性分析的发现可以作为首页重新设计的参考意见。我们让参加者描述他们的整体印象,详细说明他们最喜欢和最不喜欢的方面,并且请他们设想,如果有机会对网页做出修改,他们会做哪些调整。以下是基线测试中的一些发现:
- 许多参加者觉得首页呈现了太多的信息(信息过多);
- 因为繁杂、混乱的页面,参加者总是在很艰难地查找想要的信息;
- 发现A-Z索引的参加者都非常喜欢这个功能,并且使用得很频繁(但是很难发现这个功能);
- 参加者认为网站在布局、导航、外观和体验方面存在不一致;
- 参加者认为信息分类不清晰;
- 参加者抱怨不得不搜索太多的层级才能找到信息;
- 参加者确实发现功能和页面说明非常有用。
(4)绘制线框图和首次点击测试
制作线框图,并进行一对一的测试:
邀请65名参加者完成136个任务(针对不同的线框图)。每个参加者花费大约1小时。
首次点击测试:即只收集和分析参加者在读完任务说明之后第一次点击的数据。第一次点击是非常关键的行为,如果用户一开始就越到困难,通常就会经常遇到困难。
这种类型的测试花费时间少,使用了两个工具:Bailey的可用性测试环境(Usability Testing Environment)和Techsmith的Morae。
下图显示的任务中,相当多的参加者选择错误的链接:
下图中的任务中,比较少的人能做出一致的正确首次点击,而且非常分散,这种情况找更难解决:
(5)最终原型测试
图元化原型(有图片、颜色和用于标题的文字)将用于最后的可用性测试。
投放前的可用性测试分为两部分:预测试和最终测试。
预测试有18名参加者,共完成了56个任务。这些任务被分为三类:24个首页首次点击测试,24个某一新建二级页面的首次点击侧试,9个“从首页到内容页面”的测试。所有参加者要在一小时的现场测试单元(in-person testing session)内完成所有场景任务。
测试完毕后,总结分析数据,进行一些修改。
最终的现场测试使用了56个稍许改动过的任务,另外的19名参见参与了测试。
下表列出了“从首页到内容页”的任务结果。结果显示,成功率从62%提高到78%,满意度从46分提高到了78分。
基线测试和投放前测试中绩效和偏好结果对比表 | |||
基线测试 | 投放前测试 | 提高百分率(%) | |
成功率 | 62 | 78 | 26 |
平均时间 | 96 | 81 | 19 |
平均浏览的网页数 | 8.3 | 4.9 | 69 |
满意度(百分制) | 46 | 78 | 70 |
结论
可用性测试度量在这次的网页和网站修改中有三个主要用途。
- 是给这个网站确定了成功率的总体基线。这样可用于与跟其他网站、可用性目标、修改过的网站等进行比较。
- 发现了用户越到最多问题的一些任务,这能帮助我们发现网站中问题最大的地方,从而可以使设计师将他们的主要经历用于这些区域的加强上。
- 发现哪些一致呈现高操作绩效的任务,从而可以节约时间和精力。
经过可用性测试之后,相对于原来的页面,新的首页有了实质性的改善。我们很难想象,如果修改过程中不引入高水准的可用性测试,要怎样才能做出有效、有用和重要的修改来提升网站。
转载请注明:陈童的博客 » cdc.gov网站的再设计