这部分将围绕关于五种基本数据图类型的建议和技术展开:
- 条形(柱状)图(Column or bar graphs)
- 折线图(Line graphs)
- 散点图(Scatter plots)
- 饼图(Pie charts)
- 堆积条形图(Stacked bar graphs)
1. 柱状图或条形图
柱状图(column graphs)和条形图(bar graphs)是基本相同的,唯一的差别就是朝向不同。从技术上讲,柱状图是竖直的而条形图是水平的。
- 条形图适用于呈现离散项目或类别(如任务、参加者、设计等)上的连续数据数值(如时间、百分比等)。如果两个变量都是连续的,那么折线图更适合。
- 连续变量的坐标轴通常以0为起点。
- 不要让连续变量的坐标轴高于其理论上可能的最大值。举例来说,如果要图示成功完成每个任务的用户百分比,理论上的最大值为100%。
上图中第二张图的错误样例是:没有添加数据标题,纵轴没有从0点开始,没有显示置信区间,纵轴刻度使用了过高的精确度。
2. 折线图
折线图(Line graphs)常用语显示连续变量的变化趋势,特别是随时间变化的趋势。使用折线图的关键原则是:
- 折线图适于要呈现这样的数据:一个连续变量(如正确率、错误数等)是另一连续变量(如年龄、实验试次等)的函数。如果其中一个变量是不连续的(如性别、参加者、任务等),那么采用条形图则更适合。
- 显示数据点。真正重要的是实际的数据点,而不是线条。线条的意义只是把数据点连接起来以使数据所表现出来的趋势更为明显。
- 使用适当粗细的线条使之更为清晰。太细的线条不仅难以看清,而且难以分辨颜色。并且可能暗示数据的精确度比实际的精确度要高。
上图中第二个样例的错误包括:没有标注纵轴,没有显示数据点,没有显示置信区间,所用直线磅数太低。
3. 散点图
散点图(Scatter plots)也称X/Y图,用来显示成对数值。使用散点图的关键原则是:
- 要图形化的数据必须要进行配对。一个经典的例子是一组人的身高和体重。每个人显示为一个数据点,而两个轴则可以是身高和体重口
- 通常情况下,两个变量是连续的。
- 使用适当的刻度。纵坐标轴上的值不能低于0,因此合适的做法是以这一点为起点,而不是以0为起点。
- 以散点图的方式呈现数据通常是为了显示两个变量之间的关系。因此,在散点图上添加趋势线通常是有帮助的。可能需要包括R2值以表示拟合度(the goodness of fit)。
4. 饼图
饼图(Pie charts)显示了整体的各部分或相应的百分比。使用饼图的关键原则是:
- 饼图仅适于各部分相加为100%的数据。某些条件下,这意味着要创造一个表示“其他”的类别。
- 使饼图中分割的组块数最小。如果分割的块数过多,就会失去意义。使用时请尽量不要超过六个组块。
- 在大多数情况下,图表应包含每个部分的百分比和标题,通常,它们应与各组块相邻近,有必要的话可以用导引线连接。为了避免重叠,有时候还必须手动地调整各标题。
错误样例的错误包括:组块数过多,图例放置位置交叉,没有显示各组块的百分比。
5. 堆积条形图
堆积条形图(Stacked bar graphs)本质上是多个以饼图显示的条形图。加入有一系列的数据集,且其中每一个都代表总体的一部分,那么使用这种类型的图是合适的。使用堆积条形图的关键原则是:
- 与饼图类似,堆积条形图仅适合于每个项目的各部分相加为100%的条件。
- 系列中的项目通常是分类别的(如任务。参加者等)。
- 使每个条形中的分割组块数最小化。如果每个直条分割的组块数超过三个就会给解释带来困难。恰当的做法是合并某些部分。
- 可能的话,使用受众约定俗成的颜色编码。例如,绿色是好的,黄色表达临界状态,红色是不好的。
错误样例的错误包括:分割部分过多,颜色编码不符合约定,没有纵轴标题。
转载请注明:陈童的博客 » 可用性研究中用图形来呈现数据