一、构成分析类
1.饼图/环形图
饼图经常表示一组数据的占比,需要数值维度。如图,各扇形面积代表各类型装修材料销售额的大小,整体为装修材料总销售额。右侧环形图为饼图的变种,中心区域可展示数据或者文本信息。
饼图也是有缺陷的,当类别过多,也不适宜在饼图上表达。因此在使用饼图时我们需要顺时针降序排列,同时维度取值在10个以内。
2.玫瑰图
玫瑰图是饼图的变种,用来对比不同类别的数值大小,在数值相差不大的时候使用。
3.旭日图
旭日图也是饼图的变种,表现整体在各个维度上的构成,以及维度与维度之间的从属关系。如图,可以清楚看到整体的销售额在三大类产品的分布,而每类产品的各品牌销售额区别也可以直接对比,同时也可以看到每类产品的品牌分布。
4.仪表盘
模仿汽车仪表盘,采用绝对值与相对值结合的方式,展现某个指标的完成情况,在项目进度,计划完成度较常见。只适合展现数据的累计情况,不适用于数据的分布特征等,同时一般超过100%后不太好表现。
5.矩形树图
当我们想表达过多类型的数据时,可以使用矩形树图,它展现同一层级的不同分类的占比情况,还可以同一个分类下子级的占比情况,每个矩形代表一个聚合类,颜色的深浅和面积的大小代表这个聚合类的大小。如图,比如电子商务、产品销售等涉及大量商品品类的分析等。
局限是不适合展现不同层级的数据,比如组织架构图,每个分类不适合放在一起看占比情况。且当以面积表示大小,当数值相近时人眼难以辨别,当然可通过填充数值弥补。
6.瀑布图
采用绝对值与相对值结合的方式,展示各成分构成情况,更多的用于核心指标的分解,适合展示数据累积变化过程,局限是各类数据差别太大则难以比较。
二、对比分析类
1.柱状图/多指标柱状图
柱状图是一种应用得很广泛的图形,它表征分类型变量与数值型变量的关系,常用于多个维度的比较和变化。柱形图至少需要一个数值型维度,通常文本维度/时间维度通常作为X轴,数值型维度作为Y轴。
一般需要排序,如果分类型变量是有序的,按照它本身的顺序排列即可,如果分类型变量无序,那么则根据数值型变量的大小进行排序,使柱状图的高度单调变化。
2.条形图/多指标条形图
类似柱状图,只不过两根轴对调了一下。因为有大量空白位置标示每个类别的名称,所以适用于类别名称过长的情况,但分类过多则无法展示数据特点。
3.象形图
以形象化的图片数量代表维度数值的大下,多用于具体实物的对比。
4.堆积柱图/堆积条图
用来比较同类别各变量和不同类别变量总和差异。需要注意的是堆积柱内各项间具有相同性质的维度划分,最好不要是不同的度量。
5.折线图
折线图是用来观察数据的趋势,主要展示数据随时间或有序类别的波动情况的趋势变化。对比时使用,常见时间维度对比。如果是无序类别则无法展示数据特点。
6.面积图
用面积展示数值大小,展示数量随时间变化的趋势。多用于时间维度的对比,其中堆积面积图中堆积部分需要是具有相同性质的维度划分。
7.雷达图
雷达图将多个分类的数据量映射到坐标轴上,对比某项目不同属性的特点,适用于了解同类别的不同属性的综合情况,以及比较不同类别的相同属性差异。它在商务、财务领域应用较大,常见于经营状况,财务健康程度。比如对企业财务进行分析,划分出六大类:销售、市场、研发、客服、技术、管理。通过雷达图绘制出预算和实际开销的维度对比,会很清晰。另外在游戏中也应用广泛,如图游戏人物的各项数值对比。
需要注意雷达图的数据必须进行标准化处理,同时指标是正向且可以比较的,也就是指标代表越好,且当指标差异较大时,需要进行标准化,消除单位影响。另外雷达图是静态数据,不可能有时间维度,同时能表达的静态数据信息有限,线条不宜超过5条,指标不宜超过8个。
8.对比条图
两个项目在各个维度的对比时使用。
9.子弹图
对比条形图的变种,多用于对比实际与目标之间的差距。
10.双轴图
以左右两个Y轴的形式,展示同一维度下不同指标的情况。两个坐标轴的图表类型选择需要区分开。
11.帕累托图
双轴图变种,用来分析原因,确定产生问题的主要原因。
12.漏斗图
漏斗图是流程转化分析,适用于关键业务环节数据比较,将各环节串联起来构成漏斗,量化流程内环节,追踪各环节转化率。转化是漏斗图主要表达的信息。例如在网站的用户行为分析中,如图,反映了报告浏览人数中,有5%的用户下载了此报告。在实际工作中,各种业务流程均可构建漏斗。
13.词云
词云主要展现文本信息,对出现频率较高的“关键词”予以视觉上的突出,常用于对比文本出现频次。如用户画像标签,搜索关键词频次、新闻关键词频次。
三、分布类
1.散点图/气泡图/四象限图
散点图在报表中不常用到,但是数据分析中比较常见。散点图通过坐标轴来揭示数据间的关系,发掘变量与变量之间的关联,当存在大量数据点,结果更精准,比如回归分析。当数据量小的时候会比较混乱。气泡图是散点图的变种,它使用气泡代替散点图的数值点,面积大小代表数值大小。
2.地图
一切和空间属性有关的分析都可以用到地理图。比如各地区销量,或者某商业区域店铺密集度等。一般用颜色深浅或气泡大小来展示区域范围的数值大小。比如人口密度、各地区销量,或者某商业区域店铺密集度等。
3.箱线图
箱线图(Boxplot)也称箱须图(Box-whisker Plot),它是用一组数据中的最小值、第一四分位数、中位数、第三四分位数和最大值来反映数据分布的中心位置和散布范围,可以粗略地看出数据是否具有对称性。通过将多组数据的箱线图画在同一坐标上,则可以清晰地显示各组数据的分布差异,为发现问题、改进流程提供线索。假如你是一位互联网电商分析师,你想知道某商品每天的卖出情况:该商品被用户最多购买了几个,大部分用户购买了几个,用户最少购买了几个。箱线图就能很清晰的表示出上面的几个指标以及变化。
另外企业产品质量管理、人事测评、探索性数据分析等统计分析活动也经常会被应用到。
4.热力图
热力图可以用于对比两个维度的数值大小,用颜色深浅代表数值的大小。热力图在网页分析、业务数据分析等其他领域也有较为广泛的应用。如图展示了不同区域在不同时间的订单数量。
四、关系分析类
1.桑基图
桑基图是一种特定类型的流程图,图中延伸的分支宽度对应数据流量的大小,它常表示信息的变化和流动状态。常用于能源、材料成分、金融等数据的可视化分析,还有网站用户行为路径的分析。
2.关系树图
表现各个维度之间的关系,多用于组织架构分析。
3.关系图
表现各个维度之间的关系,及各关系间的关系强弱。比如社交关系链、品牌传播、或者某种信息的流动。
总结:数据可视化是借助图形化手段,更清晰有效地传达与沟通信息的一种方式,在传达信息这个目的之下,我们就要正确地进行选择,首先需要依据数据类型和目的选择正确的图表类型。
当我们做数据可视化时,可以先对现有的数据进行分析,得出自己的初步结论,明确要表达的信息和主题(即,你通过图表要说明什么问题)。然后根据这个目的在现有的或你知道的图表信息库中选择能够满足你目标的图表类型。最后开始动手制作图表,并对图表进行美化、检查,直至最后图表完成。
让数据流动起来,开启业绩增长!
了解500+品牌零售商使用LinkFlow的场景用例