首页学术资讯大学生实习期需学会制作的15个数据匹配图

大学生实习期需学会制作的15个数据匹配图

时间:2018-12-24 编辑整理:早检测网 来源:早检测网

大数据时代,数据驱动决策。处理不好庞大、复杂的数据,其价值将大打折扣。那如何缩短数据与用户的距离?让用户一眼抓到重点?让老板为你的汇报方案鼓掌?

大数据时代,数据驱动决策。处理不好庞大、复杂的数据,其价值将大打折扣。那如何缩短数据与用户的距离?让用户一眼抓到重点?让老板为你的汇报方案鼓掌?

本文通过连环15关,层层深入,传你数据匹配图形神功,让数据可视化更高效。无论数据总量和复杂程度如何,数据间的关系大多可分为三类:比较/构成/分布&联系。

01比较

基于分类/时间的数据对比,通常需用到比较型图表。用户通过图表轻松识别最大/最小值,查看当前和过去的数据变动情况。

常见场景:哪个地区的收件量最多?今年的收入和去年相比如何……

1)条目少 – 柱状图

类似的图形表达为直方图,不过后者较柱状图而言更复杂(直方图可以表达两个不同的变量),主要用于数据的统计与分析。

比较条目较少时,如5个地区收件量的对比,可选用柱状图表示。

 

柱状图

2) 条目多 条形图

排列在工作表的列或行中的数据可以绘制到条形图中。条形图显示各个项目之间的比较情况。

当条目较多,如大于12,移动端上的柱状图会显得拥挤不堪,更适合用条形图。一般数据条目不超过30条,否则易带来视觉和记忆负担。

 

条形图

3) 看趋势 折线图

折线图是排列在工作表的列或行中的数据可以绘制到折线图中。折线图可以显示随时间(根据常用比例设置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势。

X轴为连续数值(如时间)且注重变化趋势时,则适用折线图。

 

 

 

折线图

4) 扩大差异 南丁格尔玫瑰图

又名为极区图,是一种圆形的直方图。南丁格尔自己常昵称这类图为鸡冠花图(coxcomb),并且用以表达军医院季节性的死亡率,对象是那些不太能理解传统统计报表的公务人员。

除柱状图外,有无更新颖的表现方式呢?那就属南丁格尔玫瑰图了。

 

南丁格尔玫瑰图

由于扇形的半径和面积是平方的关系,南丁格尔玫瑰图会将数值之间的差异放大,适合对比大小相近的数值。它不适合对比差异较大的数值,因为数值过小的类目会难以观察。

此外,因为圆有周期性,玫瑰图也适于表示周期/时间概念,比如星期、月份。依然建议数据量不超过30条,超出可考虑条形图。

5) 双向 双向条形图

前面的例子都是单维度比较,当比较正反两类甚至更多维度的数据时,可尝试双向条形图,下图为各大区的重点地区的收派件量的对比。

 

双向条形图

用颜色区分大区,空心/实心区分收件量和派件量,既能整体比较大区,又能详细对比地区的情况。

打怪升级,再加点难度。在双向图上再增加一个维度,如下表,比较5个地区的利润及相应的收入和成本。请先思考一下,再下滑看推荐图表。

 

业务数据

 

双向条形图(多维度)

通过图形一眼就能看出深圳区的利润低于广州区,即使它的收入高于广州区,但成本相对来说高于广州区。

6) 目标达成 子弹图

子弹图,顾名思义是由于该类信息图的样子很像子弹射出后带出的轨道。

实际业务中,常要考察指标的达成情况,如收入达标情况及所处区间(优、良、差),如下表,你会怎么可视化呢?动手画一画吧!

 

业务数据

 

子弹图

子弹图,因为像子弹射后带出的轨道。相较于仪表盘,它能够在狭小的空间中表达丰富的数据信息,在信息传递上有更大的效能优势。

若还要比较4个季度的收入情况,只需用不同颜色区分。如下图,一眼便知第二季度表现较好,而第一季度则不佳。

 

子弹图

7) 性能 雷达图

又可称为戴布拉图、蜘蛛网图(Spider Chart),是财务分析报表的一种。即将一个公司的各项财务分析所得的数字或比率,就其比较重要的项目集中划在一个圆形的图表上,来表现一个公司各项财务比率的情况,使用者能一目了然的了解公司各项财务指标的变动情形及其好坏趋向。

对于一些多维的性能数据,如综合评价,常用雷达图表示。指标得分接近圆心,说明处于较差状态,应分析改进;指标得分接近外边线,说明处于理想状态。

 

雷达图

以上就是「比较」类的常用图表,可归纳如下。

 

此表并非一成不变的「铁表」,相互之间还会串联交叉,大家还需灵活应用。

02 构成

部分相较于整体,一个整体被分成几个部分。这类情况会用到构成型图表,如五大区的收件量占比、公司利润的来源构成等。

1) 单层 饼状图

饼状图常用于统计学模型。有2D3D饼状图,2D饼状图为圆形,手画时,常用圆规作图。饼状图显示一个数据系列(数据系列:在图表中绘制的相关数据点,这些数据源自数据表的行或列。图表中的每个数据系列具有唯一的颜色或图案并且在图表的图例中表示。可以在图表中绘制一个或多个数据系列。饼状图只有一个数据系列。)中各项的大小与各项总和的比例。

1关中,对比5个地区的收件量时用到了柱状图。若看占比情况,饼状图更合适。

 

饼状图

如果变成17个地区,会怎样?

 

像不像彩色七星瓢虫?所以饼图分类一般不超过9,超过建议用条形图展示。

除饼图外,环形图(甜甜圈图)亦可表示占比,其差异是将饼图的中间区域挖空,在空心区域显示文本信息,比如标题,优势是其空间利用率更高。

 

环形图

2) 分层 环形图、旭日图

环形图是由两个及两个以上大小不一的饼图叠在一起,挖去中间的部分所构成的图形,主要是在制作EXCEL中区分或表明某种关系。

对于管理层而言,需先把握大局和重点。比如大区负责人需一眼看到重点地区及重点分部的情况(如下图),如何展示?

 

 

环形图

 

旭日图

这个叫旭日图,逐层下钻看数据,大区的重点地区及相应分部的构成情况一目了然。

3) 累计趋势 堆叠面积图

强调数量随时间而变化的程度,也可用于引起人们对总值趋势的注意。堆积面积图和百分比堆积面积图还可以显示部分与整体的关系。

接下来,看看数值构成随时间变化的案例:第一大区(包含四个重点地区)近四年收入构成的趋势要如何可视化?自己想一想,再下滑看推荐方案。

 

 

业务数据

 

堆叠面积图

推荐方案是堆叠面积图,可以展现分量(地区)对于总量(大区)的贡献,并显示总量(大区)的变化过程。需要说明的是,地区收入的起点并非从 y=0 开始,而是在下面的地区基础上逐层叠加,最后组成一个整体。

4)累计比较 堆叠柱状图

如果将上图X轴的标签文字(即年份)和图例(即地区)互换(如下图A),用来看每个地区近四年的收入构成,用哪个图更合适?

 

堆叠柱状图

是不是觉得都可以?那图中 X1 有何含义?堆叠面积图 A 方案和堆叠柱状图 B 方案都可以表现累加值。差别在于,堆叠面积图的 x 轴是连续数据(如时间),堆叠柱状图的 x 轴是分类数据。此案例中的 x 轴是非连续的分类数据,因此用 B 方案更适合。

5) 累计增减 瀑布图

瀑布图是由麦肯锡顾问公司所独创的图表类型,因为形似瀑布流水而称之为瀑布图( Waterfall Plot)。此种图表采用绝对值与相对值结合的方式,适用于表达数个特定数值之间的数量变化关系

若想表达两个数据点间数量的演变过程,可使用瀑布图。开始的一个值,在经过不断的加减后,得到一个值。瀑布图将这个过程图示化,常用来展现财务分析中的收支情况。

 

瀑布图

以上就是「构成」类常用图表,可归纳如下。

 

03 分布&联系

通过分布&联系型图表能看到数据的分布情况,进而找到某些联系,如相关性、异常值和数据集群。

常见使用场景:客户的年龄段分布?单票成本与收件量的关系?

1) 两个变量 散点图

散点图是指在回归分析中,数据点在直角坐标系平面上的分布图,散点图表示因变量随自变量而变化的大致趋势,据此可以选择合适的函数对数据点进行拟合。

用两组数据构成多个坐标点,考察坐标点的分布,判断两变量之间是否存在某种关联或总结坐标点的分布模式。散点图将序列显示为一组点。值由点在图表中的位置表示。类别由图表中的不同标记表示。散点图通常用于比较跨类别的聚合数据。

仍以业务为例,下图为全国网点的单票成本/收入分布情况。

 

 

散点图

单单这样看,可能看不出什么,如果加两条平均线就不一样了。

 

加了平均线,就知道哪些网点高于平均线,哪些低于平均线。但网点那么多,总不能逐个点击查看是哪个大区的,给散点加上颜色后,就很有意义了。

 

通过此图,可以看出哪些大区单票利润较低,急需提升,比如广泛聚集于右下角的第四大区,单票收入低于平均线,单票成本却高于平均线。

2) 三个变量 气泡图

气泡图是可用于展示三个变量之间的关系。它与散点图类似,绘制时将一个变量放在横轴,另一个变量放在纵轴,而第三个变量则用气泡的大小来表示。排列在工作表的列中的数据(第一列中列出 x 值,在相邻列中列出相应的 y 值和气泡大小的值)可以绘制在气泡图中。气泡图与散点图相似,不同之处在于:气泡图允许在图表中额外加入一个表示大小的变量进行对比。

大家都知道,网点总利润除了和单票利润有关,还和体量(即收件量)有关,用散点的面积大小表示收件量,就变成了气泡图。

 

气泡图

3) 结合地图 热力图

以特殊高亮的形式显示访客热衷的页面区域和访客所在的地理区域的图示。热力图 可以显示不可点击区域发生的事情。城市热力图该检测方式只提供参考。

你将发现访客经常会点击那些不是链接的地方,也许你应该在那个地方放置一个资源链接。比如:如果你发现人们总是在点击某个产品图片,你能想到的是,他们也许想看大图,或者是想了解该产品的更多信息。 同样,他们可能会错误地认为特别的图片就是导航链接。

气泡图与地图结合可演变为热力图。通过热力图,能看到哪些网点收派件量较多,需进行资源调配。

 

热力图

以上是 「分布&联系」类的常用图表,可归纳如下:

 

当我们拿到数据后,先提炼关键信息,明确数据关系及主题,再选择合适的图表进行可视化。希望下图能给各位一些参考(结合可视化专家 Andrew Abela 的图表选择指南,进行了简化调整)

数据可视化设计只要多练习、多总结,总有一天会得心应手。

 

 

毕业论文查重:早检测论文查重网www.zaojiance.com

在线咨询
在线留言
系统列表
返回顶部