上一小节内容 简单地聊聊统计学 里提到了数据类型,那么这一节就要针对不同类型的数据说一说数据图形化的展示,对定性数据主要做分类,对定量数据则主要在分组。 1、定性数据的图示方法不管是定性数据还是定量数据,最好的整理方法都是做频数分布表,频数是指落在某一特定类别或组中的数据的个数,把所有类别的频数全部列出所构成的表就是频数分布表。在Excel里最简单的想要做频数分布表的方法就是合理地使用透视表。对定性数据来说,频数分布表是很容易做出来的,直接统计每个类别下的频数即可。 做好频数分布表以后,就可以作图了,对于定性数据,我们可以使用条形图、排列图、饼图、环形图等图形来描述。这些图在Excel中的具体做法以及注意事项可参考这篇文章: 饼图、条形图、环形图的区别A/B两个班的学生统计其考试成绩如下,画出两个班成绩的对比图。 这道题目要想用饼图展示,只能分别画两个饼图,简单地展示每个班级各名次下所占的比例。 条形图直观地展示了两个班级不同名次下的人数情况。 环形图能将饼图叠加在一起,更能展示不同分类数据所占比例的比较,如图内圈为A班,外圈为B班,可以明显地看出B班良好的人数占比较多,A班几个的人数占比较多。 2、数值型数据的图示方法对于数值型数据,做频数分布表时需要先分组,再计算频数,通常是在确定好组数的前提下设置好组距,按照组距进行分组,一个组中的最小值是下限,最大值是上限,组数是根据数据的实际情况来设置,适中即可,组距=(最大值-最小值)/组数。 数值型数据如何做频数分布表,在之前的文章中也有写到过,在Excel里可以用两种方法来计算频数分布表,函数法和【数据分析】工具里的【直方图】功能。 对于数值型数据,可以用直方图、箱型图来展示数据,值得注意的是,直方图和条形图的区别,条形图更多地被用来展示分类数据,直方图被用在数值型数据的展示上。 箱型图主要是找出一组数据的最大值、最小值、中位数、两个四分位数,用来反映原始数据的分布特征。关于箱型图的做法,在这篇文章里也有提到,大家可以参考: 当有多个变量时,可以用散点图、气泡图、雷达图等来展示数据。 散点图是用二维坐标系来展示两个变量间关系,气泡图则可以展示3个变量的关系,与散点图稍微不同的区别是第三个变量用气泡的大小来表示。 上面学生成绩的案例里就可以用雷达图来展示两个班级的学生成绩分布是否大致一致: 3、什么是好的图表什么是好的数据图表,这个其实挺仁者见仁智者见智的,有些人喜欢图表细节的美化,有些人认为能看懂就行,写了这么久的分析报告,画了这么多图,可乐我关于“什么是好的图表”这个问题也有一点自己的小体会,其实就是因地制宜了,翻译过来就是:看人下菜碟。老板喜欢哪种风格的图表,就给他做哪种风格的图表,除非你能说服他接受你的想法。可能有点暗黑,但这就是职场啊。 比如你觉得这种图很高大上,但老板就觉得花里胡哨,那就还是用正常的条形图吧。 但一般来说,还是有一些普适性的原则,比如:
关于图表的探索,我也写过一些文章可供大家参考: |
|