随着互联网的大力发展,数据分析逐渐成了热门职业。那一个小白该如何入门呢?作为一个大学、研究生都是统计学专业的学渣,虽然没学到统计学的精髓,但是大致的脉络还比较了解,加上在互联网行业工作也有六七年,今天就浅谈一下,之后有时间关于分析方法、案例、数据等等再慢慢分享: 1、统计学专业 一个齐全的统计学院应该包含以下四个方向:
2、课程设置(以经济统计为例) 核心学科大差不差,如各个方向的字面意思一样,比如:经济统计会有一些经济类课程,如宏观/微观经济学,金融学等;精算会有一些保险类的课程,如寿险/非寿险精算等。 以经济统计为例,主要课程如下: 经济统计学主要课程 3、数据分析的大概流程 “数据分析”的范畴很广,包含了经典的统计学方法,如方差分析、回归、统计推断、主成分分析、因子分析、聚类分析等等,也包含现代的回归、分类方法,如决策树、随机森林、神经网络、支持向量机等等。现代数据分析方法,或者叫数据挖掘,越来越偏向于计算机编程层面。但是很多统计分析软件,比如R,有现成的“包”,可以直接调用,比如,在R里,randomForest函数可以实现随机森林的算法。 这里就先不介绍具体方法了,后面有时间结合一些互联网公司的案例慢慢讲,效力了好几家公司了,有足够多的数据和案例可供分享,哈哈。画了个数据分析的一般流程: 数据分析步骤 最后需要说明的是,统计学或者数据分析只是一个工具,需要深入的与业务结合才能有价值。 关于方法、案例、软件、数据等等欢迎大家一起探讨。 4、入门资料推荐
5、关于大数据 就是个概念,看看就行了,别当真。有本书倒是可以推荐下《大数据时代》。 |
|