【黄宝臣的回答(488票)】: 基本答一下吧,但是不是很准确,只了解大致情况(杭州),带有某种行业自黑。 1. 第一阶段(一般岗位叫数据专员) 基本学会excel(VBA最好学会;会做透视表;熟练用筛选、排序、公式),做好PPT。这样很多传统公司的数据专员已经可以做了 2. 第二阶段(数据专员~数据分析师) 这一阶段要会SQL,懂业务,加上第一阶段的那些东西。大多数传统公司和互联网小运营、产品团队够用了。 3. 第三阶段(数据分析师) 统计学熟练(回归、假设检验、时间序列、简单蒙特卡罗),可视化,PPT和excel一定要溜。这些技术就够了,能应付大多数传统公司业务和互联网业务。 4. 第四阶段(分裂)
发现回答的有点文不对题额,不过大致是所有从底层数据工作者往上发展的基本路径。往数据发展的基本学习路径可以概括为以下内容: 1. EXCEL、PPT(必须精通) 数据工作者的基本姿态,话说本人技术并不是很好,但是起码会操作;要会大胆秀自己,和业务部门交流需求,展示分析结果。技术上回VBA和数据透视就到顶了。 2. 数据库类(必须学) 初级只要会RDBMS就行了,看公司用哪个,用哪个学哪个。没进公司就学MySQL吧。 NoSQL可以在之后和统计学啥的一起学。基本的NoSQL血MongoDB和Redis(缓存,严格意义上不算数据库),然后(选学)可以了解各类NoSQL,基于图的数据库Neo4j,基于Column的数据库BigTable,基于key-value的数据库redis/cassendra,基于collection的数据库MongoDB。 3. 统计学(必须学) 如果要学统计学,重要概念是会描述性统计、假设检验、贝叶斯、极大似然法、回归(特别是广义线性回归)、主成分分析。这些个用的比较多。也有学时间序列、bootstrap、非参之类的,这个看自己的意愿。 其他数学知识:线性代数常用(是很多后面的基础),微积分不常用,动力系统、傅里叶分析看自己想进的行业了。 4. 机器学习(数据分析师要求会选、用、调) 常用的是几个线性分类器、聚类、回归、随机森林、贝叶斯;不常用的也稍微了解一下;深度学习视情况学习。 5. 大数据(选学,有公司要求的话会用即可,不要求会搭环境) hadoop基础,包括hdfs、map-reduce、hive之类;后面接触spark和storm再说了。 6. 文本类(选学,有公司要求的话会用即可) 这部分不熟,基本要知道次感化、分词、情感分析啥的。 7. 工具类 语言:非大数据类R、Python最多(比较geek的也有用julia的,不差钱和某些公司要求的用SAS、Matlab);大数据可能还会用到scala和java。 可视化(选学):tableau、http://plot.ly、d3.js、echarts.js,R里面的ggplot、ggvis,Python里的bokeh、matplotlib、seaborn都不错 数据库语言:看你自己用啥学啥 其他框架、类库(选学):爬虫(requests、beautifulsoup、scrapy),日志分析(常见elk)
【罗宾的回答(8票)】: 我工作5年,一直在互联网公司做和数据相关的工作, 接触过各种数据分析师,数据专员,etl工程师,数据挖掘,数据科学家,数据运营,数据产品。看了其他人的答案,我觉得更偏向数据开发,或者数据挖掘,我来说下一般招聘网站里要求的数据分析师的情况吧。 对数据分析师的要求和数据分析师所隶属的部门相关,数据分析师一般存在于三类部门: 一是隶属于负责某一条产品线的业务部门,部门只有一个数据分析师,也可能叫数据专员,部门内的其他人是运营、产品,数据分析师的日常工作就是给领导或同事出各种数据报表,偶尔出个报告,只要熟练掌握excel和ppt即可,数据来自bi系统,或者提需求给技术部或数据部提取数据。统计学的知识用不上,因为你的领导和同事完全不懂,他们就是想看某个数据,需要你给出数据来证明他们产品改进或运营的效果,他们会根据经验来理解这些数据。这类数据分析师的工作比较机械重复,但对自己所属的产品线非常熟悉,适合刚毕业的。 二是隶属于数据部门,有的也叫数据中心(或者装B的大数据中心),数据分析师也可能叫数据运营,需要熟练掌握sql,了解数据库的知识,有的也需要会python,每天大部分工作是写sql帮业务提数,还有就是帮业务梳理逻辑,把数据需求落实进bi系统或宽表里。 三是隶属于业务部门里独立的数据组,整个组由多个数据分析师组成,所需的技能和行业相关,一般电商之类的熟练掌握excel、sql、spss就够了,如果是金融行业,那就得会sass。工作是制作各种报表,监控业务情况,也会有专项分析报告,主要是向大领导汇报。 其实现在大部分互联网公司的数据建设都不健全,尤其是流量数据,但出于安全性的考虑又不用第三方数据分析系统,所以无论你是哪个部门的数据分析师,大部分的工作都是在获取和加工数据,做数据报表。对工具的掌握决定了你获取和加工数据的效率和层次,比如你只会用bi导数,用excel处理数据,在遇到bi没有的数据,或者涉及几十万数据量的时候,你就只能写邮件提需求了。 但也不是说掌握了各种技术和工具就能当个好的数据分析师,好的数据分析师必须是要非常熟悉并理解业务的,因为你要是不懂业务,你连需要取什么数都不知道! 现在还有一个岗位和数据相关,叫数据科学家,很像其他回答里说的那种懂各种算法,或者高阶的数据分析师,但这类数据人员基本不是从低阶数据分析师进化来的,而是本来就是计算机相关专业的硕士或博士。同样的还有数据挖掘工程师。 如果想走技术路线,或者所谓大数据方向,最好去公司专门的数据部,起码可以接触到更多的数据和技术。如果在业务部门做数据分析师,虽然门槛低好入行,但没有机会和空间,做的时间再久也是导数做报表,发展不大。 【天道仇情卍的回答(6票)】:
学完123就可以了吧。 【今晚打老虎的回答(1票)】: 上面的黄,说的很好了。我补充一丢丢。只是从开发上来讲,最好是会Java,因为方便看Hadoop的源码。多线程必须很熟练,因为mr基本都是,写mr其实不难,类似于在做填空。 Linux常用命令必须熟练。 最好有关系型数据库的基础,这样学noSQL比较容易。个人认为大数据其实不是很难,但是特别繁琐,因为它要学的东西太多了,没有人都会,也没有人只会一点。但是比起之前搞Oracle的RAC感觉还是容易了一些 【kilo的回答(0票)】: 对于学习大数据这件事情考虑了很久,既然选择这一行就要坚持到底,有没有去过普开数据的同学们,请教一下经验。 【黑车司机的回答(0票)】: 找一家公司做实习生 原文地址:知乎 |
|