那么数据分析师的价值到底在哪里体现呢?请听西线学院小编慢慢说来。 我认为在于: 第一在于对行业知识和常识的深度理解,对信息流通渠道的高度敏感。这需要广泛阅读和自我检验。因为Causal relation并不好用统计学知识得到,很容易犯错;专业知识和常识才能保证不会犯傻瓜错误。 第二,帮助企业和项目搭建自动化的数据pipeline。一来需要分析师要有能力搞data source,另外这也需要他有以数据驱动的IT架构的设计能力。毕竟无论你使用什么模型,其本质都是在做measure。你数据不够,永远不可能得到更贴近真实环境的measure。另外,好的pipeline才能让未来的分析工作和企业方便地scale,不必总需要重复造轮子。你的接口设计的好坏,数据方便调用的程度都是极其考验人能力的。 第三,选用合适的模型简化真实世界的情况,追求定量结果。这需要不仅仅是统计学知识,其它工程知识甚至都需要放入常备的知识库。举几个例子:描述非平稳高维时间序列(Multivariate Time Series)你就用VAR能做得好么?那我用Sticky HDP-HMM就比它好得多。可是这就是唯一的好描述么?未必。Acoustics里的Impulse response analysis/dynamical systems在某些情况下的经验可以借用过来,那也许会比直接用以上那些方法更好。你要是多留心,热工程、地震地质研究、EE、气象、统计物理等等不同的领域都有一些模型能迁移到其它领域使用。 |
|
来自: 昵称39310928 > 《待分类》