本文最初发表于 Towards Data Science 博客,经原作者 Jay Kachhadia 授权,InfoQ 中文站翻译并分享。 本文探讨了成为一名机器学习数据科学家需要具备的条件,以跟上行业不断变化的需求。 多年来,对于拥有计算机科学、统计学、商业分析、工程管理、物理学、数学或数据科学学士、硕士或博士学位的年轻人而言,数据科学一直是他们的目标。然而,人们对于数据科学有很多误解。这已经不仅仅是机器学习和统计学了。 这些年来,我已经与许多有志于数据科学领域的人讨论过要进入这个领域的想法。为什么数据科学如此火爆?或者统计学和机器学习能帮助你进入这个领域吗?它还会是未来吗? 即使我和你们都在同一条船上,但我现在正在体验到,目前对于下一代数据科学家进入这一领域的需求是如何形成的。我并不会教你如何进入数据科学领域,因为在互联网上,已经有很多人这样做了。 人人都想进入数据科学领域。几年前,这个领域就存在供需问题:数据科学家的供给减少了,需求却在 DJ Patil 博士和 Jeff Hammerbacher 抛出“数据科学”这个术语之后增加了。但是现在,到了 2020 年,情况发生了逆转。来自于正规 /MOOC 教育的数据科学爱好者的流入增加了,需求也增加了,但是还没有达到那种程度。这一术语已经演变得越来越广泛,包括人们从事数据科学所需要的大部分辅助功能。我想引用我最喜欢的一句话,来自 KDnuggets:
说到这里,以下是我觉得数据科学如此火爆的原因:
有些人会这样说,所以让我来谈谈目前行业状况的一些真相。随着 数据科学 家头街的需求和声望的增长,许多公司已经开始将数据科学家的头街改成产品分析师、商业情报分析师、商业分析师、供应链分析师、数据分析师和统计学家,因为人们离职是为了获得数据科学家的头街,而这些头街正是他们从事同样的工作所得到的。所有这一切都是尊重的问题,很多角色因为字面上的细微变化而受到尊重。 因此,公司开始以同样的方式改变头街,让它变得更加耀眼、更令人向往,正如数据科学家——分析、产品数据科学家、数据科学家——增长、数据科学家——供应链、数据科学家——可视化或数据科学家——还有什么不是? 大多数追求教育 / 在线培训的人都有这样的误解,认为所有的数据科学家都在构建奇特的机器学习模型,但事实并不总是如此。至少,当我开始攻读应用数据科学硕士学位的时候,我以为大多数数据科学家都会进行机器学习,但是直到我在美国实习和工作的时候,我才开始了解真实的情况。驱使人们追求数据科学的力量源自于炒作人工智能及其商业影响。 对于那些想以数据科学家的身份从事应用机器学习的人——机器学习(这就是我要命名的头街,因为它不是数据科学家——分析),在 2020 年还没有博士学位的时候,机器学习还有更多的事情要做,而不是仅仅知道如何将机器学习应用于数据集,几乎所有人现在都能做到。我从自己的经历中还发现了其他几件重要的事情,它们可以帮助你在面试过程中找到数据科学家的角色,甚至能帮你入围:
所以,现在光知道机器学习或统计学,并不会让你进入数据科学领域从事机器学习的,除非你很幸运,在行业内有一些很好的人脉(你显然应该经营人脉,这是非常重要的!),或者你名下已经有了杰出的研究记录。业务应用和领域知识往往是随着经验的积累而积累,不可能通过预先学习而获得,除非在相关行业进行实习。 两个月前,我研究生刚毕业,就以数据科学家的身份加入了媒体巨头 ViacomCBS。除了研究助理和实习经历之外,我完全没有任何全职的行业经验。我在这家公司的职责包括从构思——开发——生产机器学习产品,其中我使用了本文上面所列的大部分内容。我希望本文对所有有抱负的数据科学家和有意进入该领域的机器学习工程师有所帮助。 Jay Kachhadia,ViacomCBS 数据科学家,构建智能数据产品。 原文链接: https:///full-stack-data-science-the-next-gen-of-data-scientists-cohort-82842399646e 你也「在看」吗?👇 |
|