社群群友在群里分享了一篇文章,有群友说这是, 人工智能AI对科学发现的影响的最佳论文。 概要:本文深入研究了人工智能对创新活动的影响,特别是通过观察美国一家大型企业研发实验室中1,018名科学家随机应用新材料发现技术的情况。研究结果显示,在人工智能的助力下,研究人员发现的材料数量激增44%,专利申请量增加了39%,下游产品创新也提高了17%。这些新发现的化合物以其新颖的化学结构,推动了更多革命性的发明。 (上面这个确实是好事,至少证明AI并不是自己重复自己,也不是不能生产新知识,相反能够帮助人类发现新东西。) 然而,这项技术对不同生产力水平的科学家产生了不同的影响:生产力最低的三分之一科学家几乎没有获得益处,而顶尖研究人员的产出却几乎翻了一番。 (这表明,在同一个AI工具面前,大牛可以让生产力翻翻,但普通人几乎没有任何长进,这加大了科学家的不平等。) 文章进一步分析了这些结果背后的机制,发现人工智能自动化了57%的“创意生成”任务,使得研究人员能够将更多精力集中于评估模型生成的候选材料。顶尖科学家利用他们的专业知识,优先选择最有潜力的人工智能建议,而其他科学家则在测试假阳性上耗费了大量资源。 (这表明,AI其实完全可以帮你完成那些极具创意性的任务,而你要做的就是判断哪个最具发展潜力,然后开展下去,但普通人往往判断力太差而将大把经历耗费在测试没有多大意义的事情上) 简要介绍,下面的研究发现非常值得关注: 人工智能对经济发展的影响,不仅在于其改变商品和服务生产方式的能力,更在于其对创新过程本身的强化作用。近年来,深度学习技术的进步在促进科学突破方面展现出巨大潜力,特别是在药物发现和材料科学等领域。这些领域的模型能够基于庞大的现有数据集进行训练。然而,关于这些工具如何在现实世界中影响发明创造的研究还不多见,研发瓶颈、组织摩擦或可靠性问题都可能限制其效果。因此,人工智能对创新速度和方向的影响仍然是一个未知数。同时,人工智能对科学家的影响也存在不确定性,这取决于人工智能是作为人类专业知识的补充还是替代品。 为了探究这些问题,本文通过对美国一家大型企业研发实验室中1,018名科学家的实证研究,考察了人工智能工具在材料发现中的随机应用效果。该实验室专注于将材料科学应用于医疗保健、光学和工业制造等领域,并拥有一支由化学、物理和工程学领域高级学位持有者组成的研究团队。传统上,科学家们依赖于昂贵且耗时的试错方法来发现新材料,设计多种潜在结构并测试其属性。而人工智能技术,借助深度学习的进步,部分自动化了这一过程。模型使用现有材料的组成和特性作为训练数据,预测并生成具有特定属性的新化合物“配方”。科学家们随后对这些候选材料进行评估,选择最有潜力的进行合成。一旦研究人员成功创造出有用的新材料,它们就会被集成到新产品原型中,并继续进行开发、规模化生产和商业化。 自2022年5月起,实验室分三个阶段引入了这项工具。研究团队被随机分配至各个阶段,这样的安排使我们能够通过对比已经使用和尚未使用该技术科学家的表现,来准确评估技术的实际影响。各阶段在教育背景、经验和历史成就等可观测变量上保持了均衡,这验证了随机分配的有效性。本文利用覆盖研发全过程的详尽数据,深入分析了人工智能对材料发现的影响,以及其对专利申请和产品创新的深远影响。 在人工智能的辅助下,科学家发现的材料数量激增了44%。这些新化合物展现出更卓越的性能,这表明该模型不仅增加了材料的数量,还提高了其质量。随着材料数量的增加,专利申请量也随之增加了39%,几个月后,包含这些新化合物的产品原型数量增加了17%。在考虑了投入成本之后,该工具使研发效率提升了13-15%。这些结果带来了两个重要的启示:首先,它们展示了人工智能在增强研究能力方面的显著潜力;其次,它们证实了这些研究成果能够有效转化为产品创新,并未在研发的后续阶段遭遇瓶颈。 人工智能无疑为创新进程注入了新动力,但这些创新成果的新颖性究竟如何?在科学研究中运用机器学习的一个主要担忧是,它可能会加剧所谓的“街灯效应”。由于模型是基于现有知识训练的,它们可能会引导研究方向偏向那些已经有所了解但价值相对较低的领域。然而,本文的研究显示,这项工具在研发的三个阶段都显著提升了创新的新颖性。首先,我采用了De 等(2016)提出的化学相似性方法来衡量新材料的原创性。与现有化合物相比,模型生成的材料展现出了更为独特的物理结构,这表明人工智能开辟了设计空间中的新领域。其次,我发现这导致了更具创造性的发明。接受人工智能辅助的科学家申请的专利更有可能引入新的技术术语,这是变革性技术的领先指标。第三,我发现人工智能改变了产品的性质:它增加了代表新产品线而非现有产品改进的原型比例,推动创新朝着更加激进的方向发展。 进一步分析这项技术的分配效应,我发现它在高能力科学家中获得了不成比例的好处。我根据处理前期间的成果构建了初始生产力的衡量指标,并控制了材料类型和应用,以考虑某些化合物本身更容易被发现的可能性。通过估计每个生产力分位数的单独处理效应,我记录到了能力分布中的显著差异性影响。尽管生产力最低的三分之一科学家几乎没有受益,但排名前10%的科学家的产出增加了81%。因此,90:10的表现不平等性超过了两倍。这表明人工智能和人类的专业知识在创新生产函数中是互补的。 本文的第二部分深入分析了这些成果背后的机制。通过结合科学家活动的丰富文本数据与大型语言模型,并将这些数据分类为不同的研究任务,我发现人工智能显著地改变了发现过程。该工具自动化了大部分“创意生成”任务,将科学家的精力重新分配到评估模型建议的候选化合物上。在没有人工智能的情况下,研究人员几乎将一半的时间用于构思潜在的材料。引入该工具后,这一比例降至不到16%。与此同时,评估候选材料所花费的时间增加了74%。因此,人工智能具有双重效应:它替代了设计化合物的特定劳动,但由于与评估任务的互补性,它在更广泛的发现过程中增强了劳动。 接下来,我揭示了科学家在评估人工智能生成的候选化合物时所展现的技能差异,并探讨了这一工具产生异质性影响的原因。我收集了研究人员测试的材料以及这些实验的结果。顶尖科学家利用他们的专业知识,识别出有前景的人工智能建议,优先研究最具可行性的候选材料。而其他科学家则在测试假阳性上浪费了大量资源。实际上,有相当一部分研究人员的测试顺序几乎与随机选择无异,几乎没有从工具中获得实质性的好处。评估能力与初始生产力呈正相关,这解释了科学家之间表现差异的扩大。这些结果表明,评估模型预测的新研究技能正变得越来越重要,成为人工智能技术的有力补充。因此,我为Agrawal 等(2018)提出的观点提供了证据:随着机器预测的改进,人类判断和决策的价值也随之提升。 为了理解这些判断差异的来源,我对实验室的研究人员进行了调查。调查结果揭示了领域知识的核心作用。擅长评估的科学家认为,他们在类似材料方面的训练和经验是评估过程的关键。与此相对,那些难以评估人工智能建议的化合物的研究人员表示,他们的背景知识对此帮助不大。支持这一解释的证据是,评估能力排名前四分之一的研究人员在其研究材料领域发表学术文章的概率是其他科学家的3.4倍。尽管一些人认为大数据和机器学习会使领域知识变得过时,但这些结果表明,只有具有足够专业知识的科学家才能充分利用人工智能的力量。 我将我的估计结果与一个简单的模型相结合,阐述了组织适应性如何增强该工具的效果。人工智能改变了特定技能的回报结构,提升了判断力的价值,同时降低了创意生成的重要性。因此,调整招聘策略,优先聘用具有强大判断力的科学家,可以显著提升生产力。在我样本数据的最后一个月,这部分数据未包含在主要分析中,实验室解雇了3%的研究人员。与理论预测相吻合,这些被解雇的科学家中有83%属于判断力最差的四分之一。实验室通过增加新招聘,弥补了这些人员的流失,实现了劳动力的净增长。由于研究人员构成的变化,我的估计结果可能低估了人工智能在长期内的影响。 新技术的影响不仅限于提高生产力。它们还可能深刻影响工人的福祉和成功所需的专业技能。在创新领域,这些考量尤为重要,因为它们在一定程度上决定了谁能成为科学家,进入哪些领域,以及他们会投资于哪些技能。本文的最后一部分将通过调查来探讨这些问题。 研究人员对工作内容的满意度减少了44%。这一影响在科学家中相对均匀,表明即使是人工智能的“受益者”也面临着成本。受访者指出,技能未得到充分利用和创造力下降是他们最关心的问题,这突显了适应快速技术进步的难度。此外,这些结果挑战了人工智能主要将自动化那些枯燥的任务、让人类专注于更有意义活动的观点。尽管提高生产力所带来的满足感在一定程度上缓解了这一负面效应,尤其对于高能力的科学家来说,但82%的研究人员总体上感到福祉下降。 使用该工具不仅影响了工作满意度,还改变了材料科学家对人工智能的看法。科学家们对人工智能提升生产力的信心几乎翻倍。同时,对失业的担忧并未改变,这显示了对人类判断力的持续需求。然而,由于研究过程的变化,科学家们预计人工智能将改变在该领域取得成功所需的技能。因此,计划进行再培训的研究人员数量增加了71%。这些发现表明,实际应用人工智能可以显著影响人们对这项技术的看法。调查回应还揭示了一个重要事实:领域专家并未预见到本文所记录的效果。
7年,计量经济圈近2000篇不重类计量文章, 可直接在公众号菜单栏搜索任何计量相关问题, Econometrics Circle |
|