变革了人类社会的基础科学，正在遭遇AI革命

BBSBIAN 2017-07-08

展开全文

来源：新智元（AI_era）

现代社会，科学是基石之一。科学的进展支撑了人类的进步，从蒸汽机到电再到汽车火箭与飞机，以及现在的信息技术以及人工智能都是如此。

人工智能本身是一门科学，现在，它也在变革科学。 7月7日，Science发布最新一期杂志，《Science》以AI在科学研究中的角色为主题，制作了AI 特辑。所推荐的研究包括，AI 在物理学、天文学、生物学习、社会学等领域的巨大应用价值和潜力。

1对于科学家来说，AI 的前景是最光明的：有望主导科学发现的进程

大数据迎来了自己的竞赛场。

在各个领域，搜集数据的能力已经呈现爆发式的增长：在生物学，基因和蛋白质的数据库在飞速增长；在天文学领域，对天空的研究带来了拍字节（petabytes）的数据；在社会科学领域，数不清的帖子和推特纷纷从“水龙头”上流出来。

数据洪流能推翻人类的洞见和分析，能帮助实现这种计算能力的进步也创造了新的强大工具。

在一场蔓延到众多科学领域的革命中，研究者正在数据的洪流上使用人工智能，通常以人工神经网络的形式。

与更早期在AI上的尝试不一样，这样的“深度学习”系统不需要人类专家的知识进行编程。取而代之的，这些系统自己进学习，通常来自大型的训练数据集，直到它们能在数据中看到模式和发现异常，这些数据集相比人类能处理的都要更大、更复杂。

AI 并不仅仅在变革科学：它能在你的智能手机上讲话，能在无人驾驶汽车上与道路进行对话，并且在众多未来学家中引起了关于大规模失业的担忧。

对于科学家来说，AI 的前景是最光明的：AI 有望主导科学发现的进程。

但是，与一名学生或者一名博士后不一样，神经网络不能解释自己是如何思考的：计算机带来的成果是不透明的。

所以它们的兴起已经产生了一个称为“AI神经科学”的领域：努力打开神经网络的黑匣子，在人们心中建立对它们产生的见解的信心。

随着AI在科学的角色中不断扩展，理解机器内部的“思维”也变得越来越迫切。已经有一些先锋开始转向AI，进行试验设计，以及解释结果，开辟了全自动化科学的前景。

AI 这一不知疲倦的学徒可能很快就会变成一个成熟的同事。

2Science社论：AI、社会与人类

Eric Horvitz

Eric Horvitz 是微软的技术院士，微软研究院的主管。他曾担任AAAI主席，是斯坦福百年研究报告的发起人。

【Eric Horvitz 】在关于他科幻小说的一篇文章中，艾萨夫·阿西莫夫（Isaac Asimov）反思道，“将机器人看做会无差别地摧毁制作者的危险设备”这种观点变得十分普遍。阿西莫夫不同意这种看法，并制定了“机器人三定律”，旨在确保机器人系统安全，对人类友好。阿西莫夫提出机器人定律后几年，“人工智能”（AI）一词在 1955 年被第一次提出。此后半个世纪以来，AI 已经发展为成熟的学科，有了子领域，产生了一系列方法，使计算机能够感知、学习、推理和理解自然语言。

“深度学习”方法让机器在模式识别方面的准确性有了出人意料的飞跃，AI 的发展越来越激动人心。这些进步已经成了消费者手中的各种功能，从语音、语音翻译到半自动驾驶。然而，许多艰难的挑战仍然存在，还有很多人类智能的方面让 AI 科学家为之不解。

对AI 高涨的兴趣也因其潜在缺点的担忧而有所缓解。有些人担心超级智能的崛起和 AI 系统失控。其他人则侧重于近期可能发生的问题，关注潜在的不利后果。例如，用于指导医疗保健和刑事司法高风险决策的数据分类器，可能会遭受数据集本身所带的偏见的影响，最终得出不公平或不准确的推论。其他亟待解决的问题还有自动化系统做出决策的法律和伦理问题，很难解释系统是如何做出推论的，新形式的监视对公民自由构成的威胁，旨在操纵民意的自动化系统操作，AI 的犯罪行为，破坏军事应用影响，以及可能使工人失业、扩大财富不平等。

随着我们推动 AI 科学的发展，在短期和长期的规模上，解决 AI 对人与社会的影响至关重要。我们可以通过重点研究，监测和分析来制定有价值的评估和指导方案。AI 的影响范围广泛，需要跨学科团体的参与，包括计算机科学家，社会科学家，心理学家，经济学家和律师。在长期的问题上，需要沟通交流来弥合世人关于超级智能和恶意 AI 的意见分歧。在这方面有希望的方向包括，弄清黑箱的研究，还有让拥有软件验证、安全性和故障安全设计专业背景的计算机科学家和工程师一起参与工作。

好消息是，相关的研究、项目和计划已经建成。2008 年，AAAI 主持了长期 AI 影响的多项研究，最终在加利福尼亚州的 Asilomar 举行了一次会议。这次会议启发了斯坦福大学《百年 AI 研究》，这是一个负责组织类似研究的项目，在一个世纪乃至更久的时间里，每隔 5 年发布一份报告（去年发布了第一份报告）。其他最近的努力还包括，由美国国家科学院主办的研讨会和研究。去年 4 月，发表了一份关于自动化对美国劳动力影响的报告，这是两年研究的成果。今年早些时候，来自工业界，学术界和民间社会的代表组成了一个非营利组织，名为“Partnership on AI”，旨在推荐开发和实施 AI 技术的最佳方法。

阿西莫夫在他的文章中得出结论：“我不认为如果感觉到一件事有危险，解决办法就是不去了解它。对我来说，解决方案一定是去了解它。正视危险，就是学会如何安全地处理它。”事实上，AI的前进道路应以求知欲、关怀心和合作为指导。

3AI 侦探如何打开深度学习的黑箱

深度神经网络，或者说深度学习，有着变革科学发现的潜力。但是，随着这些网络被应用到越来越多的学科，许多以“解释”为职业精神的科学家开始提出这样一个问题：为什么。模型你告诉我为什么得到这样一个结论？这一可解释的问题，在行业和学术圈内刺激着新一代的研究者。正如显微镜揭示了细胞的原理一样，这些研究者也在开发工具，用于理解神经网络是如何做决策的。

一些工具在不需要透视的情况下对AI 进行探索；一些则是能够与神经网络本身进行竞争和替代性工具，但是拥有更高的透明度；还有一些人使用更多的深度学习来进入到黑箱中去。总的来说，他们创造了一个新的学科，叫 AI 神经科学。

4【AI 在行动】AI的早期证明地：寻找新粒子

粒子物理学家早在20世界80年代就开始尝试使用人工智能，当时“神经网络”这一术语刚刚进入大众的想象。这一领域依赖AI 和机器学习算法，因为每一个实验中心都是在数不清的、相似的复杂例子探测器中进行发掘。这正是AI擅长的地方。

粒子物理学家尝试通过粉碎亚原子粒子带来的巨大的能量来带来的新物质来理解新的宇宙的内部工作原理。例如2012年，世界上最大的质子对撞机、瑞士的LHC发现的长期预测的希格斯玻色子。然而，这种异乎寻常的颗粒不附带标签。在几分之一纳秒之内，它们会衰变成其他粒子，物理学家必须发现那些更常见的粒子，看看它们是否与一个与同一个族系相一致的方式相配合，这些工作相对困难，因为传统的对撞中会产生许多外族的粒子。机器学习算法在从背景中筛选信号方面表现优异，并且可能对这一领域变得更加重要，因为LHC等机器带来的数据量在不断增加。

5【AI 在行动】算法如何分析大众情绪

社交媒体每年有数以亿计的用户和数以亿计的微博和帖子，为社会科学带来了巨大的数据。社交媒体也开辟了前所未有的机会，使用人工智能（AI）从人类大众媒体传播中提取意义。例如，宾夕法尼亚大学积极心理学中心使用机器学习和自然语言处理来筛选数据，衡量公众的情绪和身体健康，包括抑郁和信任程度以及几种人格特质。传统上这是通过调查完成的。但社交媒体资料便宜而丰富。不过，社交媒体也是凌乱的，而 AI 则为科学家提供了一种强大的方法，从中找出模式。

6【AI 在行动】解决自闭症

对于遗传学家来说，自闭症是一个棘手的问题。遗传模式表明自闭症具有很强的遗传成分。但是，已知在自闭症中发挥一定作用的几十种基因变体，只能解释所有病例的约 20％。寻找其他可能有助于解释自闭症的变体需要查看 25,000 个其他人类基因及其周围 DNA 的数据——对于人类调查人员而言任务过于繁重。因此，计算生物学家使用人工智能（AI）工具。首先，这些研究人员结合了数百个基因组学数据集，用机器学习构建了基因相互作用的地图。他们将少数成熟的自闭症风险基因与成千上万其他未知基因的基因进行比较，单去年一年就发现了另外 2500 个可能参与形成自闭症的基因。现在，他们已经开发了一个深度学习工具去发现可能在自闭症和其他疾病中也发挥作用的非编码DNA。

7【AI 在行动】理解天空

天体物理学家使用人工智能（AI）来创建类似于电影技术的东西，这些技术可以使模糊的图像变清晰：神经网络可以使模糊的星系图像看起来像是用比实际更好的望远镜拍摄的。这可以让天文学家从观察中得出更精细的细节。这种系统通过让两个神经网络相互对抗而起作用。一个是产生图像的生成器，另一个是努力发现任何虚假内容的鉴别器，鉴别器的工作会让生成器变得更好。研究团队拍摄了数千个星系的真实图像，然后人为地对它们做了降维。然后，研究人员用这些图像训练生成器，让它们能够骗过鉴别器。最终，网络在让有噪音的星系图片变平滑方面超越了其他技术。

8【AI 在行动】化学，发现新分子

要制作一种新的分子，化学家需要从数百个分子结构单元和数千个化学反应中找出合适的搭配。从很早开始，计算化学家就利用已知的化学反应编程计算机，希望创建能够计算出新的分子结构的软件。但化学反应往往不是单纯的成功或失败，会产生不同浓度的产品混合物。所以，现在研究人员正在寻求人工智能的帮助。研究人员开发了一种从数百万次成功实验中学习的神经网络，能够自己选择反应，生成新的分子。

9AI 术语表：人工智能 17 大常见词

当人们在谈人工智能的时候，他们在说些什么？这一词语目前还没有最清晰的边界。当它在达特茅斯学院的1956年的一个会议上被推出时，它指的是，让机器以一种人类看来是“智能”的方式运行。人工智能的一个重要的进步是机器学习，它在拼写检查到自动驾驶技术中得到了展示，并且通常由称为神经网络的计算机系统来执行。对AI的讨论也可能包括其他术语。

算法。一系列按部就班的引导。计算机算法可以非常简单（比如，下午三点给我发提醒），也可以很复杂（识别行人）。

反向传播。这是许多神经网络学习的方式。他们会发现自己的输出和计划的输出之间的差异，并反向调整计算进程，以进行执行。

黑箱。这是对一些深度学习系统的描述。它们拿到输入并且提供输出，但是，人要理解其中其中的计算过程，却并不容易。

深度学习。一个多层的神经网络，如何对更多的抽象概念进行反应。在对一张图片进行解析时，各层可能会首先对边缘进行反应，然后是爪子，接下来才是狗。

专家系统。是 AI 的一种形式，可以尝试复制某个领域的专家的专业知识，比如医学诊断。它综合了一系列知识，并通过手写代码进行应用。机器学习技术正在逐步取代手写代码。

生成对抗网络。一组共同训练的神经网络，能生成真实的新数据，并通过竞争进行提升。一个网络提供新的样本，另一个网络则尝试检验其真假性。

机器学习。对算法的使用，能够在不需要精确的指导下，从数据中发现模型。一个系统可能可以学会怎样将输入和输出的特征联系起来，比如输入的图像和输出的标签。

自然语言处理。计算机尝试“理解” 语音和文字。它必须对词、语法和意图进行解析，并能够满足语言中的不同使用。处理过程通常包括机器学习。

神经网络。在机器学习中使用的，一个对人类大脑高度浓缩和简化的模型。一系列单元会接收到输入（比如，一张图像的像素），然后进行简单的计算，进而把它们传递到下一层的各个单元中。最后的一层会提供答案。

神经形态芯片。一种计算机芯片，用于执行神经网络的功能。可以进行模拟、数字化或者组合。

感知机。一种早期的神经网络类型，20世纪50年代开发。曾经被热捧，但是最终被证明有其局限性。有一段时间，对感知机的兴趣超越了神经网络。

强化学习。机器学习的一种，在其中，算法可以通过一个完成一个抽象的目标进行学习，比如，“玩游戏中获得最高分”或者“让一个工厂变得更加高效”。在训练的过程中，算法的每次尝试都会基于其对最终目标的贡献进行评估。