导读: 王承志 黎润红 | 撰文 今年的诺贝尔化学奖“意外”颁给了3位从事计算和人工智能应用研究的科学家:David Baker、Demis Hassabis和John M. Jumper。其中,Hassabis无疑是最身份最复杂的科学家,他获得过国际象棋冠军、当过电子游戏制作人、研究过心理学和神经科学、还是一位多次创业的企业家。他的人生之路犹如一场又一场游戏,每一场都沉迷其中却又充满创造力。 Hassabis是家中三个孩子中的老大,1976 年 7 月 27 日出生于英国伦敦。他的聪慧可能有部分源自其混血血统,母亲是一位新加坡的华人,在英国的一家百货公司工作,而父亲则是塞浦路斯出生的希腊人。Hassabis小时候,父亲开了家玩具店,Hassabis经常在玩具店里摆弄各种玩具,还自己创造一些新游戏并带着弟弟妹妹一起玩,这让Hassabis爱玩的天性得到充分培养和释放。 4岁时,Hassabis看到父亲和叔叔下国际象棋,观看了一会儿后就迷上了这种游戏。仅仅数周后,他已经能赢下不少成年人。5岁时他开始参加英国象棋比赛,6岁赢得伦敦8岁以下年龄组冠军。13岁时,Hassabis已然成为国际象棋大师,在他的年龄组排名世界第二。 对于Hassabis来说,下象棋像是一个思考的游戏。 Hassabis曾一度想成为职业象棋选手,但后来选择了他认为更激动人心的领域。 在一次BBC“荒岛唱片”(Desert Island Discs)节目采访中,Hassabis透露了自己的想法转变的契机:11岁时,他去列支敦士登参加了一场国际象棋比赛。当时他的对手是丹麦冠军,一名成年人,他们艰苦博弈了14个小时,最后Hassabis过度劳累选择了认输,虽然赛后复盘他其实可以下成平局。他说,我觉得我们是不是在浪费大脑,为什么不用我们的脑力做点更有意义的事情呢,比如解决癌症或者别的疾病的治疗方法,那不是更好吗? 但下国际象棋对Hassabis的思维有很大影响。他在接受TED采访时说,下象棋让他对“思考”的过程产生了思考——在棋局的思考中,除了包括决策和计划,还包括“视觉化”(visualization)和“想象力”(imagination)。这些思考让他后来学习神经生物学来理解大脑产生记忆和想象的机制,也对后来AlphaGo的诞生产生了很大影响。 20世纪80年代中期,在和英格兰队一起参加国际象棋训练营时,Hassabis有机会接触到了计算机。训练营使用相当早期的国际象棋计算机来进行训练以及相互对弈,这让爱玩的Hassabis相当感兴趣。8岁时,Hassabis在一次象棋比赛中获得了200英镑的奖金,这是他人生的“第一桶金”。他用这笔奖金购买了一台叫作“ZX Spectrum”的计算机,并通过自学掌握了编程能力。他回忆说:“我感觉这东西是魔法道具。如果把汽车看成是放大人体力的机器,那电脑让我觉得是增强人智力的工具。我从小时候就理解了这种直觉。” 这种直觉伴随了Hassabis的成长和整个职业生涯,“让电脑放大人的智力”成了Hassabis改变人类发展的方向标。 作为一个名副其实的天才,Hassabis的智力表现远超其同龄同学,16岁即在高等数学、物理和化学三门科目上达到A level,获得了剑桥大学的入学资格,然而因为年纪实在太小,学校建议他一年后再入学。 Hassabis不想浪费这一年时间,他想起一款他特别爱玩的游戏《上帝也疯狂》(Populous),于是联系了这款游戏的制作人Peter Molyneux,说想去他那里工作。Peter后来创造了多个经典游戏,包括《地下城守护者》《黑与白》以及《神鬼寓言》等。当时,Peter创办了一家电子游戏公司Bullfrog Productions,他跟Hassabis交流后同意了。但是当Hassabis来公司入职的时候,Peter发现他年龄不够,公司甚至没法合法雇佣他,只能给他现金。Hassabis用这笔钱从家里搬了出去,住进基督教青年会青年旅舍。加入公司后,Hassabis先参与了一款游戏的设计,不久即在Peter设计的经营模拟游戏《主题公园》里担任主程序员,这套游戏后来热卖超过千万份。电子游戏的设计与制作为Hassabis后来的职业生涯做了充分的铺垫,也成为他创业的第一个选择。 一年后(1997年),Hassabis进入剑桥大学女王学院学习计算机科学,22岁即以“双一等”的成绩获得剑桥的本科学位。在剑桥求学期间,Hassabis又迷上了围棋,还多次参加学生围棋锦标赛。剑桥围棋大师Charles Matthews看出了Hassabis的潜力,亲自指导其围棋,他后来回忆Hassabis的围棋水平很快从围棋业余12级提升至4级。Hassabis感受到了围棋的巨大魅力,以及其和国际象棋的根本性区别——它更依赖棋手长期对弈养成的经验和直觉。 当Hassabis在剑桥学习计算机时,Bullfrog Productions公司被电子艺界(EA)收购,然后Peter又创立了一家游戏公司狮子头工作室(Lionhead Studios)。Hassabis毕业后又加入了Peter的新公司,并接手游戏《黑与白》的开发。他将AI技术引进游戏制作,并担任首席AI程序员。这一年夏天,Hassabis去日本旅游,见到了日本棋盘游戏大师Masahiko Fujuwarea。就在他们见面前的两个月,IBM的深蓝计算机刚刚击败国际象棋冠军卡斯帕罗夫,他们谈到这个热门话题,Hassabis说,也许有一天他会做出一个计算机程序,击败最厉害的围棋选手(众所周知,后来他真的做到了)。这个时候,Hassabis已经开始考虑将人工智能和战略游戏结合起来。 随着这种想法越来越强烈,Hassabis很快离开了狮子头工作室并创立了自己的游戏公司Elixir Studio。他试图开发一个用人工智能模拟一个完整的幻想国家的游戏。他有太多的奇思妙想,想要糅合进这款游戏,这导致游戏越做越庞大,并不停地延后发布日期。后来,公司不得不对游戏进行了大量删减才得以发售,然而市场反应平平。Hassabis吸取了教训,又制作了一款反派邦德模拟游戏《邪恶天才》。这款游戏滑稽地模仿了老式特工电影,却让玩家扮演反派的特工,充满了反讽风格。这款游戏充分体现了Hassabis的“玩家”天性,游戏发售后的口碑大大好于之前发售的游戏。然而,此时的Hassabis却已不满足于这点商业成绩,而是思考起“让电脑放大人的智力”更大的应用方向。 此时的人工智能发展尚属早期,到底什么技术方向能取得大的突破还无人知晓。Hassabis觉得既然计算机发展的目标是要放大人的智力,就应当先搞清楚人的大脑是如何产生智力的。于是,他卖掉了公司所有游戏的知识产权,随后申请去伦敦大学学院(UCL)研究认知神经科学。在这里,他跟随著名神经生物学家埃莉诺·马奎尔(Eleanor Maguire)研究记忆如何重建以及想象力是如何产生的。值得一提的是,马奎尔教授也是一位爱玩的“玩家”,她在2003年获得过搞笑诺贝尔奖,她的研究发现伦敦出租车司机的大脑比普通人更加发达,特别是与空间记忆和导航相关的海马体区域。或许正是这种“爱玩”的特性吸引了Hassabis。 Hassabis只花了4年的时间就获得了博士学位,随后他去麻省理工学院和哈佛大学继续研究人的大脑是如何记住知识以及如何获得想象的能力。他在波士顿的这项研究于2007年发表在《科学》杂志上,获得了该领域的广泛关注,并被《科学》评为年度十大科学进展。 在Hassabis研究神经科学的这几年里,人工智能领域取得了飞速的发展,特别是深度神经网络的潜力得到了证明。2009年,吴恩达等人使用30张Nvidia GeForce GTX 280 GPU训练了一亿参数的深度神经网络,取得了远超之前的模型性能,为深度学习的领域带来很大的信心。 Hassabis感到他等待的时刻到来了。2010年,34岁的他离开学术界创立了自己的新公司DeepMind。从公司名字就能看出他坚信深度学习可以达到人类的智力。Hassabis说DeepMind的核心使命是“解决智能问题”,即理解并复制人类智能的工作原理,“然后用智能解决其他一切问题”。Hassabis计划将这些智能技术应用于各种领域,以解决人类的所有当前不可解决的问题,包括能源、气候、疾病等等。 这一年,Hassabis参加了硅谷著名投资人彼得·蒂尔(Peter Thiel)赞助的奇点峰会。在这次会上,Hassabis分享了他对通用人工智能(AGI)的实现路径,他认为当时主流的技术路线包括基于规则编写的人工智能,以及试图完全复现人类大脑的神经网络的做法,都是不现实的。他指出应当了解大脑是如何处理信息的,而非大脑的物理系统或者在某个特定情况下遵循了什么规则。会上,Hassabis找到彼得·蒂尔进行了简短的交流,蒂尔很快决定投资DeepMind。8岁时,Hassabis靠下国际象棋获得的200英镑得到了买电脑的第一桶金。而这一次,Hassabis获得了DeepMind的第一桶金,上次的一万倍——200万英镑的投资,其中大部分来自蒂尔。 Hassabis有种强大的人才吸引能力,两位合伙人Shane Legg和Mustafa Suleyman都是他在UCL学习时认识的,他们都是AI领域顶尖科学家,且对AGI的实现充满了热情。实际上,Legg对AGI这个词的广泛使用起了很大推动。人工智能学家Ben Goertzel在自己的一篇博客中提到,他当时正在写一本书向人们介绍能够达到或者超越人类智力的人工智能,最初他想叫做“真实智能(Real Intelligence)”,但觉得不妥。在询问了一些朋友后,Legg回信说可以叫做“通用人工智能”(artificial general intelligence)。Goertzel同意了这个叫法,并把它作为书名。这本书出版后,AGI这个词逐渐被接受并广泛使用。Suleyman在DeepMind担任首席产品官,负责开发将AI技术用于游戏的产品。后来,在DeepMind工作了十余年,Suleyman离开后短暂创业后加入微软,成为Microsoft AI的CEO。这些顶尖人才都被Hassabis“用智能解决人类一切问题”的愿景吸引,一起成立了DeepMind。 Hassabis和他的合伙人们很快拉起一支精干的队伍,开发一种自学习算法。这种算法融合了深度学习以及强化学习技术,可以通过自主学习精通复杂的任务,他们把这套算法叫做Deep Q-Network (DQN) 。这里的Q表示强化学习里每个操作对应的质量(quality),质量值(Q-value)越高则表明尝试的行动在将来会得到更好的结果,例如游戏的胜率。通过不断提升每次行动的质量,算法就会自发地学会如何得到更好的结果。 作为一名资深“玩家”,Hassabis的AI研究也从他钟爱的游戏开始,他们在古老的雅达利电子游戏上测试了他们的算法。最初是3款简单游戏:乒乓球、打砖块和耐力赛,算法仅通过学习屏幕上的像素点就学会且精通了游戏。他们又在一些更复杂的游戏上做了尝试,包括海底探险、光速骑士和Q*bert等,DQN算法都能迅速地从零开始学会玩这些游戏,并超越所有人类玩家。Hassabis说,当他们的AI打通了Breakout游戏时,他们的“顿悟时刻”来临。和以往所有的AI都不一样,这套算法没有给程序任何策略,而是让算法自己尝试并找出获胜的方法。 DeepMind的惊艳表现很快被互联网大厂注意到,2013年脸书公司(Facebook)开始与DeepMind展开收购谈判,消息传出后谷歌(Google)也加入其中,最终谷歌于2014年1月以4亿英镑(约6.5亿美元)收购了DeepMind。这时离DeepMind公司成立还不到4年。 DeepMind加入谷歌后获得了更多的资金,Hassabis觉得可以挑战更难的问题。他想起在剑桥学习围棋的日子,以及和Masahiko Fujuwarea交流中提到的要击败所有人类围棋高手的愿望。象棋可以靠计算暴力破解可能的步骤,而围棋则无法实现。当时最好的围棋软件也无法和业余棋手相抗衡,更不用说专业棋手。Hassabis和团队认为强化学习也许能解决这个问题,通过学习每个步骤对应终局的胜率,算法可以通过对很多盘棋局的学习来判断每一步下得好不好,而不是通过直接计算接下来可能的每个落子点来对弈。 2015年10月,DeepMind研发的围棋AI软件AlphaGo第一次公开亮相,对战欧洲棋王樊麾。樊麾出生于中国西安,后来移居法国。他自幼学棋,去法国后获得过多次欧洲围棋冠军,也多次代表欧洲参加世界性围棋比赛。2015年8月,DeepMind邀请他参观公司,并展示了他们的AlphaGo项目。他受邀在10月份与AlphaGo进行分先五局竞赛,AlphaGo以5:0完胜樊麾。事实上,在第一盘棋结束时,樊麾已经感觉到AlphaGo的棋力远胜自己。这是人工智能第一次在高度复杂的博弈游戏中战胜人类高手,也证实了深度学习和强化学习处理复杂问题的潜力,而这正是Hassabis成立DeepMind的愿景。 和樊麾的对弈进一步确定了AlphaGo的研发方向,DeepMind继续训练他们的AI。AlphaGo在2016年和2017年分别战胜了围棋世界冠军李世石9段和柯洁9段。 尽管AlphaGo在人类世界中已经无敌,DeepMind还是通过自监督学习的方法进一步提升了其棋力,于2017年发布了能完胜AlphaGo的新版本AlphaZero。Hassabis解释说,之所以叫做Zero是因为它从零先验知识开始,这样可以构建一个更通用的系统。所以AlphaGo只能玩围棋,但AlphaZero可以玩任何两人游戏。2019年,DeepMind发布了一个叫做MuZero的模型,一网打尽了人类的所有棋类游戏,包括围棋,象棋和日本将棋和多种雅达利电子游戏,可以说在智力游戏中已然独孤求败。 当然,这些成就对Hassabis来说只是开胃前菜,用来检验和磨炼DeepMind的AI能力。他在11岁时已经决定要把智力用在相比下棋“更有意义的事情”上,那么他亲手创造的人工智能必然也会被用在更加激动人心的领域。 在2016年AlphaGo战胜李世石后,DeepMind将研发重心转向了生命科学,并组建了两支新的团队——DeepMind Healthcare和AlphaFold。 DeepMind Healthcare在如何将AI用在医学领域进行了多个方向的探索,例如与摩尔菲尔兹眼科医院合作,使用机器视觉对眼部进行扫描,寻找导致失明的疾病的早期迹象。另一个例子是与美国退伍军人事务部合作,利用机器学习预测患者急性肾损伤的发作,这项技术能够比传统检测提前48小时预测患者在住院期间的病情恶化情况。2018年,这个部门和Google Healthcare合并,以期进一步加速AI在医疗健康领域的渗透和革新。 而AlphaFold团队的成立,成为了Hassabis新传奇的开端。这个团队的目标是解决蛋白质的折叠问题。蛋白质是对人类最重要的生物分子,不但支撑着所有的生命活动,而且可以作为药物、工业生产的原料以及生物催化剂等经济价值极大的产品。蛋白质由20种不同的氨基酸排列组合而成,就像乐高模型一样,用一些标准的元件就可以拼搭出无穷的组合。几乎一切生物学问题都可以归结为蛋白质以及围绕蛋白质的其他生物分子是如何发挥功能的,因而现代分子生物学里蛋白质科学占据着最核心的部分。 要想直观地知道蛋白质是如何发挥功能的,就需要知道蛋白质长什么样,也就是生物学家说的蛋白质结构。蛋白质通过氨基酸的折叠形成了各种形态,就像一张纸经过折叠可以变成各种形态一样。很多生物学家通过各种技术手段,比如X射线衍射、核磁共振以及冷冻电镜来解析蛋白是如何折叠的。这些技术手段各有优劣,但都需要大量的劳动来进行样本制备和实验操作。即使是训练有素的结构生物学家,也往往需要花费数年时间才能解析少量的蛋白结构。为此,很多科学家尝试使用计算机算法来破解这个难题。 20世纪90年代后,各种蛋白折叠解析算法相继问世。1994年,美国马里兰大学的John Moult教授创立了一个称为CASP(the Critical Assessment of Techniques for Protein Structure Prediction)的比赛,来检验参赛算法和真实实验得出的蛋白结构相比的准确率。包括David Baker等一大批领域内的学者都通过CASP比赛展现了各自的算法能力。Baker团队还做了一个Foldit的电子游戏,让用户在游戏里拼出正确的蛋白结构。 Hassabis在剑桥读本科时,在酒吧里打台球时认识了一位叫做Tim Stevens的研究员。Tim的研究方向正是蛋白质的结构,他特别有激情地向Hassabis说明他工作的重要性:人的身体所做的几乎所有事情都和蛋白质有关,理解蛋白质作用的原理对于理解身体如何工作以及疾病如何发生和治疗至关重要。他不厌其烦地向Hassabis强调:如果我们能破解蛋白质折叠,将是生物学的变革。 Stevens的热情确实在一定程度上感染了Hassabis。后来Hassabis去MIT做博士后时,又一次作为“玩家”认真体验了Foldit游戏,他惊讶于人类直觉在蛋白质折叠问题上的作用。2016年AlphaGo对战李世石时,Hassabis在首尔现场观战,看着AlphaGo的表现他突然有了一种想法:蛋白质的折叠和围棋好像没有太大区别,都是一种极其复杂的组合问题,这样的问题无法通过暴力计算解决。AlphaGo能够模仿围棋大师的直觉,那么同样的思路也能像玩Foldit游戏那样模拟人的直觉。 Hassabis回去后立刻组织人马启动了蛋白质折叠预测的项目,也就是后来大家所知道的AlphaFold。AlphaFold的基本原理和AlphaGo有相似之处,都是通过卷积神经网络学习已有的数据。幸运的是,当时全世界的结构生物学家已经通过几十年的积累,解析了超过170,000种蛋白质的程序。AlphaFold学习了这些结构,经过测试能比较准确地预测一些未知的蛋白结构。 2018年,在第13届CASP竞赛中,AlphaFold初次参赛即取得了总分第一的成绩。在那次竞赛中,AlphaFold成功预测了43种蛋白质中的25种蛋白质的精确结构,总分领先于其余参赛队伍。这一年,深度学习大放异彩,频频登上新闻头条:生成对抗网络(GAN)第一次生成了逼真的高质量图像风靡网络,Google发布了BERT,在多个自然语言处理任务上取得了重大突破,深度学习三巨头Yoshua Bengio、Geoffrey Hinton和Yann LeCun也在这一年共同获得了图灵奖。AlphaFold的成功也为这一年深度学习的热潮增添了一抹亮色。实际上,AlphaFold之外,这届CASP比赛里有多支参赛队伍都取得了远超第12届CASP1比赛的成绩,而他们无一例外都使用了深度学习的技术。 虽然AlphaFold在蛋白质折叠预测领域已经取得了空前的成功,但Hassabis觉得离真正的实用还有很大距离。他把目光投向了当时兴起的一个新的技术架构Transformer。这个架构是由谷歌的Vaswani等人在2017年发表的论文《Attention Is All You Need》中首次介绍,以其创新的自注意力机制和并行处理能力,迅速在自然语言处理(NLP)领域崭露头角,后来大火的ChatGPT也是基于这个架构。Hassabis认为蛋白质实际上就是一种复杂的语言,Transformer的神经网络架构看上去非常适合捕捉蛋白质里各个氨基酸之间的复杂关系。 对于优秀的企业家来说,合适的人才比其他所有因素对企业成功都更重要。尽管AlphaFold团队实力已经不俗,但Hassabis仍然不遗余力地寻找和吸纳这个领域的全球顶尖人才。2017年在Transformer架构提出来后,Hassabis敏锐意识到其在蛋白结构预测领域的潜能。此时AlphaFold第一版的开发已经进行了大半,是否要重构整个架构体系成为Hassabis需要决策的问题。如果真的要重构,那么需要什么样的人来领导新的开发团队? 这一年,Hassabis寻找到了刚从芝加哥大学博士毕业的John Jumper。他也曾在Hassabis的母校剑桥求学,学习理论凝聚态物理,还曾在D.E. Shaw Research 研究所担任科学助理,利用计算机模拟做蛋白质分子动力学研究,后来又去芝加哥大学研究如何把机器学习应用于蛋白质动力学。虽然刚毕业的Jumper还没有企业工作经验,但Hassabis准确地意识到了他的非凡才能,让他领导团队重构AlphaFold。Jumper把MSA(多序列比对)和等变注意体系结构(Equivariant Attention Architecture)和Transformer架构结合起来,大幅提升了模型的性能。重构的AlphaFold能够以原子级的精度预测蛋白质结构,即使在没有已知相似结构的情况下也能做到。 2024年诺贝尔化学奖得主John Jumper 图源:Google DeepMind DeepMind把重构后的模型称为AlphaFold2,虽然这个名字看上去只是AlphaFold的升级版,但其底层算法已经完全不同。2020年,Jumper带着AlphaFold2参加了第14届CASP竞赛。上一届CASP竞赛中,AlphaFold虽然获得了总分第一,但在一些项目指标上和其他一些参赛队伍差距还不是很大,甚至互有胜负。但在CASP14中,AlphaFold2则以极高的预测准确性,特别是在复杂蛋白的预测上,遥遥领先于其他所有选手,其卓越表现震惊了整个科学界。蛋白结构生物学的科学家们一致认为这是该领域迄今为止最重大的突破。结构生物学家Andriy Kryshtafovych,也是CASP14的组织者之一,在会上当场表示,不敢相信70岁的自己真的“活久见”了(I wasn't sure that I would live long enough to see this)。 第二年,DeepMind开源了AlphaFold2模型,并用AlphaFold2预测了人类98.5%的蛋白质结构,还同时包括了大肠杆菌、果蝇、小鼠等20种模式生物的蛋白质组数据,总计超过35万个蛋白质的结构,并免费开放给所有科研人员。而在此之前50年内,所有的结构生物家穷尽毕生努力也只覆盖了人类不到20%的蛋白结构。 Hassabis难掩激动,在推特上表示:“这是我一生中梦寐以求的一天,这就是我创立DeepMind 的原因,为了构建人工智能并用它来实现像AlphaFold 2 这样的非凡科学突破,以推进科学并造福人类!我为这个不可思议的团队感到无比自豪!”
AlphaFold2很快成为几乎所有蛋白质领域科学家的可靠工具。制药企业、疫苗研发企业以及很多合成生物学企业都在利用AlphaFold2预测或改造新的蛋白质以及和蛋白质结合的分子。 2024年5月,DeepMind又推出了AlphaFold3,不但进一步提高了预测精度,还能够预测蛋白质与其他生物分子(如DNA、RNA、小分子配体等)的复合物结构,这标志着AI在生物学领域的应用达到了一个新的高度,为未来的药物发现和生物医学研究提供了更强大的工具。 AlphaFold实现了Hassabis“让电脑放大人的智力”的远大目标,也体现了他建立DeepMind的初衷——“让 AI 突破帮助人们进一步理解基础科学问题”。 2024年10月,Demis Hassabis和John Jumper一起获得了诺贝尔化学奖,整个科学界为之沸腾。作为非化学领域出身,也非在大学等传统科研机构工作的他们来说,这一奖项的获得无疑具有里程碑意义。 Hassabis在获奖后说道:在可以预见的未来,我觉得 AI 工具能让个体科学家做得更多......最优秀的科学家与这些 AI 工具配合,将能够完成令人难以置信的工作。 而John Jumper更是捧得了70年来最年轻诺奖得主的桂冠,可以说,Demis Hassabis的慧眼识珠对Jumper的职业发展起了决定性的作用。 同时具有科学家和企业家身份的Demis Hassabis依然活跃于一线工作,继续实现着“用智能解决人类的一切问题”的梦想。他是一位不折不扣的工作狂,几乎每天都会工作到深夜。在一次采访中他说道:“在我醒来的每一个时刻,工作都是我想做的事情,也许甚至在我的梦中也是如此,这也是我最有热情的事情”。 作为一名善于寻找乐趣的“大玩家”,工作已经成了Hassabis最大的乐趣。他领导的DeepMind正在将人工智能技术用于更多领域,包括语言模型(Google Gemini),机器人(RoboCat),材料科学(GNoME)等等。或许在不久的将来,Hassabis也会在其他领域带来AlphaFold式的颠覆。 每当天才降落于人间,人类的文明常常会前进一大步。如果“用智能解决人类的一切问题”是一场大型游戏,Hassabis无疑是最优秀的头号玩家之一。我们期待他在这场游戏里拿下更多的奖杯。 作者简介: 王承志,北京大学医学博士,科普作家。智源深澜创始人,致力于使用AI技术推动生物分子的创造。 |
|