分享

戴文渊:如何反转?人工智能专家给李世石出点招

 竹叶连三世 2016-03-13

戴文渊:如何反转?人工智能专家给李世石出点招
选择字号:     本文共阅读 741 次 更新时间:2016-03-10 10:48:13

进入专题: 人工智能  

● 戴文渊  

   

引言

   如果说1997年IBM深蓝战胜国际象棋世界冠军卡斯帕罗夫是机器突破了人类的第一道防线话,2016年AlphaGo是不是摧毁了人类的最后一点骄傲呢?

*1997年5月11日,国际象棋世界冠军卡斯帕罗夫与IBM公司的国际象棋电脑“深蓝”对局


   虽然作为多年的AI工作者,是AI的坚定支持者,我还是觉得人类的最后一道防线可以多坚守一段时间。那么,我来给李世石出点招吧 :)

   这一切的一切,还是得先从AlphaGo的原理讲起。

   

原理:AlphaGo如何运作?

   

   区别于国际象棋靠推演,围棋需要靠“感觉”。围棋变化太多了,每一步棋可以有多达300多种选择。仅仅推演6-7步,就已经是现在计算机所不能及,更不用说人。所以,即便是人,在很多场景下都要靠感觉来决定下一步往哪里走。这种“感觉”,靠的是智力。

   

   AlphaGo基于当今最领先的“深度学习”技术,来建立机器的智力。当前的这种人工智能技术,是一种仿生学技术,运用数学模型去模仿人类的大脑。这种机器大脑,在面对棋局时也可以“感觉”出情势的好坏。而“感觉”的好坏体现的就是智力水平。

   

   那么,智力水平怎么比拼呢?通常我们数“脑细胞”的数量。就像人的脑细胞比狗多,所以人比狗聪明;狗的脑细胞比蟑螂多,所以狗比蟑螂聪明。4年前,Google就研发出了一个脑细胞数量达到百万量级的大脑Google Brain,能识别出猫脸。为此Google动用了1000+台服务器。

*Andrew Ng(吴恩达)是Google Brain的核心人物


   如果要让机器大脑更聪明怎么办?一个直接的办法就是,增加服务器。服务器数量增加10倍,脑细胞数量就能增加10倍,机器大脑就更聪明了。

   

   所以,AlphaGo有多聪明,主要看它有多少“脑细胞”。“脑细胞”的数量,主要看投入了多少计算资源。

   

能力:AlphaGo有多厉害?

   

   AlphaGo的智力水平肯定是不如人的。

   

   4年前的Google Brain,脑细胞数量是人的万分之一。虽然时过进迁,但Google的投入仍然不可能达不到当年一万倍。从第一盘比赛中,也可以看得出来,李世石在开局和布局是占有优势的。

   

   第一盘棋中,真正让人感到害怕的也不是AlphaGo的棋力,而是它的没有情绪、不知疲倦、沉着冷静。这与AI无关,是机器的本性。

   

   情绪、体力、心理波动等人性弱点对棋局结果的影响不可低估。事实上,李世石并不输在棋力,而是输在获得优势以后的轻敌,以及之后所犯的错误。

   

胜机:李世石还有机会么?

   

   双方对比来看,李世石比AlphaGo聪明,棋力更深厚。AlphaGo比李世石的人性弱点:情绪控制更好,它不会紧张,不会嘚瑟,不会沮丧,也不会体力下降。李世石面对的其实是一位棋力比他稍差的忍者。好在,他是占据主动的一方。在棋力占优的情况下,只要不犯错误,是可以立于不败之地的。

   

   综合来看,我仍然看好李世石。

*阿尔法围棋(AlphaGo)是一款围棋人工智能程序,由位于英国伦敦的谷歌(Google)旗下DeepMind公司的戴维·西尔弗、艾佳·黄和戴密斯·哈萨比斯与他们的团队开发,这个程序利用“价值网络”去计算局面,用“策略网络”去选择下子。(图为赛场)

   和AlphaGo对抗时,人类需要注意的是:

   1. AlphaGo所基于的人工智能技术,强项不在于推演,而是借鉴过去见过的局面。所以,如果要击败AlphaGo,需要尽可能把局面导向历史上没人下过的棋。

   2. 围棋的边角战斗靠计算,中空战斗靠感觉。既然感觉占优,那就一定要尽量把胜负手留在棋盘中间(或许武宫正树更适合pk AlphaGo?)。靠做“势”取胜,而不是把战火引到边角实地。

   3. 一旦进入到局部缠斗,尽早将局部肉搏战打完,不要留出大量小区域短兵相接的局面,保持局面尽可能大开大合。

   

   此外,需要格外小心的是,一定要克服自己人性的弱点。局面领先时,避免骄傲;落后时,避免气馁;胶着时,避免紧张。

   

   李世石如果能在后面几局注意控制自己的心魔:那么不仅可以沉着冷静,也可以小宇宙爆发。相信后面还是有很大机会可以扳回。

   

   总的来说,要战胜AlphaGo:

   1. 准备历史上没下过的布局;

   2. 把胜负手留在棋盘中间;

   3. 不留短兵相接的局面;

   4. 控制自己的心魔。

   

   还有一点,可能是李世石犯的错误,但已无法改变了。据说,他要求下快棋。AlphaGo系统的分为两个部分,一是学习,二是对弈。其中,学习的部分是最耗时间和资源的,而对弈部分相对计算没那么大。要限制AlphaGo,应该要限制它的学习时间,而不是对弈时的思考时间。特别是,对于AlphaGo这样的分布式系统,Google完全可以通过增加一倍服务器数量来让落子速度倍增,而李世石是不可能给自己的大脑扩容的。其实,最好的限制AlphaGo的办法是尽早与他对弈,不让他继续学习下去 :)

   

   据说,柯洁已经发话说,AlphaGo下不过自己了。如果柯洁要巩固自己的优势,

   

   建议

   1. 尽早与AlphaGo对弈

   2.下慢棋

   3. 或者还有一个不靠谱的招,改一下规则,下20*20的棋 :)

   

投入:AlphaGo花了多少钱?

   

   最后,我想一个有意思的话题是,AlphaGo到底花了Google多少钱:)

   

   从今天双方在棋力上的差距来看,差距已经不是很大了。只要Google愿意多投入5-10倍的资源,AlphaGo的棋力应该可以超越人类了。要达到这样的智力水平,我想Google应该至少投入了数亿美金的资源。

   

   随着技术水平的提升,和投入的加大,大概只需要1~2年,AlphaGo在棋力上应该也可以超越人类。

   

   写到这里,我其实还是很羡慕AlphaGo团队的科学家的,他们有一个很好的sponsor,能给他们一个环境去完成一件划时代的壮举——我何尝不曾想拥有这样的环境——3年前我和我的老师杨强提出的围棋方案找不到sponsor的场景仍然历历在目。

   

   不过,后来我也想明白一个事情。其实我们的大环境缺的并不是有理想有抱负的科学家,而是sponsor。所以真正挑战人类的其实是IBM,不是许峰雄;是Google,不是DeepMind团队。就像,真正修成圣彼得大教堂的,是天主教会,而不是米开朗基罗。

*圣彼得大教堂

   这也是为什么,我决定要做第四范式————中国有好的科学家,但缺好的sponsor。

   

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多