分享

2:0!柯洁再负AlphaGo,过程惊心动魄!

 skysun000001 2017-05-25

撰文 《环球科学》记者 褚波 发自乌镇

 

虽然在人机大战的第一场比赛中告负,但比赛结束后,柯洁的心态似乎放松了不少。


5月24日下午,柯洁“忙里偷闲”,在乌村钓鱼、射箭,脸上泛着笑容,看起来颇为轻松愉快。傍晚时分,他还陪同一位朋友,出现在《环球科学》记者所住客栈附近的一家餐馆,购买食物。被一些记者认出后,柯洁还微笑着点头致意。

  

柯洁在乌村钓鱼

 

柯洁这时的状态,与第一场比赛中的托腮、皱眉、捂嘴、抓头发、挖耳朵相去甚远。但我们并不知道,柯洁的内心是否和脸上的表情一样放松;我们也不知道,在第一比赛结束,得出“AlphaGo已经接近围棋的上帝”这样的论断后,柯洁是否还对第二场比赛抱有信心。


不管柯洁是如何想的,尽管第一场也只是以四分之一惜败,但外界,包括柯洁的同行、朋友在内,很少有人看好他。比如,棋圣聂卫平就曾在赛前直言:柯洁的水平与AlphaGo差距太大,将以0比3完败。”而在《环球科学》记者所在的“围棋峰会媒体群”里,各路媒体记者一直在讨论头一天的比赛,以及第二场比赛可能出现的结果——几乎所有记者都认为,第二场比赛柯洁仍将以失败告终。


5月25日上午10点,《环球科学》记者来到围棋峰会会场,柯洁也恰好在此时步入会场,远远看去,他表面非常平静,步伐轻松,似乎延续着前一天下午的好状态。而会场内,现场硕大的LED屏幕上,“AlphaGo 1:0 Ke Jie”的字样不断提醒着在场的嘉宾、媒体记者上一场比赛的结果。1:0的比分会变成1:1还是2:0,将在几个小时后见分晓。

 

 

柯洁步入会场

 

上午10:30,对弈者入座,第二场比赛开始。


仅仅几步过后,AlphaGo与柯洁的对弈局势就让现场解说古力九段和张璇九段感到意外:AlphaGo第3手就下了一个三三,这正是前天柯洁用过的招法;而柯洁在前几手的下法,似乎是在模仿AlphaGo。


随着时间的流逝,柯洁仍然做出了托腮、抱头等小动作,但这些小动作的频率明显低于第一场比赛。在熟悉柯洁的古力和张璇看来,柯洁其他的一些动作,比如身体前倾、扇扇子,说明了柯洁在这场比赛中“非常投入,状态不错”。而且在前半个小时,对弈双方的用时也没有拉开明显差距,这与第一场有所不同。


一个小时过后,双方进入胶着状态。柯洁也展示出了强大的实力,并且似乎采用了与第一场完全不同的战术:他尽量让棋盘复杂起来。因为相比第一场比赛中打完一个局部再打另一个局部的战术,混战引发的计算要多得多,如果AlphaGo剪枝剪不过来,就有可能出现漏算。就像一位Twitter用户的评论:柯洁想让棋盘复杂起来,AlphaGo想让棋盘简单起来。甚至DeepMind创始人哈撒比斯也在Twitter上表示,柯洁的表现很完美!


 

 

中午12:09,接替古力和张璇的现场解说刘菁和周睿羊也认为,柯洁在第二场比赛中的表现要好于第一场,“战术是对的”,并且“有一点机会”战胜AlphaGo。看着棋盘上“复杂的局面”,周睿羊说,“第一场比赛让我们非常悲观,今天这场比赛,让我们看到了一些希望(明天,周睿羊要和其他4位同行一起,与AlphaGo下一场团体赛)”。


下午1点,比赛进入关键阶段,古力和张璇再次上场解说。他们认为,柯洁选择了一种最激烈的战斗方式,显示了柯洁的决心和斗志,并且散发出了一种和人类棋手比赛时所没有的杀气。“棋盘上的局势正在朝着我们预测的方向演变,他确实有机会”,古力补充说。


遗憾的是,在下午1点25分左右,柯洁的出现失误,让局势陡然发生变化,朝着不利于白棋的局势演变,而正是这个阶段的失误,让柯洁不得不再次面临失败的结局。


总体来算,通过独特的战术,柯洁创造了一些机会,但最终的结果说明,在无比复杂的混战局面中,还是人类棋手先出了错。而AlphaGo再给人类上了一课。


对于整个人类来说,发展AlphaGo的最终目的,是要把这种技术应用在能源、医疗、教育和建筑等方向上,帮助我们探索科学的世界,帮助我们在医学和科学领域取得进步。


而对于围棋爱好者来算,AlphaGo可以用来训练新棋手,使其技术水平快速上市,”如果用AlphaGo来训练业余五段的选手,他很快可以达到职业初段的水平,”古力说。




扩展阅读:这几天频频被提起的TPU和TensorFlow到底是什么?


不同于CPU、GPU这类通用工具,TPU(TensorProcessing Unit,张量处理器)是一款为机器学习而定制的专用芯片,它在计算精度降低的情况下更耐用,每一个操作调用更少的晶体管,因而具有更高的效能(每瓦计算能力)。尽管在一些应用上利用率很低,但TPU平均比当前的GPU或CPU快15~30倍,性能功耗比高出约30~80倍。TPU已经达到了7年后的科技水平,被用于谷歌街景和Alphago中,一直被视为谷歌的秘密武器。


TensorFlow 是谷歌开源的机器学习系统,它表达了高层次的机器学习计算,大幅简化了第一代系统,并且具备更好的灵活性和可延展性,在图形分类、音频处理、推荐系统和自然语言处理等场景下都有丰富的应用,使用TensorFlow的Google应用包括:Gmail, Google Play Recommendation,Search, Translate, Map。 TensorFlow一大亮点是支持异构设备分布式计算,它能够在各个平台上自动运行模型,从电话、单个CPU / GPU到成百上千GPU卡组成的分布式系统。




    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多