江铸久:人机大战,开启围棋新纪元
2016/3/14 三联生活周刊

     人机大战Round5押注

     回复你的预测结果,我们将抽取5名读者,各赠送一张「三联·阅读汇」活动入场券(场次自选,坐标北京)。本次投票截止至15日下午4时。

    

     李世石对战AlphaGo

     这是一场已经可以预知结果的比赛了。李世乭并没有输给机器,而是输给了人类创造出来的高科技。因为AlphaGo的运行原理是遇强则强,简单来说就是AlphaGo的进步是不需要传统意义上的对手的,达到一个高度后,只需要自己克隆自己,昨天的自己就是它今天最好的对手。

     一般人类包括职业棋手,在提升自己的上升空间的的时候也需要对手,需要对手带来的不断磨练。在对抗中发现自己的弱点,发扬自己的长处来弥补自己的弱点。

     AlphaGo的可怕、可恨、可爱之处,在于它能自我培养。换句话说它可以随时克隆一个自己或N个自己,然后让不同阶段的自己对练。它甚至于在比赛中都在不停地做这个学习习惯。

     所以在比赛开始前,我就预感一旦电脑赢一盘,就等于电脑赢了。因为赢了一盘之后,它可以在这个基础上学习对手的长处,发现对手的弱点,不停的练习,这就是深度学习。

     那么我们试想一下当李世乭跟柯洁对决的时候,现在世界上最顶尖的两个人对决,他们的每盘碰撞都能让双方获益匪浅,然后共同提高。可以说围棋界的每一个天才的成长都是依循着这样一个轨迹的。

    

     柯洁对战李世石

     接下来的事情就比较容易理解了。人与人之间的对决那都是要在相隔一段时间之后才会有的。即使是十番棋、五番棋期间也是需要休息的。AlphaGo不同,今天跟李世乭对决完,当晚它就相当于又跟李世乭下了几十盘。这就是我理解的AlphaGo的深度学习。

     看了这么多讲AlphaGo的文章,特别是跟好朋友,原来微软研究院的副院长张铮聊了,知道了AlphaGo运作的规律和原理。这是一种科学,它具备这样的能力,实际上具备了我们专业棋手多少梦寐以求的,就是不停跟强手作战,对阵,从中学习,它是夜以继日,可能应该说是分分秒秒。

     至于说,AlphaGo跟最强的人对抗之后,它就学到了最强的人的招法,从而提高了自己,应该只是我们的一种臆想。

     要知道它本身就很容易达到了最强,当然在它成长的过程中有个学习的过程,但是它一旦赢了最强的对手,像李世乭这样等级的棋手,那它的训练量就是爆炸式的增长。

     除了它的学习劲头,就是把人类的所有有质量的高水平的棋谱输入学习之后,它还有一个就是能够在比如像我们已经看到的跟李世乭的对局中学习。

     当它碰到有困惑的一手、需要几个选点的一手,在它已知的棋谱里没有见过的,需要所谓搜索的时候,现在的高科技已经能够把搜索提高到一秒钟决定一步棋,有的文章说需要0.2毫秒,有的说0.3毫秒,什么概念呢,就是说在两三秒之间,它已经能够下出一百万步。也就是它可以自己去搜索,自己去猜测,自己去琢磨这步棋好不好,关键是它在实战。它把经过N个自己对决的实战里选出最能赢棋的一手(胜率最高的那一手,拿出来,放在棋盘上)。

     这让我想到一个画面:当年吴清源老师在19岁时跟秀哉对战,下到最后官子阶段,吴老师一拉拉门,抬头,就惊呆了,所有本因坊一门的弟子都到齐了,整整齐齐的礼服、和服,几乎每个人手里都捧着棋谱,吴老师那盘棋的所有的官子后面的变化,都写在那儿,只要不出错,按照本子往下来就可以了。

    

     1933年吴清源与本因坊秀哉对局

     而AlphaGo是具有成千上万倍的这样的能力的。那就可以说这是人类科技了不起的地方。在这样的情况下,那李世乭、我们人类还同它在这方面进行较量,除非我们人不犯一丁点儿错。

     我们经常说职业棋手的脑子可以算到几步远,这指战略上,战术上算到几十步甚至推算到百步以上。那你想,如果我们面对的是这样一个AlphaGo,它在两三秒内已经跟你来回了一百万步,这根本不是一个量级的了。

     AlphaGo的出现引发我最多思考的,就是我们该如何学习利用人类智慧结晶。谁能打败AlphaGo?我想当今的棋界恐怕是没有人的。AlphaGo的厉害之处在于它只要赢棋,它不要下的最漂亮。它在KGS上可以跟三段下,它也可以跟欧洲冠军樊麾下,似乎赢得也不多,看上去水平也不是那么好,它跟李世乭下,它还是这个表现。如果我们要看到精彩的,我们要有个参照物,倒过来讲,AlphaGo找的参照物在不停的升级。所以我觉得对于我们职业界人类棋手来说,如果你想找到自己最好的那一面,那就可以跟AlphaGo练。

     人机对决对我最大的震撼和启发就是,我们今后培养孩子们学围棋的时候更加注重培养他们的大局观,注重培养良好的学习习惯,启发他们的创造性思维。当然这是围棋本身早就有的,也正是因为学习围棋对这些有帮助,所以让孩子们能够喜爱这个事情,能够让AlphaGo的整个团队从围棋中得到和作出这样一个人类智慧结晶超棒的东西来。

     由此我联想到的是,孩子们的学习包括在学校的一些课程,是不是可以做些重大修改,有些知识是可以不学,或者不一定非得学到什么程度,甚至可以暂时不学。因为我们可以借助高科技提升我们的学习效率,而人类创造性的想象力,创造性的思维是最宝贵的,对于这类的思维活动应该更加保护,应该着重开发孩子们这方面的能力。

     (图片来自网络)

     ⊙ 本文版权归《三联生活周刊》所有,请勿转载,侵权必究。

     三联生活周刊

     一本杂志和他倡导的生活

     长按二维码 即关注

    

    

    

    http://www.duyihua.cn
返回 三联生活周刊 返回首页 返回百拇医药