42%的胜率,并不是说还有四成赢的机会,而是在对手不犯错误的情况下,必输的意思。
alphaGo真的要输了?而且还是执白输?
要知道,在deepmind内部的测评中,在黑棋贴7。5目的现代规则中,相当于没开始下,黑棋就已经损失了一块地盘,白棋的胜率显著高于黑棋。
机器对弈下,alphaGo持白棋战胜自己的胜率超过55%。
其实这几年人类围棋界也有相同的看法,尤其在古杰异军突起后。
古杰去年执白全年只输过一盘,白棋胜率百分之九十七,而他执黑棋的胜率一下子就跌到了百分之六十。
而现在,阿法狗在执白的情况下,居然要输了?
而且还是在没有出现bug的情况下输掉了?
赢不了了。
当黑棋第125手的飞再次分割了白棋之后,就连只有业余四段实力的哈萨比斯也看出来,整盘棋面上,白棋的劣势已经非常明显。
而到了白棋第146手之后,阿法狗的自评胜率已经跌到了12%以内。
但阿法狗仍旧还在竭力抵抗,但谁都能看的出来,没有什么希望了。
它的对手太强大了!
怎么可能!
?
怎么可能有这样的棋手?
哈萨比斯完全无法理解。
手持白棋不停落子的黄世杰同样也无法理解。
他是业余六段,阿法狗的实际开发人,没有人比他更理解阿法狗的棋力,哪怕面对的是李世实这样的顶尖棋手,他也能自信的说,他对AI思路的理解比李世实更准确。
但现在,黄世杰完全看不懂对手的棋路,也不敢说自己能够看得懂阿法狗的思路。
哪怕到了几十手之后,他都仍旧看不懂双方为什么会这么下。
只知道莫名其妙的,黑棋似乎就占据上风了。
为什么下的很多招式是自己之前从未见过的?
对面的,真的是一个人类吗?
不,哪怕是AI,也一样是要用人类棋谱进行学习的,招数并没有真正的脱离人类的思考范畴,只是把人类的招数探索到了极致而已。
但现在在这个对手,所使用的招数,无论从布局,还是局部定式,完全和人类既有套路不一样。
除非……对方真的是个AI,并且从未学过任何人类的招数,只凭自我对弈,自我学习,自我推理,掌握了这个游戏!
黄世杰被自己的想法吓了一大跳。
如果他的猜测是真的,那就意味着,对方不止是在训练上走在了deepmind前面,在算法上,更是把deepmind远远甩在了后面!
此前他们也曾经设想过让alphaGo完全自我对弈来掌握围棋,但效果非常糟糕。
在实验中,他们发现,alphaGo所用的策略梯度算法在平衡探索新策略与利用已知策略之间存在严重的不稳定性,导致AI无法从整局优势的角度上去考虑胜负优势。
而且,围棋的胜负信号噪音太强了,如果没有初期的既有知识引导,会导致模型在初期训练阶段无法有效学习。
除此之外,还需要解决神经网络的“灾难性遗忘”
问题和没有初始策略下的大量随即走子的问题。
可以说,这里面任何一个问题,可能都需要大量的人力物力和极为聪明的大脑来花费几个月的时间进行解决。
尤其是“灾难性遗忘”
,这种学了新知识就忘了旧知识的现象在深度学习领域非常常见,可以说,整个深度学习领域迄今都没有找到太好的办法应对各种原因所造成的灾难性遗忘。