亚博每月vip规则



  退役赛的最后一局,李世石回到了自己的家乡。对战之地距离李世石的出生地飞禽岛 40 多公里,他曾在飞禽岛度过了他的童年时光,也是在这里决定成为职业围棋选手。12 月 21 日,全罗道新安郡曾岛 EI dorado 度假村,李世石在第 181 手投子认输。这是与 Handol 退役赛对战的最后一局,前两局,李世石一胜一负。最后一盘棋,还是惜败于 AI。

亚博每月vip规则

  赛后,李世石在接受采访时表示:「这场比赛中,Handol 的表现与前几场类似,如果自己能够再谨慎一点,或许比赛的结果会有所不同。」对于退役后的工作,李世石还没有做出选择。

  2019 年 1 月,Handol 连续战胜了申旻埈九段、李东勋九段、金智硕九段、朴正焕九段和申真瑞九段五位韩国顶级围棋选手,8 月在山东举行的「中信证券杯」世界智能围棋公开赛中,Handol 也捧回了季军奖杯。

  11 月 19 日,李世石向韩国棋院正式递交辞呈,宣告了自己 24 年职业围棋生涯的结束。

  人类再次在围棋「人机大战」中取得了一场胜利。谷歌 DeepMind 资深研究员、ALphaGo 主要程序开发者黄士杰曾在看完前两盘对决之后表示,如果再有两年的算法更新和优化,AlphaGo Master 将会是最强的棋手。但 AI 要做到万无一失,仍需要解决 bug 问题。

  这一局,李世石在第 31 手出现误判,而后白棋的胜率预测一直保持在 90% 以上,到了第 40 手以后,胜负已经基本明朗。

  虽然在围棋的算力上,人类已经难以与机器相比,但棋手们可以通过与 AI 的对弈不断提升自己的水平,甚至发展出更为先进的战术。据古力此前透露,「绝艺」已经成为中国国家围棋队训练专用 AI。

  在围棋 AI 领域,棋力最高的选手仍然是 DeepMind 公司的 AlphaGo,它也是第一个击败人类围棋世界冠军的人工智能程序。在 2017 年柯洁与 AlphaGo 对战之后,David Silver、谷歌大脑负责人 Jeff Dean 等人曾在乌镇围棋峰会现场对 AlphaGo 背后的技术进行过解读。

  上个月,DeepMind 又推出了名为 MuZero 的「通用版」AlphaGo,在国际象棋、日本将棋和围棋的精确规划任务中可以匹敌 Alpha Zero,在围棋中甚至超过了 Alpha Zero。但与前辈不同的是,MuZero 不需要提前获知规则。

  上个月,DeepMind 又推出了名为 MuZero 的「通用版」AlphaGo,在国际象棋、日本将棋和围棋的精确规划任务中可以匹敌 Alpha Zero,在围棋中甚至超过了 Alpha Zero。但与前辈不同的是,MuZero 不需要提前获知规则。

  AlphaGo 最初主要是依靠大量学习人类棋手的棋谱来提高棋艺,之后 进入到完全的自我深度学习阶段,也就是完全摒弃人类棋手的思维方式,按照自己(左右互搏)的方式研究围棋。结合监督学习与强化学习的优势,AlphaGo 通过训练形成一个策略网络,将棋盘上的局势作为输入信息,并对有所可行的落子位置形成一个概率分布。然后训练一个价值网络对自我对弈进行预测,以-1(对手的绝对胜利)到 1(AlphaGo 的绝对胜利)的标准,预测所有可行落子位置的结果。

  「绝艺」的训练主要包括人类棋谱数据库和机器自对弈,它的算法基于策略网络与价值网络两大核心,并创新性地大幅提升了价值网络的精度,使其大局观表现更好。在 2018 腾讯世界人工智能围棋大赛中,「绝艺」在决赛中 7:0 大胜另一款围棋 AI「星阵」夺冠,半决赛五番棋和决赛七番棋不失一局,赛后「星阵」研发团队亦称赞「绝艺」已经「达到了 AlphaGo 的水准」。

  一直以来,人们都认为顶尖人类棋手与 AI 之间的差距在二子到三子之间,但由于从来没有进行过正式比赛的对局,所以真正差距无从得知。李世石提到,自己最终选择下升降棋,也是想确认人类和人工智能之间的差距到底有多少。在对战 Handol 之前,李世石说自己已经有大概 5 个月的时间没有参加过比赛,也几乎没有进行过围棋训练。

  最终李世石在第 122 步认输。这一局时长 3 小时 20 分钟,至此,李世石与 Handol1:1 战平,而剩下的最后一局尤为关键。

  李世石在 2016 年 3 月与 AlphaGo 的一番激战,被认为是人工智能历史上的一次里程碑事件——虽然李世石以 1:4 的比分落败,但在比赛的第四局,李世石的惊天翻盘却让他成为了迄今为止唯一一个战胜过 AlphaGo 的棋手。他在第 78 手出人预料的一挤,让 AlphaGo 后续的反应出现失常,彻底改变了战局——这与此次在第一局中战胜 Handol 的场面何其相似。

  尽管在围棋上已经登峰造极,真正让李世石名声大噪的还是与 AlphaGo 的「人机大战」。

  这场比赛仅用两小时就分出了胜负, 在 100 手以内即告结束。尽管李世石表示赛前曾连续练习了十天的被让两子棋,「几乎醒着的时候都在练棋」,但他也表示未能料到自己会在与 AI 的对决中获胜。

  原标题:《1:2,李世石最后一战被AI击败,唯一战胜过AlphaGo的人退役了》

  上个月,DeepMind 又推出了名为 MuZero 的「通用版」AlphaGo,在国际象棋、日本将棋和围棋的精确规划任务中可以匹敌 Alpha Zero,在围棋中甚至超过了 Alpha Zero。但与前辈不同的是,MuZero 不需要提前获知规则。

发表评论

电子邮件地址不会被公开。 必填项已用*标注