一个连业余棋手都打不过的新模式居然打败了AI——世界最强围棋AI KataGo。
没错,这个令人瞠目结舌的结果来自麻省理工,加州大学伯克利分校等的最新论文。
研究人员通过使用反攻击方法抓住了KataGO的盲点,并基于这一技术,一个菜鸟级别的围棋程序成功击败了KataGo。
不用搜索,这个胜率甚至达到了99%。
这样,围棋界的食物链瞬间变成了:业余棋手gt,新AI gtTop Go AI。
等等,这个神奇的新AI是怎么让它变得好吃又强大的。
尖锐的攻击角度
在介绍新AI之前,我们先来了解一下——这次攻击的主角KataGo。
KataGo是目前最强大的开源围棋AI,由哈佛的AI研究人员开发。
此前,KataGo击败了超人精灵OpenGo和Leela Zero,即使没有搜索引擎,其水平也堪比欧洲职业围棋手前100名。
刚刚获得三星杯冠军,实现三年四冠的韩国围棋第一人沈镇裕,一直在和KataGo对练。
面对如此强劲的对手,研究人员选择的方法可以说是四两拨千斤。
他们发现,尽管KataGo通过与自己下数百万盘棋来学习围棋,但这仍然不足以涵盖所有可能的情况。
所以,这一次,他们不再选择自我游戏,而是选择战斗攻击的方法:
让攻击者和固定的受害者玩一个游戏,用这种方式训练攻击者。
这种改变让他们在训练KataGo时,只需要0.3%的数据就能训练出端到端的对抗策略。
具体来说,这种对抗策略并不是完全在玩一局游戏,而是通过欺骗KataGo玩到对进攻方有利的位置来提前结束游戏。
第一篇论文介绍了亚当·格里夫:
这种做法会让卡塔戈误以为自己赢了,因为它的地盘比对手大很多。
但是左下角的区域并不会真的对分数有贡献,因为那里还有黑子,这意味着它并不完全安全。
因为卡塔戈对胜利过于自信——认为如果比赛结束,计算得分,他就赢了——卡塔戈会主动传球,然后进攻方也会传球,从而结束比赛,开始得分。
但正如格莱夫分析的那样,由于卡塔戈圈地内的黑子仍在活动,并没有按照围棋规则判定为死子,所以卡塔戈圈地内有黑子的地方不能算作有效令。
所以,最后的胜利者不是卡塔戈,而是进攻者。
这一胜利并非独一无二在没有搜索的情况下,这种对抗策略对KataGo的攻击率达到了99%
当KataGo使用足够多的搜索接近超人的水平时,他们的胜率达到了50%。
此外,尽管有这种巧妙的策略,但攻击者模型本身在围棋中并不强大:事实上,人类业余爱好者可以轻松击败它。
研究人员表示,他们研究的目的是通过攻击KataGo的一个意想不到的漏洞,证明即使是高度成熟的AI系统也存在严重的漏洞。
正如普通工人格里夫所说:
强调更好地自动化测试AI系统的必要性,以找到最糟糕的故障模式,而不仅仅是测试一般性能。
研究团队
研究团队来自麻省理工学院,加州大学伯克利分校等,常见的论文有托尼·王童和亚当·格里夫
托尼·王童是麻省理工学院计算机科学专业的博士生,曾在英伟达,创世纪治疗公司等公司实习。
加州大学伯克利分校人工智能专业博士生亚当·格里夫毕业于剑桥大学,获得硕士和学士学位主要研究方向是深度学习的鲁棒性
文末附有论文链接,感兴趣的朋友可以自行取阅~
纸质链接:
参考链接:
声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。