导读:李世石个人资料 || AlphaGo简介 || 李世石&AlphaGo第一局结果 || 李世石&AlphaGo第二局结果 || 李世石&AlphaGo第三局结果 || 李世石&AlphaGo第四局结果 || 李世石&Al... |
李世石个人资料 || AlphaGo简介 || 李世石&AlphaGo第一局结果 || 李世石&AlphaGo第二局结果 || 李世石&AlphaGo第三局结果 || 李世石&AlphaGo第四局结果 || 李世石&AlphaGo第五局结果 || 对战时间表
对战进行中
继谷歌宣布人工智能项目AlphaGo实现突破性研究——计算机程序首次击败专业棋手之后, 谷歌DeepMind今日公布了将与过去十年最佳围棋手李世石之间的终极挑战的详细情况。3月9日至3月15日,AlphaGo将在韩国首尔与李世石进行5场挑战赛。比赛完全平等,获胜者将得到一百万美元奖金。
双方对战时间分别为3月9日(周三)、3月10日(周四)、12日(周六)、13日(周日)、15日 (周二)的北京时间中午12点进行比赛。
本次比赛用时每方2小时,1分钟读秒三次。比赛采用中国规则,黑贴3又3/4子(黑贴7目半)。采用中国规则是因Alpha GO以中国规则为基础开发。
比赛采用5局3胜制,最终比赛获胜方将获得奖金100万美元。如果AlphaGo获胜,奖金将捐赠给联合国儿童基金会(UNICEF),STEM教育,以及围棋慈善机构(Go Charity)。
李世石
李世石(朝鲜语:,朝鲜汉字:李世乭),1983年3月2日生于韩国全罗南道,2006年3月12日与女友金贤珍完婚,同年9月3号女儿李慧琳出世。1995年入段,1998年二段,1999年三段,2003年因获LG杯冠军直接升为六段,2003年4月获得韩国最大棋战KT杯亚军,升为七段,2003年7月获第16届富士通杯冠军后直接升为九段。2006、2007、2008韩国围棋大奖——最优秀棋手大奖(MVP)。棋风特点——李世石属于典型的力战型棋风,善于敏锐地抓住对手的弱处主动出击,以强大的力量击垮对手,他的攻击可以用“稳,准,狠”来形容,经常能在劣势下完成逆转。
阿尔法围棋(AlphaGo)是一款围棋人工智能程序,由位于英国伦敦的谷歌(Google)旗下DeepMind公司的戴维·西尔弗、艾佳·黄和戴密斯·哈萨比斯与他们的团队开发,这个程序利用“价值网络”去计算局面,用“策略网络”去选择下子。2015年10月阿尔法围棋以5:0完胜欧洲围棋冠军、职业二段选手樊麾;2016年3月对战世界围棋冠军、职业九段选手李世石。
AlphaGo程序原理:
1.深度学习
阿尔法围棋(AlphaGo)的主要工作原理是“深度学习”。“深度学习”是指多层的人工神经网络和训练它的方法。一层神经网络会把大量矩阵数字作为输入,通过非线性激活方法取权重,再产生另一个数据集合作为输出。这就像生物神经大脑的工作机理一样,通过合适的矩阵数量,多层组织链接一起,形成神经网络“大脑”进行精准复杂的处理,就像人们识别物体标注图片一样。
2.两个大脑
阿尔法围棋(AlphaGo)是通过两个不同神经网络“大脑”合作来改进下棋。这些大脑是多层神经网络跟那些Google图片搜索引擎识别图片在结构上是相似的。它们从多层启发式二维过滤器开始,去处理围棋棋盘的定位,就像图片分类器网络处理图片一样。经过过滤,13 个完全连接的神经网络层产生对它们看到的局面判断。这些层能够做分类和逻辑推理。
这些网络通过反复训练来检查结果,再去校对调整参数,去让下次执行更好。这个处理器有大量的随机性元素,所以人们是不可能精确知道网络是如何“思考”的,但更多的训练后能让它进化到更好。
第一大脑:落子选择器 (Move Picker)
阿尔法围棋(AlphaGo)的第一个神经网络大脑是“监督学习的策略网络(Policy Network)” ,观察棋盘布局企图找到最佳的下一步。事实上,它预测每一个合法下一步的最佳概率,那么最前面猜测的就是那个概率最高的。这可以理解成“落子选择器”。
第二大脑:棋局评估器 (Position Evaluator)
阿尔法围棋(AlphaGo)的第二个大脑相对于落子选择器是回答另一个问题。不是去猜测具体下一步,它预测每一个棋手赢棋的可能,在给定棋子位置情况下。这“局面评估器”就是“价值网络(Value Network)”,通过整体局面判断来辅助落子选择器。这个判断仅仅是大概的,但对于阅读速度提高很有帮助。通过分类潜在的未来局面的“好”与“坏”,AlphaGo能够决定是否通过特殊变种去深入阅读。如果局面评估器说这个特殊变种不行,那么AI就跳过阅读在这一条线上的任何更多落子。
谷歌AlphaGo执白中盘胜李世石 1-0领跑人机大战
谷歌围棋胜李世石
3月9日,谷歌阿尔法围棋与李世石的人机大战五番棋首局在首尔四季酒店战罢,人类代表韩国棋手李世石九段执黑不敌阿尔法围棋。总体而言,电脑在局部战斗中不落下风甚至更强,但在布局和大局判断上不如人类顶级棋手。李世石今天输在中后盘的松懈上,如果后面李世石能够乘胜追击的话,胜负很有悬念。双方第二局的比赛将于3月10日打响。
比赛回顾:
比赛韩国当地时间下午13时(北京时间12时)打响,但早在不到10点的时候,赛场四季酒店就挤满了记者。开赛前2小时,观战室向记者们开放,上去稍微晚一点,就没有了靠前的座位。
随着开赛时间的临近,气氛也变得有些紧张起来。谷歌给记者们准备了两个观战室,分别提供英文解说和韩语解说。赛场和观战室分隔开来,只有内部工作人员才能进入。开赛前20分钟,李世石在妻子和女儿的陪伴下来到赛场,一闪而过。
该来的总会来,13时,比赛正式开始。阿尔法围棋的作者之一黄士杰(Aja Huang)代替电脑在棋盘上落子。围棋猜先的礼仪是,围棋界地位高或者年龄长者抓子,面对不到2岁的阿尔法围棋,33岁“高龄”李世石作为世界冠军显然是上手。猜先结果,阿尔法猜错,李世石可以选择黑棋或者白棋。
一般来说,现在的职业围棋高手喜欢下白棋,但李世石有些出人意料地第一盘选择了执黑先行。很快李世石给出了理由,黑棋布局走出了一个新型,阿尔法的应对不佳,有些亏损。李世石显然研究了电脑围棋的理论,得出了电脑在布局阶段不太擅长应对新型的推论,棋局的进行证明了这一点,李世石有备而来。
不过围棋决定胜负的往往是中盘阶段,阿尔法似乎也“意识”到了自己形势不佳,之后的下法选择得非常强硬,双方早早就展开了接触战。电脑的下法令观战的职业棋手目瞪口呆,几乎招招都是最佳应对。好在战斗也是李世石的强项,双方就像武林高手,猛对几掌,然后各自退了好几步。
不过在第一个战役结束之后,电脑的选择令人费解。正常高手,对掌之后,总要运气缓一下,然后再打,电脑的下法则是直接又扑上来了。过刚易折,这处的战役,李世石抓住机会,围住一块大空。人族代表心里有底了,电脑虽然在局部战斗表现出色,但在大局上似乎不如人类高瞻远瞩。
不过作为人类最大弱点是会受情绪波动的影响,取得优势后,李世石的心态似乎发生了变化,右下角黑棋下得太过保守,白棋左右逢源,角部做活,大龙也及时补棋,黑棋一无所得,此前的优势消失殆尽。各路讲解的职业棋手判断也出现了分歧,不过随着棋局进入官子阶段,大家发现李世石其实败局已定。
最终李世石投子认负,表情上看上去不是很痛苦,不知是不是找到了电脑的弱点?
谷歌提供了100万美元作为奖金,如果李世石取胜拿走奖金,如果阿尔法围棋取胜,谷歌将把这笔钱捐赠给慈善机构。此外李世石还有15万美元的出场费和每场2万美元的赢棋奖金。
谷歌人工智能“阿尔法围棋”与韩国棋手李世石的第二局较量在首尔四季酒店举行,在此次较量中双方互换黑白,由“阿尔法围棋”执黑对战李世石。最终,“阿尔法围棋”再下一城,以总比分2:0领先李世石,人类被逼到了悬崖边。
12日在韩国首尔举行的围棋人机大战第三盘对局中,尽管出现了此前两盘没有出现的“劫争”,但人工智能“阿尔法围棋”仍以176手,执白中盘胜李世石。这样,“阿尔法”在从9日开始的5盘人机大战中,已以3:0完胜。
3月13日,谷歌“阿尔法围棋”与李世石的人机大战五番棋第四局在韩国首尔四季酒店战罢,李世石中盘击败“阿尔法”,扳回一局。虽然1∶3的比分已经无法逆转,但本局的胜利对人类来说意义重大。当天,李世石展现出了自己的风格,在中盘的战斗中,下出妙手,击溃“阿尔法”,最终守住胜果。
2016年3月15日,围棋“人机大战”第五场,经过5个小时激战,韩国棋手李世石九段不敌“阿尔法围棋”AlphaGo,“阿尔法围棋”以4:1总比分取得胜利。
3月9日 第一场比赛(北京时间中午12点)
3月10日 第二场比赛(北京时间中午12点)
3月12日 第三场比赛(北京时间中午12点)
3月13日 第四场比赛(北京时间中午12点)
3月15日 第五场比赛(北京时间中午12点)
播放数:610
播放数:543
播放数:1193