导读:李世石个人资料 || AlphaGo简介 || 李世石&AlphaGo第一局结果 || 李世石&AlphaGo第二局结果 || 李世石&AlphaGo第三局结果 || 李世石&AlphaGo第四局结果 || 李世石&Al... |
李世石个人资料 || AlphaGo简介 || 李世石&AlphaGo第一局结果 || 李世石&AlphaGo第二局结果 || 李世石&AlphaGo第三局结果 || 李世石&AlphaGo第四局结果 || 李世石&AlphaGo第五局结果 || 对战时间表
对战进行中
继谷歌宣布人工智能项目AlphaGo实现突破性研究——计算机程序首次击败专业棋手之后, 谷歌DeepMind今日公布了将与过去十年最佳围棋手李世石之间的终极挑战的详细情况。3月9日至3月15日,AlphaGo将在韩国首尔与李世石进行5场挑战赛。比赛完全平等,获胜者将得到一百万美元奖金。
双方对战时间分别为3月9日(周三)、3月10日(周四)、12日(周六)、13日(周日)、15日 (周二)的北京时间中午12点进行比赛。
本次比赛用时每方2小时,1分钟读秒三次。比赛采用中国规则,黑贴3又3/4子(黑贴7目半)。采用中国规则是因Alpha GO以中国规则为基础开发。
比赛采用5局3胜制,最终比赛获胜方将获得奖金100万美元。如果AlphaGo获胜,奖金将捐赠给联合国儿童基金会(UNICEF),STEM教育,以及围棋慈善机构(Go Charity)。
李世石
李世石(朝鲜语:,朝鲜汉字:李世乭),1983年3月2日生于韩国全罗南道,2006年3月12日与女友金贤珍完婚,同年9月3号女儿李慧琳出世。1995年入段,1998年二段,1999年三段,2003年因获LG杯冠军直接升为六段,2003年4月获得韩国最大棋战KT杯亚军,升为七段,2003年7月获第16届富士通杯冠军后直接升为九段。2006、2007、2008韩国围棋大奖——最优秀棋手大奖(MVP)。棋风特点——李世石属于典型的力战型棋风,善于敏锐地抓住对手的弱处主动出击,以强大的力量击垮对手,他的攻击可以用“稳,准,狠”来形容,经常能在劣势下完成逆转。
阿尔法围棋(AlphaGo)是一款围棋人工智能程序,由位于英国伦敦的谷歌(Google)旗下DeepMind公司的戴维·西尔弗、艾佳·黄和戴密斯·哈萨比斯与他们的团队开发,这个程序利用“价值网络”去计算局面,用“策略网络”去选择下子。2015年10月阿尔法围棋以5:0完胜欧洲围棋冠军、职业二段选手樊麾;2016年3月对战世界围棋冠军、职业九段选手李世石。
AlphaGo程序原理:
1.深度学习
阿尔法围棋(AlphaGo)的主要工作原理是“深度学习”。“深度学习”是指多层的人工神经网络和训练它的方法。一层神经网络会把大量矩阵数字作为输入,通过非线性激活方法取权重,再产生另一个数据集合作为输出。这就像生物神经大脑的工作机理一样,通过合适的矩阵数量,多层组织链接一起,形成神经网络“大脑”进行精准复杂的处理,就像人们识别物体标注图片一样。
2.两个大脑
阿尔法围棋(AlphaGo)是通过两个不同神经网络“大脑”合作来改进下棋。这些大脑是多层神经网络跟那些Google图片搜索引擎识别图片在结构上是相似的。它们从多层启发式二维过滤器开始,去处理围棋棋盘的定位,就像图片分类器网络处理图片一样。经过过滤,13 个完全连接的神经网络层产生对它们看到的局面判断。这些层能够做分类和逻辑推理。
这些网络通过反复训练来检查结果,再去校对调整参数,去让下次执行更好。这个处理器有大量的随机性元素,所以人们是不可能精确知道网络是如何“思考”的,但更多的训练后能让它进化到更好。
第一大脑:落子选择器 (Move Picker)
阿尔法围棋(AlphaGo)的第一个神经网络大脑是“监督学习的策略网络(Policy Network)” ,观察棋盘布局企图找到最佳的下一步。事实上,它预测每一个合法下一步的最佳概率,那么最前面猜测的就是那个概率最高的。这可以理解成“落子选择器”。
第二大脑:棋局评估器 (Position Evaluator)
阿尔法围棋(AlphaGo)的第二个大脑相对于落子选择器是回答另一个问题。不是去猜测具体下一步,它预测每一个棋手赢棋的可能,在给定棋子位置情况下。这“局面评估器”就是“价值网络(Value Network)”,通过整体局面判断来辅助落子选择器。这个判断仅仅是大概的,但对于阅读速度提高很有帮助。通过分类潜在的未来局面的“好”与“坏”,AlphaGo能够决定是否通过特殊变种去深入阅读。如果局面评估器说这个特殊变种不行,那么AI就跳过阅读在这一条线上的任何更多落子。
谷歌AlphaGo执白中盘胜李世石 1-0领跑人机大战
3月9日,谷歌阿尔法围棋与李世石的人机大战五番棋首局在首尔四季酒店战罢,人类代表韩国棋手李世石九段执黑不敌阿尔法围棋。总体而言,电脑在局部战斗中不落下风甚至更强,但在布局和大局判断上不如人类顶级棋手。李世石今天输在中后盘的松懈上,如果后面李世石能够乘胜追击的话,胜负很有悬念。
谷歌人工智能“阿尔法围棋”与韩国棋手李世石的第二局较量在首尔四季酒店举行,在此次较量中双方互换黑白,由“阿尔法围棋”执黑对战李世石。最终,“阿尔法围棋”再下一城,以总比分2:0领先李世石,人类被逼到了悬崖边。
12日在韩国首尔举行的围棋人机大战第三盘对局中,尽管出现了此前两盘没有出现的“劫争”,但人工智能“阿尔法围棋”仍以176手,执白中盘胜李世石。这样,“阿尔法”在从9日开始的5盘人机大战中,已以3:0完胜。
3月13日,谷歌“阿尔法围棋”与李世石的人机大战五番棋第四局在韩国首尔四季酒店战罢,李世石中盘击败“阿尔法”,扳回一局。虽然1∶3的比分已经无法逆转,但本局的胜利对人类来说意义重大。当天,李世石展现出了自己的风格,在中盘的战斗中,下出妙手,击溃“阿尔法”,最终守住胜果。
2016年3月15日,围棋“人机大战”第五场,经过5个小时激战,韩国棋手李世石九段不敌“阿尔法围棋”AlphaGo,“阿尔法围棋”以4:1总比分取得胜利。
3月9日 第一场比赛(北京时间中午12点)
3月10日 第二场比赛(北京时间中午12点)
3月12日 第三场比赛(北京时间中午12点)
3月13日 第四场比赛(北京时间中午12点)
3月15日 第五场比赛(北京时间中午12点)
播放数:610
播放数:543
播放数:1193