0460网站之家-百万网站的摇篮,全球志愿者倾情共建亚太地区最具影响力的网站知识圈
0460申明:本站所收录网站资料均免费展示,请大家查阅时,谨慎选择、自辩真伪,感谢您的理解与支持。
网站简介:阿尔法狗围棋(AlphaGo)是一款围棋人工智能程序,由位于英国伦敦的谷歌(Google)旗下DeepMind公司的戴维·西尔弗、艾佳·黄和戴密斯·哈萨比斯与他们的团队开发,这个程序利用“价值网络”去计算局面,用“策略网络”去选择下子。
共有8425位网友访问了“谷歌阿尔法狗围棋官网”的网站百科介绍页,点击上面大标题(home图标)即可进入网站主页。
  • 网站百科官网最新播报:巨灵鸟

    歌阿尔法狗围棋官网

    Alphago(中文名称为阿尔法围棋或阿尔法狗,网址:https://deepmind.com/alpha-go.html)是由英国伦敦Google DeepMind开发的人工智能围棋程序,成为第一个不借助让子,在全尺寸19×19的棋盘上击败职业围棋棋手的电脑围棋程序,也是人工智能与人类智慧的一大挑战。

    程序原理

    阿尔法围棋(AlphaGo)是一款围棋人工智能程序。这个程序利用“价值网络”去计算局面,用“策略网络”去选择下子。

    阿尔法围棋深度学习

    阿尔法围棋(AlphaGo)的主要工作原理是“深度学习”。“深度学习”是指多层的人工神经网络和训练它的方法。一层神经网络会把大量矩阵数字作为输入,通过非线性激活方法取权重,再产生另一个数据集合作为输出。这就像生物神经大脑的工作机理一样,通过合适的矩阵数量,多层组织链接一起,形成神经网络“大脑”进行精准复杂的处理,就像人们识别物体标注图片一样。 

    阿尔法围棋两个大脑

    阿尔法围棋(AlphaGo)是通过两个不同神经网络“大脑”合作来改进下棋。这些大脑是多层神经网络跟那些Google图片搜索引擎识别图片在结构上是相似的。它们从多层启发式二维过滤器开始,去处理围棋棋盘的定位,就像图片分类器网络处理图片一样。经过过滤,13 个完全连接的神经网络层产生对它们看到的局面判断。这些层能够做分类和逻辑推理。

    这些网络通过反复训练来检查结果,再去校对调整参数,去让下次执行更好。这个处理器有大量的随机性元素,所以人们是不可能精确知道网络是如何“思考”的,但更多的训练后能让它进化到更好。

    第一大脑:落子选择器 (Move Picker)

    阿尔法围棋(AlphaGo)的第一个神经网络大脑是“监督学习的策略网络(Policy Network)” ,观察棋盘布局企图找到最佳的下一步。事实上,它预测每一个合法下一步的最佳概率,那么最前面猜测的就是那个概率最高的。这可以理解成“落子选择器”。

    第二大脑:棋局评估器 (Position Evaluator)

    阿尔法围棋(AlphaGo)的第二个大脑相对于落子选择器是回答另一个问题。不是去猜测具体下一步,它预测每一个棋手赢棋的可能,在给定棋子位置情况下。这“局面评估器”就是“价值网络(Value Network)”,通过整体局面判断来辅助落子选择器。这个判断仅仅是大概的,但对于阅读速度提高很有帮助。通过分类潜在的未来局面的“好”与“坏”,AlphaGo能够决定是否通过特殊变种去深入阅读。如果局面评估器说这个特殊变种不行,那么AI就跳过阅读在这一条线上的任何更多落子。

    阿尔法狗的世界排名

    2016年3月在一场五番棋围棋比赛中,AlphaGo于前三局均击败职业围棋棋手李世乭,成为第一个不借助让子而击败职业九段围棋棋手的电脑围棋程序。

    阿尔法狗与韩国棋手 李世石之间的人机世纪大战已经落下帷幕,人工智能4-1取得胜利,而且因为“终于”输了一场,阿尔法狗也有了正式的WHR等级分数和排名。在最新排名中,阿尔法狗以9胜1负的战绩,积3586分,排名世界第二,仅次于中国棋手柯洁九段。

    2016年3月13日告负后,阿尔法狗的分数为3533,排名世界第四,领先李世石一个名次。在昨天的比赛结束后,A阿尔法狗凭借一场胜利,分数增加到3586,排名也超越韩国棋手朴廷桓、日本棋手井山裕太而来到第二,仅次于中国棋王柯洁(3621分)。

    巧合的是,就在15日晚柯洁在微博中再次约战,“为了围棋职业棋手尊严,全力一战!”显然,围棋一哥面对来自人工智能界代表,柯洁肩负着为人类捍卫荣誉的使命。

    2015年10月,谷歌公司的旗下人工智能团队DeepMind开发的围棋程序阿尔法狗以5-0横扫欧洲围棋冠军樊麾,再加上与李世石的前四局比赛,阿尔法狗的总战绩是八胜一负。

    虽说在第四局比赛输给李世石,但阿尔法狗却得到另一收获。按照GoRatings.org的算法,如果一名选手从未遭受失利,就不会进入排名统计。由于这场失利,让它正式进入世界职业围棋选手排名,因此在世界职业围棋排名网站GoRatings.org上有了自己的一席之地。

    WHR等级分制是根据棋手在正式比赛中赢了谁又输了谁,使用贝叶斯方式计算出来,因此必须至少输一盘才有结果。当然,随着阿尔法狗参加的正式比赛越来越多,等级分也会越来越接近它的真实水平。

    专业术语上来说:AlphaGo其做法是使用了蒙地卡罗树状搜索与两个深度神经网络相结合方法,其中一个是以估值网络来评估大量的选点,而以走棋网络来选择落子。在这种设计下,电脑可以结合树状图的长远推断,又可像人类的大脑一样自发学习进行直觉训练,以提高下棋实力。

    AlphaGo和之前的围棋程序相比表现出显著提升。在和Crazy Stone和Zen等其他围棋程序的500局比赛中,AlphaGo(运行于一台电脑上)仅输一局。而在其后的对局中,AlphaGo(可运行于多台电脑上)在500局比赛中全部获胜,且对抗运行在单机上的 AlphaGo 有 77% 的胜率。2015年10月的分布式运算版本AlphaGo使用1,202块CPU及176块GPU。

    然而 Google 并没有公开解释从2015十月到2016三月间的实力增强有什么硬件或软件的改进,所以在三月进行的竞赛中可能进一步运用更多的硬件。

    AlphaGo使用蒙特卡洛树搜索,借助估值网络与走棋网络这两种深度神经网络,通过估值网络来评估大量选点,并通过走棋网络选择落点。AlphaGo最初通过模仿人类玩家,尝试匹配职业棋手的过往棋局,其数据库中约含3000万步棋着。一旦它达到了一定的熟练程度,它开始和自己对弈大量棋局,使用强化学习进一步改善它。围棋无法仅通过寻找最佳步来解决;游戏一盘平均有150步,每一步平均有200种可选的下法,意味着有太多需要解决的可能性。

    从某种意义上说,谷歌阿尔法围棋开启了人工智能(AL)的新时代!

    财 ㊛D 囻 囼

    财 ㊛D 囻 囼

    零四六零 . c o m
    网站标签:阿尔法围棋 围棋 谷歌 
收藏到:IE收藏夹  
0
1

(提示:顶到网站百科首页,让更多人看到)   上一站 下一站
复制本页网址,与您QQ/MSN上的好友分享,就是您对0460网站之家最大的支持!   »用Google翻译此网页: 查看此网页的繁体版 查看此网页的英文版
现在有0人对'谷歌阿尔法狗围棋官网'发表评论 谷歌阿尔法狗围棋官网怎么样?
您的姓名: * 可选项,留空即为匿名发表
评论内容:
剩余字数:  * 按 Ctrl + Enter 直接发送.
        

0460温馨提示:网站资料由网站主发布,请大家评论时文明用语;评论只需提交一次,请等候审核,方可显示。
相关网站推荐
收录推荐: 百度公益平台 八方资源网 360网站安全检测 企业黄页目录 搜狗站长平台 网址资源库(英) YpState目录 0460行业 站长工具 互动百科(0460)  更多»
免责声明:0460导航所展示的网站资料、数据、广告等均来自互联网,仅供大家参考。0460网站之家对可能产生的好坏结果均不承担任何责任。
关于我们 | About Us | 主页修复 | 合作伙伴 | 网站提交 | 友情链接 | 增值服务 | 公益广告 | 纠错中心 | 收藏本页
欢迎阁下来访网站之家,请认准本站唯一网址:www.0460.com,请勿镜像,违者自重。
2004-2020 0460 - 我的上网主页 - 最新网站 - 感谢您对0460的支持与关怀!
移动版:http://m.0460.com
欢迎访问0460网站之家移动版,随时随地获取网站知识!