类型:休闲益智 版本:v1.16大小:4.8MB更新:2024/11/12 16:02:15 语言:简体中文等级:平台:Android
软件介绍
阿尔法围棋,英文名Go Free,通过深度学习算法,经过大量的棋局数据训练,具备了超强的围棋实力。它能够分析棋局形势,制定出精准的下棋策略,与人类棋手进行高水平的对弈。
一款围棋人工智能程序,由位于英国伦敦的谷歌旗下DeepMind公司的戴维·西尔弗、艾佳·黄和戴密斯·哈萨比斯与他们的团队开发,这个程序利用“价值网络”去计算局面,用“策略网络”去选择下子。
第一大脑:落子选择器 (Move Picker)
阿尔法围棋(AlphaGo)的第一个神经网络大脑是“监督学习的策略网络(Policy Network)” ,观察棋盘布局企图找到最佳的下一步。事实上,它预测每一个合法下一步的最佳概率,那么最前面猜测的就是那个概率最高的。这可以理解成“落子选择器”。
第二大脑:棋局评估器 (Position Evaluator)
阿尔法围棋(AlphaGo)的第二个大脑相对于落子选择器是回答另一个问题。不是去猜测具体下一步,它预测每一个棋手赢棋的可能,在给定棋子位置情况下。这“局面评估器”就是“价值网络(Value Network)”,通过整体局面判断来辅助落子选择器。这个判断仅仅是大概的,但对于阅读速度提高很有帮助。通过分类潜在的未来局面的“好”与“坏”,AlphaGo能够决定是否通过特殊变种去深入阅读。如果局面评估器说这个特殊变种不行,那么AI就跳过阅读在这一条线上的任何更多落子。
对局双方各执一色棋子;
空枰开局;
黑先白后,交替着一子于棋盘的点上;
棋子下定后,不再向其他点移动;
轮流下子是双方的权利,但允许任何一方放弃下子权而使用虚着。
阿尔法围棋最大的特点是,它会自己学习!
“阿尔法围棋”的核心系统属于时下最火的基于神经网络的深度学习:模拟人脑神经网络,通过大量数据分析学习了3000万步的职业棋手棋谱,再通过增强学习的方法自我博弈,寻找比基础棋谱更多的打点来击败人类。
“阿尔法围棋”通过策略网络和价值网络来决定棋路,不去计算每一步的可能性,颇有人类棋手“我感觉这样会赢”的味道。
多种难度可以去选择,与智能AI进行对弈。