知识分子
?跟踪前沿进展,掌握最新动态 撰文 冯枭、黄华、惠家明 责编 叶水送 ● ● ● No.1AlphaGo将向新的领域发起挑战 近日,用AlphaGo横扫围棋界的DeepMind团队,实现了一个可用于多种任务的通用性强化学习算法AlphaZero,可自主从零开始学习。此前,很多棋类游戏的人工智能程序依赖于人类的经验,对其计算参数和某些与问题相关的特定领域参数进行调整,以获得极致的表现。最近,DeepMind团队将AlphaGoZero的算法进行了通用化,使用深度神经网络和从零开始的强化学习代替人工输入的特定知识,包括一个通用的蒙特卡罗树搜索算法和一个基于神经网络的通用评估函数。测试表明,AlphaZero在围棋上仅需三天的训练即可达到AlphaGoZero的水平,仅需四个小时和两个小时的训练就超越了当前顶级的国际象棋和日本象棋AI(这些AI都曾击败人类选手)。DeepMind团队认为,这一结果表明AlphaZero可被运用到更多的有固定规则的挑战性领域中,而不再局限于某一个问题。 |
转载请注明地址:http://www.yanzizhanga.com/yzzjg/2231.html
- 上一篇文章: 中华冷兵器
- 下一篇文章: 花卉管家园艺1522第一组