#86 – David Silver: AlphaGo, AlphaZero, and Deep Reinforcement Learning
David Silver 领导 DeepMind 的强化学习研究小组,曾担任 AlphaGo、AlphaZero 的首席研究员,并联合领导 AlphaStar 和 MuZero,在强化学习领域做了许多重要工作。通过注册以下赞助商来支持此播客:- MasterClass:https://masterclass.com/lex- Cash App - 使用代码“LexPodcast”并下载:- Cash App(App Store):https://apple.co/2sPrUHe- Cash App(Google Play):https://bit.ly/2MlvP5w 剧集链接:强化学习(书籍
Искусственный интеллект: вторая жизнь древней игры
围棋一直是计算机下棋比人类弱的少数游戏之一。 2016 年 3 月,这一切都发生了变化,当时基于神经网络的程序 AlphaGo 击败了我们这个时代最伟大的棋手之一韩国人李世石 (Lee Sedol)。
AlphaGo проходит путь от новичка до гроссмейстера за три дня
谷歌伦敦子公司 DeepMind 宣布,它已经创造了一款机器,它可以比其前身 AlphaGo 更好地玩中国古代围棋游戏,去年 AlphaGo 战胜了来自首尔的世界级大师李世石 (Lee Sedol) 。
ИИ одерживает убедительную победу над одним из лучших игроков в го
昨天,由 DeepMind(谷歌旗下)开发的 AlphaGo 程序和过去 10 年来世界上最优秀的围棋棋手之一李世石之间的历史性围棋比赛结束了一系列 5 场比赛。职业九段。结果让支持李的人感到失望——该节目以4:1的压倒性比分获胜。有关游戏本身和超级程序的详细信息在我们的材料中。
Программа AlphaGo выиграла две партии из пяти у одного из сильнейших игроков в го
由 Google 旗下 DeepMind 开发的 AlphaGo 程序赢得了本周该机器将与世界上最强大的围棋选手之一、九段职业选手李世石进行的五场比赛中的第二场比赛。历史正在我们眼前书写,朋友们!