摘要 — 近年来,深度强化学习 (DRL) 在各种完全和不完全信息游戏中取得了重大突破。在这些游戏中,斗地主是中国流行的纸牌游戏,由于信息不完整、状态空间大、协作元素多以及每回合可能的动作数量庞大,因此非常具有挑战性。最近,一种名为 DouZero 的斗地主人工智能系统被提出。DouZero 使用传统蒙特卡洛方法、深度神经网络和自我对弈程序进行训练,无需抽象人类先验知识,其表现优于所有现有的斗地主人工智能程序。在这项工作中,我们建议通过在 DouZero 中引入对手建模来增强 DouZero。此外,我们提出了一种新颖的教练网络,以进一步提升 DouZero 的性能并加速其训练过程。通过将上述两种技术融入到斗地主AI系统中,斗地主AI系统取得了更好的性能,在包括斗地主在内的400多个AI代理中名列Botzone排行榜榜首。索引术语 — 斗地主,强化学习,蒙特卡洛方法,对手建模,教练网络
(511) 35 (566) (510) 广告、营销和促销服务;与游戏、纸牌游戏、老虎机游戏、视频游戏、博彩、赌博、赌场、宾果游戏、扑克、即赢、彩票和博彩活动有关的广告、营销和促销服务;机会游戏、技巧游戏以及机会和技巧混合游戏的广告、营销和促销;网站和应用程序的广告、营销和促销;电视广告;广播广告;电影广告;报纸、杂志和宣传册上的广告;通过夹心板提供的广告服务;横幅广告;按点击付费广告;计算机网络上的在线广告;发布和更新广告文本;运营联属广告和营销计划;为他人在互联网上做广告;用于促进电子商务的广告服务;为广告目的安排竞赛;制作广告材料和商业广告;分发广告、营销和促销材料;汇编与广告有关的统计数据;提供广告空间、时间和媒体;广告、营销和促销咨询、顾问和援助服务;忠诚度、激励和奖金计划服务;用于商业、广告、营销和促销目的的客户俱乐部服务;提供在线业务和商业信息;在线赌场的管理;与所有上述服务有关的咨询、信息和顾问服务。
已故 100 岁的美国退役陆军上校罗伯特·格林使用电脑玩纸牌,偶尔也会上网。他一生中从乘坐马车旅行到乘坐喷气式飞机飞往夏威夷,从使用煤气灯到使用电力,从需要数周才能送达的邮件到即时电子邮件。他依然记得自己为国家服务的岁月。在美国军官协会柑橘分会的年度夏季蓝调午餐会上,来自因弗内斯的格林获得了表彰和缅怀。退役陆军上校、MOAA 成员 Curt Ebitz 说:“他是一位了不起的人,有着杰出的服役记录。”“令我印象深刻的是 — — 他如此致力于我们的国家,并确保下一代了解我们的国家有多么伟大,并了解保持它的伟大所必需的牺牲,”Ebitz 说。格林的生日庆祝活动持续了整整一个月,直到今天才结束,包括与他的“女性朋友”共进午餐,与妻子、两个儿子和女儿及其配偶一起参加派对。格林总共有 10 个孙子、19 个曾孙和一个玄孙。上周,格林收到了奥巴马总统的一封信,祝贺他百年诞辰,他说,这“非常精彩,尽管我是共和党人”。在他的一生中,他喜欢大多数总统,尤其是富兰克林·罗斯福和哈里·S。
(510) 广告、营销和促销服务;与游戏、纸牌游戏、老虎机游戏、视频游戏、博彩、赌博、赌场、宾果游戏、扑克、即赢、彩票和投注活动有关的广告、营销和促销服务;机会游戏、技巧游戏以及机会和技巧混合游戏的广告、营销和促销;网站和应用程序的广告、营销和促销;电视广告;广播广告;电影广告;报纸、杂志和宣传册上的广告;通过夹心板提供的广告服务;横幅广告;按点击付费广告;计算机网络上的在线广告;发布和更新广告文本;运营联属广告和营销计划;为他人在互联网上做广告;用于促进电子商务的广告服务;为广告目的安排竞赛;制作广告材料和商业广告;分发广告、营销和促销材料;汇编与广告有关的统计数据;提供广告空间、时间和媒体;广告、营销和促销咨询、顾问和协助服务;忠诚度、激励和奖金计划服务;用于商业、广告、营销和促销目的的客户俱乐部服务;提供在线业务和商业信息;在线赌场的管理;与所有上述服务有关的咨询、信息和顾问服务。
Browne, C. (2011)。进化游戏设计。doi: 10.1007/978-1-4471-2179-4 Neller, T. W. (2016 年 12 月)。AI 教育:志趣相投。AI Matters,2 (4),7–8。摘自 https://doi.org/10 .1145/3008665.3008668 doi: 10 .1145/3008665.3008668 Neller, T. W.、Malec, M.、Presser, C. G. M. 和 Jacobs, F. (2014)。Fowl Play 纸牌游戏的最佳、近似最佳和公平游戏。在 H. J. van den Herik、H. Iida 和 A. Plaat(编辑)中。),计算机和游戏(第233-243 页)。Cham:Springer International Publishing。Neller,T. W.,& Ziegler,D.(2019 年 7 月)。计算机生成 Birds of a Feather 谜题。AAAI 人工智能会议论文集,33 (01),9693-9699。取自 https://ojs.aaai.org/index .php/AAAI/article/view/5035 doi: 10.1609/aaai.v33i01.33019693 Russell, S., & Norvig, P. (2020)。人工智能:一种现代方法(第 4 版)。Pearson。Shaker, N., Togelius, J., & Nelson, M. J.(2016)。游戏中的程序内容生成。Springer。
人类可以在协作任务(例如打篮球)中快速适应新伙伴,因为他们知道任务的哪些基本技能(例如如何运球、如何投篮)可以传给新伙伴。人类还可以通过延续他们已经开发的惯例(例如举起手势传球)来快速适应与相同伙伴的类似任务,而无需从头开始学习协调。为了与人类无缝协作,AI代理也应该快速适应新伙伴和新任务。然而,目前的方法并没有试图区分任务固有的复杂性和合作伙伴使用的惯例,更普遍的是,很少有人关注利用惯例来适应新环境。在这项工作中,我们提出了一个学习框架,以原则性的方式将规则依赖表示与惯例依赖表示区分开来。我们表明,在某些假设下,我们的规则依赖表示是跨合作伙伴的最佳响应策略分布的充分统计数据。通过这种表示分离,我们的代理能够快速适应新伙伴,并以零次方式与旧伙伴协调新任务。我们通过三个复杂程度各异的协作任务实验验证了我们的方法:情境多臂老虎机、积木放置任务和纸牌游戏 Hanabi。
3 西霍码头 在普利茅斯的西霍码头上可以看到一个三米高的铸铁人体雕塑,被称为“Look II 雕像”。1967 年 5 月 28 日,成千上万的人在这里观看了弗朗西斯·奇切斯特爵士驾驶吉普赛蛾 IV 号在 266 天内独自环游世界后登陆。他回到了皇家西部游艇俱乐部的总部,现在是码头旁边的海滨酒吧和烧烤店。该雕塑由世界著名艺术家安东尼·葛姆雷爵士 OBE 设计,他还设计了标志性的北方天使,并于 2020 年 9 月揭幕,以纪念五月花号从普利茅斯启航 400 周年。该雕塑设计成生锈的外观,被普利茅斯人昵称为“Rusty Reg”。它重达近 3 吨,由 22 块铸铁制成,像纸牌屋一样堆叠,但又像巨石阵的石头一样坚固。艺术家希望这件作品能唤起人们跨越地平线去另一个地方建立新生活的渴望。
二十一点是一款赌场纸牌游戏,只有几个基本动作,但它具有不可思议的可能性(Thorp,1966)。Garvie(2017)解释了二十一点的所有规则。简而言之,游戏的目的是达到或获得尽可能接近21分。玩家用两张牌开始游戏,并决定是否拿另一张卡(命中)(站立)。如果玩家超过21岁,他们会输。如果经销商拥有21多名,则球员将获胜。如果球员的总数高于经销商,他们也会赢。其他可能的动作是分开的,只有在玩家手中有两个同一张卡并加倍时才允许,只有在卡总计9,10或11时才允许。通过拆分,游戏有效地分为2场比赛,两场比赛正常进行。又增加了一张卡,但它使该游戏的赌注翻了一番。游戏取决于运气,并且没有一种能够赢得的策略,但是,与次级或随机比赛相比,有一些玩法可以增加获胜几率的方法。由于二十一点是一款赌场游戏,因此它的设计使房屋总是有略有优势。根据其他研究(Summerville,2019年),(Thorp,1966)二十一点的最佳策略
摘要:随着 AlphaGo 的突破,人机博弈人工智能迎来了大爆发,吸引了世界各地越来越多研究者的关注。作为检验人工智能的公认标准,各种人机博弈人工智能系统(AI)相继问世,如 Libratus、OpenAI Five 以及击败人类专业选手的 AlphaStar。人机博弈人工智能的快速发展标志着决策智能迈出了一大步,目前的技术似乎可以处理非常复杂的人机博弈。因此,一个自然而然的问题出现了:当前人机博弈技术可能面临哪些挑战,未来的趋势又是什么?为了回答上述问题,本文对近期成功的游戏 AI 进行了综述,涵盖了棋盘游戏 AI、纸牌游戏 AI、第一人称射击游戏 AI 和实时战略游戏 AI。通过本次综述,我们 1)比较不同类型游戏的主要难点以及实现专业人类水平 AI 的相应技术; 2)总结开发复杂人机博弈人工智能时可以适当依赖的主流框架和技术;3)提出成功人工智能中现有技术的挑战或缺点;4)尝试指出人机博弈人工智能的未来趋势。最后,我们希望这篇简短的评论可以为初学者提供入门知识,并为人机博弈人工智能领域的研究人员提供启发。
宏基因组学可用于监测抗生素耐药基因的扩散(ARGS)。args在诸如分解和纸牌原理等数据库中发现的源自可培养和致病性细菌,而来自不可培养和非病原细菌的ARG仍然研究了。功能元素基于表型基因的选择,并且可以从具有与已知ARGS共享的潜在低认同性的不可培养的Bacteria中识别出ARG。在2016年,创建了ResfinderFG V1.0数据库,以从功能性研究中收集ARG。在这里,我们介绍了数据库Resfinderfg v2.0的第二个范围,该v2.0可在基因组流行语Web服务器中心(https://cge.food.dtu.dtu.dk/ services/ resfinderfg/)中获得。它包括3913 ARG,由50个精心策划的数据集的功能性宏基因组学鉴定。我们评估了与肠道,土壤和水(海洋 +淡水)全球微型基因目录(https://gmgc.embl.de)相比,我们评估了其检测ARG的潜力。res- finderfg v2.0允许检测未检测到使用其他数据库检测的ARG。这些包括对β-甲酰胺,环素,苯酚,糖肽 /环烯烯和甲氧苄啶 /磺胺酰胺的抗性。因此,ResfinderFG v2.0可用于识别与常规数据库中发现的ARG,从而改善了抗抗性的描述。