在线学习中的有效探索(AAAI 最佳论文亚军、IJCAI)行星健康问题通常是空间规划问题,其中每个动作都是特定于上下文的,对应于地球上的物理区域。与每个动作相关的地理特征使我们能够使用平滑度假设来关联动作。例如在野生动物保护中,我们预计具有相似地理特征的地区也会有相似的偷猎模式。从数学上讲,我们可以将两个动作的奖励中的这种相似性编码为 Lipschitz 连续性。此外,每个动作(巡逻一组区域)在区域数量上是组合的,但可以分成具有附加、可分解奖励的构成区域。因此,我们引入了一种新的多臂老虎机变体,该变体结合了可分解性和平滑性,在这些奖励估计上强制实施 Lipschitz 连续性假设,以实现明显更快的收敛 [3]。我们表明,这种方法可以改善遗憾界限,并且不依赖于区域数量 N ,与最先进的 ˜ O ( T
Conference reviewing AAAI Conference on Artificial Intelligence 2021 Conference on Artificial Intelligence, Ethics, and Society (AIES) 2019 Conference on Economics and Computation (EC) 2020 Conference on Learning Theory (COLT) 2018 Conference on Neural Information Processing Systems (NeurIPS) 2017, 2018, 2019, 2020, 2021 European Symposium on Algorithms (ESA) 2020 Innovations in Theoretical Computer Science (ITCS) 2021,2022国际自动机,语言和节目(ICALP)2022国际人工智能与统计会议(AISTATS)2019年国际学习代表国际会议(ICLR)2022,2022,2024国际机器学习国际机器学习会议(ICML)2017,2019,2019,2019年,2019年,2018年国际智能国际会议(2020年),2018年国际会议(IMAI)2018年国际会议(I),2018年(I)离散算法研讨会(SODA)2018,2020,2021,2023关于计算机科学基础(FOCS)2019年分布式计算原理(PODC)2016 2016年计算理论的研讨会(STOC)2017,2021,2021,2021,2024 on Web and Internet经济学(葡萄酒)的
Service: Committee Member / Reviewer: - Advances in Neural Information Processing Systems (NeurIPS): 2024, 2023, 2022, 2021, 2020 - The Association for the Advancement of Artificial Intelligence (AAAI): 2025, 2023, 2022 - International Conference on Machine Learning (ICML): 2024, 2023, 2022, 2021, 2020 - Conference on Learning Theory (COLT): 2024, 2023 - Annual ACM Symposium on Theory of Computing (STOC): 2023 - International Conference on Learning Representations (ICLR): 2025, 2024 - Innovations in Theoretical Computer Science (ITCS): 2024 - International Joint Conference on Artificial Intelligence (IJCAI): 2024, 2023, 2022, 2021 - ACM International Conference on Knowledge Discovery and Data Mining (KDD): 2021 - International Conference on Artificial Intelligence and Statistics (AISTATS): 2025, 2024, 2023 - Conference on Algorithmic Learning Theory (ALT): 2021 - Conference on Economics and Computation (EC): 2023 - INFORMS Workshop on Data Science (WDS): 2023 - INFORMS Journal on Computing - Management Science - Transactions on Machine Learning Research (TMLR) - IEEE Transactions on Pattern Analysis and Machine智能(TPAMI)
II。 相关的工作Matthias Ankerst,Daniel Keim和Hans-Peter Kriegel(2009)[1]提出,探路者:一种可视化路径分析的方法。 IEEE视觉语言和以人为中心计算(VL/HCC)的IEEE研讨会的会议,引入探路者,这是一种可视化大而复杂的图形中探路算法的方法。 这使用户可以深入了解算法本身的决策过程。 Yves Kodratoff和Robert Armstrong(1994)[2]提出了广度优先的搜索和深度优先搜索:将约束转换为偏好作者。 第十二届国际人工智能会议(IJCAI)会议录,探索对广度优先搜索(BFS)和深度优先搜索(DFS)算法的修改,以在图形遍历过程中纳入用户偏好。 C. Y. Lee(1961)[3]提出了一种用于路径连接及其应用的算法IR IR IR IR IRE TRACTACTIONS在电路理论上。 介绍深度优先搜索(DFS)算法的开创性纸。 本文探讨了如何将DFS用于电路设计中的电线路由,从而为电路板上的电线找到有效的路径。 除了路由之外,DFS还具有查找连接组件或分析拓扑结构的应用。II。相关的工作Matthias Ankerst,Daniel Keim和Hans-Peter Kriegel(2009)[1]提出,探路者:一种可视化路径分析的方法。IEEE视觉语言和以人为中心计算(VL/HCC)的IEEE研讨会的会议,引入探路者,这是一种可视化大而复杂的图形中探路算法的方法。这使用户可以深入了解算法本身的决策过程。Yves Kodratoff和Robert Armstrong(1994)[2]提出了广度优先的搜索和深度优先搜索:将约束转换为偏好作者。第十二届国际人工智能会议(IJCAI)会议录,探索对广度优先搜索(BFS)和深度优先搜索(DFS)算法的修改,以在图形遍历过程中纳入用户偏好。C. Y. Lee(1961)[3]提出了一种用于路径连接及其应用的算法IR IR IR IR IRE TRACTACTIONS在电路理论上。介绍深度优先搜索(DFS)算法的开创性纸。本文探讨了如何将DFS用于电路设计中的电线路由,从而为电路板上的电线找到有效的路径。除了路由之外,DFS还具有查找连接组件或分析拓扑结构的应用。
大学和Riken AIP的Baiho访问科学家,他的研究重点是机器学习,深度学习,基础模型及其应用。他是MBZUAI MLD的访问研究学者,Microsoft Research和Alibaba Damo Academy的客座研究员,Riken AIP的博士后研究员。他撰写了MIT Press,Springer自然以及基金会和趋势的三本机器学习专着。他曾担任Neurips的高级主席,以及神经,ICML和ICLR的区域主席。他还曾担任IEEE TPAMI,MLJ和JAIR的副编辑,以及JMLR和MLJ的编辑委员会成员。他在Neurips获得了杰出的纸质奖,在Neurips的最有影响力的论文,著名的Neurips的区域主席,ICLR的杰出地区主席以及IEEE TNNLS的杰出副编辑。他获得了RGC早期职业计划,NSFC总体计划,IJCAI早期职业聚光灯,Riken Baiho奖,Dean杰出成就奖,Microsoft Research Startrack计划以及来自Bytedance,Baidu,Baidu,Alibaba and Tencent的教师研究奖。2。Tongliang Liu教授是悉尼大学悉尼AI中心的主任,Tongliang Liu教授是悉尼大学悉尼AI中心的主任,
游戏长期以来一直是人工智能研究的基准和试验台。近年来,随着人工智能算法的发展和计算能力的提升,人工智能系统在围棋[Silver et al. ,2017]、星际争霸[Vinyals et al. ,2019]和德州扑克[Zhao et al. ,2022]等许多游戏中都取得了超越人类的表现。这些游戏在世界各地举办的季节性和年度活动中都很受欢迎。这种受欢迎程度促使学术界投入精力并开发新算法来解决它们。麻将在世界各地都很流行,尤其是在中国,并且有很多地区变体。由于其不完全信息和多目标性质,它对人工智能算法提出了挑战,但却被人工智能研究界忽视了。为了促进人工智能研究和探索人工智能在麻将中的应用,我们在 IJCAI 举办了三场麻将人工智能竞赛。来自学术界和工业界的数十支团队参与了比赛,他们运用各种算法来构建自己的代理。我们每年都会组织研讨会,邀请顶尖团队进行口头报告,分享他们的方法。比赛结果和他们的报告表明,基于深度学习的现代人工智能算法在这款游戏上具有巨大的潜力,并且优于启发式方法。然而,为了进一步提高人工智能代理的性能,仍有一些悬而未决的问题需要解决。我们希望我们在比赛中的经验能够促进对麻将等复杂现实世界游戏的进一步人工智能研究。
– Program committee member / reviewer for ACL (2023, 2020, 2017, 2016, 2014, 2013, 2012, 2011, 2010, 2009, 2007, 2005, 2004, 2003, 2002), AISTATS (2010), COLING (2014, 2012, 2008), EAAI (2013), EACL (2012, 2006, 2003, 1999), EMNLP (2018, 2017, 2016, 2014, 2013,2012,2011,2011,2010,2010,2008,2008,2007,2006,2003,2002 - 2018,2010中的“最佳审稿人”奖项,FSMNLP(2005,2001),ICGI(2012),ICFP(2008),ICLR(2008),ICLR(ICLR(2017),2017年),ICML(2019,2016,2016,2004); NAACL (2016, 2015, 2013, 2012, 2010, 2009, 2006), NeurIPS (2020, 2019, 2018, 2017, 2016, 2014, 2013, 2011, 2010, 2007), NLP-LING (2010), SCiL (2020, 2018), SIGMOR- PHON (2023, 2019, 2018, 2014, 2012, 2010, 2008, 2006, 2004, 2002, 2000, 1998年),WINLP - 卫生NLP研讨会(2023,2021,2019,2018,2018,2017),ACL统计NLP和加权自动机(Statfsm)(2016)(2016),ACL关于NLP(unsnlp)的神经疗法中的语言结构相关性的ACL相关性(2011年) ACL关于NLP和CL教学的ACL讲习班(2024、2013、2008、2005、2002),CVPR结构化预测的研讨会(2013年),ICML关于依次模型预测的关于预测的研讨会(2013),国际惯例会议,依赖性语言学的国际会议(2011年),关于对Slavic语言学的诉讼,对Slavic Linguisticals的For-Mal of-Mal of-Mal of-Mal Intershop。
Jennifer G. Dy 是马萨诸塞州波士顿东北大学电气与计算机工程系的全职教授,她于 2002 年首次加入该系。她分别于 1997 年和 2001 年获得印第安纳州西拉斐特普渡大学电气与计算机工程学院的硕士和博士学位,并于 1993 年获得菲律宾大学电气工程系的学士学位。她的研究涵盖机器学习的基础及其在生物医学成像、健康、科学和工程中的应用,研究领域包括无监督学习、可解释模型、可解释人工智能、降维、特征选择/稀疏方法、向不确定专家学习、主动学习、贝叶斯模型、深度表示学习、持续学习和可信赖人工智能。她是体验式人工智能研究所的人工智能教员主任。她还是机器学习实验室主任,也是东北大学 SPIRAL(信号处理、成像、推理和学习)中心的创始教员。她于 2004 年获得 NSF 职业奖。她曾担任或正在担任 ICML 董事会 (前身为国际机器学习学会) 秘书、《机器学习研究杂志》、《机器学习》杂志、《IEEE 模式分析与机器智能学报》副主编/编委会成员、机器学习、人工智能和数据挖掘顶级会议 (ICML、NeurIPS、ACM SIGKDD、AAAI、IJCAI、UAI、AISTATS、ICLR、SIAM SDM) 的组织和/或技术程序委员会成员、SIAM SDM 2013、ICML 2018、AISTATS 2023 和 AAAI 2024 的项目主席。她是 AAAI 研究员
CONFERENCE PROCEEDiNGS [C15] HOVER: Versatile Neural Whole‑Body Controller for Humanoid Robots.Tairan He*, WenliXiao*, ToruLin, ZhengyiLuo, ZhenjiaXu, ZhenyuJiang, JanKautz, ChangliuLiu, GuanyaShi, Xiaolong Wang, Linxi “Jim” Fan † , Yuke Zhu † ICRA , 2025 [Paper] [C14] OmniH2O: Universal and Dexterous Human‑to‑Humanoid Whole‑Body Teleoperation and Learning.Tairan He*, Zhengyi Luo*, Xialin He*, Wenli Xiao, Chong Zhang, Kris Kitani, Weinan Zhang, Changliu Liu, Guanya Shi.CoRL , 2024 [Paper] [C13] WoCoCo: Learning Whole‑Body Humanoid Control with Sequential Contacts.Chong Zhang*, Wenli Xiao*, Tairan He, Guanya Shi.CoRL ( Oral ), 2024 [Paper] [C12] Learning Human‑to‑Humanoid Real‑Time Whole‑Body Teleoperation.Tairan He*, Zhengyi Luo*, Wenli Xiao, Chong Zhang, Kris Kitani, Changliu Liu, Guanya Shi IROS , 2024 ( Oral ) [Paper] [C11] Progressive Adaptive Chance‑Constrained Safeguards for Reinforcement Learning.Zhaorun Chen, Binhao Chen, Tairan He, Liang Gong, Chengliang Liu.IROS , 2024 [Paper] [C10] Agile But Safe: Learning Collision‑Free High‑Speed Legged Locomotion.Tairan He*, Chong Zhang*, Wenli Xiao, Guanqi He, Changliu Liu, Guanya Shi.RSS , 2024 ( Outstanding Student Paper Award Finalist ‑ Top 3 ) [Paper] [C9] Safe Deep Policy Adaptation.Wenli Xiao*, Tairan He*, John Dolan, Guanya Shi.ICRA , 2024 [Paper] [C8] State‑wise Safe Reinforcement Learning: A Survey.Weiye Zhao, Tairan He, Rui Chen, Tianhao Wei, Changliu Liu.IJCAI (Survey Track) , 2023.[Paper] [C7] Probabilistic Safeguard for Reinforcement Learning Using Safety Index Guided Gaussian Process Models.
摘要 — 使用计算智能(即人工智能 (AI) 和机器学习 (ML) 的方法)来自动发现、实施和微调金融市场中自主自适应自动交易的策略的研究由来已久,有关该主题的一系列研究论文已在 IJCAI 等主要 AI 会议和《人工智能》等著名期刊上发表:我们在此展示的证据是,这一研究领域存在许多方法上的失误,实际上,一些据称表现最佳的公共领域 AI/ML 交易策略通常会被完全不涉及 AI 或 ML 的极其简单的交易策略所超越。我们在此强调的结果很容易在十多年前相关关键论文发表时就被揭示,但这些论文发表时公认的方法涉及一种对交易代理进行实验评估的最低限度的方法,仅根据在少数市场场景中对交易代理进行的几千次测试做出断言。在本文中,我们展示了使用并行云计算设施对广泛参数值进行详尽测试的结果,我们在其中进行了数百万次测试,从而创建了更丰富的数据,可以从中得出更可靠的结论。我们表明,已发表文献中最好的公共领域 AI/ML 交易员的表现通常不如“零以下智能”交易策略,这种策略从表面上看似乎过于简单,以至于会造成财务损失,但它与市场的互动方式在实践中比研究文献中众所周知的 AI/ML 策略更有利可图。这种简单的策略可以胜过现有的基于 AI/ML 的策略,这表明 AI/ML 交易策略可能是对错误问题的良好回答。