h Onors and Wards•AAMAS 2022:21届国际澳大利亚国际代理商和多代理系统的最佳PC会员奖。•在该部门内的最高教学表现奖。信息学,2020-21学年,雅典经济学和商业大学。•大会SAGT 2017:第10届国际算法游戏理论研讨会上的最佳纸张奖,以“紧密的福利保证统一价格统一的纯净均衡”,与Georgios Birmpas,Orestis telelis,Artem tsikikiridis共同撰写。•Microsoft外部研究计划奖的获得者:“超越搜索:语义融合和互联网经济学”,与Sander Bohte,Nicole Immorlica和Han La Poutr´e共同,2008年。•在EC 2003会议上最佳学生纸奖:第四届ACM电子商务会议,“在多商品流程游戏的核心”的论文,与Amin Saberi合着。•乔治亚理工学院计算学院院长奖学金,2000-2001(旨在为第一年的博士生奖学金)。•来自希腊国家奖学金基金会和Bodosakis Foundation的年度奖学金,1995- 2000年。•在全国大学入学考试中排名第二,希腊,1995年。•1994年,希腊数学学会高性能学会的奖项。
贾斯汀·卡塞尔目前在卡内基梅隆大学匹兹堡语言技术研究所和巴黎人工智能跨学科研究所 PRAIRIE 工作,她还担任巴黎 Inria 的高级研究员。在卡内基梅隆大学,卡塞尔曾担任 HCII 主席,以及计算机科学学院技术战略与影响副院长。此前,她曾在西北大学任教,并在那里创立了技术与社会行为博士课程和研究中心,在此之前,她是麻省理工学院媒体实验室的终身教授。卡塞尔曾获得麻省理工学院 Edgerton 奖、安妮塔·博格研究所女性远见奖、AAMAS 时间考验论文奖以及美国国家科学院亨利和布赖纳·大卫政策社会科学奖。她是 ACM、AAAS 和苏格兰皇家科学院的院士,并于 2022 年获得爱丁堡大学荣誉博士学位。在法国,卡塞尔被任命为法国政府委员会 CNNUM(法国国家数字委员会)的成员,该委员会由 21 名成员组成,负责法国数字技术的未来。她的研究结合了她在文学、语言学和心理学方面的跨学科背景,旨在构建倾听多于说话的人工智能系统,并建立融洽的关系,以改善人机协作。更多信息请访问 www.justinecassell.com 和 http://articulab.hcii.cs. cmu.edu/。
荣誉和奖项最佳纸张奖,ACM计算机支持合作工作与社会计算会议(CSCW),2019年。最佳技术 +跨学科论文,ACM公平,问责制和透明度会议(ACM FAT*),2019年。研究论文荣誉提名,网络会议(www),2018年。最佳纸张奖的入围纸,第19届ACM经济与计算会议(EC),2018年。2016年宾夕法尼亚州校友会早期职业奖。建议Bo Wagoner的博士学位。论文,该论文获得了2016年ACM Sigecom博士学位论文奖的荣誉。建议XI(Alice)Gao的博士学位。论文因IFAAMAS-14 Victor Lesser杰出论文奖和2014年ACM Sigecom博士学位论文奖而获得荣誉提名。最佳纸张奖,国际自治代理和多工业系统会议(AAMAS),2012年。AI的10观看,IEEE Intellignent Systems(Jan./feb。 2011年)。 NSF早期职业发展奖,2010年至2015年。 建议三个托马斯神庙箍奖获得高级论文,2008年 - 礼物。 杰出纸质奖,ACM电子商务会议(EC),2008年。 荣誉提名,决策科学学院博士学位论文竞赛,2006年。 EBRC博士支持奖竞赛的冠军,2004年。AI的10观看,IEEE Intellignent Systems(Jan./feb。2011年)。NSF早期职业发展奖,2010年至2015年。建议三个托马斯神庙箍奖获得高级论文,2008年 - 礼物。杰出纸质奖,ACM电子商务会议(EC),2008年。荣誉提名,决策科学学院博士学位论文竞赛,2006年。EBRC博士支持奖竞赛的冠军,2004年。EBRC博士支持奖竞赛的冠军,2004年。
从演示和成对偏好推断奖励函数是将强化学习 (RL) 代理与人类意图相结合的良好方法。然而,最先进的方法通常专注于学习单一奖励模型,因此很难权衡来自多位专家的不同奖励函数。我们提出了多目标强化主动学习 (MORAL),这是一种将社会规范的不同演示组合成帕累托最优策略的新方法。通过维持标量权重的分布,我们的方法能够以交互方式调整深度 RL 代理以适应各种偏好,同时无需计算多个策略。我们在两种场景中通过实证证明了 MORAL 的有效性,这两种场景模拟了交付和紧急任务,需要代理在存在规范冲突的情况下采取行动。总的来说,我们认为我们的研究是朝着具有学习奖励的多目标 RL 迈出的一步,弥合了当前奖励学习和机器伦理文献之间的差距。
[28]。Zhang,Lingxuan Zhao,Haochong Xia,Shuo Sun,Jiaze Sun,Molei Qin,Xinyi Li,Yuqing Zhao,Yilei Zhao,Xinyu Cai,Longtao Zheng,Longtao Zheng,Xinrun Wang,Bo an。金融贸易的多模式基础代理:工具增强,多元化和通才。第30届ACM SIGKDD知识发现与数据会议(KDD)的会议记录,2024年。[27]。Pengdeng Li,Shuxin Li,Chang Yang,Xinrun Wang†,Shuyue Hu,Xiao Huang,Hau Chan,Bo an。可配置的镜像下降:统一决策。第41届国际机器学习会议(ICML)会议录,2024年。[26]。Xinrun Wang ∗,Chang Yang ∗,Shuxin Li,Pengdeng Li,Xiao Huang,Hau Chan和Bo An。增强NASH平衡求解器。第33届国际人工智能会议(IJCAI)的会议记录,2024年。[25]。Pengdeng Li,Shuxin Li,Chang Yang,Xinrun Wang†,Xiao Huang,Hau Chan,Bo an。自适应PSRO:迈向自动基于人群的游戏求解器。第33届国际人工智能会议(IJCAI)的会议记录,2024年。[24]。Longtao Zheng,Rundong Wang,Xinrun Wang†,Bo An†。Synapse:轨迹-AS-exemplar提示,并带有用于计算机控制的内存。2024年国际学习代表会议(ICLR)的会议记录,2024年。[23]。Weihao Tan,Winao Zhang,Shanqi Liu,Longtao Zheng,Xinrun Wang†,Bo An†。真正的知识来自实践:通过强化学习使大型语言模型与具体的环境保持一致。2024年国际学习代表会议(ICLR)的会议记录,2024年。[22]。Shanqi Liu,Dong Xing,Pengjie Gu,Bo An,Yong Liu,Xinrun Wang†。贪婪的顺序执行:使用统一框架解决同质和异质的合作任务。2024年国际学习代表会议(ICLR)会议录,Spotlight,2024。[21]。Pengdeng Li ∗,Shuxin Li ∗,Xinrun Wang†,Jakub Cerny,Youzhi Zhang,Stephen Marcus McAleer,Hau Chan,Bo An。Grasper:追求追求问题的通才追求者。第23届国际自主代理和多代理系统会议(AAMAS)的开发项目,2024年。[20]。molei Qin,Shuo Sun,Winao Zhang,Haochong Xia,Xinrun Wang†,Bo An†。Earnhft:高频交易的有效层次增强学习。第38届AAAI人工智能会议(AAAI)的会议记录,2024年。[19]。Haochong Xia,Shuo Sun,Xinrun Wang†,Bo An†。 市场贡献:通过语义上下文将控制权添加到金融市场数据的生产中。 第38届AAAI人工智能会议(AAAI)的会议记录,2024年。 [18]。 Pengdeng Li,Runsheng Yu,Xinrun Wang†,Bo An。 大规模stackelberg均值游戏的过渡信息增强学习。 第38届AAAI人工智能会议(AAAI)的会议记录,2024年。 [17]。 shuo sun ∗,molei Qin ∗,wentao Zhang,Haochong Xia,Chuqiao Zong,Jie Ying,Yonggang Xie,Lingxuan Zhao,Xinrun Wang wang†,Bo An†。 [16]。Haochong Xia,Shuo Sun,Xinrun Wang†,Bo An†。市场贡献:通过语义上下文将控制权添加到金融市场数据的生产中。第38届AAAI人工智能会议(AAAI)的会议记录,2024年。[18]。Pengdeng Li,Runsheng Yu,Xinrun Wang†,Bo An。大规模stackelberg均值游戏的过渡信息增强学习。第38届AAAI人工智能会议(AAAI)的会议记录,2024年。[17]。shuo sun ∗,molei Qin ∗,wentao Zhang,Haochong Xia,Chuqiao Zong,Jie Ying,Yonggang Xie,Lingxuan Zhao,Xinrun Wang wang†,Bo An†。[16]。商家:一个由强化学习增强的整体定量交易平台。第三十七届神经信息处理系统会议(NEURIPS)数据集和基准曲目,2023年。Pengjie Gu,Xinyu Cai,Dong Xing,Xinrun Wang†,Mengchen Zhao,Bo An。离线RL具有离散代理表示POMDPS中的概括性。第三十七届神经信息处理系统会议(神经),2023年。[15]。Shuo Sun,Xinrun Wang†,Wanqi Xue,Xiaoxuan Lou,bo an†。掌握股票市场,并有效地混合了多元化的交易专家。第29届ACM SIGKDD知识发现与数据会议(KDD)的会议记录,2023年。[14]。Runsheng Yu,Weiyu Chen,Xinrun Wang,James Kwok。通过多目标软改进功能增强元学习。第11届学习代表国际会议(ICLR),2023年。[13]。Pengdeng Li,Xinrun Wang†,Shuxin Li,Hau Chan,Bo an。对均值现场游戏的人口大小的政策优化。第11届学习代表国际会议(ICLR),2023年。[12]。Shuxin Li,Xinrun Wang†,Youzhi Zhang†,Wanqi Xue,Jakub Cerny,Bo an。使用预训练的策略来解决大规模追求逃避游戏。第37届AAAI人工智能会议(AAAI)的会议记录,11586-