纽约,纽约,2025年3月5日 - ACM,计算机协会,今天,Andrew G. Barto和Richard S. Sutton是2024 ACM A.M.的接受者图灵(Turing)因发展强化学习的概念和算法基础而奖。在从1980年代开始的一系列论文中,Barto和Sutton介绍了主要思想,构建了数学基础,并开发了强化学习的重要算法,这是创建智能系统的最重要方法之一。Barto是马萨诸塞大学阿默斯特大学的信息和计算机科学名誉教授。Sutton是艾伯塔大学(University of Alberta)的计算机科学教授,Keen Technologies的研究科学家,AMII的研究员(Alberta Machine Intelligence Institute)。ACM A.M.图灵奖,通常称为“计算机上的诺贝尔奖”,带有100万美元的奖金,并提供了Google,Inc.提供的财务支持。该奖项以英国数学家Alan M. Turing的名字命名,他阐明了计算机的数学基础。什么是强化学习?人工智能(AI)的领域通常与建造代理有关,即感知和行动的实体。更聪明的代理人是那些选择更好的行动方案的代理商。因此,某些行动方案比其他行动更好的概念是AI的核心。奖励 - 从心理学和神经科学中借来的一个术语 - 指示提供给与其行为质量相关的代理商的信号。强化学习(RL)是学习信号更成功地学习的过程。从奖励中学习的想法已经熟悉了数千年。后来,艾伦·图灵(Alan Turing)1950年的论文“计算机和智能”,解决了“ can can
A.S. 博士Karuppudaiyan S 博士,副教授E. Vijayaragavan 博士,副教授V. Mathan Raj 博士,副教授P. Sudhakar 博士,副教授R. Murugesan 博士,副教授J. Santhakumar 博士,副教授V. Praveena,副教授N. Harshavardhana 博士,副教授Sandipan Roy,研究助理教授D. Raja 博士,助理D. Selwyn Jebadurai 博士,助理Daniel J. Stephen 博士,助理P. Susai Manickam 博士,助理Abburi Lakshman Kumar,助理。 Shravan Kumar C 博士,助理S. Manikandan先生,助理教授; Sathiyamoorthy K 博士,助理Vamsi Krishna Dommeti 先生,助理K. Jegadeesan先生,助理教授Senkathir.S,助理教授R. Saravanakumar 博士,助理I. Aatthisugan 博士,助理Deborah Serenade Stephen 博士,助理S. Sasikumar 博士,助理AC Arun Raj 博士,助理Vignesh KS 博士,助理Premkumar N,助理教授
关于ACM ACM,计算机机械协会www.acm.org是世界上最大的教育和科学计算社会,将计算机教育者,研究人员和专业人员团结起来,以激发对话,分享资源并应对该领域的挑战。ACM通过强大的领导力,最高标准和对技术卓越的认可来增强计算行业的集体声音。ACM通过提供终身学习,职业发展和专业网络的机会来支持其成员的专业发展。
已发表版本引文(哈佛):Zeng, N, Jiang, L, Vignali, G & Ryding, D 2023,奢侈品零售中的客户互动体验:人工智能聊天机器人在互动营销中的应用。CL Wang(编辑),《帕尔格雷夫互动营销手册》。Palgrave Macmillan,第 785-805 页。https://doi.org/10.1007/978-3-031-14961-0_34
作为国际复合材料最新进展会议(ICRACM)系列的创始人、总裁和主席,我谨向所有对会议主题表现出浓厚兴趣的参与者表示衷心的感谢。由于先进复合材料是航空航天、发电、地面交通、核能和化学工业中许多要求严格的节能环保应用的有利材料。这些材料具有独特的性能,例如强度高、刚度高、疲劳寿命长、密度低以及对预期功能的适应性。近年来,世界各地在这些材料的设计、开发、制造和应用方面取得了重大成就,并且仍在继续进行大量创新研究以应对技术和经济挑战。全球范围的参与和认可使在不同地方举行的每届国际复合材料最新进展会议(ICRACM)取得了巨大成功; ICRACM - 2004 于 2004 年 12 月在印度瓦拉纳西的 BHU 举行。ICRACM - 2007 于 2007 年 2 月在印度新德里的印度人居中心举行。ICRACM - 2010 于 2010 年 12 月在法国利摩日的利摩日大学举行。ICRACM - 2013 于 2013 年 2 月在印度果阿的国际中心举行。ICRACM - 2016 于 2017 年 2 月 6 日至 8 日在印度安得拉邦贡土尔维杰亚瓦达的 KL 大学举办,由 Prof 担任主席。B.Nageswara Rao。第六届复合材料最新进展国际会议 (ICRACM-2019) 于 2019 年 2 月 25 日至 28 日在瓦拉纳西 IIT (BHU) 的 Swatantrata Bhavan 举办。来自印度和国外的 300 多名代表在 ICRACM-2019 会议的技术会议上发表了专家演讲。ICRACM 系列的主要目标是将来自世界各地各个学科的学者和研究人员聚集在一起,分享知识并交流观点,从而实现复合材料的工业应用。由于复合材料社区独特的维度和重要性需求,大多数 ICRACM 系列都得到了日本东京六本木 AOARD - AFOSR 和新加坡 GONR 的支持。这些支持是基于这样的信念:科学和技术进步是由不同研究人员和技术人员之间的直接互动强力推动的。我将非常感谢他们对 ICRACM 系列取得巨大成功的支持。创始人 总裁 ICRACM 系列最后,我非常感谢所有参加 ICRACM - 2004、ICRACM - 2007、ICRACM - 2010、ICRACM - 2013、ICRACM - 2016 和 ICRACM - 2019 会议的朋友,他们从世界各地长途跋涉而来,为年轻的复合材料研究人员介绍了他们的复合材料经验。此外,组委会还非常感谢日本东京 AOARD - AFOSR 主任/经理、新加坡 ONR 和欧洲陶瓷学会主席的财政支持,以组织 ICRACM 系列会议,为世界各地的复合材料研究人员提供学术利益和互动。第七届系列会议将于 2023 年 9 月 26 日至 29 日在德国亚琛工业大学纺织与复合材料工程研究所举行。计划于 2025 年 2 月 17 日至 20 日在印度理工学院、瓦拉纳西贝拿勒斯印度教大学土木工程系举办八场系列活动。
© 2023 作者。这是一篇开放获取的文章,根据知识共享署名许可条款发布。
从演示和成对偏好推断奖励函数是将强化学习 (RL) 代理与人类意图相结合的良好方法。然而,最先进的方法通常专注于学习单一奖励模型,因此很难权衡来自多位专家的不同奖励函数。我们提出了多目标强化主动学习 (MORAL),这是一种将社会规范的不同演示组合成帕累托最优策略的新方法。通过维持标量权重的分布,我们的方法能够以交互方式调整深度 RL 代理以适应各种偏好,同时无需计算多个策略。我们在两种场景中通过实证证明了 MORAL 的有效性,这两种场景模拟了交付和紧急任务,需要代理在存在规范冲突的情况下采取行动。总的来说,我们认为我们的研究是朝着具有学习奖励的多目标 RL 迈出的一步,弥合了当前奖励学习和机器伦理文献之间的差距。
抽象的背景探针®治疗药是抗体前药,通过肿瘤相关蛋白酶在肿瘤微环境中激活,从而将活性限制为肿瘤微环境并最小化“非肿瘤”毒性。我们报告了CX-072(PACMilimab)的第一研究剂量 - 定量和单药扩展相位数据,这是针对针对编程死亡配体1(PD-L1)的概率检查点抑制剂。该多中心,开放标签研究(NCT03013491)的剂量升级阶段的方法,具有晚期实体瘤的成年人(天真到程序中降临至dephemed-Death-1/pd-l1或细胞毒性T-淋巴细胞毒性T-淋巴细胞4的抗原4抑制剂)与七剂量施用量施用七剂量的抑制作用。每14天静脉注射一次。主要终点是最大耐受剂量(MTD)的安全性和确定。在扩展阶段,患有六种预先指定恶性肿瘤之一(三阴性乳腺癌[TNBC];肛门鳞状细胞癌[ASCC];皮肤SCC [CSCC];未差异降低的多余型肉瘤[UPS];小肠腺癌[sba]和Thymic thymic [sba];或高肿瘤突变负担(HTMB)肿瘤。主要终点是客观响应(实体瘤的响应评估标准v.1.1)。结果,未达到30 mg/ kg的剂量达到MTD。根据扩展阶段的药代动力学和药效学发现,选择了10 mg/kg的建议2剂量(RP2D)。参加膨胀阶段的九十八名患者:TNBC(n = 14),ASCC(n = 14),CSCC(n = 14),UPS(n = 20),SBA(n = 14),TET(n = 8)和HTMB肿瘤(n = 14)。在RP2D接受PACMILIMAB的114例患者中,有10例患者(9%),6例患者(5%)的严重TRAES(5%)和由于两名患者的TRARES导致治疗停药(2%)(2%),据报道了与治疗相关的不良事件(TRAES)。≥3级与免疫相关的AE发生在两名患者中(皮疹,心肌炎)。高PD-L1表达(即> 50%的肿瘤比例评分)。在患者中观察到确认的客观反应
摘要 背景 Probody ® 治疗药物是抗体前体药物,可在肿瘤微环境中被肿瘤相关蛋白酶激活,从而将活性限制在肿瘤微环境中并最大限度地降低“非肿瘤”毒性。我们报告了 CX-072(pacmilimab)首次人体研究的剂量递增和单药扩增期数据,CX-072 是一种针对程序性死亡配体 1 (PD-L1) 的 Probody 检查点抑制剂。方法 在这项多中心、开放标签研究 (NCT03013491) 的剂量递增阶段,晚期实体瘤成人患者(未使用过程序性死亡-1/PD-L1 或细胞毒性 T 淋巴细胞相关抗原 4 抑制剂)被纳入七个剂量递增队列之一,每 14 天静脉注射一次 pacmilimab。主要终点是安全性和确定最大耐受剂量 (MTD)。在扩展阶段,招募了患有六种预先指定的恶性肿瘤之一(三阴性乳腺癌 [TNBC];肛门鳞状细胞癌 [aSCC];皮肤鳞状细胞癌 [cSCC];未分化多形性肉瘤 [UPS];小肠腺癌 [SBA];和胸腺上皮肿瘤 [TET]);或高肿瘤突变负荷 (hTMB) 肿瘤的患者。主要终点是客观反应(实体肿瘤反应评估标准 v.1.1)。结果剂量高达 30 mg/kg 时未达到 MTD。根据扩展阶段的药代动力学和药效学结果,选择 10 mg/kg 的推荐 2 期剂量 (RP2D)。扩展期招募了 98 名患者:TNBC(n=14)、aSCC(n=14)、cSCC(n=14)、UPS(n=20)、SBA(n=14)、TET(n=8)和 hTMB 肿瘤(n=14)。在 RP2D 接受 pacmilimab 治疗的 114 名患者中,10 名患者(9%)报告了≥3 级治疗相关不良事件 (TRAE),6 名患者(5%)报告了严重 TRAE,2 名患者(2%)因 TRAE 而停止治疗。2 名患者(皮疹、心肌炎)发生了≥3 级免疫相关不良事件。在 22/144 (19%) 名患者中观察到高 PD-L1 表达(即 >50% 肿瘤比例评分)。在患者中观察到了确认的客观反应