本研讨会旨在将开拓者和从业人员汇集到研究问题上的研究问题,以讨论其新的范式并寻找路线图,从而促进对新兴研究问题的理解,从而引起广泛的兴趣并以方向向前发展交流见解。我们努力在这个基本主题背后建立一个社区,并提供平台,共享想法,探索共识并创造协作机会。值得一提的是,基础模型的当前数据实践在很大程度上是不透明的1。本研讨会的一个使命是在预处理阶段本身就开源数据工作进行社区努力。随后的努力包括创建数据集,基准(例如MLCommons和Dataperf)以及专门的场所(例如DMLR)来促进基础模型数据问题的研究,并最终促进FMS在社交技术方面的广泛部署,从而为大体而提供受益的型社会技术。
自LMRL研讨会上一次在Neurips 2022(https://www.lmrl.org/)举行,对生物学的代表性学习兴趣已经激起了新的想法,并引发了传统方法,并引发了如何通过机器学习来最佳地捕捉生物系统复杂性的讨论。大规模公共DNA和RNA测序,蛋白质序列和3D结构,质谱和细胞绘画数据集(跳跃CP,RXRX3,人类细胞图集)的可用性促进了许多大型“基础模型”的生物学模型(Rozenblatt-ordos-poss-ord。2021; Fay等。2023; Chandrasekaran等。2023)。这些模型旨在从嘈杂,原始和非结构化的高维数据中提取“有意义的”表示,以解决各种生物学问题。
概率建模是我们对世界提出推论的最基本方式之一。本文率先将深度学习与可扩展的概率推断(通过所谓的重新聚集技巧摊销的平均场变异推断),从而产生了变异自动编码器(VAE)。这项工作的持久价值植根于其优雅。用于开发VAE的原则加深了我们对深度学习与概率建模之间相互作用的理解,并引发了许多随后的有趣概率模型和编码方法的发展。Rezende等人的并发工作。还提出了在ICML 2014上发表的题为“随机反向传播和深层生成模型中的近似推断”的论文中。
保留所有权利。未经许可就不允许重复使用。(未经同行评审证明)是作者/资助者,他已授予Medrxiv的许可证,以永久显示预印本。
基于这些基本问题,学界认识到,传统的基础模型方法,如大型语言模型 (LLM),可能会限制生成新颖的生物学假设的能力 (Gao et al., 2024)。与生成遵循语义和句法规则的文本不同,创建新的科学假设和自动化湿实验室实验需要以推理、规划和科学知识为基础 (Wu et al., 2024)。因此,有必要探索和讨论将“AI 科学家”实现为混合系统的潜力——通过人类监督、LLM、机器学习模型和实验工具增强的 AI 代理 (Huang et al., 2024)。如果成功,这些生物学中的 AI 代理应该能够制定生物医学假设、批判性地评估它们、表征它们的不确定性并适应新的生物学见解 (Richard et al., 2024)。这种适应性将确保人工智能代理在快速发展的生物数据面前保持相关性,同时平衡新发现的吸收与既有知识的保留(Chaves 等人,2024 年)。
该研讨会旨在建立一个围绕新兴人类协同进化领域(HAIC)建立一个多学科研究界,以了解从连续和长期的人类互动中出现的反馈回路。随着AI系统已经变得越来越普遍,并且在较长时期内已经存在于社会中,来自不同领域和方法论的学者开始着重于海克及其对系统建筑,人类反馈,调节和其他领域的重要性(例如Damiano&Dumouchel,2018; j arvel e等。,2023; Matsubara等。,2023; Donati,2021年; Zhao等。,2024)。通过这个研讨会,我们希望为该研究议程奠定合作基础。为了实现这一目标,我们将组织来自学术界和行业的专家谈判,动态小组讨论,主动的突破性会议和网络机会,借鉴我们多样化的经验,组织了在ML,NLP,HCI和相关领域的领先会议上组织相关研讨会。跨越包括算法,推荐系统和大型语言模型(LLMS)在内的各种领域,该研讨会挑战了AI的传统观点,仅作为通过人类提供的信号改善的工具(Anthis等人,2024; Chang等。,2024; Kulkarni&Rodd,2020年; Mehrabi等。,2021; Chang等。,2023; Meimandi等。,2023);取而代之的是,它还将调查人类如何改变其行为,决策过程和认知框架,以应对与AI的长期互动以及如何响应人为随着时间的变化而开发AI系统(Gabriel等人(Gabriel等)(Gabriel等人),2024)。,2024; Subramonyam等。,2024; Wu等。,2023; Zhao等。对HAIC的研究需要超越AI基准的典型性能指标,从而探索了多个分析。从低水平的角度来看,海克可以随着双向学习过程的重塑行为而随着时间的流逝而随着时间的流逝而发生的HAIC(Liu等人,2024a; Maples等。,2024; Mozannar等。,2023; Reuel等。,2024b)。此共同进化也出现在建模层面:随着“金”网刻度训练数据集被已经生成的输出,新的行为和风险污染了(Gerstgrasser等人。,2024; Shumailov等。,2024)。从高级的角度来看,它可能涉及许多人的长期互动(Ge等人,2024;刘等。,2024c)和AI代理(Park等人,2023; Wu等。,2023年)及其对社会机构的影响,例如医疗保健(Bica等人,2021; Grote&Keeling,2022年; Vaidyam等。,2019年),教育(Roll&Wylie,2016; Yang等人,2013,2015),运输(Keeling等人,2019年; Keeling,2020;刘等。,2022,2023)和刑事司法(Jacobs&Wallach,2021; Marx等人,2020)。这种多学科的多层次方法反映在研究问题,主题和专家小组成员和演讲者的选择中。开放问题我们将讨论和辩论包括:
下一代机器人应结合其他领域的想法,例如计算机视觉,自然语言处理,机器学习和许多其他领域,因为封闭环境需要在复杂的真实环境中基于多模式输入来处理复杂的任务。这个研讨会的计划着重于机器人学习的生成模型,该模型在于AI和机器人技术的重要和基本领域。基于学习的机器人技术方法已在各种任务中实现了高成功率和概括能力,例如操纵,导航,大满贯,场景重建,原则和物理建模。但是,机器人学习面临着几个挑战,包括数据收集的昂贵成本以及在不同任务和方案中的可转移性较弱。受到计算机视觉和自然语言处理的重大进展的启发,已经努力将生成模型与机器人学习结合在一起,以应对上述挑战,例如综合高质量数据,并将生成框架纳入表示和政策学习。此外,预先训练的大型语言模型(LLM),视觉语言模型(VLM)和视觉语言 - 行动(VLA)模型适用于各种下游任务,以充分利用丰富的常识知识。这种渐进发展使机器人学习框架可以应用于复杂而多样化的现实世界任务。
我们提议在 ICLR 2025 上举办一个全天中型研讨会,题为“加速材料设计的人工智能”(AI4Mat-ICLR-2025)。该研讨会将成为人工智能与材料科学交叉领域的研究人员使用人工智能驱动的技术解决紧迫科学挑战的场所,如图 1 所示。人工智能正在开始彻底改变材料科学与工程,推动学术和政府机构(美国国家标准与技术研究所 (NIST),2024 年;多伦多大学,2024 年;mol,2023 年;宾夕法尼亚州立大学,2024 年;美国国家科学基金会 (NSF),2024 年)和企业研究实验室(IBM Research,2024 年;默克集团,2023 年;微软研究,2024 年;FAIR Chem,2024 年)的全球重大研究计划,同时还出现了几家由人工智能驱动的材料发现初创公司(Radical AI,2024 年;CuspAI,2024 年;PhaseTree,2024 年;Entalpic AI, 2024;轨道材料,2024)。为了促进这些不同利益相关者之间的合作,我们的研讨会将采用包容性材料设计方法,涵盖晶体、聚合物、分子、纳米材料、非晶态材料和高熵材料等多种物质形式。这种整体方法将确保全面的讨论,并促进材料领域的新方向。
首先,以受邀演讲、投稿论文和参与结构化讨论的形式,解决表征对齐的问题以及机器学习可解释性和安全性领域的相关问题,这些问题都是 ICLR 和其他机器学习会议持续关注的问题。这些问题源于以下中心主题:智能系统何时以及为何学习对齐的表示,以及科学家和工程师如何干预这种对齐?例如,由于大型模型在各个行业和科学领域的使用增加(例如,Gemini Team Google,2023 年;OpenAI,2023 年),该领域需要找到更好地解释和最终理解这些系统的方法。模型可解释性与这些系统形成的表示紧密相关(参见 Doshi-Velez 和 Kim,2017 年;Sucholutsky 等人,2023 年;Lampinen 等人,2024 年;Muttenthaler 等人,2024 年)。因此,更好地理解表示及其与参考系统(通常是人类目标)的一致性,反过来会促进模型的可解释性和可解释性。另一组问题集中于表示学习与计算神经科学和认知科学之间的联系。这些领域已经相对独立地开发了评估和增强人工智能与人类智能系统在神经和行为层面的一致性的方法(Collins 等人,2024 年;Muttenthaler 等人,2024 年;Dorszewski 等人,2024 年;Bonnen 等人,2024 年;Sundaram 等人,2024 年)。我们的研讨会旨在就确定衡量和增强人工智能与人类智能系统一致性的最有用方法展开公开讨论。