to tensordict,我们创建了一个对特定数据签名不可知的系统,还可以直接替换与他人的组件来测试不同的想法。➔它也使我们的代码大大
概率建模是我们对世界提出推论的最基本方式之一。本文率先将深度学习与可扩展的概率推断(通过所谓的重新聚集技巧摊销的平均场变异推断),从而产生了变异自动编码器(VAE)。这项工作的持久价值植根于其优雅。用于开发VAE的原则加深了我们对深度学习与概率建模之间相互作用的理解,并引发了许多随后的有趣概率模型和编码方法的发展。Rezende等人的并发工作。还提出了在ICML 2014上发表的题为“随机反向传播和深层生成模型中的近似推断”的论文中。
自LMRL研讨会上一次在Neurips 2022(https://www.lmrl.org/)举行,对生物学的代表性学习兴趣已经激起了新的想法,并引发了传统方法,并引发了如何通过机器学习来最佳地捕捉生物系统复杂性的讨论。大规模公共DNA和RNA测序,蛋白质序列和3D结构,质谱和细胞绘画数据集(跳跃CP,RXRX3,人类细胞图集)的可用性促进了许多大型“基础模型”的生物学模型(Rozenblatt-ordos-poss-ord。2021; Fay等。2023; Chandrasekaran等。2023)。这些模型旨在从嘈杂,原始和非结构化的高维数据中提取“有意义的”表示,以解决各种生物学问题。
我们提议在 ICLR 2025 上举办一个全天中型研讨会,题为“加速材料设计的人工智能”(AI4Mat-ICLR-2025)。该研讨会将成为人工智能与材料科学交叉领域的研究人员使用人工智能驱动的技术解决紧迫科学挑战的场所,如图 1 所示。人工智能正在开始彻底改变材料科学与工程,推动学术和政府机构(美国国家标准与技术研究所 (NIST),2024 年;多伦多大学,2024 年;mol,2023 年;宾夕法尼亚州立大学,2024 年;美国国家科学基金会 (NSF),2024 年)和企业研究实验室(IBM Research,2024 年;默克集团,2023 年;微软研究,2024 年;FAIR Chem,2024 年)的全球重大研究计划,同时还出现了几家由人工智能驱动的材料发现初创公司(Radical AI,2024 年;CuspAI,2024 年;PhaseTree,2024 年;Entalpic AI, 2024;轨道材料,2024)。为了促进这些不同利益相关者之间的合作,我们的研讨会将采用包容性材料设计方法,涵盖晶体、聚合物、分子、纳米材料、非晶态材料和高熵材料等多种物质形式。这种整体方法将确保全面的讨论,并促进材料领域的新方向。
什么构成了良好的表示?这个问题在机器学习中可以通过以下几种方式之一来解决:通过评估下游行为(例如,Geirhos 等人,2018 年),通过检查内部表示(例如,Kornblith 等人,2019 年),或通过表征系统的归纳偏差(例如,Kumar 等人,2022 年)。这些方法中的每一种都涉及在某种分析层面(无论是行为、内部表征还是介于两者之间的某种东西)测量人工智能系统与地面真实系统(通常是人类或人类群体)的一致性。然而,尽管有这个共同的目标,但研究人工智能和生物智能系统之间一致性的机器学习、神经科学和认知科学界目前缺乏一个跨方法和学科传达见解的共同框架。该研讨会旨在通过定义、评估和理解生物和人工系统之间表征对齐的含义来弥合这一差距。我们邀请机器学习、神经科学和认知科学界的研究人员以受邀演讲、投稿论文和结构化讨论的形式参与讨论,以解决以下问题:
首先,以受邀演讲、投稿论文和参与结构化讨论的形式,解决表征对齐的问题以及机器学习可解释性和安全性领域的相关问题,这些问题都是 ICLR 和其他机器学习会议持续关注的问题。这些问题源于以下中心主题:智能系统何时以及为何学习对齐的表示,以及科学家和工程师如何干预这种对齐?例如,由于大型模型在各个行业和科学领域的使用增加(例如,Gemini Team Google,2023 年;OpenAI,2023 年),该领域需要找到更好地解释和最终理解这些系统的方法。模型可解释性与这些系统形成的表示紧密相关(参见 Doshi-Velez 和 Kim,2017 年;Sucholutsky 等人,2023 年;Lampinen 等人,2024 年;Muttenthaler 等人,2024 年)。因此,更好地理解表示及其与参考系统(通常是人类目标)的一致性,反过来会促进模型的可解释性和可解释性。另一组问题集中于表示学习与计算神经科学和认知科学之间的联系。这些领域已经相对独立地开发了评估和增强人工智能与人类智能系统在神经和行为层面的一致性的方法(Collins 等人,2024 年;Muttenthaler 等人,2024 年;Dorszewski 等人,2024 年;Bonnen 等人,2024 年;Sundaram 等人,2024 年)。我们的研讨会旨在就确定衡量和增强人工智能与人类智能系统一致性的最有用方法展开公开讨论。
该研讨会旨在建立一个围绕新兴人类协同进化领域(HAIC)建立一个多学科研究界,以了解从连续和长期的人类互动中出现的反馈回路。随着AI系统已经变得越来越普遍,并且在较长时期内已经存在于社会中,来自不同领域和方法论的学者开始着重于海克及其对系统建筑,人类反馈,调节和其他领域的重要性(例如Damiano&Dumouchel,2018; j arvel e等。,2023; Matsubara等。,2023; Donati,2021年; Zhao等。,2024)。通过这个研讨会,我们希望为该研究议程奠定合作基础。为了实现这一目标,我们将组织来自学术界和行业的专家谈判,动态小组讨论,主动的突破性会议和网络机会,借鉴我们多样化的经验,组织了在ML,NLP,HCI和相关领域的领先会议上组织相关研讨会。跨越包括算法,推荐系统和大型语言模型(LLMS)在内的各种领域,该研讨会挑战了AI的传统观点,仅作为通过人类提供的信号改善的工具(Anthis等人,2024; Chang等。,2024; Kulkarni&Rodd,2020年; Mehrabi等。,2021; Chang等。,2023; Meimandi等。,2023);取而代之的是,它还将调查人类如何改变其行为,决策过程和认知框架,以应对与AI的长期互动以及如何响应人为随着时间的变化而开发AI系统(Gabriel等人(Gabriel等)(Gabriel等人),2024)。,2024; Subramonyam等。,2024; Wu等。,2023; Zhao等。对HAIC的研究需要超越AI基准的典型性能指标,从而探索了多个分析。从低水平的角度来看,海克可以随着双向学习过程的重塑行为而随着时间的流逝而随着时间的流逝而发生的HAIC(Liu等人,2024a; Maples等。,2024; Mozannar等。,2023; Reuel等。,2024b)。此共同进化也出现在建模层面:随着“金”网刻度训练数据集被已经生成的输出,新的行为和风险污染了(Gerstgrasser等人。,2024; Shumailov等。,2024)。从高级的角度来看,它可能涉及许多人的长期互动(Ge等人,2024;刘等。,2024c)和AI代理(Park等人,2023; Wu等。,2023年)及其对社会机构的影响,例如医疗保健(Bica等人,2021; Grote&Keeling,2022年; Vaidyam等。,2019年),教育(Roll&Wylie,2016; Yang等人,2013,2015),运输(Keeling等人,2019年; Keeling,2020;刘等。,2022,2023)和刑事司法(Jacobs&Wallach,2021; Marx等人,2020)。这种多学科的多层次方法反映在研究问题,主题和专家小组成员和演讲者的选择中。开放问题我们将讨论和辩论包括:
用于遥感的机器学习(ML4RS)已成为一个关键而令人兴奋的研究领域,有可能应对一些最紧迫的全球挑战,包括气候变化,粮食安全,灾难管理和保护。遥感数据是从各种仪器中收集的,这些工具在各种空间,时间和光谱维度上捕获地球,为ML社区提供了独特的研究机会和挑战。与传统的数据模式不同,这些数据集是高维,非常多模式的,并且在许多空间和时间尺度上包含模式。这些特征通常需要在交叉切割的ML主题中采用专门的方法,例如自学/半监督学习,域适应/概括和多模式学习/数据融合,以释放其全部潜力。我们的研讨会将促进对早期工作的讨论和反馈,这对于有影响力的应用程序和机器学习中的新发展至关重要。
Roberta Reareanu是Meta的研究科学家,也是UCL的名誉讲师。她从纽约大学获得了计算机科学博士学位,在那里她从事深度强化学习的概括。目前,她通过培训反馈和与外部工具,环境和人类的互动来培训他们,从而增强基础模型,从而增强基础模型。罗伯塔(Roberta)先前已经在ICML 2021上的无监督RL(URL)的研讨会,开放式的代理人学习(芦荟)(芦荟)在ICLR 2022和Neurips 2023以及2023年NEURIPS 2023的社会负责语言模型研究工作室。
基于这些基本问题,学界认识到,传统的基础模型方法,如大型语言模型 (LLM),可能会限制生成新颖的生物学假设的能力 (Gao et al., 2024)。与生成遵循语义和句法规则的文本不同,创建新的科学假设和自动化湿实验室实验需要以推理、规划和科学知识为基础 (Wu et al., 2024)。因此,有必要探索和讨论将“AI 科学家”实现为混合系统的潜力——通过人类监督、LLM、机器学习模型和实验工具增强的 AI 代理 (Huang et al., 2024)。如果成功,这些生物学中的 AI 代理应该能够制定生物医学假设、批判性地评估它们、表征它们的不确定性并适应新的生物学见解 (Richard et al., 2024)。这种适应性将确保人工智能代理在快速发展的生物数据面前保持相关性,同时平衡新发现的吸收与既有知识的保留(Chaves 等人,2024 年)。