有两种主要的扩散模型方法:降解扩散概率模型(DDPMS)(Sohl- Dickstein等,2015; Ho等,2020)和基于得分的生成模型(Song&Ermon,2019)(SGMS)(SGMS)。以前的DDPM逐渐通过向前过程将样品从目标分布转换为噪声,并训练向后的过程逆转转换并用于生成新样品。另一方面,SGM使用得分匹配技术(Hyvärinen&Dayan,2005; Vincent,2011)来学习数据生成分布的得分函数的近似,然后使用Langevin Dynamics生成新样本。由于对于现实世界的分布,得分功能可能不存在,Song&Ermon(2019)建议在训练样本中添加不同的噪声水平以覆盖整个实例空间,并训练神经网络以同时学习所有噪声水平的得分函数。
2。C. Gomes,T。Dietterich,C。Barrett,J。Conrad,B。Dilkina,S。Ermon,F。Fang,A。Farnsworth,A。Fern,X。Fern,D。Fern,D。Fink,D。Fink,D。Fisher,A。R. Sheldon,D。Shmoys,M。Tambe,W。Wong,C。Wood,X。Wu,Y。Xue,A。Yadav,A。Yakubu,M。L。Zeeman。 计算可持续性:更美好的世界和可持续未来的计算。 ACM通信中,2019年C. Gomes,T。Dietterich,C。Barrett,J。Conrad,B。Dilkina,S。Ermon,F。Fang,A。Farnsworth,A。Fern,X。Fern,D。Fern,D。Fink,D。Fink,D。Fisher,A。R. Sheldon,D。Shmoys,M。Tambe,W。Wong,C。Wood,X。Wu,Y。Xue,A。Yadav,A。Yakubu,M。L。Zeeman。计算可持续性:更美好的世界和可持续未来的计算。ACM通信中,2019年
与 Evo Eric Nguyen、Michael Poli、Matthew G. Durrant、Brian Kang、Dhruva Katrekar、David B. Li、Liam J. Bartie、Armin W. Thomas、Samuel H. King、Garyk Brixi、Jeremy Sullivan、Madelena Y. Ng、Ashley Lewis、Aaron Lou、Stefano Ermon、Stephen A. Baccus、Tina Hernandez- Boussard、Christopher Ré、Patrick D. Hsu、Brian L. Hie 一起进行从分子到基因组规模的序列建模和设计 [25'+5'] 演讲者所属机构:加利福尼亚州帕洛阿尔托 Arc 研究所;加利福尼亚州伯克利市加利福尼亚大学。
歌曲和Ermon指出,现有模型具有重大局限性:“基于可能性的模型要么需要对模型架构进行强限制,以确保可拖动的归一化常规常量以进行可能性计算,要么必须依靠代孕目标来近似最大的可能性训练。隐性生成模型通常需要对抗训练,众所周知,这是不稳定的,可能导致模式崩溃”。归一化常规,不稳定性和模式崩溃已经是显式密度文献采样多年来所处理的主要计算问题。在这里,我们介绍了另一种表示概率分布的方式
Garyk Brixi ∗,1,2,3,Matthew G. Durrant ∗,1,2,Jerome Ku ∗,1,2,Michael Poli ∗,2,3,5,Greg Brockman ∗ ∗,2,6,§,§,Daniel Chand,Daniel Chand ∗,1,2,2,2,2,2,3,Gonzale a.Gonzalez aref.gonzalez king ∗,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,6,§,2,6,§ David B. Li ∗∗ , 1 , 2 , 3 , Aditi T. Merchant ∗∗ , 1 , 3 , Mohsen Naghipourfar ∗∗ 1 , 2 , 7 , eric ngyen ∗∗∗ 2 , 3 , chia ricci-tam ∗ chia ∗∗∗ 2 , 2 , 2 , , 2 , , , , Sun∗∗∗∗∗ ∗∗ 2 , Ali Taghibakshi ∗∗∗ ∗∗ ∗∗ ∗ ∗ ∗ ∗ ∗ er E E E E E Anton Vorontsov ∗ ∗ ∗ ∗ ∗收er远er本 * ∗ ∗ ∗ ∗ er本∗ ∗ ∗发 ∗ ∗发 er家发∗发 ∗发够 * ∗ ∗ ∗ ∗消E EM e,4 * ∗ ∗ ∗ ∗发 ∗消EM段,4,4,布兰登·杨(Brandon Yang)∗ ∗ ∗ ∗ ∗ ∗收er远er家人∗ ∗ ∗ ∗消ET恤∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗消E ET,那么eTADADAD A.的,那么4 nichadems 9,4 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 nicholas K. wang a vangah adams 9,specuus 3 Ermon,Daniel Guo 1,3,Rajesh Ilango 1和Janik 4,Amy 6,Lu 7,Reshma Mehta,Mofrad 7,Madelena Y。 ng 3 , jappreet Pannu 3 , Christopher Ré 3 , Jonathan C. Schmok 1 , John St. John 4 , Jeremy Sullivan 1 , Kevin Zhu 7 , Greg Zynda 4 , Daniel Balsam 8 , 10 , Patrick Collison 1 , 10 , Anthony B. Costa 4 , 4 , 10 , Thomas McGrath 8 , 10 , Kimberly Powell 4 , 10 , Dave P. Burke ‡ , 1 ,2,10,Hani Goodzi‡,1,2,11,Patrick,2,7,10,Brian L. Hie‡,†,1,2,2,3,10
[FEL49] William Feller。“关于随机过程的理论,对应用的尤为参考”。:1949年。URL:https:// api。Spenticscholar.org/corpusid:121027442。[SE19] Yang Song和Stefano Ermon。“通过估计数据分布梯度来生成建模”。in:神经信息处理系统的进步32(2019)。[HJA20] Jonathan Ho,Ajay Jain和Pieter Abbeel。“降级扩散概率模型”。in:神经信息处理系统的进步33(2020),pp。6840–6851。[儿子+20] Yang Song等。“通过stochastic微分方程基于得分的生成建模”。in:arxiv预印arxiv:2011.13456(2020)。[DN21] Prafulla Dhariwal和Alexander Nichol。“扩散模型在图像合成上击败了gans”。in:神经信息过程的进步34(2021),pp。8780–8794。[Kin+21] Diederik Kingma等。“变化扩散模型”。in:神经信息处理系统的进步34(2021),pp。21696–21707。[HS22] Jonathan Ho和Tim Salimans。“无分类器扩散指南”。in:arxiv预印术:2207.12598(2022)。[CHI+23] Cheng Chi等。“扩散策略:通过行动扩散进行视觉策略学习”。in:arxiv预印术:2303.04137(2023)。
模仿学习使代理可以在绩效指标未知并且未指定奖励信号时从专家演示中学习。标准模仿方法通常不适用于学习者和专家的参议员能力不匹配和示威的情况,并被未观察到的混杂偏见污染。为了应对这些挑战,已追求因果模仿学习的最新进步。但是,这些方法通常需要访问可能并非总是可用的基本因果结构,从而带来实际挑战。在本文中,我们研究了使用部分识别的规范马尔可夫决策过程(MDP)内的强大模仿学习,即使在系统动力学不是从混杂的专家演示中确定系统动力学的情况下,也允许代理商实现专家性能。特定的,首先,我们从理论上证明,当MDP中存在未观察到的混杂因素(UCS)时,学习者通常无法模仿专家的表现。然后,我们在部分能够识别的设置中探索模仿学习 - 从可用的数据和知识中,转移分布或奖励功能是无法确定的。增强了著名的Gail方法(Ho&Ermon,2016年),我们的分析导致了两种新颖的因果模仿算法,这些算法可以获得有效的政策,以确保实现专家绩效。
[ 5 ] Xuan Zhang, Limei Wang, Jacob Helwig, Youzhi Luo, Cong Fu, Yaochen Xie, Meng Liu, Yuchao Lin, Zhao Xu, Keqiang Yan, Keir Adams, Maurice Weiler, Xiner Li, Tianfan Fu, Yucheng Wang, Haiyang Yu, YuQing Xie, Xiang Fu, Alex Strasser, Shenglong Xu , Yi Liu, Yuanqi Du, Alexandra Saxton, Hongyi Ling, Hannah Lawrence, Hannes Stärk, Shurui Gui, Carl Edwards, Nicholas Gao, Adriana Ladera, Tailin Wu, Elyssa F. Hofgard, Aria Mansouri Tehrani, Rui Wang, Ameya Daigavane, Montgomery Bohde, Jerry Kurtin, Qian Huang, Tuong Phung, Minkai Xu, Chaitanya K. Joshi, Simon V. Mathis, Kamyar Azizzadenesheli, Ada Fang, Alán Aspuru-Guzik, Erik Bekkers, Michael Bronstein, Marinka Zitnik, Anima Anandkumar, Stefano Ermon,PietroLiò,Rose Yu,StephanGünnemann,Jure Leskovec,Heng JI,Jimeng Sun,Regina Barzilay,Tommi Jaakkola,Connor W. Coley,Coley,Coley,Xiaoning Qian,Xiaofeng Qian,Xiaofeng Qian,Tess Smidt和Shuiiwang Ji。“量子,原子和连续体系中科学的人工智能”。Arxiv预印型ARXIV:2307。08423(2023)。
扩散模型从噪声中创建数据(Song等,2020)。他们经过训练,可以将数据的向前路径逆转到随机噪声,因此,可以使用神经网络的近似和泛化特性,可用于生成训练数据中不存在的新数据点,但遵循训练数据的分布(Sohl-Dickstein等人。,2015年; Song&Eron,2020)。这种生成建模技术已被证明非常有效地对高维,感知数据(例如图像)进行建模(Ho等人,2020)。近年来,扩散模型已成为产生具有令人印象深刻概括能力的自然语言输入的高分辨率图像和视频的事实方法(Saharia等人,2022b; Ramesh等。,2022; Rombach等。,2022; Podell等。,2023; Dai等。,2023; Esser等。,2023; Blattmann等。,2023b; Betker等。,2023; Blattmann等。,2023a; Singer等。,2022)。由于其迭代性质和相关的计算成本以及推理期间的较长采样时间,对这些模型进行更多有效训练的制剂的研究和/或更快的采样速度有所增加(Karras等人,2023;刘等。,2022)。
Rishi Bommasani* Drew A. Hudson Ehsan Adeli Russ Altman Simran Arora Sydney von Arx Michael S. Bernstein Jeannette Bohg Antoine Bosselut Emma Brunskill Erik Brynjolfsson Shyamal Buch Dallas Card Rodrigo Castellon Niladri Chatterji Annie Chen Crescent Crescent Daro 和 Chris Doncy Moussa Doumbouya Esin Durmus Stefano Ermon John Etchemendy Kawin Ethayarajh 李飞飞 Chelsea Finn Trevor Gale Lauren Gillespie Karan Goel Noah Goodman Shelby Grossman Neel Guha Tatsunori Hashimoto Peter Henderson John Hewitt Daniel E. Ho Jenny J Hong Hong J. Jag 和 Thomas H. Jaghil I. Pratyusha Kalluri Siddharth Karamcheti Geoff Keeling Fereshte Khani Omar Khattab Pang Wei Koh Mark Krass Ranjay Krishna Rohith Kuditipudi Ananya Kumar Faisal Ladhak Mina Lee Tony Lee Jure Leskovec Isabelle Levent Xiang Lisa Li Xuechen Li Tengyu Ma Ali Malik Dtch Mikwall Manning Mikwall Mikwane Eric Dtch. Suraj Nair Avanika纳拉扬 迪帕克·纳拉亚南 本·纽曼 艾伦·聂 胡安·卡洛斯·尼布尔斯 哈米德·尼勒福罗尚 朱利安·尼亚尔科 吉雷·奥古特 劳雷尔·奥尔 伊莎贝尔·帕帕迪米特里奥 朴俊成 克里斯·皮耶希 伊娃·波特兰斯 克里斯托弗·波茨 阿迪蒂·拉古纳坦 罗布·赖希 任洪宇 弗里达·荣 尤瑟夫·罗哈尼 罗希亚·瑞安 罗希亚·罗 多拉·瑞安 卡梅罗 R. 佐川诗织Keshav Santhanam Andy Shih Krishnan Srinivasan Alex Tamkin Rohan Taori Armin W. Thomas Florian Tramèr Rose E. Wang William Wang Bohan 吴家俊 吴玉怀 吴桑 谢志强 Michihiro Yasunaga Jiaxuan You Matei Zaharia Michael 张天一 张希坤 张宇恒 张鲁恒 周凯蒂 珀西梁*1