科学发现和工程设计目前受到物理实验的时间和成本的限制,主要是通过需要深入域专业知识的反复试验和直觉选择。数值模拟是物理实验的替代方法,但由于现有数值方法的计算要求,通常对于复杂的现实世界域而言是不可行的。人工智能(AI)通过开发快速数据驱动的替代模型来提出潜在的范式转移。尤其是一个称为神经操作员的AI框架提出了一个原则上的框架,用于在连续域上定义的功能之间学习映射,例如时空过程和部分微分方程(PDE)。他们可以在训练期间看不见的新位置推断和预测解决方案,即执行零拍的超分辨率。神经操作员可以在许多应用中增强甚至替换现有的模拟器,例如计算流体动力学,天气预报和材料模型,而速度更快4-5个数量级。此外,可以将神经操作员与物理和其他领域的约束集成在一起,以获得更高的重点,以获得高保真的解决方案和良好的概括。由于神经操作员是可区分的,因此他们可以直接优化用于反设计和其他反问题的参数。我们认为,神经操作员提出了一种变革性的模拟和设计方法,从而可以快速的研发。
[24] K. Kashinath,M。Mustafa,A。Albert,J.L。Wu,C。Jiang,S。Esmaeilzadeh,K。Azizzadenesheli,R。Wang,A。Chattopadhyay,A。Singh,A。Manepalli,D.Chirila,R.YU,R.Walters,R.Walters,B.White,H。Xiao,H。A. Tchelepi,P。Marcus,A。Anandkumar,P。Hassanzadeh和Prabhat。物理知识的机器学习:天气和气候建模的案例研究。皇家学会的哲学交易A,379(2194),2021。
[J9] K. Kashinath,M。Mustafa,A。Albert,J-L。 Wu,C。Jiang,S。Esmaeilzadeh,K。 Azizzadenesheli,R。Wang,A.Singh,A。Manepalli,D。Chirila,R.YU,R。Walters,B。White,H。Xiao,H。A. Tchelepi,P。Marcus,A。Anandkumar,Prabhat。”物理知识的机器学习:天气和气候建模的案例研究”
▶ 与 Bhattacharya、Hosseini、Kovachki [1] 合作(PCA 网络) ▶ 与 Li、Kovachki、Azizzadenesheli、Liu、Bhattacharya、Anandkumar [19, 10] 合作(FNO) ▶ 与 Lanthaler、Li [14] 合作(通用近似) ▶ 与 Lanthaler [17] 合作(近似的复杂性) ▶ 与 Lanthaler、Trautner [18] 合作(有限维实现) ▶ 与 Lanthaler、Kovachki [11] 合作(评论) ▶ Kovachki [12] 合作(机器学习和科学计算)
[ 5 ] Xuan Zhang, Limei Wang, Jacob Helwig, Youzhi Luo, Cong Fu, Yaochen Xie, Meng Liu, Yuchao Lin, Zhao Xu, Keqiang Yan, Keir Adams, Maurice Weiler, Xiner Li, Tianfan Fu, Yucheng Wang, Haiyang Yu, YuQing Xie, Xiang Fu, Alex Strasser, Shenglong Xu , Yi Liu, Yuanqi Du, Alexandra Saxton, Hongyi Ling, Hannah Lawrence, Hannes Stärk, Shurui Gui, Carl Edwards, Nicholas Gao, Adriana Ladera, Tailin Wu, Elyssa F. Hofgard, Aria Mansouri Tehrani, Rui Wang, Ameya Daigavane, Montgomery Bohde, Jerry Kurtin, Qian Huang, Tuong Phung, Minkai Xu, Chaitanya K. Joshi, Simon V. Mathis, Kamyar Azizzadenesheli, Ada Fang, Alán Aspuru-Guzik, Erik Bekkers, Michael Bronstein, Marinka Zitnik, Anima Anandkumar, Stefano Ermon,PietroLiò,Rose Yu,StephanGünnemann,Jure Leskovec,Heng JI,Jimeng Sun,Regina Barzilay,Tommi Jaakkola,Connor W. Coley,Coley,Coley,Xiaoning Qian,Xiaofeng Qian,Xiaofeng Qian,Tess Smidt和Shuiiwang Ji。“量子,原子和连续体系中科学的人工智能”。Arxiv预印型ARXIV:2307。08423(2023)。
1。Guatteri,M.,Mai,P.M。,&Beroza,G。C.(2004)。 用于强型地面运动预测的动态破裂模型的伪纳米近似。 美国地震学会的公告,94(6),2051- 2063年。 2。 Graves,R。W.和Pitarka,A。 (2010)。 使用混合方法宽带地面运动模拟。 美国地震学会的公告,100(5a),2095– 2123。 3。 Graves,R。和Pitarka,A。 (2016)。 在粗大断层上进行的运动地面运动模拟,包括3D随机速度扰动的影响。 美国地震学会的公告。 4。 Song,S.-G.,Dalguer,L。A.,&Mai,P.M。(2013)。 具有1分和2分统计的地震源参数的伪动态源建模。 Geophysical Journal International,196(3),1770– 1786年。 5。 Mai,P.M.,Galis,M.,Thingbaijam,K.K.S.,Vyas,J.C。,&Dunham,E。M.(2018)。 伪动力地面动作模拟中的故障粗糙度。 纯净和应用的地球物理Pageoph,174(9),3419–3450。 6。 Zongyi Li,Nikola Kovachki,Kamyar Azizzadenesheli,Burigede Liu,Kaushik Bhattacharya,Andrew Stuart和Anima Anandkumar。 参数偏微分方程的傅立叶神经操作员,2020。 7。 Andrews,D。J. (2005)。 破裂动力学,能量损失在滑动区域之外。 地球物理研究杂志,110,B01307。 8。 9。 10。Guatteri,M.,Mai,P.M。,&Beroza,G。C.(2004)。用于强型地面运动预测的动态破裂模型的伪纳米近似。美国地震学会的公告,94(6),2051- 2063年。2。Graves,R。W.和Pitarka,A。(2010)。使用混合方法宽带地面运动模拟。美国地震学会的公告,100(5a),2095– 2123。3。Graves,R。和Pitarka,A。(2016)。在粗大断层上进行的运动地面运动模拟,包括3D随机速度扰动的影响。美国地震学会的公告。4。Song,S.-G.,Dalguer,L。A.,&Mai,P.M。(2013)。具有1分和2分统计的地震源参数的伪动态源建模。Geophysical Journal International,196(3),1770– 1786年。5。Mai,P.M.,Galis,M.,Thingbaijam,K.K.S.,Vyas,J.C。,&Dunham,E。M.(2018)。 伪动力地面动作模拟中的故障粗糙度。 纯净和应用的地球物理Pageoph,174(9),3419–3450。 6。 Zongyi Li,Nikola Kovachki,Kamyar Azizzadenesheli,Burigede Liu,Kaushik Bhattacharya,Andrew Stuart和Anima Anandkumar。 参数偏微分方程的傅立叶神经操作员,2020。 7。 Andrews,D。J. (2005)。 破裂动力学,能量损失在滑动区域之外。 地球物理研究杂志,110,B01307。 8。 9。 10。Mai,P.M.,Galis,M.,Thingbaijam,K.K.S.,Vyas,J.C。,&Dunham,E。M.(2018)。伪动力地面动作模拟中的故障粗糙度。纯净和应用的地球物理Pageoph,174(9),3419–3450。6。Zongyi Li,Nikola Kovachki,Kamyar Azizzadenesheli,Burigede Liu,Kaushik Bhattacharya,Andrew Stuart和Anima Anandkumar。参数偏微分方程的傅立叶神经操作员,2020。7。Andrews,D。J. (2005)。 破裂动力学,能量损失在滑动区域之外。 地球物理研究杂志,110,B01307。 8。 9。 10。Andrews,D。J.(2005)。破裂动力学,能量损失在滑动区域之外。地球物理研究杂志,110,B01307。8。9。10。Tinti,E.,Fukuyama,E.,Piatanesi,A。,&Cocco,M。(2005)。 运动源时间函数与地震动力学兼容。 美国地震学会的公告,95,1211–1223。 Mai,P。M.和Beroza,G。C.(2002)。 一个空间随机场模型,以表征地震滑移中的复杂性。 地球物理研究杂志,107(B11),2308。 Mai,下午,Spudich,P.,Botwright,J。;有限源破裂模型中的低中心位置。 美国地震学会公告200; 95(3):965–980。Tinti,E.,Fukuyama,E.,Piatanesi,A。,&Cocco,M。(2005)。运动源时间函数与地震动力学兼容。美国地震学会的公告,95,1211–1223。Mai,P。M.和Beroza,G。C.(2002)。 一个空间随机场模型,以表征地震滑移中的复杂性。 地球物理研究杂志,107(B11),2308。 Mai,下午,Spudich,P.,Botwright,J。;有限源破裂模型中的低中心位置。 美国地震学会公告200; 95(3):965–980。Mai,P。M.和Beroza,G。C.(2002)。一个空间随机场模型,以表征地震滑移中的复杂性。地球物理研究杂志,107(B11),2308。Mai,下午,Spudich,P.,Botwright,J。;有限源破裂模型中的低中心位置。 美国地震学会公告200; 95(3):965–980。Mai,下午,Spudich,P.,Botwright,J。;有限源破裂模型中的低中心位置。美国地震学会公告200; 95(3):965–980。
2020; Jin等。,2020b; Ayoub等。,2020年; Kakade等。,2020年; Du等。,2021)。特别是,对于有限的状态空间,神经功能近似值取得了显着的成功(Mnih等人。,2015年; Berner等。,2019年; Arulkumaran等。,2019年),而线性函数近似器理论上变得更好地理解(Yang和Wang,2020; Jin等人。,2020b; Ayoub等。,2020年; Kakade等。,2020年; Du等。,2021)。相比之下,尽管在实践中普遍存在,但在部分观察到的马尔可夫决策过程中的强化学习(POMDPS)较少地研究(Cassandra等人,1996; Hauskrecht和Fraser,2000年; Brown and Sandholm,2018年; Ra i Qerty等。,2011年)。更具体地,部分可观察性构成了统计和计算。从统计的角度来看,由于缺乏马尔可夫财产,预测未来的奖励,观察或国家是一项挑战。尤其是,预测未来通常涉及推断国家的分布(也称为信仰状态)或其功能作为历史的摘要,即使假设(observation)发射和(状态)过渡内核也已知(Vlassis etal。 ,2012年; Golowich等。 ,2022)。 同时,学习发射和过渡内核面临因果推理通常遇到的各种问题(Zhang and Bareinboim,2016年)。 ,2021)。 ,2020a)。,2012年; Golowich等。,2022)。同时,学习发射和过渡内核面临因果推理通常遇到的各种问题(Zhang and Bareinboim,2016年)。,2021)。,2020a)。例如,它们通常是不可实现的(Kallus等人。即使假设它们是能够识别的,它们的估计可能需要一个样本量,该样本量在地平线和维度上成倍缩小(Jin等人。即使在评估政策方面,这种统计挑战也已经令人难以置信(Nair和Jiang,2021; Kallus等人。,2021; Bennett和Kallus,2021),构成了政策优化的基础。从计算角度来看,众所周知,策略优化通常是棘手的(Vlassis et al。,2012年; Golowich等。,2022)。此外,有限的观察和状态空间扩大了统计和计算挑战。另一方面,大多数现有结果仅限于表格设置(Azizzadenesheli等人。,2016年; Guo等。,2016年; Jin等。,2020a; Xiong等。,2021),其中观察和状态空间是有限的。在本文中,我们研究了POMDP中的线性函数近似,以解决有限观察和状态空间所扩增的实力挑战。尤其是我们的贡献是四倍。首先,我们定义了具有线性结构的一类POMDP,并确定了针对样品良好的增强学习的不良调节措施。这样的不良调节措施对应于表格设置中的重复(Jin等人,2020a)。第二,我们提出了一种增强学习算法(OP-TENET),该算法适用于任何POMDP承认上述线性结构。此外,我们在操作装置中使用最小值优化公式,以便即使数据集较大,也可以在计算功能庄园中实现算法。第三,从理论上讲,我们证明了Op -Tenet在o(1 /ǫ2)情节中达到了最佳政策。尤其是样品复杂性在线性结构的固有维度上缩放,并且是观测和状态空间大小的独立性。第四,我们的算法和分析基于新工具。 特别是,op-tenet的样本效率是由se- 启用的第四,我们的算法和分析基于新工具。特别是,op-tenet的样本效率是由se-