基于能量的模型(EBM)最近收到了感兴趣的插入量,并已应用于现实的图像产生(Han等,2019; Du&Mordatch,2019年),3D形状形状的合成(Xie等,2018b),脱离分布和对抗性的鲁棒性(Lee等人,2018年; du&Morth。 (Hinton,1999; Du等,2020a),记忆建模(Bartunov等,2019),文本生成(Deng等,2020),视频生成(Xie等,2017),增强学习(Haarnoja等人(Haarnoja et al。,2017; Du等,2019; Du等,protein; et et and of Focein; eft al。,protein Dive and Flive and Div); Du等人,2020b)和生物学上的培训(Scellier&Bengio,2017年)。对比性差异是(Hinton,2002)提出的训练EBM的流行而优雅的程序,可降低训练数据的能量并提高模型产生的采样综合的能量。模型进行了模型是通过MCMC过程(通常是Gibbs采样或Langevin Dynamics)生成的,从而利用了对采样和随机优化的广泛研究。对比差异的吸引力是其简单性和可扩展性。它不需要培训额外的辅助网络(Kim&Bengio,2016; Dai等,2019)(引入其他调整和平衡需求),可以用来构成零射模型。
强化学习(RL)借助深度神经网络中的广告,使多样化的学科中的重大分解。一些早期的亮点是在计算机游戏中(Mnih等,2015),国际象棋和GO(Silver等,2016)和机器人技术(Lillicrap等,2015; Haarnoja等,2018b)。最近的高光包括开发有效的算法,例如矩阵乘法(Fawzi等,2022)和分类(Mankowitz等,2023)。RL在天文学上也有一些应用。Telescope automation is closely related to robotics and RL can be used in telescope control including adaptive optics (Nousiainen et al., 2022; Landman et al., 2021; Nousiainen et al., 2021) and adaptive reflective surface control (Peng et al., 2022) as well as in observation scheduling (Jia et al., 2023a,b, 2022)。进一步向下数据流,RL已应用于射电天文数据处理管道(Yatawatta and Avruch,2021; Yatawatta,2023)进行超参数调整。将模范天文学视为从观察望远镜到科学家的数据流或信息,我们可以看到RL的更多应用以帮助和完善这种流程并激发该出版物。几种方法属于机器学习的伞(ML):监督学习是最常用的方法,在该方法中既可以赋予计算机的输入和所需的输出,以学习执行某个任务。无监督