自LMRL研讨会上一次在Neurips 2022(https://www.lmrl.org/)举行,对生物学的代表性学习兴趣已经激起了新的想法,并引发了传统方法,并引发了如何通过机器学习来最佳地捕捉生物系统复杂性的讨论。大规模公共DNA和RNA测序,蛋白质序列和3D结构,质谱和细胞绘画数据集(跳跃CP,RXRX3,人类细胞图集)的可用性促进了许多大型“基础模型”的生物学模型(Rozenblatt-ordos-poss-ord。2021; Fay等。2023; Chandrasekaran等。2023)。这些模型旨在从嘈杂,原始和非结构化的高维数据中提取“有意义的”表示,以解决各种生物学问题。