Bonita Saunders 2021 Etta Zuber Falconer 讲师 – 美国妇女数学协会和美国数学协会 J. Teufel、S. Kotler、E. Shojaee、A. Kwiatkowski、S. Geller、S. Glancy、M. Knill – 2021 年物理世界年度突破奖第一名
引入DNA甲基化发生时,将甲基(CH3)添加到DNA序列中时。添加的甲基的位置决定了甲基化的类型。在特殊性中,胞嘧啶(5MC)的第五位置的DNA修饰在基因调节中起着至关重要的作用,并且参与了其他重要的生物学过程(Breiling and Lyko 2015)在细菌和真核生物中都发生。目前对基于变压器的语言模型有很大的兴趣。诸如Bert之类的模型(Devlin等人2018)及其变体在几种自然语言处理任务上表现良好。除了适应特定领域(例如医学领域)外,基于变压器的语言模型也被转移到生物学序列(例如DNA序列)(Ji等人2021)和蛋白质术(Teufel等人2022)。在木兰 - 甲基(Zeng,Gautam和Huson 2023)中,我们介绍了几种针对域特异性的微型语言模型,用于对短DNA序列的甲基化状态进行分类。在这里,我们的目的是将这种模型用作编码器,以分类哺乳动物的5MC DNA甲基化状态。以前的研究(Abnar和Zuidema 2020)表明,变压器的自我发注意机制可用于解释模型并量化特征性节奏,而我们在Mulan-Methyl上的工作表明,注意力评分可以提高合理的特征重要性。因此,在这里,我们提出了一项研究,该研究使用由编码器产生的注意权重作为
Wood,H Shonna Yin,William T. Zempsky,Emily Zimmerman,Benard P. Dreyer和Recover-Pediatric Consortium
Wood 18,H。Shonna Yin 114,William T. Zempsky 115,Emily Zimmerman 116,Benard P. Dreyer 1,代表Recover-Pediatric Consortium¶
Wood 18,H。Shonna Yin 114,William T. Zempsky 115,Emily Zimmerman 116,Benard P. Dreyer 1,代表Recover-Pediatric Consortium¶