。cc-by 4.0未经同行评审获得的未获得的国际许可证是作者/筹款人,他已授予Biorxiv的许可证,以永久显示预印本。它是此预印本的版权持有人(该版本发布于2023年7月15日。; https://doi.org/10.1101/2023.07.14.549076 doi:biorxiv Preprint
GPT系列的成功证明,GPT可以从序列中提取一般信息,从而使所有下游任务受益。这促使我们使用预训练的模型来探索DNA序列中的隐藏信息。但是,DNA序列分析中的数据和任务需求是复杂性和多样性,因为DNA相关数据包括不同类型的信息,例如序列,表达水平等,而目前尚无专门为这些特征设计的模型。在此,我们提出了DNAGPT,这是一种从9种的超过100亿个碱基对进行预训练的广义基础模型,可以对任何DNA序列分析任务进行微调。我们的模型可以同时处理或输出DNA序列和数字。此外,我们独特的令牌设计使用户可以根据自己的任务要求设计提示,从而适用于任何类型的任务。我们已经评估了我们的分类,回归和生成任务的模型。我们证明了DNAGPT受益于预训练,因此可以为任何下游任务带来绩效提高。我们的模型不仅是基因组分析领域的新尝试,而且为在生物学中应用基础模型提供了新的方向。
1 Sidney Kimmel医学院微生物和免疫学系,托马斯·杰斐逊大学,费城,宾夕法尼亚州费城,19107年,美国2分子寄生虫学实验室,林赛·金博尔研究所,纽约血液中心,纽约血液中心,纽约,纽约,10065帕克,阿德莱德公园,澳大利亚5042,澳大利亚5 Alpha Genesis Inc.,Yemassee,SC 29945,美国6 IDEXX BIOANALYTICS,西萨克拉曼多,CA 95605,美国7,美国7分司,药理学和实验治疗系,Sidney Kimmel医学院美国97030,贝勒医学院国家热带医学院儿科开发中心,美国9号,美国9号感染研究所,兽医与生态科学研究所,利物浦利物浦L3 5rf,英国利物浦大学 *通信 *通信); David.abraham@jefferson.edu(D.A。)†这些作者为这项工作做出了同样的贡献。
Yu Gao 1 †, Qiping Dong 1 †, Kalpana Hanthanan Arachchilage 1,2 †, Ryan D. Risgaard 1 , Jie Sheng 1,2 , Moosa Syed 1 , Danielle K. Schmidt 1 , Ting Jin 1,2 , Shuang Liu 1 , Dan Doherty 2 , Ian Glass 2 , Birth Defects Research Laboratory 3 , Jon E. Levine 4,5 , Daifeng Wang 1,2,6 *, Qiang Chang 1,7,8 *, Xinyu Zhao 1,4 *, André M. M. Sousa 1,4 *
Jennifer Kwon、Alec Knapp、Andrew Hill、Kristen Browoleit、Sai An、Stuart Sundsdeth、Tyler Goodwin、Michael Hefferan、Kendra Congdon、Charles Gersbach、Blythe Sather
本研究从 4 种河口多毛类:Capitella capitata、Scalibregma inflatum、Dendronereis aesturiana 和 Namalycastis abiuma 中分离出共 17 种形态不同的肠道相关细菌。用琼脂扩散法评估了分离菌株的益生菌活性,例如蛋白酶、淀粉酶和脂肪酶等消化酶以及对鱼类病原体的抗菌活性。基于其较好的酶促和抗菌活性,选取两株细菌 CMST Poly1 和 CMST Poly2 进行进一步的益生菌研究。根据生化和形态学特征,这两株益生菌菌株均为革兰氏阳性、杆状、不运动、不形成芽孢、同型发酵、缺乏催化酶和明显的蛋白水解活性,并且对多种抗生素敏感。此外,通过 16S rRNA 基因序列分析确认这两株菌株为枯草芽孢杆菌 CMST Poly1 和 Priestia megaterium CMST Poly2。我们的结果表明,枯草芽孢杆菌 CMST Poly1 和 Priestia megaterium CMST Poly2 菌株可作为水产养殖应用中的益生菌菌株使用。
1 密歇根大学生物医学工程系,美国密歇根州安娜堡 48109 2 凯斯西储大学生物医学工程系,美国俄亥俄州克利夫兰 44106 3 大都会健康医疗中心骨科系,美国俄亥俄州克利夫兰 44106 4 退伍军人事务医疗中心路易斯斯托克斯克利夫兰分部,美国俄亥俄州克利夫兰 44106 5 密歇根大学医学院麻醉系,美国密歇根州安娜堡 48109 6 密歇根大学外科系整形外科科,美国密歇根州安娜堡 48109 7 密歇根大学医学院神经外科系,美国密歇根州安娜堡 48109 8 密歇根大学电气工程与计算机科学系,美国密歇根州安娜堡48109,美国 9 密歇根大学机器人研究所,密歇根州安娜堡 48109,美国 10 密歇根大学神经科学研究生课程,密歇根州安娜堡 48109,美国 11 密歇根大学医学院神经病学系,密歇根州安娜堡 48109,美国 12 上述作者对本研究贡献相同。∗ 任何通讯作者均应致函此联系人。
表示用于子场拼接制造工艺的四个段或子块。 (E) 柄尖电极布局(顶部)和 CMOS 电路布局(底部)的细节。 (F) 柄中一个金属层穿过拼接区域时的自上而下的扫描电子显微镜 (SEM) 图像(比例尺:1 µm);左上:拼接重叠区域外的横截面;右上:最窄处的横截面;由于双重光刻胶曝光,金属线更窄。 (G) 柄尖机械研磨至 25° 的 SEM 照片;插图:探针 10
神经编码的一个具有挑战性的目标是表征视觉影响的基础神经表示。为此,我们分析了猕猴视觉皮层的多单元活动与最新的深层生成模型的潜在表述,包括生成对抗网络的特征 - 触发器(即Style of Stylegan)的特征 - 触发器,而语言的差异差异网络的语言对比度表示。潜在表示的质量单变量神经编码分析表明,特征示词表示的解释越来越多的方差比腹侧流的替代表示更多。随后,对特征示意图表示的多元神经解码分析导致视觉感知的最新时空重建。综上所述,我们的结果不仅强调了特征 - 触发物在塑造视觉感知基础的高级神经表示中的重要作用,而且还可以成为神经编码未来的重要基准。
小胶质细胞是脑特异性巨噬细胞,可对脑中的破坏性事件做出快速反应。小胶质细胞活化会导致特定的变化,包括增殖、形态变化、迁移到损伤部位以及基因表达谱的变化。炎症状态的变化与许多神经退行性疾病有关,例如帕金森病和阿尔茨海默病。因此,研究和量化小胶质细胞对于更好地了解它们在疾病进展中的作用以及评估此类疾病的新治疗方法的细胞相容性至关重要。在以下研究中,我们实施了一种基于机器学习的方法来快速自动量化小胶质细胞;将该工具与手动量化(基本事实)以及替代免费软件(例如基于阈值的 ImageJ 和基于机器学习的 Ilastik)进行了比较。我们首先在从大鼠和非人类灵长类动物获得的免疫组织化学标记小胶质细胞的脑组织上训练算法。随后,我们在帕金森病的临床前啮齿动物模型中验证了训练算法的准确性,并证明了算法在从小鼠获得的组织以及三个合作实验室提供的图像上的稳健性。我们的结果表明,机器学习算法可以精确地检测和量化所有三种哺乳动物物种中的小胶质细胞,与手动计数后观察到的细胞相当。使用此工具,我们能够检测和量化半球之间的微小变化,这表明该算法的强大和可靠性。这样的工具对于研究疾病中的小胶质细胞反应非常有用