Kelly Payette a , b , * , Hongwei Bran Li c , d , Priscille de Dumast e , f , Roxane Licandro g , h , Hui Ji a , b , Md Mahfuzur Rahman Siddiquee i , j , Daguang Xu j , Andriy Myronenko j , Liu Kang , Peng Wang , Lichen Ying l , Juanying Xie l , Huiquan Zhang l , Guiming Dong m , Hao Fu m , Guotai Wang m , ZunHyan Rieu n , Donghyeon Kim n , Hyun Gi Kim o , Davood Karimi p , Ali Gholipour p , Helena R. Torres q , r , s , t , Bruno t , Bruno t , L ˜ a t . Vilaça q , Yang Lin u , Netanell Avisdris v , w , Ori Ben-Zvi w , x , Dafna Ben Bashat w , x , y , Lucas Fidon z , Michael Aertsen aa , Tom Vercauteren z , Daniel Sobotka ab , Georg Langs ab , Mireia Aleny ` a acda Maria Inmacula , Oscar Belle a Specktor Fadida v , Leo Joskowicz v , Liao Weibin af , Lv Yi af , Li Xuesong af , Moona Mazher ag , Abdul Qayyum ah , Domenec Puig ag , Hamza Kebiri e , f , Zelin Zhang ai , Xinyi Xu ai , Dan Wu ai , Kuan Wu aj , Jian Jian , Jian Yuz hi Xu ai , Li Zhao ai , Lana Vasung ak , al , Bjoern Menze c , Meritxell Bach Cuadra e , f , Andras Jakab a , b , am
· Vivian White,计算机科学本科生和蒙特利尔 IN-BIC 研究员。2022 年至今。· Jackson Sweet,计算机科学本科生。2024 年至今。· Cameron Henderson,计算机科学硕士。2024 年至今。· Joe Ewert,计算机科学硕士。2024 年至今。· Robin Preble,计算机科学硕士。2024 年至今。· Rory Bates,计算机科学本科生。2024 年至今。· Mayla Ward,计算机科学和数学本科生。2024 年至今。· John-Paul Powers,计算机科学毕业生。2023–2024。· Angus Read,计算机科学本科生和研究生。2021–2023。· Cameron Kaminski(→ Purdue),计算机科学本科生。2022–2023。· Suyhun “Michael” Ban,计算机科学本科生。2021–2023。 · Caitlin Bannister(→ 布朗/NIH 博士项目),神经科学本科生。2021–2023。· Jessica Stillwell(→ PNNL),计算机科学本科生。2020–2022。· Grant Chou(→ Tuthill 实验室研究技术员),计算机科学本科生。2020–2022。· Biraj Pandey,华盛顿大学应用数学博士。2019–2022。· Sean McCulloch(→ 艾伦脑科学研究所),计算机科学硕士。2020–2021。· Seth Hirsh(→ Facebook),华盛顿大学物理学博士。2018–2020。· Satpreet Singh,华盛顿大学电气与计算机工程博士。2018–2019。· Yuchen Wang(→ Adobe),华盛顿大学计算机科学与工程本科生。2018–2019。· Nathan Lee,华盛顿大学应用数学博士。2018–2019。 · Joseph Knox(→ Facebook),艾伦脑科学研究所。2017–2018。· Nile Graddis,艾伦脑科学研究所。2015–2018。· Joshua Mendoza(→ PNNL)。华盛顿大学应用数学荣誉论文:网络结构对在 B¨otzinger 和前 B¨otzinger 复合体中创建两相呼吸模式的影响,2014–2015。UWIN Postbac 奖学金,2016。
Comprehensive analysis of microbial content in whole-genome sequencing samples from The Cancer Genome Atlas project Yuchen Ge 1,2,* , Jennifer Lu 1,3 , Daniela Puiu 1,2 , Mahler Revsine 1,4 , and Steven L. Salzberg 1,2,3,4,* 1 Center for Computational Biology, Johns Hopkins University, Baltimore, Maryland, United States 2 Department of Biomedical Engineering, Johns Hopkins University 3 Department of Pathology, Johns Hopkins School of Medicine 4 Department of Computer Science, Johns Hopkins University 5 Department of Biostatistics, Johns Hopkins University *Correspondence to: salzberg@jhu.edu, yge15@jhmi.edu Abstract In recent years, a growing number of publications have reported the presence of microbial species in human tumors and of mixtures of microbes that appear to对不同的癌症类型高度特异。我们最近对三种癌症类型数据的重新分析表明,据报道,技术错误导致了许多微生物物种的错误报道,据报道在癌症基因组图集(TCGA)项目的测序数据中发现了许多微生物物种。在这里,我们扩展了分析,涵盖了目前从癌症基因组图集(TCGA)项目中获得的所有5,734个全基因组测序(WGS)数据集,其中涵盖了25种不同类型的癌症。我们使用更新的计算方法和数据库分析了微生物含量,并将我们的结果与癌症中细菌,病毒和真菌的两项主要研究的结果进行了比较。引言最近的许多研究使用了癌症基因组图集(TCGA)项目创建的庞大测序资源来探索微生物物种在癌症中的潜在作用。我们的结果扩展并加强了我们最近的发现,这表明微生物的存在远小于以前报道的小说,并且在TCGA数据中鉴定出的大多数物种根本不存在,或者是已知的污染物,而不是居住在肿瘤中的微生物。作为这项扩展分析的一部分,为了帮助他人避免被有缺陷的数据误导,我们发布了一个数据集,其中包含在所有5,734个TCGA样品中检测到的细菌,病毒,古细菌和真菌的详细读取计数,该样本可以作为未来研究的公众参考。尽管收集了大多数TCGA数据的目的是研究人类遗传变异或基因表达,但肿瘤中存在的微生物(包括病毒,细菌和真菌 - 可能)也被捕获为测序实验的偶然副作用。在人类肿瘤样本中识别微生物,其中绝大多数生物质预计是人类的,需要非常小心,以免被污染物,测序矢量或其他可能存在于数据中的污染物,测序矢量或其他文物。在这项研究中,我们的目标是对TCGA项目的数千个全基因组测序(WGS)样本进行详尽而细致的调查,目的是识别这些样品中的任何微生物。通过公开获得结果,我们希望刺激更多的研究,这些研究可能会放大或反驳各种肿瘤类型中微生物的最新发现。我们还将我们的发现与最近使用许多相同TCGA数据的研究结果进行了比较,并描述了在某些情况下受到污染影响的发现。这些研究以及其他依赖数据的研究已牵涉到癌症各个方面的微生物组,从调节肿瘤微环境到影响治疗