随着生成的数据量的不断增长,数据驱动的计算分析在生物医学研究中变得越来越重要。但是,缺乏共享研究成果的实践,例如数据,源代码和方法,会影响研究的透明度和可重复性,这对于科学的发展至关重要。由于不足的文档,代码和数据共享,许多已发表的研究无法再现。我们对2016年至2021年之间发表的453项手稿进行了全面分析,发现其中50.1%未能共享分析法规。即使在那些确实披露其代码的人中,绝大多数人也无法提供更多的研究输出,例如数据。此外,只有十分之一的文章以结构化且可重复的方式组织了其代码。我们发现了代码可用性语句的存在与增加代码可用性之间的显着关联。此外,与进行主要分析的研究相比,进行二级分析的一定比例倾向于共享其代码。根据我们的发现,我们提出提高对代码共享实践的认识,并立即采取措施提高代码可用性,以提高生物医学研究中的可重复性。通过提高透明度和可重复性,我们可以促进科学严格,鼓励协作并加速科学发现。我们必须优先考虑开放科学实践,包括共享代码,数据和其他研究产品,以
版权所有 © 2024 ISSR 期刊。这是一篇开放获取的文章,根据知识共享署名许可协议发布,允许在任何媒体上不受限制地使用、分发和复制,前提是对原始作品进行适当的引用。摘要:DNA序列吸烟、咀嚼槟榔叶和饮酒是亚洲口腔癌的主要原因。戒烟困难,加上患者的经济状况,导致无法及早诊断,从而导致死亡率上升。如今,分子科学、计算生物学和其他领域取得了重大进展,但我们仍然无法确定口腔癌(也称为鳞状细胞癌 (OSCC))的病因。早期发现可以提高存活率,因此,每年体检的教育至关重要。基因组(DNA序列)的计算分析可以帮助患者进行有针对性的细胞治疗,并有望治愈。在本文中,我们将研究用于检测 OSCC 的计算工具和各种分析。分析包括检测细胞异常以及其他可能最终导致癌细胞发生的分子反应。之后,我们研究各种计算工具或技术,包括局部和全局序列比对、蛋白质结构、基因和功能结构分析,以帮助医务人员发现癌症,进而有助于口腔癌的治疗、预后,并有望最终治愈。
2 纽约大学柯朗数学科学研究所,纽约,纽约州 b 电子邮件:ns4361@nyu.edu;网站:https://www.linkedin.com/in/sawantnihar/ 3 MPR,华盛顿特区 摘要:冠状病毒病(COVID-19)演变为大流行病,严重阻碍了公共交通系统的使用。在后 COVID-19 时代,我们可能会看到在城市内、城际和州际旅行中,人们将更多地依赖具有固有物理距离的自动驾驶汽车和个人快速交通 (PRT) 系统,而不是公共汽车、火车和飞机。然而,航空旅行仍将是人类洲际交通的主要方式。在本研究中,我们对典型的洲际飞机通风系统进行了全面的计算分析,以确定环境因素最有利于人类舒适度的座位,包括空气质量、防止口腔或鼻腔释放的污染物(如二氧化碳和冠状病毒)以及热舒适度。波音和空客飞机都考虑了同行旅客鼻子/嘴巴排出的空气速度、温度和空气污染物浓度。在每架飞机上,都分析了头等舱、商务舱和经济舱部分。我们得出了关于每架飞机每个部分哪个座位最合适的结论,并提供了环境条件数据来支持我们的推论。公众可以使用这些发现来决定他们应该坐哪个座位
利用工程酶进行催化为活性药物的生产提供了更有效的途径。然而,生物催化在早期药物发现活动中的潜力仍未得到充分开发。在这项研究中,我们开发了一种生物催化策略,通过苯并噻吩和相关杂环的分子内环丙烷化来构建富含 sp 3 的多环化合物。我们进化出了两种具有互补区域异构体选择性的卡宾转移酶,以催化在杂环的 C2 或 C3 位上带有重氮酯基的苯并噻吩底物的立体选择性环化。我们通过结合晶体学和计算分析阐明了这些反应的详细机制。利用这些见解,可以将其中一种生物催化剂的底物范围扩大到包括以前不反应的底物,这凸显了整合进化和理性策略来开发用于新自然转化的酶的价值。这里获得的分子支架具有三维和立体化学复杂性以及“三元律”特性的组合,这使得它们对于基于片段的药物发现活动具有很高的价值。
摘要:先前的研究表明,Fe II / a -酮戊二酸依赖性双加氧酶 AsqJ 诱导了构巢曲霉中绿藻素生物合成的骨架重排,从苯并[1,4]二氮杂-2,5-二酮底物中生成喹诺酮骨架。我们报告称,AsqJ 催化了一个完全不同的额外反应,只需改变苯并二氮杂-2,5-二酮底物的取代基即可。这种新机制是通过底物筛选、功能探针的应用和计算分析建立的。AsqJ 从合适的苯并[1,4]二氮杂-2,5-二酮底物的杂环结构中切除 H 2 CO 以生成喹唑啉酮。这种新型 AsqJ 催化途径由复杂底物中的单个取代基控制。 AsqJ 这种独特的底物导向反应性使得能够有针对性地生物催化生成喹诺酮或喹唑啉酮,这两种生物碱框架具有特殊的生物医学意义。
非核糖体肽是化学和功能多样的天然产物,具有重要的医学和农业应用。细菌和真菌基因组包含数千种非知名功能的非核糖体肽生物合成基因簇(BGC),为肽发现提供了有希望的资源。可以通过预测非透射体肽合成酶(NRPSS)中腺苷酸(a)结构域的底物(a)结构域来推断这种肽的核心结构特征。但是,现有的域预测方法依赖于有限的数据集,并且经常与选择大型基材或较少研究的域中的域斗争。在这里,我们系统地策划和计算分析了3,254个域,并介绍了两个新的高准确性特异性预测指标,Paras和Parasect。通过应用PARAS鉴定出具有异常高的L- tryptophan特异性的一种新型域,并且在相应的NRP上进行完整的蛋白质质谱法表明它可以指导链霉菌物种中与色氨酸肽相关的代谢产物的产生。在一起,这些技术将加速新型NRPS及其代谢产物的表征。Paras和Parasect可在https://paras.bioinformatics.nl上找到。
尽管空气微生物组及其多样性对于人类健康和生态系统的弹性至关重要,但全面的空气微生物多样性监测仍然很少见,因此对空气微生物组的组成,分布或功能知之甚少。在这里我们表明,基于纳米孔测序的元基因组学可以通过液体撞击和量身定制的计算分析来稳健地评估空气微生物组与主动空气采样相结合。我们为空气微生物组分析提供快速,便携式实验室和计算方法,我们将利用这些方法来稳健地评估受控温室环境的核心空气微生物组和自然室外环境的分类学组成。我们表明,长阅读测序可以通过从头元基因组组件来解决物种级注释和特定的生态系统功能,尽管用作纳米孔测序的输入的碎片DNA量较低。然后,我们使用我们的管道来评估以西班牙巴塞罗那为例的城市空气微生物组的多样性和可变性;该随机实验使人们对城市边界内的高度稳定位置特异性空气微生物组的存在提供了首先见解,并展示了可通过自动,快速和便携式纳米孔测序技术来实现的强大微生物评估。
在过去的十年中,在数字化梵语文本和推进语言的计算分析方面取得了重大进展。然而,为促进NLP的努力促进了诸如语义类比预测,命名实体识别和其他人的复杂语义下游任务,而其他人仍然有限。此差距主要是由于缺乏建立在大规模梵文文本数据上的坚固,预先训练的梵文模型,因为这需要大量的计算资源和数据准备。在本文中,我们介绍了Sansgpt,这是一种生成的预培训模型,已在大量的梵文文本上进行了培训,旨在促进下游NLP任务的微调和开发。我们的目标是该模型是推进梵语NLP研究的催化剂。此外,我们开发了一种专门针对梵语文本优化的自定义令牌,从而实现了复合词的有效令牌化,并使其更适合生成任务。我们的数据收集和清洁过程涵盖了各种各样的可用梵文文献,以确保培训的全面代表。我们通过对语义类比预测和明喻元素提取进行微调来进一步证明该模型的疗效,分别达到了大约95.8%和92.8%的令人印象深刻的精度。
MXenes 作为储能材料具有独特的特性;然而,有限的层间距离和持续循环下的结构稳定性限制了它们的应用。在这里,我们开发了一种独特的方法,涉及将 Nb 原子掺入 MXene(Ti 3 C 2 )中,以增强其实现更高离子存储和更长时间稳定性的能力。使用密度泛函理论进行了计算分析,从原子细节上解释了材料结构、电子结构、能带结构和态密度。Nb 掺杂的 MXene 显示出 442.7 F/g 的良好电荷存储容量,这使其可应用于超级电容器。X 射线衍射(XRD)表明在 MXene 中 Nb 掺杂后 c 晶格参数增强(从 19.2A ◦ 到 23.4A ◦ ),这显示了引入具有较大离子半径的元素(Nb)的效果。此外,带隙从原始 MXene 的 0.9 eV 变为 Nb 掺杂 MXene 的 0.1 eV,这表明后者由于金属性质更强而具有导电性增加的特征,这与实验结果相符。这项工作不仅展示了 MXene 中的掺杂效应,还有助于解释物理参数变化所涉及的现象,推动了基于二维材料的储能领域的发展。
摘要:药物基因组学是一个快速发展的领域,其目标是为每位患者提供个性化治疗 1。此前,我们开发了新药机会计算分析 2 (CANDO) 平台,用于多尺度治疗发现,通过分析化合物与大型蛋白质库的相互作用,筛选出针对任何 3 适应症/疾病的最佳化合物。我们在 4 CANDO 5 平台内实施了全面的精准医疗药物发现流程,以确定哪些药物最有可能对非小细胞肺癌 (NSCLC) 的突变表型有效,其依据的假设是具有相似相互作用 7 特征(或特征)的药物将具有相似的行为,因此表现出协同作用。CANDO 8 预测 EGFR 抑制剂奥希替尼最有可能与四种 KRAS 抑制剂产生协同作用。 9 细胞增殖试验验证研究证实,奥希替尼与 10 ARS-1620(一种 KRAS G12C 抑制剂)和 BAY-293(一种泛 KRAS 抑制剂)联合使用,通过作用于突变型 KRAS 表现出协同作用,11 降低细胞增殖。我们的精准医疗管道可用于 12 识别能够与 KRAS G12C 抑制剂产生协同作用的化合物,并通过了解它们在蛋白质组学/相互作用组学尺度上的行为来评估它们 13 成为药物的可能性。14