RNA编辑是一种广泛的转录后机制,能够通过插入/缺失或基本替换来修改成绩单。它在哺乳动物中很突出,其中数百万腺苷被酶的成员脱离插入。a-to-i RNA编辑具有大量的生物学功能,但在大规模转录组数据集中的检测仍然是未解决的计算任务。为此,我们开发了Reditools,这是第一个软件包,该软件包专门用于RNA编辑Pro filefifing RNA序列(RNASEQ)数据。它已成功地用于人类转录组中,证明了RNA编辑的组织和细胞类型特异性及其普遍性。在我们的专业重复数据库中收集了有关人类RNASEQ数据的大规模重新分析分析的结果,其中包含超过450万个事件。在这里,我们详细描述了两个基于我们的计算资源,重新数字和重复的生物信息学过程。在第一个程序中,我们概述了在人类细胞系NA12878中检测RNA编辑的工作流,为此,转录组和整个基因组数据可用。在第二个程序中,我们展示了如何在亨廷顿疾病供体的验尸样本中鉴定在特定的重新编码位点上的非调节编辑。在64位计算机上运行≥32GB的随机存储器(RAM)的Linux上,这两个过程均应使用4至24个内核,〜76 h。我们的方案旨在研究具有可用转录组和/或基因组读数的不同生物体中的RNA编辑。可以在https://github.com/bioinfouniba/reditools上获得完成这两个过程和Docker映像的脚本。
1 tummalachervu@gmail.com摘要:本文探讨了在云计算环境中优化数据科学工作流的挑战和创新。首先要强调数据科学在现代行业中的关键作用以及云计算在启用可扩展有效的数据处理方面的关键作用。主要重点在于识别和分析云基础结构中部署的当前数据科学工作流中遇到的关键挑战。这些挑战包括与处理大量数据有关的可伸缩性问题,优化计算资源的资源管理复杂性,成本管理策略以平衡绩效与费用以及确保强大的数据安全和隐私措施。手稿随后深入研究了旨在应对这些挑战的创新解决方案和技术。它讨论了诸如简化重复任务的工作流动自动化工具和框架,例如Docker和Kubernetes等容器化技术,以进行有效的应用程序部署和管理,以及使用无服务器体系结构以增强可扩展性并降低操作成本。此外,它探讨了并行处理框架(例如Apache Spark和Hadoop)在优化数据处理任务中的好处。还研究了用于动态工作流优化的机器学习算法和云环境中有效的数据管理策略的集成。通过详细的案例研究和各个领域的应用示例,手稿说明了这些优化策略的实际实施和结果。此外,它讨论了云技术的新兴趋势,AI驱动的自动化在提高工作流效率方面的作用以及围绕云计算中数据科学运营的道德考虑。该手稿以发现结果的摘要,对寻求增强其数据科学工作流程的组织的实践建议,以及对未来研究方向的见解,以应对不断发展的挑战。
背景:公开访问的重症监护数据库包含巨大的临床数据,但是它们的利用通常需要先进的编程技能。大型数据库和非结构化数据的日益增长的复杂性给需要编程或数据分析专业知识以直接利用这些系统的临床医生带来了挑战。目的:本研究旨在简化与重症监护相关的数据库部署和通过大语言模型提取。方法:该平台的开发是一个两步过程。首先,我们使用Docker Container Technology启用了自动化数据库部署,并具有结合的基于Web的分析接口Meterfase和Superset。第二,我们开发了重症监护室的预审预周化变压器(ICU-GPT),这是一种大型语言模型,在重症监护室(ICU)数据上进行了微调,该模型集成了Langchain和Microsoft Autogen。结果:自动部署平台的设计考虑了用户友好性,使临床医生能够在本地,云或远程环境中部署1个或多个数据库,而无需手动设置。成功克服了GPT的令牌限制并支持多策略数据后,ICU-GPT可以生成结构化查询语言(SQL)查询,并根据请求输入从ICU数据集中提取洞察力。为临床医生开发了一个前端用户界面,以在基于Web的客户端上实现无代码SQL生成。结论:通过利用自动部署平台和ICU-GPT模型的功能,临床医生可以更有效,更有效地可视化,提取和安排与重症监护相关的数据库,而不是手动方法。我们的研究可以减少在复杂的生物信息学方法上花费的时间和精力,并提高临床研究。
在这项研究中,我们探讨了计算神经科学中的模拟设置。我们使用Genesis,一种通用模拟引擎,用于亚细胞组件和生化反应,现实的神经元模型,大型神经网络和系统级模型。Genesis支持开发和运行计算机模拟,但留下了一个差距,用于建立当今更大,更复杂的模型。大脑网络现实模型的领域已过度生长了最早模型的简单性。挑战包括管理软件依赖性和各种模型的复杂性,设置模型参数值,将输入参数存储在结果旁边以及提供执行统计信息。此外,在高性能计算(HPC)上下文中,公共云资源正在成为昂贵的本地集群的替代品。我们提出了神经模拟管道(NSP),该管道有助于使用基础架构作为代码(IAC)容器化方法,促进了大规模的计算机模拟及其部署到多个计算基础架构。作者通过定制的视觉系统(称为retnet(8×5,1))使用生物学上可见的霍奇金 - 赫斯利尖刺神经元,证明了NSP在用创世纪编程的模式识别任务中的效果。我们通过在Hasso Plattner Institute(HPI)将来以服务为导向的计算(SOC)实验室以及通过全球最大的公共云服务提供商的Amazon Web Services(AWS)上执行54套本地执行的模拟来评估管道。我们报告了使用Docker的非候选和容器的执行,并在AWS中呈现每个仿真的成本。结果表明,我们的神经模拟管道可以减少神经模拟的进入障碍,从而使它们更实用和成本效率。
胎儿MRI广泛用于定量脑容量研究。但是,目前,缺乏普遍接受的胎儿脑部分割和分割方案。已发表的临床研究倾向于使用不同的策略方法,据报道,这些方法也需要大量耗时的手动精炼。在这项工作中,我们建议通过为3D T2W运动校正大脑图像开发新的强大深度学习胎儿脑分割管道来应对这一挑战。首先,我们使用发展中的人类连接项目的新胎儿脑MRI ATLAS定义了一种新的精制脑组织拟合方案,该方案使用了19个区域。该方案设计是基于组织学大脑图谱的证据,单个受试者3D T2W图像中结构的清晰可见性以及与定量研究的临床相关性。随后,它用作开发自动化深度学习的脑组织拟层管道,该管道在360个胎儿MRI数据集中训练有不同的获取参数,并使用半监督的方法和手动精制的标签从ATLAS中传播。管道在不同的采集方案和GA范围内证明了强大的性能。分析390名正常参与者的组织体积(妊娠年龄范围21-38周),并用三种不同的采集方案进行扫描,并未揭示生长图中主要结构的显着差异。在<15%的病例中仅存在小错误,因此显着减少了手动细化的需求。此外,有65例室性肿瘤和60例正常对照病例之间的定量比较与基于手动分割的早期工作中报道的发现一致。这些初步结果支持拟议的基于ATLAS的深度学习方法的可行性,以进行大规模体积分析。创建的胎儿脑体积百分比和带有拟议管道的Docker将在手稿出版后在线公开获得。
校园,卡拉奇,巴基斯坦。Shazia.dawood@iqra.edu.pk 摘要背景:抵抗素是一种与肥胖、慢性炎症和胰岛素抵抗有关的激素,在代谢和炎症途径中起着至关重要的作用。非甾体抗炎药 (NSAID) 如阿司匹林和布洛芬因其抗炎特性而广泛使用,并且可能与抵抗素相互作用来调节炎症和胰岛素抵抗。目的:本研究旨在比较阿司匹林和布洛芬与抵抗素的分子对接相互作用,以确定它们的结合亲和力、相互作用模式以及对抵抗素结构和功能的潜在影响。该研究还试图评估这些相互作用对管理肥胖相关炎症和胰岛素抵抗的意义。方法:使用 Molegro Virtual Docker (MVD) 和 UCSF Chimera 进行分子对接模拟。抵抗素的晶体结构 (PDB ID:1IRF) 是从蛋白质数据库中获得的。制备并优化了阿司匹林和布洛芬作为配体,并确定了抵抗素的活性位点。进行对接模拟以评估结合亲和力和相互作用模式,并对结果进行可视化和分析,以了解氢键和活性位点相互作用。结果:阿司匹林和布洛芬都表现出对抵抗素的强结合亲和力,布洛芬的亲和力(MolDock评分为-81.6732)略高于阿司匹林(MolDock评分为-81.2585)。阿司匹林与Thr37形成一个氢键,而布洛芬与Ser65和Cys56形成两个氢键,表明相互作用更稳定。每种配体的不同相互作用残基组表明不同的结合机制以及对抵抗素构象和功能的潜在影响。结论:研究表明阿司匹林和布洛芬可以与抵抗素强结合,布洛芬表现出稍强和更稳定的相互作用。这些不同的相互作用可能影响抵抗素在炎症和胰岛素抵抗中的作用,为控制这些疾病提供了潜在的治疗途径。需要进一步的实验验证来确认这些相互作用在体内的功能后果,这可以为开发针对慢性炎症疾病和代谢紊乱的靶向疗法提供参考。
图 4 系统总体架构 Fig.4 General framework of system 2.2 Amazon 云计算平台技术介绍 在云计算被提出之前,开发者需要按照需求购买存 储设备和计算设备等硬件设施,但是往往由于计算的不 准确性会造成资源的浪费。云计算的基本概念最初是由 Google 公司提出的。使用云计算平台用户不需要购买任 何硬件设施,因为云计算平台直接提供易交付和易扩展 的 IT 服务,如虚拟服务器、远程数据库以及大容量存储 服务。 本文通过制作服务器的 Docker 文件,将服务器部署 于 Amazon 云端。下面就以 AWS [23] ( Amazon Web Services ,亚马逊云服务)的虚拟服务器( Amazon EC2 )、 可扩展的云存储( Amazon S3 )和云端动态数据库 ( Dynamo DB ) 3 种云平台技术做简要介绍。 Amazon EC2 的 Web 服务接口简单,可以轻松获取 和配置容量。使用该服务,可以完全控制计算资源,并 可以在成熟的 Amazon 计算环境中运行。 Amazon EC2 将 获取并启动新服务器实例所需要的时间缩短至几分钟, 当计算要求发生变化时,可以快速扩展计算容量。 Amazon S3 提供一个简明的 Web 服务界面,用户可 通过它随时在 Web 上存储和检索任意大小的数据。使用 Amazon S3 ,用户只需按实际使用的存储量付费,没有最 低费用和准备成本。 DynamoDB 是一种快速、全面受管的 NoSQL 数据库 服务,它能让用户以简单并且经济有效的方式存储和检 索任何数据量,同时服务于任何程度的请求流量。所有 数据条目均存储在固态硬盘( solid state drives , SSD )中, 具有极高的可用性和耐久性。 2.3 农作物的测量和虚拟模型的生成 虚拟农作物建模对象包括水稻和番茄。为了获取水 稻建模所需的相关参数,于 2015 年和 2016 年在浙江杭 州中国水稻研究所进行了相关试验。选取时期为拔节期
Applications : SOLIDWORKS, Simulink, LabVIEW, Microsoft Office, Creo, NX, ANSYS, Confluence, Unity Programming : Python, C++, MatLab, HTML, Java, ROS, Machine Learning, Image Processing, Embedded Firmware Manufacturing : Sheet Metal Design, CNC, Composite Materials, DFM, Soldering, PCB Design, Rapid Prototyping Professional Experience Planet Labs -系统工程实习生 - 2023年6月 - 2023年6月,加利福尼亚州旧金山•在我们的下一代航天器上开发了任务重要资格测试的测试程序。•模拟了航天器原型的一天中的一天,涵盖了所有子系统以进行需求验证。基本机器人技术 - 机械工程师 - 加利福尼亚州帕萨迪纳,2020年1月 - 2022年8月•使用神经网络推理加速器开发了下一代感知硬件。•开发了用于基于Docker的容器的机器人操作系统的外围驱动程序。•集成的神经网络将优化的边缘计算机纳入生产硬件解决方案。•向消费者,工业和食品安全的制造环境部署和集成的自定义检查硬件。Morse Corp-工程合作社 - 马萨诸塞州剑桥市2019年1月 - 2019年8月•为无人机设计的结构组件及其在Solidworks中的飞行测试设备。•开发了固件,以控制飞行测试设备上释放机制的精确时机。•使硬件测试方法更可靠,并且与自动测试和冗余安全系统一致。•与系统工程团队合作就与美国陆军的主要开发合同提案。努力机器人 - 系统工程合作社 - 马萨诸塞州切尔姆斯福德,2018年1月 - 2018年6月•对机器人性能进行了移动性,耐力,通信和附属互操作性的验证。•设计了一种定制测试工具,以使用基于Python的软件来测量和记录机器人地面速度。HASBRO Inc.-工程合作社,Integrated Play -Pawtucket,RI,2017年1月至2017年6月•使用高级技术,诸如语音交互之类的高级技术,为动画,连接的玩具设计了新的游戏体验。•使用Unity和Google Cardboard Android应用程序原型的新型游戏VR互动概念。•使用加工和3D打印零件创建了用于未来动画玩具的机制模拟。工程活动结构和复合材料实验室 - 研究生研究员2023-2024•研究物理知情的神经网络,用于建模飞行中机翼的空气动力学和结构响应。•开发和训练神经网络,使用Pytorch和Nvidia模量框架预测复杂的3D流。Avatar Xprize Arm Capstone Project 2019秋季•在由5名学生组成的团队中,设计和原型拟建了拟人化机器人手臂和触觉外骨骼控制器。•开发了一个带有精确扭矩控制的准直接驱动应用程序的紧凑型无刷发动机驱动程序。•编写了电动机控制器固件,包括面向现场的控制,RS485上的串行通信以及实施
1. Morita T、Asada M、Naito E。神经影像学研究对理解人类认知大脑功能发展的贡献。Front Hum Neurosci。2016;10:464。doi:10.3389/fnhum.2016.00464 2. Bandettini PA。神经影像学方法有什么新进展?Ann NY Acad Sci。2009;1156:260-293。doi:10.1111/j.1749-6632.2009.04420.x 3. Verner E、Baker BT、Bockholt J 等人。使用 BrainForge 加速神经影像学研究。Gateways 2020,会议改善生物医学研究的数据使用; 2020 年 10 月 21 日。4. Poldrack RA、Baker CI、Durnez J 等人。扫描地平线:迈向透明和可重复的神经影像学研究。Nat Rev Neurosci。2017;18(2):115-126。doi: 10.1038/nrn.2016.167 5. Gorgolewski K、Poldrack R。提高神经影像学研究透明度和可重复性的实用指南。PLOS Biol。2016;14:e1002506。doi: 10.1371/journal.pbio.1002506 6. Baker M。1,500 名科学家揭开可重复性的面纱。Nature。2016;533(7604):452-454。 doi: 10.1038/533452a 7. Scott A、Courtney W、Wood D 等人。COINS:为大型异构数据集构建的创新信息学和神经成像工具套件。Front Neuroinform。2011;5:33。doi: 10.3389/fninf.2011.00033 8. Yoo AB、Jette MA、Grondona M。SLURM:用于资源管理的简单 Linux 实用程序。引自:Feitelson D、Rudolph L、Schwiegelshohn U 编。并行处理的作业调度策略。JSSPP 2003。计算机科学讲义。Springer;2003:44-60。9. Avesani P、McPherson B、Hayashi S 等人。开放扩散数据衍生物、通过衍生物的集成发布和可复制的开放云服务进行脑数据升级。 Sci Data 。2019;6(1):69。doi:10.1038/s41597-019-0073-y 10. Flywheel。为医疗和研究领域的数字化转型提供动力。2021 年 5 月 14 日访问。flywheel.io 11. Kurtzer GM、Sochat V、Bauer MW。Singularity:用于移动计算的科学容器。PLoS One。2017;12(5):e0177459。doi:10.1371/journal.pone。0177459 12. Merkel D。Docker:用于一致开发和部署的轻量级 Linux 容器。Linux J 。2014;239:2。13. Ashburner J、Barnes G、Chen CC 等人。SPM12 手册。第 2464 卷。威康信托神经影像中心;2014 年。14. Smith SM、Jenkinson M、Woolrich MW 等人。功能性和结构性 MR 图像分析进展以及作为 FSL 的实现。神经影像。2004 年;23 (Suppl 1):S208-S219。doi: 10.1016/j.neuroimage.2004.07.051 15. Cox RW。AFNI:用于分析和可视化功能性磁共振神经影像的软件。Comput Biomed Res。1996 年;29(3):162-173。doi: 10. 1006/cbmr.1996.0014 16. Cox RW、Hyde JS。用于分析和可视化 fMRI 数据的软件工具。NMR Biomed。 1997;10(4–5):171-178。doi:10.1002/(SICI)1099- 1492(199706/08)10:4/5<171::AID-NBM453>3.0.CO;2-L 17. fMRI 工具箱的 Group ICA (v4.0c)。神经影像和数据科学转化研究中心。2021 年 5 月 6 日访问。https://trendscenter. org/software/gift/ 18. TReNDS 中心。Docker, Inc.访问日期:2022 年 1 月 13 日。https://hub.docker.com/orgs/trendscenter/repositories 19. 神经影像和数据科学转化研究中心。GitHub, Inc. https://github.com/trendscenter/ 20. Gorgolewski K、Burns CD、Madison C 等人。Nipype:一个灵活、轻量且可扩展的 Python 神经影像数据处理框架。Front Neuroinform。2011;5:13。doi:10.3389/fninf.2011.00013 21. GorgolewskiKJ、AuerT、CalhounVD 等人。Thebrainimagingdatastructure,一种组织和描述神经影像实验输出的格式。Sci Data。2016;3(1):160044。 doi: 10.1038/sdata.2016.44 22. FosterI.Globusonline:通过云服务加速和民主化科学。IEEEInternetComput。2011;15(3):70-73。doi: 10.1109/MIC。2011.64 23. Allen B、Bresnahan J、Childers L 等人。面向数据科学家的软件即服务。Commun ACM。2012;55(2):81-88。doi: 10.1145/2076450.2076468 24. Calhoun VD、Adali T、Pearlson GD、Pekar JJ。一种使用独立成分分析从功能性 MRI 数据进行组推断的方法。Hum Brain Mapp。2001;14(3):140-151。 doi: 10.1002/hbm.1048 25. Allen E、Erhardt E、Damaraju E 等。静息状态网络多变量比较的基线。Front Syst Neurosci。2011;5:2。doi: 10.3389/ fnsys.2011.00002 26. Allen EA、Damaraju E、Plis SM、Erhardt EB、Eichele T、Calhoun VD。跟踪静息状态下的全脑连接动态。大脑皮层。2014;24(3):663-676。doi: 10.1093/cercor/bhs352 27. Ashburner J、Friston KJ。基于体素的形态测量——方法。神经影像学。2000;11(6):805-821。 doi: 10.1006/nimg.2000.0582 28. Fischl B. FreeSurfer。神经影像学。2012;62(2):774-781。doi: 10.1016/j.neuroimage.2012.01.021 29. Andersson JLR、Sotiropoulos SN。一种用于校正扩散 MR 成像中的偏共振效应和受试者运动的综合方法。神经影像学。2016;125:1063-1078。doi: 10.1016/j.neuroimage.2015.10.019 30. Andersson JL、Skare S、Ashburner J。如何校正自旋回波平面图像中的磁化率畸变:应用于扩散张量成像。神经影像学。 2003;20(2):870-888。doi: 10.1016/s1053-8119(03)00336-7 31. Andersson JLR、Graham MS、Drobnjak I、Zhang H、Filippini N、Bastiani M。面向扩散 MR 图像运动和失真校正的综合框架:体积运动内。神经影像学。2017;152:450-466。doi: 10.1016/j.neuroimage.2017.02.085 32. CalhounVinceD、MillerR、PearlsonG、Adal 𝚤 T。Thechronnectome:时变连接网络作为fMRIdatadiscovery 的下一个前沿。神经元。2014;84(2):262-274。 doi: 10.1016/j.neuron.2014.10.015 33. Du Y、Fu Z、Sui J 等人。NeuroMark:一种基于自动化和自适应 ICA 的管道,用于识别可重复的 fMRI 脑部疾病标记物。神经影像:临床。2020;28:102375。doi: 10.1016/j.nicl.2020.102375 34. Griffanti L、Zamboni G、Khan A 等人。BIANCA(脑强度异常分类算法):一种用于自动分割白质高信号的新型工具。神经影像学。2016;141:191-205。doi:10.1016/j.neuroimage.2016.07.018