1新加坡科学技术与研究机构生物信息学研究所2新加坡临床科学研究所,科学技术与研究机构,新加坡3见Swee Hock公共卫生学院,新加坡国立大学,新加坡国立大学,新加坡国立大学,新加坡4号研究所,新加坡,新加坡5 Yong linoologice linoologice linoologice lin Ondicore,National of National of Scipore新加坡国立大学,新加坡国立大学7妇产科和人类潜在翻译研究计划,Yong Loo-Lin医学院,新加坡国立大学,新加坡国立大学,新加坡8号,赫尔辛基大学赫尔辛基大学赫尔辛基大学赫尔辛基大学,芬兰大学赫尔辛基大学赫尔辛基大学,芬兰大学9型民俗研究中心的赫尔辛基大学赫尔辛基大学赫尔辛基大学赫尔斯基研究中心,芬兰研究中心的研究中心,并告知了一名纽约市的研究中心。利益相关者,跨学科的合作努力旨在通过创造和传播现实世界证据1。健康证据需要以卫生专业人员,患者以及公共或私人卫生经理清楚理解的方式进行传达和传播。在2023年OHDSI APAC研讨会上,知识翻译是与证据消费者(患者和消费者,临床医生,研究人员,监管机构和政策制定者)的圆桌讨论中出现的关键主题2。生成人工智能(AI)可能是向人群和/或健康经理传达科学健康证据的有效策略。方法科学,技术与研究机构(A*Star)通过开放的交互式数据保险库平台(图1)开创了健康研究,用于假设构建和数据驱动的发现3。数据保险库中的OMOP数据目录4,5启用了开放科学系统中知识发现和管理的数据库级别特征。心血管数据库中的OHDSI AI 6被配置为回答OHDSI和新加坡心血管研究的研究文献中的问题(图2)。
我们在过去5年(2024年4月22日至2019年4月22日之间)在关键字“联合数据网络”上搜索了PubMed,并确定了任何描述FDN并包括健康数据的出版物。我们通过使用内部大语言模型来补充这些发现,根据与初始搜索中确定的关键论文的相似性分数来识别其他论文。我们筛选了确定的论文,这些论文描述了出版物中提到或引用的任何其他FDN感兴趣的FDN。最后,我们询问了四位具有FDN研究经验的流行病学同事,如果我们发现的FDN列表中可能会缺少任何网络,因为即使他们没有出版物,我们也希望包括已知的FDN。
方法的CDW数据报告,以扩展为止,CDW的数据报告基础架构是用oracle技术来用于ETL和构建和构建并介绍报告和分析的。CDW当前包含来自几个临床系统的数据,这些数据通过报告和仪表板向临床医生呈现。通过三个工作流提供了用于构建报告基础架构的ETL工具和技能,用于交付Digione项目:(1)采购CDW中尚未存在的变量,(2)将CDW的变量从CDW转换为OMOP,以及(3)(3)(3)对基础结构进行效应以实现联邦研究的研究3。数据输送基础架构为了将患者数据传递给临床医生,数据报告基础架构使用的ETL和报告工具已被重新用于实施数据传递基础架构。基础架构允许CDW独立的研究支持团队代表质量和研究注册表所有者向CDW签订数据订单。研究支持是数据接收者,有责任将数据派遣到特定的注册表中。
摘要背景:自卢旺达爆发 COVID-19 疫情以来,已收集了大量 SARS-COV-2/COVID-19 相关数据,包括 COVID-19 检测和医院常规护理数据。不幸的是,这些数据分散在不同的数据结构或格式的孤岛中,无法用于增进对疾病的了解、监测其进展并生成指导预防措施的证据。该项目的目标是利用人工智能 (AI) 和数据科学技术协调数据集,以支持卢旺达政府监测和预测 COVID-19 负担的需求,包括医院入院率和总体感染率。方法:该项目将收集现有数据,包括医院电子健康记录 (EHR)、COVID-19 检测数据,并与社区调查的纵向数据相链接。观察性健康数据科学与信息学 (OHDSI) 的开源工具将用于通过观察性医疗结果伙伴关系 (OMOP) 通用数据模型 (CDM) 协调医院 EHR。该项目还将利用其他 OHDSI 工具进行数据分析和网络集成,以及 R Studio 和 Python。该网络将包括卢旺达多达 15 家医疗机构,其 EHR 数据将与 OMOP CDM 协调。预期结果:这项研究将产生一个技术基础设施,其中 15 家参与的医院和健康中心将在本地 Mac Mini(“数据节点”)上拥有 OMOP CDM 格式的 EHR 数据,以及一组 OHDSI 开源工具。中央服务器或门户将包含参与站点的数据目录,以及用于定义和管理分布式研究的 OHDSI 工具。中央服务器也会整合这些信息
背景观察健康数据科学和信息学(OHDSI)观察性医学结果伙伴关系(OMOP)共同数据模型(CDM)通过将这些不同来源的临床数据进行大规模分析的概念,通过使这些不同的数据模型和共同的辅助数据模型和共同的声音模型进行协调。在多个国家 /地区的多个机构中采用OMOP CDM已使各种疾病领域的跨机构合作有能力产生真实的证据并最终改善患者护理1。为了实现精确医学,它需要将基因组变体整合到CDM中。虽然OHDSI工具和词汇量已经在多个方面开发了,但迄今为止,OMOP词汇的重点是基因组变体(OMOP基因组)的重点,已放置在与癌症临床上相关的基因组变体上。这限制了其他疾病领域和健康人群中精确医学的努力;因此,我们认为改进1)基因组词汇; 2)映射工具对于最大程度地限制此限制很重要。顺便说一句,美国食品和药物管理局(US FDA)已经确定了可互操作基因组数据标准的差距,因此,使用OMOP CDM开发OMOP/GA4GH互操作性框架是战略价值。
如果源数据中没有每日剂量,则可以使用最常见剂量:对于每个源药物概念或源/目标药物概念组合,定义最常见剂量,然后将其应用于缺少剂量的记录。如果根本没有每日剂量,可以使用 ATC DDD(定义每日剂量)作为用于成人主要适应症的药物的假定平均每日维持剂量 4 。该方法在 OHDSI 论坛 5 上进行了讨论,并在口服固体药物上进行了测试。使用另一个合理的估计来评估方法的合理性:根据以下处方计算结束日期并假设服药的最常见持续时间应为 7/30/60/90 天。此外,我们审查了来源中 200 种最常见药物的结果,并得出结论,在大多数情况下,ATC DDD 方法是适用的(例如,来源药物是“氨氯地平 5 毫克口服片”,总量 = 28 片,ATC DDD = 5 毫克 => 计算持续时间 = 28 天)。但是,这种方法有一些局限性。一些药物的剂量不同,适用于不同的治疗目的,例如,阿司匹林作为镇痛药/解热药的剂量为 3 克/天,作为抗血栓剂的剂量为 1 片/天(与强度无关)。
大规模数据,例如电子健康记录和技术工具,例如AI算法,越来越多地用于公共卫生和医学。尽管此类数据资源和工具具有改善临床护理和公共卫生的巨大潜力,而无需仔细关注算法的数据,并且信息学的结论不正确,并且可能会得出建议。数据,信息学,数据科学,社会理论和公平性方面的专业知识对于确保以改善健康和不持续偏见和不平等的最佳方式来利用这些工具至关重要。需要核心生物统计学理论和方法来建立框架和方法来检查和解决数据偏见和健康不平等,对于在该领域工作的生物统计学家至关重要,以深入了解实体环境。同样,需要了解健康和数据权益问题的计算和生物信息学科学家。健康数据信息学和权益集群代表生物统计学系与医学院通用内科医学中生物医学信息学和数据科学的部分之间的伙伴关系。这项倡议将为大学提供健康数据信息学和公平研究的领先研究人员,带来重要的专业知识和观点,使教职员工多样化,并基于现有的优势。它将受益于诸如观察健康数据科学和信息学(OHDSI)开放科学合作,医学上的卓越精准医学中心(PMCOE)项目以及数据科学和AI计划,并将在这个重要界面上突出有影响力的工作。