记录版本:该预印本的一个版本于 2022 年 1 月 20 日在 Scienti¦c Reports 上发表。已发表的版本请参阅 https://doi.org/10.1038/s41598-022-04938-0 。
... ....................................................................................................................... 17 Imputing Income from Assets ............................................................................................... 18 The passbook interest rate for MSHDA is 0.09%.PERIODIC PAYMENTS ............................................................................................... 23
不规则的时间序列在医疗保健中无处不在,应用程序从预测患者的健康状况到归咎于缺失值的应用。条件扩散模型中的最新开发方法,这些模型基于观察到的数据预测缺失值,对定期定期时间序列的构成有很大的希望。它还通过用注入可变量表的噪声替换部分掩盖的局部掩盖来概括了掩盖重建的自我监督学习任务,并显示了图像识别的竞争结果。尽管对扩散模型的兴趣日益增强,但它们对不规则时间序列数据的潜力,尤其是在下游任务中,仍然没有被逐渐置换。我们提出了一个有条件的扩散模型,该模型设计为一种自我监督的学习骨干,用于此类数据,集成了可学习的时间嵌入以及一种跨维度注意机制,以解决数据的复杂时间动态。该模型不仅适合有条件的生成任务,而且还获得了隐藏的状态,对歧视任务有益。经验证据证明了我们的模型在插补和分类任务中的优势。
∗相应的作者关键字:纵向缺失数据,多发性硬化症,多个插入,关节建模插图摘要。多发性硬化症(MS)是一种慢性疾病,其特征是神经功能(运动,感觉,视觉和认知)的进行性或替代性损害。通过概率和时间依赖的方法预测疾病进展可能有助于提出可能延迟疾病进展的干预措施。但是,从不规则收集的纵向数据中提取信息知识很困难,缺少数据构成了重大挑战。MS进展,该状态量表(EDSS)随着时间的推移量化MS中的残疾。EDSS评估八个功能系统(FS)中的损伤。经常,仅报道了临床医生分配的EDSS分数,而FS子得分则缺失。推出这些分数可能很有用,尤其是根据患者对疾病进展的表型进行分层的分层。这项研究的目的是i)探索用于归类缺失FS子得分的不同方法,ii)使用完整的临床数据预测EDSS评分。结果表明,指数加权的移动平均值达到了丢失的数据插图任务中最低的错误率;此外,预测任务的归纳和SVM的分类和回归树的组合获得了最佳准确性。
为提高医疗保健质量,早期疾病预测有助于患者在为时已晚之前预防潜在的威胁生命的健康问题。人工智能是一个迅速发展的领域,其应用于糖尿病(一种全球流行病)有可能改变诊断和管理糖尿病的方式。使用了基于患者数据的六种监督机器学习算法,并比较预测糖尿病的诊断。用于实验,使用了PIMA Indians糖尿病数据库,并通过不同的技术仔细处理其缺失值。对于随机的火车测试拆分,随机森林分类算法的准确率为92%。由于应用了用于处理缺失值的技术组合(插入缺失值技术的混合),因此该模型优于其他最先进的方法。使用这种手稿的模型比对PIMA糖尿病数据进行的先前工作的准确性更好。
•在国家 /地区级别:对于构成该汇总总数的任何基本组件,在所使用的基本数据集中正式记录正式的实际价值时,将归为零。因此,“ 0.0”可以代表Na或真正的0.0,或(至关重要的)两者的组合,这是一个常见的情况。这允许易于将值进一步汇总;但是,应该指出的是,由于将缺失值归因为“ 0.0”,聚合可能代表的值低于实际情况。•在区域和全球层面上:同样,在区域和全球聚合中,缺失值被归因为零。但是,如果在特定国家完全没有数据可用的情况下,人均和人GDP估计值是可用数据的加权平均值。4.G. 区域聚合(reg_agg)4.G.区域聚合(reg_agg)
•在国家 /地区级别:对于构成该汇总总数的任何基本组件,在所使用的基本数据集中正式记录正式的实际价值时,将归为零。因此,“ 0.0”可以代表Na或真正的0.0,或(至关重要的)两者的组合,这是一个常见的情况。这允许易于将值进一步汇总;但是,应该指出的是,由于将缺失值归因为“ 0.0”,聚合可能代表的值低于实际情况。•在区域和全球层面上:同样,在区域和全球聚合中,缺失值被归因为零。但是,在某个特定国家完全没有数据的情况下,那么可用数据的人均和PER估计值是加权的平均值。4.G. 区域聚合(reg_agg)4.G.区域聚合(reg_agg)
在意大利,这些问题尤其重要,因为它们构成了 BES(公平和可持续福祉)指标的基础,而这些指标是政府经济和财政规划文件(Istat,2024)的基础。值得注意的是,这些指标中很大一部分基于调查数据,如果不解决不完整或缺失的答复,这些数据很容易不准确和不可靠。人工智能的应用,特别是机器学习 (ML) 和深度学习 (DL),为解决调查中缺失数据的问题提供了一种有希望的解决方案。可以采用此类方法来预测和估算缺失值,从而提高统计数据集的整体质量。传统技术(例如平均值或中位数估算)经常会引入偏差,而基于人工智能的方法可以促进更精确和公正的估计。可以使用多种机器学习和深度学习模型来估算健康和环境统计数据中的缺失数据。
单细胞基因组学是研究大脑等异质组织的有力工具。然而,人们对遗传变异如何影响细胞水平基因表达的了解甚少。为了解决这个问题,我们将单核、多组学数据集统一处理成一个资源,该资源包含来自 388 个人的前额叶皮层的 280 多万个细胞核。对于 28 种细胞类型,我们评估了基因家族和药物靶标之间表达和染色质的群体水平变化。我们确定了 55 万多个细胞类型特异性调控元件和 140 多万个单细胞表达数量性状位点,我们用它们来构建细胞类型调控和细胞间通讯网络。这些网络体现了衰老和神经精神疾病中的细胞变化。我们进一步构建了一个综合模型,准确推断单细胞表达并模拟扰动;该模型优先考虑了约 250 种疾病风险基因和与相关细胞类型的药物靶标。