正在通过病历和患者生成的数据生成大量医疗数据;但是,这些健康数据集的独特性质产生了计算挑战,使机器学习和因果推断变得困难。由于从单个患者收集的数据仅取决于患者护理,因此它创造了一种充满挑战的情况,在这种情况下,不同的患者可以测量不同的变量,这对于因果发现会导致混淆和缺乏概括。此外,虽然模拟解决了评估算法的核心挑战,因为它具有基础真理,并且可以在没有隐私问题的情况下共享,但当前模型要么提供了过度乐观的机器学习任务性能估计值,或者不允许在数据属性上消融研究如何影响其黑匣子的性能,从而限制了他们在健康中的广泛应用。在本文中,我通过为(i)数据模拟开发新方法来应对这些挑战,该方法模拟生成具有与真实数据相似的模拟数据,并可以在它们中编码的各种数据属性[1]和(ii)学习因果模型时,当我们拥有多个具有部分重叠变量集的数据集时[2]。此外,本论文还专注于通过仅使用连续记录的生理信号[3]引入新技术来帮助临床医生更好地监测患者的健康,并帮助2型糖尿病患者通过调整基于模拟的餐食检测方法来更好地跟踪饮食场合,从而对患者的健康进行解决。
主要关键词