使用现实世界数据了解治疗对健康相关结果的影响需要定义因果参数并施加相关识别假设,以将其转化为统计估计。半参数方法,例如目标最大似然估计器(TMLE),以构建这些参数的渐近线性估计器。要进一步建立这些估计量的渐近效率,必须满足两个条件:1)数据可能性的相关组成部分必须属于Donsker类,而2)2)滋扰参数的估计值在其真实值的速度上以比N -1 /4更快的速度收敛。高度适应性的拉索(HAL)通过在具有有界分段变化标准的Càdlàg函数中充当经验风险最小化来满足这些标准,已知是Donsker。hal达到了所需的收敛速度,从而保证了估计量的渐近效率。HAL最小化其风险的功能类别具有足够的灵活性,可以捕获现实的功能,同时保持建立效率的条件。此外,HAL可以对非方向可区分参数(例如条件平均治疗效果(CATE)和因果剂量响应曲线,对精确健康很重要。尽管在机器学习文献中经常考虑这些参数,但这些应用通常缺乏适当的统计推断。HAL通过提供可靠的统计不确定性量化来解决这一差距,这对于健康研究中的知情决策至关重要。
单元1:数学和统计基础演算:函数限制,连续性,可不同,连续分化的概念,Liebnitz Theorem,渐近线,确定的积分,降低公式,普通微分方程的顺序和程度,线性微分方程,线性微分方程具有恒定系数和laplace的恒定差异。代数:映射,组,亚组,矩阵,矩阵的基本操作,矩阵倒数,矩阵在线性方程系统中的应用,向量空间,线性变换及其矩阵表示。分析开放集,闭合集,限制,连续性,泰勒定理,拉格朗日的平均定理,罗尔定理,序列和系列,串联的收敛。概率分布:二项式,泊松和正常分布的基础知识及其在生物学中的应用。随机变量;离散且连续的概率分布,概率质量函数,概率密度函数,数学期望。几何平面,直线,球体,锥体,圆柱体,圆锥体。单元2:化学在生物信息学动力学中的作用,原子结构,周期性特性,化学键合,有机化合物中电子的分布。自然平衡,化学动力学,P和D块元素,立体化学,构型异构主义,对称性元素,手性。界面特性,热力学,第一过渡系列元素的化学性质,配位综合,有机金属化合物,Alicyclic化合物酯酯包括活性甲基元素,芳族化合物,核化合物,核化合物,零组元素,相位元素,相位规则和电化学。