智能手机已转换为便携式GNSS(全球导航卫星系统)接收器。具有数十亿此类设备记录的GNSS数据具有很大的科学研究潜力,并具有前所未有的时空分辨率。但是,目前访问大型GNSS智能手机数据的访问量是有限的,并且数据处理具有挑战性。Camaliot项目(机器学习技术在GNSS IOT数据融合中的应用)旨在解决这些问题,以促进众包GNSS数据的可用性,以进行天气预报和太空天气监测。Camaliot众包活动中大量的GNSS数据具有异质性的质量。为了应对此数据处理挑战,我们使用机器学习(ML)开发了一种自动数据选择算法。在这项研究中,比较了不同ML模型的分类性能。还检查了不同数据质量指标的重要性。初始结果表明,基于ML的分类器可以在广告系列的实际数据上获得95%的精度,而无需为质量指标设置明确的阈值。基于选定的智能手机GNSS数据,也进行了对流层参数估计实验。
地球系统模型(ESM)对于理解过去,现在和未来的气候至关重要,但它们遭受了旧式技术基础设施的困扰。ESM主要在Fortran中实施,该语言为早期职业科学家带来了很高的入境障碍,并且缺乏GPU运行时,随着GPU功率的增加和CPU缩放缩放的速度,这对于继续前进至关重要。fortran也缺乏可不同的性能 - 通过数值代码区分的能力 - 可以实现整合机器学习方法的混合模型。将ESM从Fortran转换为Python/JAX可以解决这些问题。这项工作提出了一种半自动化的方法,该方法使用大语言模型(GPT-4)将单个模型组件从Fortran转换为Python/Jax。通过从社区地球系统模型(CESM)中转换光合作用模型,我们证明了Python/JAX版本使用GPU并行化最多可快速运行时间,并通过自动差异启用参数估计。Python代码也易于阅读和运行,教室的讲师可以使用。这项工作说明了通往快速,包容和可区分气候模型的最终目标的途径。
校准模拟是使用现有的建筑模拟计算机程序并“调整”或校准程序的各种输入的过程,以便观察到的能源使用情况与模拟程序预测的能源使用情况密切匹配。采用这种方法的两个主要原因是它允许 (1) 更可靠地识别现有建筑中的节能和需求减少措施(涉及设备、操作和/或控制变化)和 (2) 在实施这些措施后增强对监测和验证过程的信心。从历史上看,校准过程是一种艺术形式,不可避免地依赖于用户知识、过去的经验、统计专业知识、工程判断和大量的反复试验。尽管专业界对此有广泛的兴趣,但不幸的是,尚未发布关于如何使用详细的模拟程序进行模拟校准的共识指南。ASHRAE 发起了一项研究项目 (RP-1051),旨在从现有研究成果中筛选出最佳工具、技术、方法和程序,并开发一种连贯而系统的校准方法,其中包括“参数估计”和校准模拟中不确定性的确定。本文对校准模拟技术进行了中肯而详细的文献综述,描述了它们的优点、缺点和适用性,从而作为在后续论文中报告研究项目结果的先行者。
摘要:在微机电系统 (MEMS) 中,高整体精度和可靠性测试至关重要。由于对运行效率的额外要求,近年来人们一直在研究机器学习方法。然而,这些方法通常与不确定性量化和可靠性保证方面的固有挑战有关。因此,本文的目标是提出一种基于贝叶斯推理的 MEMS 测试新机器学习方法,以确定估计是否可信。使用四种方法评估整体预测性能以及不确定性量化:贝叶斯神经网络、混合密度网络、概率贝叶斯神经网络和 BayesFlow。在训练集大小变化、不同加性噪声水平和分布外条件(即 MEMS 设备的阻尼系数变化)下对它们进行研究。此外,还评估和讨论了认知和随机不确定性,以鼓励在部署之前彻底检查模型,力求在 MEMS 设备的最终模块测试期间进行可靠和有效的参数估计。 BayesFlow 在预测性能方面始终优于其他方法。由于概率贝叶斯神经网络能够区分认知不确定性和随机不确定性,因此它们在总不确定性中所占的份额已得到深入研究。
在过去的几十年中,血液动力学模拟量已经稳步发展,并且已成为研究心血管系统中的选择工具。通常使用此类工具从生理参数中模拟全身血液动力学,但解决了将波形映射回到合理的生理参数的相应反问题仍然是诺言和具有挑战性的。受基于仿真推理(SBI)进展的动机,我们将此反问题作为统计推断。与替代方法有关,SBI为互动的参数提供了分布,为单个测量值提供了不确定性的多维表示。我们通过对五个临床兴趣的生物标志物进行近距离的不确定性分析来展示这种能力,并比较了几种测量模态。除了对已知事实的佐证(例如估计心率的可行性)之外,我们的研究突出了从护理标准测量值中估算新生物标志物的潜力。sbi揭示了实际相关的发现,这些发现无法通过标准灵敏度分析来捕获,例如,参数估计表现出不同的不确定性状态的亚种群的存在。最后,我们研究了与模拟波形数据库的体内和silico之间的差距,并批判性地讨论了心血管模拟如何为真实世界数据分析提供信息。
机器学习简介。必需图书馆和工具(Scipy,Numpy,Pandas,Graphviz,Seaborn,Matplotlib软件包)。学习类型 - 受监督和无监督的学习。问题类型 - 回归,分类和聚类;机器学习的应用。讨论关键概念,例如成本函数,优化 - 梯度下降算法。采样,决策界限,模型不合适和过度拟合以及偏见变化权衡,成本敏感模型,电感偏见。贝叶斯学习:概率的基础,贝叶斯规则,生成与判别模型,贝叶斯规则 - 参数估计,最大似然。监督学习:解决回归问题 - 线性回归,正则化 - 脊和拉索。解决分类问题 - 逻辑回归,SVM,决策树。合奏 - 决策森林,包装和增强。无监督的学习:聚类-DBSCAN和桦木。异常检测 - 密度估计。加强学习简介。通过主成分分析缩小维度,内核主成分分析。人工神经网络简介。模型验证和选择:准确性,置信区间,混淆矩阵,精度,召回和其他指标,超参数调整,交叉验证,引导程序和ROC曲线,R平方等等。模型部署 - 在基于云的服务器中部署机器学习模型。
生物统计学 BIOS 6310 实用临床研究信息学 3.0 学分。限制:分期和年限提供。本课程为学生提供临床研究信息学的实践经验,涉及电子健康记录 (EHR) 数据的二次使用、临床信息学数据库和工具以及基础临床数据科学,为更高级的信息学或数据科学课程做准备。BIOS 6420 连续临床数据的数据科学和分析 3.0 学分。与 BIOE 5420 交叉列出。限制:分期和年限提供。先决条件:微积分、概率论、线性代数、一些微分方程、生理学、回归和信号处理知识、Matlab、Python 或 R 编程。本课程的核心重点是临床或生物医学环境中收集的数据的生成、建模和分析,重点是时间分析。分析技术将以解决现实世界的临床和生物医学问题为基础。 BIOS 6601 应用生物统计学 I 3.0 学分(夏季、秋季)应用生物统计学方法,包括描述性和统计推断;优势比和相对风险、概率论、参数估计、比较两组或多组统计数据的检验、相关性和线性回归以及概述:多元和逻辑回归和生存分析。
摘要:由于存在大量不同的配置,因此调整刺激参数是深部脑刺激 (DBS) 治疗中的一项挑战。因此,基于特定刺激设置产生的组织激活体积 (VTA) 可视化的系统已经开发出来。然而,医疗专家仍然必须通过反复试验来寻找产生所需 VTA 的 DBS 设置。因此,我们的目标是为当前的临床设备开发一种 DBS 参数调整策略,以便在生物物理上可行的约束下定义目标 VTA。我们提出了一种机器学习方法,可以估计给定 VTA 的 DBS 参数值,该方法包括两个主要阶段:i) 基于 K 近邻的变形,以定义保留生物物理上可行约束的目标 VTA。ii) 参数估计阶段,包括使用度量学习突出显示相关 VTA 属性的数据投影,以及用于估计生成目标 VTA 的 DBS 参数的回归/分类算法。我们的方法允许设置符合生物物理的目标 VTA,并准确预测所需的刺激参数配置。此外,我们的方法的性能对于各向同性和各向异性的组织电导率都是稳定的。此外,经过训练的系统的计算时间对于现实世界的实现是可以接受的。
摘要 - 系统识别为表征和控制复杂系统的表征带来了重要的瓶颈。当系统状态和参数都无法直接访问时,这是最大的,导致双重估计问题。当前解决此类问题的方法在Net Works中经常发生的多参数系统的扩展能力受到限制。在当前工作中,我们提出了一种新的计算有效方法来处理大型双重估计问题。在这项工作中,我们得出了预测错误方法的分析后传播梯度,该方法可以有效,准确地识别大型系统。PEM方法包括将状态估计直接整合到双重优化目标中,仅在未知系统参数方面留下可区分的成本/错误函数,我们使用数值梯度/HESSIAN方法求解。直觉,此方法包括求解生成最精确状态估计器(扩展/cubature Kalman滤波器)的参数。我们证明,尽管复杂性较低,但在状态和参数估计中至少与关节Kalman过滤器(Excent/Unnesped/Cubature)和期望最大化一样准确。我们通过从人类磁脑摄影(MEG)数据中反转解剖学的个性化脑模型来证明我们的实用性。
表48:在研究CBGJ398X2204接受Impigratinib的患者中,选择实验室异常(≥10%)的情况恶化(临时分析1组的临时分析集2)值(研究CBGJ398X2204研究组1:基线和基线后ECG评估的受试者)..................................................................................................................................................................................................................................................................................................................................................................................................................... 186表51:亚组的总摘要 - 研究CBGJ398X2204 Interim分析2 in Interim for COHORT 1)。首选项和亚组发生在所有受试者中≥10%的新出现不良事件(研究CBGJ398X2204临时分析集2群体1)Impigratinib临床研究中生物分析方法性能的摘要。........ 222表55。根据制剂的剂量归一化描述性PK摘要,基于5个健康志愿者研究CBGJ398X2103,CBGJ398A2104,CBGJ398A2105,CBGJ398A2105,CBGJ398A2106,QBGJ398-1098-109-109。在通过在健康志愿者研究中的制剂中,剂量归一化AUC活性(μm*h/mg)的描述性统计。........................................................................................................ 227 Table 57.................................................................................................................................................................................................................................................................................在C1D1和C1D15上口服Impigratinib 125 mg(FMI -I -I,FMI -III和FMI -IV)口服Imprigratinib 125 mg(FMI -I,FMI -III和FMI -IV)后,Impigratinib C Max的模拟几何平均值(CV%)的摘要。...................................................................................................................... 227 Table 58.包括用于人群PK分析的研究。............................................................. 229 Table 59.数据集中基线人口统计学特征和实验室值的摘要。..................................................................................................................................... 232 Table 60.分析物分层的临时数据集2(2020年3月截止)中的人口PK分析的样本数量。..................................................................................................... 233 Table 61.参数估计和最终Inpigratinib种群PK模型的SE。最终BHS697人口PK模型的参数估计值和SE。.........................................................................................................................................................................................最终CQM157人口PK模型的参数估计和SE。.......................................................................................................................................................研究2204中每个器官损伤类别的AUC Geomean与正常肝/肾功能的比率。........................................................................................ 237 Table 65.研究2204中的肝损伤类别的模拟暴露的几何平均值。................................................................... 240 Table 68......................................................................................... 238 Table 66.在研究2204的肾功能障碍类别中,在125、100和75 mg处的模拟暴露的几何平均值。............................................................................................................ 238 Table 67 Geometric Mean of Simulated AUC 0‐24h Activity and Infigratinib C max at 50, 75, 100, 125 mg by Organ Impairment Category in Study 2204.包括用于E -R分析的研究。............................................................................. 245 Table 69.最后剂量中数据集中基线人口统计学特征的摘要。..... 246表70。通过研究中数据集中有药代动力学观察的患者的基线人口统计学特征摘要。........................................................... 250 Table 71: Distribution of FGFR2 Fusions or other Rearrangements per Local and/or Central Testing (N=108) ......................................................................................................................... 254