摘要机器学习(ML)基于基于地球系统模型(ESM)的参数化,其目标是更好地表示子网格尺度过程或加速计算。杂种ESM中的基于ML的参数化已从短高分辨率模拟中成功地学习了亚网格尺度过程。但是,大多数研究都使用特定的ML方法来参数化基因趋势或通量,该趋势源自主要是理想化的设置或超级参数的各种小规模过程(例如,辐射,对流,重力波)的复合效应(例如,辐射,对流,重力波)。在这里,我们使用过滤技术将对流与这些过程在逼真的环境中使用二十面体非静液压建模框架(ICON)明确分开,并在逼真的环境中对彼此之间的各种ML算法进行基准测试。我们发现,在表现出最佳的离线性能的同时,一条未能的U型NET学习了对流降水与亚网格通量之间的反向因果关系。尽管我们能够将U -NET的学习关系与物理过程联系起来,但对于非深度学习的梯度增强了树是不可能的。然后将ML算法在线耦合到主机图标模型。我们最好的在线性能模型,一种消融的U型NET,不包括沉淀示踪剂物种,表明与传统方案相比,与高分辨率模拟相比,模拟降水极端的一致性和平均值具有更高的一致性。但是,在水蒸气路径和平均沉淀中都引入了平滑偏置。我们的结果暗示了可能通过混合ESM显着减少系统错误的潜力。在线,与未驱动的U -NET相比,融合的U -NET显着提高了稳定性,并且在整个模拟期内运行稳定。
本文涵盖了Jovian血浆动力学和组成分析仪(JDC)的开发和校准。JDC与五个其他传感器一起是粒子环境包(PEP)的一部分,这是欧洲航天局的木星冰卫星(JUICE)任务的有效载荷之一。果汁任务旨在扩大我们对Jovian系统的理解,其中包括木星,四个Galilean Moons(IO,Europa,Ganymede和Callisto)和木星的巨大磁场。果汁计划于2023年推出。PEP有效载荷将详细研究木星及其卫星周围的等离子体环境。作为PEP的传感器之一,JDC将测量阳性和负离子的能量分布以及能量范围内的电子的能量分布,从几个EV / Q到35 keV / q。JDC覆盖的视野跨越了整个半球。JDC还使用旋转原理确定颗粒的质量。替代,有可能确定粒子到达时间的分布以研究其在时域中的分布。在本论文中,提出并讨论了本论文,离子光学,机械,电气,热,辐射屏蔽和仪器操作相关的设计解决方案。特别注意用作频道电子乘数的性能,用作启动探测器。为了在整个任务中验证其性能,对这些探测器进行了完整的终身测试。由于该测试而开发了通道电子乘数的定性性能模型。这项工作中包括的另一个实验是确定JDC内部残留气压演化。安全操作JDC高压系统需要一个非常低的残余气压。最后,使用专用原型验证了JDC线性电场的性能。这项工作的最后一部分描述了用于仪器校准的方法,并描述了JDC的备用备用模型的校准的第一个结果,JDC(将会将其转向木星的单元)进行了校准。
在智利的气候下评估了耦合模型间比较项目6(CMIP6)下36个新状态的合奏 - 艺术气候模型的抽象降水和近表面温度。分析集中在四个不同的气候子区域:北智利北部,智利中部,巴塔哥尼亚北部和巴塔哥尼亚南部。在每个子区域上,首先,我们评估了整个全球气候模型(GCM)的性能,以在历史时期(1986- 2014年)(1986- 2014年)中的降水和温度观测的栅格数据集,然后分析模型的预测,即对于四个不同的共享社会经济路径(2080-2099)(2080-2099)(2080-2099)。尽管模型的特征是一般湿和温暖的平均偏见,但它们实际上是不同子区域的主要时空气候变异性。但是,对于降水和温度,所有模型均不是所有子区域中最好的。是根据泰勒技能得分定义的最佳性能模型,人们发现所谓的“热模型”可能表现出高估的气候灵敏度,这表明使用这些模型来访问智利未来的气候变化时要谨慎。我们发现,在变化方向上有强大的(90%的模型在变化方向上达成共识)预计中央智利平均降水量减少(〜-20至〜-40%)和北部的巴塔哥尼亚北部(〜-10至10至〜-30%)(〜- 10至〜-30%),在情景SSP585下,在SPSSP245上的变化在SPSSP245上的变化很大。北部智利和南部巴塔哥尼亚南部显示了整个模型中降水的不变变化。然而,未来的近表面温度变暖呈现了整个子区域的高模块间一致性,其中最大的增量发生在安第斯山脉沿线。北部智利在SSP585中显示出最大〜6°C的最大增量,然后是中央智利(最高〜5°C)。北部和南部的巴塔哥尼亚均显示出相应的增量,高达〜4°C。我们还简要讨论了这些未来变化对智利的环境和社会经济含义。
2014 年秋天,我正在寻找一个能结合我的航空航天和计算机科学背景的博士学位论文主题。代尔夫特理工大学的一份提案中,“开放”、“数据挖掘”和“飞机”这些关键词引起了我的注意,我立即决定提交申请。半年后一个寒冷的春日早晨,我加入了代尔夫特理工大学的航空航天工程系。Hoekstra 教授和 Ellerbroek 博士热烈欢迎了我,并向我介绍了系里、同事、研究和 BlueSky 项目。第一天的最后一站——学院的 De Atmosfeer 酒吧——无疑证实了我的选择正确。这篇论文记录了我过去四年的进展和发现。它本质上回答了一个问题:我们如何使用开放数据来建模和估计飞机性能?大多数章节都基于我自 2016 年以来发表的期刊文章和会议论文集。我攻读博士学位的主要目标是……我的研究目标是建立一个开放的飞机性能模型。因此,这篇论文中产生的模型和工具是共享的,我很自豪其中一些开源工具已经被其他研究人员采用。这四年的旅程一开始似乎很长,但现在它接近终点线,感觉时间短了很多。我要感谢我的推动者 Hoekstra 教授和 Ellerbroek 博士,他们给予了我极大的支持和宝贵的指导。我要感谢 Blom 教授和 Ir. Vû,他们提供了很好的想法并共同撰写了这篇论文的一些章节,也要感谢我的博士委员会成员对这篇论文的有益评论和建议。我还要感谢控制与模拟系的所有同事,特别是感谢我们在咖啡角分享的所有鼓舞人心的哲学对话。最后要感谢我的妻子玛丽,她花了很多时间校对我的论文和这篇论文的文体,并改进了文体。最后,我觉得她可能已经秘密掌握了所有这些 ADS-B 知识。就我个人而言,我非常感谢父母从小就对我追求科学的热爱、支持和鼓励。在我攻读博士学位期间,我也非常幸运地爱上了玛丽并与她结婚,并迎来了我的儿子威廉。
摘要 — 捕获离子 (TI) 是构建嘈杂中型量子 (NISQ) 硬件的主要候选者。TI 量子比特与超导量子比特等其他技术相比具有根本优势,包括高量子比特质量、相干性和连通性。然而,当前的 TI 系统规模较小,只有 5-20 个量子比特,并且通常使用单个陷阱架构,这在可扩展性方面存在根本限制。为了向下一个重要里程碑 50-100 量子比特 TI 设备迈进,提出了一种称为量子电荷耦合器件 (QCCD) 的模块化架构。在基于 QCCD 的 TI 设备中,小陷阱通过离子穿梭连接。虽然已经展示了此类设备的基本硬件组件,但构建 50-100 量子比特系统具有挑战性,因为陷阱尺寸、通信拓扑和门实现的设计可能性范围很广,并且需要满足不同的应用资源要求。为了实现具有 50-100 个量子位的基于 QCCD 的 TI 系统,我们进行了广泛的应用驱动架构研究,评估了陷阱大小、通信拓扑和操作实现方法等关键设计选择。为了开展研究,我们构建了一个设计工具流,该工具流以 QCCD 架构的参数作为输入,以及一组应用程序和真实的硬件性能模型。我们的工具流将应用程序映射到目标设备上并模拟其执行以计算应用程序运行时间、可靠性和设备噪声率等指标。使用六个应用程序和几个硬件设计点,我们表明陷阱大小和通信拓扑选择可以将应用程序可靠性影响多达三个数量级。微架构门实现选择将可靠性影响另一个数量级。通过这些研究,我们提供了具体的建议来调整这些选择,以实现高度可靠和高性能的应用程序执行。随着业界和学术界努力构建具有 50-100 个量子比特的 TI 设备,我们的见解有可能在不久的将来影响 QC 硬件并加速实用 QC 系统的进程。
2014 年秋天,我正在寻找一个可以结合我在航空航天和计算机科学领域的背景的博士论文主题。开放、数据挖掘和飞机等关键词在代尔夫特理工大学的一份提案中引起了我的注意,我立即决定提交申请。半年后一个寒冷的春日早晨,我加入了代尔夫特理工大学的航空航天工程系。Hoekstra 教授和 Ellerbroek 博士热情地欢迎了我,并向我介绍了系里、同事、研究和 BlueSky 项目。第一天的最后一站——学院的 De Atmosfeer 酒吧——无疑证实了我的选择是正确的。这篇论文记录了我过去四年的进步和发现。它本质上回答了一个问题:我们如何使用开放数据来建模和估计飞机性能?大多数章节均基于我自 2016 年以来发表的期刊文章和会议论文集。我博士研究的主要目标是建立一个开放的飞机性能模型。因此,本论文中产生的模型和工具是共享的,我很自豪其中一些开源工具已经被其他研究人员采用。这段四年的旅程一开始似乎很长,但现在接近终点线时肯定会感觉短得多。我要感谢我的推动者 Hoekstra 教授和 Ellerbroek 博士,他们给予了我极大的支持并提供了宝贵的指导。我要感谢 Blom 教授和 Ir。Vû 提供了很好的想法,并参与撰写了这篇论文的部分章节,同时感谢我的博士委员会成员对这篇论文提出的有益评论和建议。我还要感谢控制与模拟系的所有同事,特别是我们在咖啡角分享的所有鼓舞人心的哲学对话。最后感谢我的妻子 Marie,她花了很多时间校对我的论文和这篇论文的文体并加以改进。最后,我觉得她可能已经秘密掌握了所有这些 ADS-B 的东西。就我个人而言,我非常感谢父母从小就对我追求科学的热爱、支持和鼓励。在我攻读博士学位期间,我非常幸运地爱上了玛丽并与她结婚,还迎来了我的儿子威廉。
鉴于它们能够用宽阔和狭窄的自然光谱杀死细菌,因此在开发新药物来打击抗生素耐药性的新药中,出现了使用细菌素的使用。因此,对于可以准确预测新型细菌蛋白的精确且有效的计算模型产生了令人信服的要求。机器学习能够从细菌素序列中学习模式和特征的能力,这些序列很难使用基于序列匹配的方法捕获,这使其成为准确预测的潜在优越选择。使用机器学习方法,在本研究中创建了用于预测细菌素的Web应用程序。使用交替决策树(ADTREE),遗传算法(GA)和线性支持向量分类器(线性SVC)基于基于的特征评估方法选择了应用程序中使用的功能集。最初,从细菌蛋白和非细菌蛋白蛋白序列的物理化学,结构和序列属性属性中提取了潜在特征。我们使用Pearson相关系数评估了候选人的特征,然后对Adtree,GA和Lineare SVC进行了单独的评估,以消除不必要的特征。最后,我们构建了随机森林(RF),支持向量机(SVM),决策树(DT),Logistic回归(LR),K -Neart -Neart Neirbors(KNN)和GaussianNaïve的贝叶斯(GNB)模型,使用功能集降低。,我们使用具有ADTREE还原功能的SVM获得了总体性能模型,在测试数据集中获得了99.11%的精度,AUC值为0.9984。我们还评估了相对于我们先前开发的软件解决方案,一种基于序列对齐的工具和深度学习方法,每个还原功能集的最佳模型的预测能力。开发了一种标题为BPAGS(基于ADTREE,GA和Linear SVC的细菌素预测)的Web应用程序,以合并使用ADTREE,GA和基于线性SVC的特征集构建的预测模型。当前,基于Web的工具提供了具有关联概率值的分类结果,并具有在培训数据中添加新样本以提高预测效率的选项。bpags可以在https://shiny.tricities.wsu.edu/bacteriocin-预测中自由访问。
在当前的麻醉学实践中,麻醉师推断出无意识状态,而无需直接监测大脑。药物和患者特异性的脑电图(EEG)特定的麻醉引起的潜意识的特征已被鉴定。我们将机器学习方法应用于构建分类模型,以在麻醉引起的无意识期间对无意识状态的实时跟踪。我们使用交叉验证选择和训练最佳性能模型,使用33,159 2S段的脑电图数据记录在7位健康志愿者中,他们收到了丙泊酚越来越多的兴奋剂,同时响应刺激,以直接评估无意识。在相同条件下收集的3个剩下的志愿者(中位志愿者AUCS 0.99-0.99)对13,929 2s EEG段进行测试时,的交叉验证模型表现出色。 模型在对27名手术患者的队列进行测试时显示出强烈的概括,这些手术患者在不同的情况下仅接受单独的临床数据集中收集的丙泊酚,并使用不同的硬件(中位患者AUC 0.95-0.98),并在病例中采取了模型预测,并采取了模型预测。 对17例接受七氟醚(单独或除丙泊酚之外)的患者的表现也很强(AUC中位数为0.88-0.92)。 这些结果表明,即使对具有类似神经机械的不同麻醉剂进行测试,EEG光谱特征也可以预测不同意性。的交叉验证模型表现出色。模型在对27名手术患者的队列进行测试时显示出强烈的概括,这些手术患者在不同的情况下仅接受单独的临床数据集中收集的丙泊酚,并使用不同的硬件(中位患者AUC 0.95-0.98),并在病例中采取了模型预测,并采取了模型预测。对17例接受七氟醚(单独或除丙泊酚之外)的患者的表现也很强(AUC中位数为0.88-0.92)。这些结果表明,即使对具有类似神经机械的不同麻醉剂进行测试,EEG光谱特征也可以预测不同意性。有了高性能的无意识预测,我们可以准确地监测麻醉状态,并且该方法可用于设计输液泵,以对患者的神经活动有明显的反应。
肯尼亚的车辆数量每年以12%的速度增长,截至2018年,国家注册舰队为400万。所有这些车辆都必须定期估值,原因是多种原因不限于保险,转售,租赁和会计。因此,重要的是要有一个易于使用,可靠,易于使用的系统,该系统可以确定车辆的价值,并给出有关该车辆的某些特性。从不同估值师获得的相同车辆获得的值的变化暴露了当代汽车估值系统中的违规行为。在需要快速汽车估值服务时,缺乏一致,准确且随时可用的工具来执行所需的估值,因为获得估值的汽车的主要方法是与有执照的评估公司或保险代理商的专家联系。现有的汽车估值机制主要依靠专家意见和使用公式来计算二手车的复合年度折旧,该折旧是从0英里处的价格中减去的,多年来根据通货膨胀进行了调整。已经尝试通过使用机器学习来自动化车辆估值,这产生了令人鼓舞的结果。已采用多元回归分析来确定对车辆值最大的车辆性质,并预测不同参数的给定值。这种方法也已成功地用于其他领域,以估计土地和FMCG等资产。在这项研究中,采用多代理系统体系结构封装了三个用于车辆价值预测的回归模型,以及一种自然语言处理模型,以从非结构化文本中从车辆描述中提取车辆功能。构建和培训了这三个模型以生成预测,每个模型都利用了基于SVM的回归和神经网络(ANN)在WEKA中的实现,或者在WEKA中实现了,或WekadeEplearning 4J版本3.8.5提供的深度学习回归。最佳性能模型为车辆估值提供了可靠的选择,其相对平均误差为11%,仅在可能的200,000条记录中接受了1000行数据的培训,因此被用于功能原型的设计。鉴于这项研究的时间,预算和计算资源限制,在给定时间,数据和计算能力的情况下,提高预测模型的性能有很大的潜力。
背景:心脏手术相关的急性肾损伤(CSA-AKI)是儿科心脏手术后的主要并发症,这与发病率和死亡率的增加有关。手术前后对CSA-AKI的早期预测可以显着改善围手术期间的预防和治疗策略的实施。但是,关于如何识别CSA-AKI高风险的小儿患者的临床信息有限。目的:该研究旨在开发和验证机器学习模型,以预测儿科人群中CSA-AKI的发展。方法:这项回顾性队列研究招募了1个月至18岁的患者,他们在中国南部南大学的3个医学中心接受了心肺旁路手术。CSA-AKI是根据2012年肾脏疾病的定义:改善了全球结果标准。特征选择分别应用于2个数据集:术前数据集以及术前和术中数据集。测试了多个机器学习算法,包括K-Nearest邻居,天真的贝叶斯,支持向量机,随机森林,极端梯度增强(XGBoost)和神经网络。通过使用接收器操作特征曲线(AUROC)下的区域(AUROC),在交叉验证中确定了最佳性能模型。使用Shapley添加说明(SHAP)方法生成模型解释。结果:其中一个中心的3278名患者用于模型推导,而另外2个中心的585例患者用作外部验证队列。CSA-AKI发生在衍生队列中的564例(17.2%)中,外部验证队列中的51例(8.7%)患者发生。在考虑的机器学习模型中,XGBoost模型在交叉验证中实现了最佳的预测性能。仅使用术前变量的XGBoost模型的AUROC为0.890(95%CI 0.876-0.906),在外部验证队列中为0.857(95%CI 0.800-0.903)。包括术中变量时,AUROC分别增加到0.912(95%CI 0.899-0.924)和0.889(95%CI 0.844-0.920)。Shap方法表明,基线血清肌酐水平,灌注时间,身体长度,手术时间和术中失血是CSA-AKI的前5个预测因子。结论:可解释的XGBOOST模型为CSA-AKI的早期预测提供了实用的工具,CSA-AKI对于正在进行心脏手术的小儿患者的风险分层和围手术期管理非常有价值。