这项工作探讨了孟加拉国降水模式的详细研究,特别着重于使用马尔可夫链在六个沿海城市进行年度降雨变化。为了创建具有四个不同降水状态的强大马尔可夫链模型,并提供了对这些状态之间过渡概率的洞察力,该研究将历史降雨数据整合到了近三十年(1994- 2023年)。为选定数量的沿海电台计算了固定测试统计量(χ²),并使用此历史数据预测了不同降雨状态之间的过渡概率。发现的结果表明,测试统计量的观察值χ²对所有沿海站都很重要,表明可靠的模型拟合。这些结果强调了了解降水模式的时间演变的重要性,这对于该地区的有效水资源管理,农业规划和灾难准备至关重要。该研究强调了降雨模式的动态性质以及自适应策略减轻气候变化影响的必要性。此外,这项研究强调了气候研究的相互联系,以及增强数据收集方法和国际协作的关键需求,以弥合有关气候变异性知识差距的差距。通过参考有关气候变化,极端降雨事件以及降水模式变化的全面学术著作,该研究详细概述了该领域当前的研究景观。总而言之,这项研究不仅有助于理解孟加拉国沿海城市的降水动态,而且还为参与参与气候适应和韧性计划的政策制定者和利益相关者提供了宝贵的见解。马尔可夫链模型与广泛的历史数据集的集成是预测未来降雨趋势并制定知情策略的强大工具,以应对改变降水模式所带来的挑战。
摘要。为了解决当今最严重的环境问题之一,减少了碳足迹,全球已将注意力转移到二氧化碳(CO 2)存储中,作为潜在的解决方案。由于其独特的功能,页岩是该领域最有趣的选择之一。吸附是CO 2通过页岩中的方法,尤其是在其超临界条件下的方法。吸附等温线模型可用于推断这种吸附的行为和机制。Langmuir,Freundlich,Dubinin-Astakhov(D-A)和Brunauer-Emmett-Teller(BET)模型是在页岩上可用于CO 2建模的众多模型之一。我们试图将这些模型拟合到本研究中从文献来源收集的实验数据中,集中在中国各个地方的四个独立的页岩样本上。是来自志留纪longmaxi组的LMX1和LMX2,来自Sichuan盆地的Ordovician Wufeng地层的WF1,以及Ordos盆地Yanchang组的YC。这些页岩的总有机碳(TOC)含量为3.19至4.27。在三个不同的温度下获得了用于拟合模型的实验数据:35、45和55°C。Langmuir和D-A型号为所有样品和温度提供了最适合数据的拟合。r²值0.93429(对于35°C时的YC岩石)至0.99287(对于WF1在35°C时为WF1),在35°C下为0.88879至0.99201 LMX1。这些模型的理论基础是代表页岩上超临界CO 2的物理性质和吸附动力学,这是其性能的原因。最后,这项研究增加了我们对页岩上CO 2吸附的理解,为未来的研究和CO 2存储中的潜在实际用途提供了有用的见解。但是,需要进行更多的研究,以完全了解各种页岩中CO 2吸附的机制和影响因素,以及开发用于预测这种行为的模型。
摘要:目标:乳房密度被认为是乳腺癌发展的独立危险因素。这项研究旨在根据患者的年龄和乳房象限来定量评估乳腺密度百分比(PBD)和乳腺体积(MGV)。我们提出了一个回归模型,以估算PBD和MGV作为患者年龄的函数。方法:1027个螺旋乳房CT(BCT)数据集中的乳房组成,没有软组织质量,钙化或来自517名女性(57±8年)的植入物。在整个乳房和四个象限中的每个象限中测量了乳房的乳腺组织体积(BTV),MGV和PBD。在七个年龄组中分析了三个乳房成分特征,从40到74岁,间隔为5年。将对数模型拟合到BTV,并使用最小二乘方法建立了对MGV和PBD作为年龄函数的乘法逆模型。结果:BTV从545±345增加到676±412 cm 3,MGV和PBD从111±164降至57±43 cm 3,分别从21±21±21降至11±21%,从最小的组最小的组(p <0.05)降低到11±21%。所有年龄段的平均PBD为14±13%。回归模型可以根据患者的年龄为基础预测BTV,MGV和PBD,其残余标准误差分别为386 cm 3、67 cm 3和13%。每个象限中MGV和PBD的减少遵循整个乳房中的象限。结论:根据BCT检查计算的PBD和MGV为妇女的乳腺癌风险评估提供了重要信息。该研究量化了整个乳房的乳腺乳腺减小和密度降低。它建立了数学模型来估计乳房成分特征 - BTV,MGV和PBD,是患者年龄的函数。
气候变化对人类社会的影响现在已得到广泛认可。然而,关于气候变化如何随着时间的流逝改变健康状况的知之甚少。围绕气候冲击和随后的亲密伴侣暴力(IPV)的国家级别数据可能与弹性政策和编程有关。我们假设气候冲击是两年后两年的气候冲击与IPV的更高流行率有关,并且这种关系仍然存在着经济发展水平不同的国家。我们汇编了国家数据,以从1993年至2019年的363次全国代表性调查中流行。这些代表性的数据来自不断有合伙人的妇女,将IPV范围定义为过去一年的身体和/或性暴力行为。我们还从1920年至2022年在190个国家 /地区汇编了紧急事件数据库(EM DAT)的数据数据库(EM DAT)的数据。使用探索性因素分析,我们符合由气候冲击变量组成的三因素潜在变量。然后,我们从气候冲击(滞后两年)和IPV发病率中拟合结构方程模型,控制着(日志)国家国内生产总值(GDP)。代表156个国家 /地区的国家数据表明,IPV与气候因素(水流学)之间存在着显着的关系(标准化估计= 0 32; SE = 0 128; P = 0 012)。GDP与IPV具有中等较大的横截面关联(估算= -0 529; SE = 0 047; P = 0 0001)。这表明迫切需要解决其他气候冲击(地质:地震/火山;大气:野火/干旱/极端温度)与IPV没有可测量的关联。模型拟合总体令人满意(RMSEA = 0 064(95%CI:0 044–0 084); CFI = 0 91; SRMR = 0 063)。气候冲击与基于全球人群的数据中的IPV发病率有纵向关联。
摘要:对骨再生的可生物降解支架的兴趣日益增加,需要研究适合脚手架形成的新材料。聚(乳酸)(PLA)是一种通常用于生物医学工程的聚合物,例如在组织工程中作为可生物降解的材料。但是,PLA沿其降解时间的机械行为仍未得到很好的探索。因此,需要研究在生理培养基中孵育的PLA支架的机械性能,以表明PLA的潜力被用作可生物降解的脚手架形成的材料。本研究的目的是确定孵育前后PLA支架的机械性能,并应用构造材料模型进行进一步的行为预测。由3D打印机“ Prusa I3 Mk3s”打印了两组PLA支架,并通过紫外线和乙醇溶液进行了灭菌。在DMEM(Dulbecco的改良Eagle培养基)中孵育第一套标本,为60、120和180天,以保持36.5°C的温度。在“ Mecmesin Multitest 2.5-I”测试架上进行压缩测试后,确定了支架的机械性能,并使用在两种不同的速度模式下施加的力。获得的数据曲线与超弹性材料模型拟合,用于模型适用性研究。将第二组样品在PBS(磷酸盐缓冲盐水)中孵育20周,并用于聚合物降解研究中。获得的结果表明,在预测的新骨组织形成周期中,PLA支架的机械性能在生理培养基中孵育过程中不会降低,尽管水解从一开始就开始并随时间增加。pla作为一种材料似乎适合在骨组织工程中使用,因为它允许具有高机械强度的生物相容性和可生物降解的支架,这是有效组织形成所需的。
1 1数学建模中心,伦敦卫生与热带医学学院,伦敦,英国,英国2,哈佛人道主义倡议,马萨诸塞州剑桥,美国,美国,波士顿3号,马萨诸塞州波士顿,美国马萨诸塞州波士顿,美国,美国4号部长澳大利亚布里斯班,6加泰罗尼亚州研究与高级研究机构(ICREA),西班牙巴塞罗那; 7巴塞罗那超级计算中心,西班牙巴塞罗那摘要Covid-19的流行动力学是由包括人口行为,政府干预,新变体,疫苗接种运动和免于先前感染的免疫力的复杂因素驱动的。 我们旨在量化多米尼加共和国SARS-COV-2动态的流行驱动因素,即1,080万人中的中上层收入国家,并评估2021年2月在挽救生命和避免住院的疫苗接种运动的影响。 我们使用了年龄结构的多变量传播动态模型来表征多米尼加共和国的流行驱动因素,并探索围绕疫苗接种覆盖范围和人口流动性的反事实情况。 我们将模型拟合到2021年12月的死亡人数,医院床的占用率,ICU床的占用率和血清阳性数据,并在不同的反事实疫苗接种场景下模拟了流行轨迹。 我们估计,在竞选活动的前6个月中,疫苗接种避免了5040次住院(95%CRI:4750-5350),1500 ICU入院(95%CRI:1420-1590)和544例死亡(95%CRI:488-606)。1数学建模中心,伦敦卫生与热带医学学院,伦敦,英国,英国2,哈佛人道主义倡议,马萨诸塞州剑桥,美国,美国,波士顿3号,马萨诸塞州波士顿,美国马萨诸塞州波士顿,美国,美国4号部长澳大利亚布里斯班,6加泰罗尼亚州研究与高级研究机构(ICREA),西班牙巴塞罗那; 7巴塞罗那超级计算中心,西班牙巴塞罗那摘要Covid-19的流行动力学是由包括人口行为,政府干预,新变体,疫苗接种运动和免于先前感染的免疫力的复杂因素驱动的。我们旨在量化多米尼加共和国SARS-COV-2动态的流行驱动因素,即1,080万人中的中上层收入国家,并评估2021年2月在挽救生命和避免住院的疫苗接种运动的影响。我们使用了年龄结构的多变量传播动态模型来表征多米尼加共和国的流行驱动因素,并探索围绕疫苗接种覆盖范围和人口流动性的反事实情况。我们将模型拟合到2021年12月的死亡人数,医院床的占用率,ICU床的占用率和血清阳性数据,并在不同的反事实疫苗接种场景下模拟了流行轨迹。我们估计,在竞选活动的前6个月中,疫苗接种避免了5040次住院(95%CRI:4750-5350),1500 ICU入院(95%CRI:1420-1590)和544例死亡(95%CRI:488-606)。我们还发现,使用具有较高疗效的产品延迟疫苗接种可比延迟疫苗接种。我们调查了疫苗接种覆盖范围的变化与人口流动性之间的权衡,以了解在大流行的后期疫苗接种的社会疏远措施的放松程度。我们发现,如果未发生疫苗接种,则需要额外减少10-20%的人口流动性才能维持相同的死亡和住院治疗。我们发现,多米尼加共和国的SARS-COV-2传播动力学是由大流行的头两年中大量免疫积累驱动的,但是尽管如此,疫苗接种对于能够恢复到大流行前移动水平而不产生相当大的发病率和死亡率至关重要。引言在2020-22期间,许多国家遭受了Covid-19的重大负担,并实施了非药物干预措施(NPI),旨在控制SARS-COV-2传播。尽管如此,各国经历了显着不同的流行动态,这是由人口行为,政府干预,新变体的引入,推出
课程目标: 1. 提供有关数据处理的必要知识,并使用统计和机器学习方法对实际问题进行分析 2. 使用编程工具生成报告并以图形形式可视化结果 预期课程成果: 1. 能够获得数据科学的基本知识 2. 将实时数据转换为适合分析的形式 3. 通过统计推断从数据中获取见解 4. 使用机器学习技术开发合适的模型并分析其性能 5. 确定需求并可视化结果 6. 分析模型的性能和结果质量 单元:1 简介 4 小时 数据科学: 数据科学简介 – 数字宇宙 – 数据来源 – 信息共享 – 数据科学项目生命周期: OSEMN 框架 单元:2 数据预处理和概念学习 6 小时 数据预处理简介 – 读取、选择、过滤数据 – 过滤缺失值 – 操作、排序、分组、重新排列、排名数据假设的制定 –概率近似正确学习 - VC 维度 - 假设消除 - 候选消除算法 单元:3 R 基础知识 8 小时 R 基础知识 - 数据类型和对象 - 控制结构 - 数据框 - 特征工程 - 缩放、标签编码和独热编码、缩减 单元:4 使用 R 进行模型拟合 8 小时 回归模型 - 线性和逻辑模型,分类模型 - 决策树、朴素贝叶斯、SVM 和随机森林,聚类模型 - K 均值和层次聚类 单元:5 可视化 6 小时 数据可视化:箱线图、直方图、散点图、热图 - 使用 Tableau - 异常值检测 - 数据平衡 单元:6 R 中的性能评估 4 小时 损失函数和误差:均方误差、均方根误差 - 模型选择和评估标准:准确度、精确度、F1 分数、召回率 - 二元预测分类 - 灵敏度 - 特异性。
多环境试验(MET)数据的分析是植物育种和农业研究的关键组成部分,为基因型逐型环境(GXE)相互作用提供了基本见解。然而,随着MET实验的复杂性的增长,基于方差的转化分析(基于ANOVA)的方法可以在准确捕获遗传和非遗传效应的潜在方差 - 稳定性结构方面表现出局限性。本研究使用埃塞俄比亚进行的十项常见的豆类品种试验的谷物产量数据集提出了对MET数据分析的因素分析混合模型(FAMM)。这项研究研究了多环境基因型效果(GXE)效应的方差相关结构的建模和在多环境现场试验中的残留误差。与具有异质遗传方差和恒定误差方差的基本GXE模型相比,包含具有异质误差差异的模型可显着改善模型拟合。然后拟合了增加顺序的因子分析模型(FA)模型,并且前三个顺序(FA1,FA2和FA3)在解释的方差百分比和统计意义上显示出显着的改善。FA3模型解释了总方差的78.12%,确定为模型复杂性和解释力之间提供最佳拟合。在十个试验环境中,遗传差异,误差差异和遗传力的估计值分别从0.008到0.984、0.053至0.695和65.40至89.86。这强调了影响感兴趣特征的基本遗传和环境因素的实质性变化。环境之间的遗传相关性也从负值到正值不等,表明跨实验条件的遗传因素的一致性不同。这些结果表明,在分析多环境试验数据时,正确建模方差 - 稳定性结构并考虑复杂的基因型相互作用的重要性。强烈建议扩大这种有效分析方法的利用,以增强各种环境之间的品种评估,并促进鉴定出色品种。关键词:因子分析混合模型,多环境试验,遗传
本课程应用多个回归技术,包括线性和逻辑模型拟合,推理和诊断。降低文本采矿的应用。将强调具有大量功能的数据集的特殊适用性的方法。示例包括但不限于前后选择,套索和脊正规化。模型复杂性,偏差差异和模型验证的问题将在大型数据集的背景下进行研究。也少于分布假设的方法也被引入,包括交叉验证和非参数方法。 学生还将被介绍给文本分类和神经网络。 还包括 EDEN,历史和工业方面的数据科学,以及机器学习在会计,经济学,财务,信息系统,管理,市场,媒体和社会学等领域的特定应用。 本课程的重要部分将涵盖大型语言模型,单词嵌入,情感分析以及将其应用于大型文本库所需的所有相关定量和编程背景。 在这些讲座中,我们关注机器学习,文本挖掘和业务交集的最新论文。 学生将学习方法论背后的直觉,假设和权衡,重点是现实世界中的问题。 所有编程工作将在Python进行。 完成本课程后,学生将能够:也少于分布假设的方法也被引入,包括交叉验证和非参数方法。学生还将被介绍给文本分类和神经网络。EDEN,历史和工业方面的数据科学,以及机器学习在会计,经济学,财务,信息系统,管理,市场,媒体和社会学等领域的特定应用。本课程的重要部分将涵盖大型语言模型,单词嵌入,情感分析以及将其应用于大型文本库所需的所有相关定量和编程背景。在这些讲座中,我们关注机器学习,文本挖掘和业务交集的最新论文。学生将学习方法论背后的直觉,假设和权衡,重点是现实世界中的问题。所有编程工作将在Python进行。完成本课程后,学生将能够:
癫痫发作在大脑网络中的扩散是癫痫患者的主要致残因素,通常会导致意识丧失。尽管在记录和建模大脑活动方面取得了进展,但揭示癫痫发作扩散动力学的性质仍然是理解和治疗药物难治性癫痫的重要挑战。为了应对这一挑战,我们引入了一种新的概率模型,该模型可以捕捉患者特定复杂网络中的扩散动力学。通过白质纤维束成像估计大脑区域之间的网络连接和交互时间延迟。该模型的计算可处理性使其能够对更详细的癫痫发作动力学模型发挥重要的补充作用。我们在患者特定的 Epileptor 网络背景下说明了模型拟合和预测性能。我们针对不同的患者特定网络推导出扩散大小(序参数)作为大脑兴奋性和全局连接强度的函数的相图。相图可以预测癫痫发作是否会根据兴奋性和连接强度扩散。此外,模型模拟可以预测癫痫发作在网络节点间传播的时间顺序。此外,我们表明,随着神经兴奋性和连接强度的变化,序参数可以表现出不连续和连续(临界)相变。平均场近似和有限尺寸缩放分析支持存在一个临界点,在该临界点处,响应函数和扩散大小的波动相对于控制参数表现出幂律发散。值得注意的是,临界点将两种不同的扩散动力学状态分开,其特征是单峰和双峰扩散大小分布。我们的研究为癫痫发作扩散动力学的相变和波动性质提供了新的见解。我们预计它将在开发用于预防药物抵抗性癫痫发作扩散的闭环刺激方法中发挥重要作用。我们的研究结果也可能引起流行病学、生物学、金融学和统计物理学中相关扩散动力学模型的兴趣。