摘要。我们研究了一种基于个体的随机流行模型,在这种流行病模型中,感染的个体在每种感染后再次变得易感性。与经典隔室模型相反,在每次感染之后,感染性是自感染以来经过的时间的随机函数。同样,根据随机易感函数,恢复的个体在一段时间后逐渐易感。我们研究了该模型的大种群渐近行为:我们证明了大量的功能定律(FLLN),并研究了限制确定性模型的地方性平衡。极限取决于易感性随机函数的定律,但仅取决于平均感染函数。flln是通过构造i.i.d的序列证明的。辅助过程并从混乱的传播理论中适应了方法。极限是Kermack和McKendrick引入的PDE模型的概括,我们展示了如何作为我们的FLLN限制的特殊情况获得该PDE模型。如果r 0小于(或等于)某个阈值,则流行病不会永远持续下去,最终从人口中消失,而如果r 0大于该阈值,则流行病将不会灭绝,并且存在一个地方性平衡。感染后很长时间后,该阈值的值是易感性的谐波平均值。
2预序5 2.1简介。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 5 2.2规范和双重规范。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 5 2.3线性编程。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 6 2.4拉格朗日功能。 。 。 。 。 。 。 。 。 。 。2预序5 2.1简介。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。5 2.2规范和双重规范。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。5 2.3线性编程。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。6 2.4拉格朗日功能。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。7 2.5反优化。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。7 2.5.1成本函数的反相反优化。。。。。。。。。。。。。。。。。8 2.6马尔可夫决策过程。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。8 2.6.1线性编程公式。。。。。。。。。。。。。。。。。。。。。。10
1 东京工业大学工学院系统与控制工程系,东京 152-8550,日本。2 早稻田大学理工学院先进科学与工程学院电气工程与生物科学系,东京 169-8555,日本。3 富山大学工学院电气与电子工程系,富山 930-8555,日本。4 大阪大学信息科学技术研究生院信息与物理科学系,大阪 565 0871,日本 5 北九州大学经济学与工商管理学院,福冈 802-8577,日本。* 电子邮件:{li.m; tanaka; carnerero}@hfg.sc.e.titech.ac.jp;wasa@waseda.jp;hirata@eng.u-toyama.ac.jp;藤崎@ist.osaka-u.ac.jp; ushifusa@kitakyu-u.ac.jp; hatanaka@sc.e.titech.ac.jp。
二十一点是一款赌场纸牌游戏,只有几个基本动作,但它具有不可思议的可能性(Thorp,1966)。Garvie(2017)解释了二十一点的所有规则。简而言之,游戏的目的是达到或获得尽可能接近21分。玩家用两张牌开始游戏,并决定是否拿另一张卡(命中)(站立)。如果玩家超过21岁,他们会输。如果经销商拥有21多名,则球员将获胜。如果球员的总数高于经销商,他们也会赢。其他可能的动作是分开的,只有在玩家手中有两个同一张卡并加倍时才允许,只有在卡总计9,10或11时才允许。通过拆分,游戏有效地分为2场比赛,两场比赛正常进行。又增加了一张卡,但它使该游戏的赌注翻了一番。游戏取决于运气,并且没有一种能够赢得的策略,但是,与次级或随机比赛相比,有一些玩法可以增加获胜几率的方法。由于二十一点是一款赌场游戏,因此它的设计使房屋总是有略有优势。根据其他研究(Summerville,2019年),(Thorp,1966)二十一点的最佳策略
我们提出了一种通用策略改进算法(GSIA),以发现简单随机游戏(SSG)的最佳策略。我们证明了GSIA的正确性,并得出了一般的复杂性结合,这意味着并改善了几篇文章的结果。首先,我们删除了SSG停止的假设,这通常是通过对游戏的多项式爆炸而获得的。第二,我们证明了与策略相关的值的分母的紧密绑定,并使用它来证明所有策略改进算法实际上是可以在随机顶点的数字r中处理的固定参数。所有已知的策略改进算法都可以看作是GSIA的实例,它允许Condon [13]从下面分析收敛的复杂性,并提出了一类算法,将Gimbert和Horn的算法推广[15,16]。这些算法最多终止R!迭代,对于二进制SSG,它们的迭代次数少于Ibsen-Jensen和Miltersen [17]给出的当前最佳确定性算法。
双曲几何已成功应用于具有一般拓扑结构的大脑皮层和皮层下表面建模。然而,与其他基于表面的大脑形态分析方法类似,此类方法通常会生成高维特征。这限制了它们在认知衰退预测研究中的统计能力,尤其是在受试者数量有限的数据集中。为了解决上述限制,我们提出了一种称为双曲随机编码 (HSC) 的新框架。我们首先通过将一般拓扑表面映射到具有一致边界条件的规范双曲参数空间来计算它们之间的差分映射,并提取临界形状特征。其次,在双曲参数空间中,我们引入了一种具有广度优先搜索方法的最远点采样以获得环形斑块。第三,采用随机坐标编码和最大池算法进行特征降维。我们通过在两个用于阿尔茨海默病 (AD) 进展研究的脑成像数据集上将其分类准确率与其他一些方法进行比较,进一步验证了所提出的系统。我们的初步实验结果表明,我们的算法在
摘要-由于储能技术的发展,不同的储能方式对电力系统的影响变得越来越重要。本文优化了基于风能的多能源系统 (MES) 的随机调度,并结合电力和热能需求响应程序以及三模式 CAES (TM-CAES) 单元评估了所提出的系统运行情况。所提出的风电一体化 MES 由 TM-CAES 单元、电锅炉单元和储热系统组成,可以与当地热网交换热能并与当地电网交换电能。使用蒙特卡罗模拟方法将电力和热能需求以及风电场发电建模为基于场景的随机问题。然后,通过将适当的场景简化算法应用于初始场景来减少计算负担。最后,将提出的方法应用于案例研究,以评估所提出方法的有效性和适用性。
我们开发了在 Heston 模型(一种流行的随机波动率模型)下为亚式期权和障碍期权定价的量子算法,并在典型市场条件下的实例中估算了它们的成本(以 T 计数、T 深度和逻辑量子比特数表示)。这些算法基于将成熟的随机微分方程数值方法与量子振幅估计技术相结合。具体而言,我们通过经验表明,尽管弱欧拉方法很简单,但它在此任务中达到了与更著名的强欧拉方法相同的精度水平。此外,通过消除准备高斯态的昂贵程序,基于弱欧拉方案的量子算法比基于强欧拉方案的量子算法的效率要高得多。我们的资源分析表明,随机波动下的期权定价是量子计算机的一个有前途的应用,并且我们的算法使得在金融应用中实现实际量子优势的硬件要求比现有技术更低。
自 19 世纪以来,动态物理系统的热力学和计算特性之间的关系一直是理论界关注的焦点,随着数字设备的能量成本在过去半个世纪中呈爆炸式增长,这一关系也具有越来越重要的实际意义。现实世界计算机最重要的热力学特征之一是,它们在有限的时间内以许多快速(共同)演化的自由度运行,远离热平衡。这种计算机还必须几乎始终遵守对其工作方式的多种物理约束。例如,所有现代数字计算机都是周期性过程,由全局时钟控制。另一个例子是,许多计算机都是模块化、分层系统,对其子系统的连接性有严格的限制。这种特性既适用于自然产生的计算机(如大脑或真核细胞),也适用于数字系统。现实世界计算机的这些特征在 20 世纪对计算过程热力学的分析中是不存在的,这些分析侧重于准静态慢速过程。然而,随机热力学领域在过去几十年中得到了发展——它提供了分析具有真实计算机特征的系统的形式化工具。我们在此认为,这些工具以及随机热力学领域目前正在开发的其他工具可能有助于我们在更深层次上理解动态系统的基本物理特性与其执行的计算之间的关系。
摘要。联盟游戏是合作的模式,在该模型中,Selfer -Sher -Fiment必须组成群体(联盟)以最大程度地提高其效用。在这些模型中,通常假定联盟的效用是固定和已知的。由于这些假设在许多应用中都不是现实的,因此有些工作通过考虑重复的随机联盟游戏来解决此问题。在这样的游戏中,代理商反复组成联盟,并观察其实用性后验,以更新他们的知识。但是,通常认为代理具有贪婪的行为:它们始终在给定时间步骤中构成他们估计的最佳联盟。在本文中,我们研究了其他策略(行为)是否允许代理商探索未经评估的联盟的策略。为此,我们提出了一个重复的随机联盟游戏的模型,其中代理使用神经网络来估计联盟的效用。我们比较了不同的探索策略,并且我们表明,由于联盟游戏的结构,尽管基于事实探索的策略可以更好地估算公用事业,但贪婪的策略还是最好的。