提出了一种结合贝叶斯推断的贝叶斯强化学习可靠性方法,以实现故障概率估计和增强学习指导的顺序实验设计。以可靠性为导向的顺序实验设计被构架为有限的马尔可夫决策过程(MDP),其相关的效用函数由对克里格估计的失败概率的认知不确定性度量定义,称为综合的错误分类概率(IPM)。在此Ba-sis上,定义了一个步骤的贝叶斯最佳学习函数,称为错误分类减少的综合概率(IPMR)以及兼容的收敛标准。采取了三种有效的策略来加速IPMR信息的顺序实验设计:(i)IPMR中内部期望的分析推导,将其简化为单个期望。(ii)替换IPMR替换其上限IPMR U,以避免对其集成的元素计算。(iii)IPMR U中正交集合和候选池的合理修剪以减轻计算机内存约束。在两个基准示例和两个数值示例中证明了所提出的APACH的功效。结果表明,与其他现有学习功能相比,IPMR U促进IPM的快速减少,同时所需的计算时间比IPMR本身要少得多。因此,提出的可靠性方法在计算效率和准确性方面都具有很大的优势,尤其是在复杂的动态可靠性问题中。
我们描述了一种基于量子理论的量子贝叶斯 (QBist) 方法对采用量子或经典力学的理性决策代理进行建模的通用方法。通过一个代理的属性可能影响另一个代理的方案这一附加要素,我们得到了一个灵活的框架来处理多个相互作用的量子和经典贝叶斯代理。我们在几种环境中进行了模拟以说明我们的构造:从外源接收信号的量子和经典代理、两个相互作用的经典代理、两个相互作用的量子代理以及经典和量子代理之间的相互作用。对多个相互作用的量子理论用户的一致处理可能使我们能够正确解释现有的多代理协议,并可能为量子算法设计等其他领域提供新方法。
18 世纪,托马斯·贝叶斯 (Thomas Bayes) 提出了一个激进的想法:用概率来表示我们认为假设正确的程度 (Bayes, 1763/1958)。他在一场赌博游戏中这样做:在经历了一定数量的输赢之后,你赢的概率有多大?使用概率论根据数据更新我们的信念程度的想法是我们现在所说的贝叶斯规则的基础(见图 1)。贝叶斯可能认为他的工作具有较低的概率,而这一模型在 200 多年后成为贝叶斯认知模型的基础,该模型从理性信念更新的角度解释人类行为(例如,Griffiths 等人,2010 年)。贝叶斯认知模型解释了归纳推理——从有限的数据得出不确定结论的过程,例如根据在对话中听到的新词推断其含义。在贝叶斯模型中,这种推断是将数据(例如,你听到新词的上下文)与我们对世界的现有期望(例如,对一个词可能具有何种含义的期望)相结合的结果。这些期望以假设的“先验分布”来表达,更合理的假设具有更高的先验概率。这捕捉到了学习者的“归纳偏差”——那些影响学习者选择的假设的数据以外的因素(Mitchell,1997)。先验分布可以定义为
2018 年,美国估计有 42,220 例肝细胞癌和肝内胆管癌新发病例和 30,200 例死亡病例 [1]。这些死亡病例大多数是由于肝细胞癌 (HCC),这是最常见的原发性肝癌 [2]。在全球范围内,肝癌是癌症死亡的第四大原因 [3]。HCC 最常与慢性乙型肝炎病毒或丙型肝炎病毒感染有关,尤其是并发肝硬化,这限制了手术切除的可行性 [4]。对于适合手术的患者,肝移植和手术切除仍然是早期 HCC 最有效的治疗方法。不幸的是,绝大多数患者在被诊断为 HCC 时已处于晚期,肿瘤无法切除。以往,晚期HCC预后不佳,治疗仅限于经动脉化疗栓塞、射频消融、放射治疗和全身药物治疗[5]。欧洲SHARP试验首次证明,多靶点小分子酪氨酸激酶抑制剂(TKI)索拉非尼可延长不可切除的HCC患者的中位生存期,优于安慰剂[6]。随后,更多靶向药物相继问世,并在II期或III期临床试验中证明其有效且安全[7]。尽管已有研究将这些药物的有效性和安全性与索拉非尼或安慰剂进行了比较,但尚未进行过头对头比较[8]。为了进一步评估靶向药物治疗HCC患者的疗效和安全性证据,我们进行了贝叶斯网络荟萃分析(NMA)以比较不同HCC靶向药物的生存期、客观缓解率(ORR)和不良事件(AE)。
直线加速器相干光源 X 射线自由电子激光器是一种复杂的科学仪器,每天会多次更改配置,因此需要快速调整策略来减少连续实验的设置时间。为此,我们采用贝叶斯方法通过控制四极磁铁组来最大化 X 射线激光脉冲能量。高斯过程模型为机器响应提供了相对于控制参数的概率预测,从而在寻找全局最优时实现了探索和利用的平衡。我们表明,可以从存档的扫描中学习模型参数,并且可以从光束传输中提取设备之间的相关性。结果是一个样本高效的优化程序,结合了历史数据和加速器物理知识,大大优于现有的优化器。
人工智能 (AI) 和机器学习模型越来越多地应用于实际应用。在许多此类应用中,人们强烈希望开发混合系统,使人类和 AI 算法能够协同工作,充分利用两者互补的优势和劣势。我们开发了一个贝叶斯框架,用于结合人类和机器的预测和不同类型的置信度分数。该框架使我们能够研究影响互补性的因素,其中人类和机器预测的混合组合比单独的人类或机器预测组合产生更好的性能。我们将此框架应用于一个大规模数据集,其中人类和各种卷积神经网络执行相同的具有挑战性的图像分类任务。我们从经验和理论上表明,即使人类和机器分类器的表现不同,只要这些准确度差异在由人类和机器分类器置信度分数之间的潜在相关性确定的范围内,就可以实现互补性。此外,我们证明,通过区分人类和机器分类器在不同类别标签上犯的错误,可以提高混合人机性能。最后,我们的结果表明,引出并纳入人类信心评级可提高贝叶斯组合模型的混合性能。我们的方法适用于涉及人类和机器算法的各种分类问题。
在通信过程中估计信号时,自然需要利用对未知参数的先验知识进行贝叶斯参数估计 [1]。量子通信是一种很有前途的近期通信技术,它可以比传统协议更安全、更有效地传输信息。关于如何在给定的噪声量子信道上忠实地传输经典和/或量子信息,已经有很多研究,例如 [2]–[4]。量子贝叶斯估计是有效解码量子态中编码的经典信息的关键因素。量子贝叶斯估计在量子传感和量子计量领域也得到了极大关注 [5]–[8]。量子贝叶斯估计大约半个世纪前由 Personick [9],[10] 发起。由于量子估计理论的最新进展,量子贝叶斯估计问题重新引起了人们的关注。针对贝叶斯风险,提出了几种量子贝叶斯界,例如 [9]–[17]。然而,它们中的大多数都没有捕捉到真正的量子性质,因为已知的下界几乎都是基于经典贝叶斯界的直接翻译。特别是,先前提出的下界是通过对算子空间上的内积的某个选择应用柯西-施瓦茨型不等式推导出来的。Holevo 在一般统计决策问题的背景下发起了对量子估计的非平凡下界的研究 [18]。他还基于量子 Fisher 信息矩阵分析了贝叶斯风险的下界 [19]–[21]。特别是,他对高斯移位进行了彻底的分析
由于人工智能越来越多地用于高风险应用,因此可以解释使用的模型变得越来越重要。贝叶斯网络提供了基于概率理论的可靠人工智能的范式。他们提供了一种语义,该语义可以通过利用它们之间的条件独立性来实现与域变量相关的概率分布的声明性表示。该表示由有向的无环图组成,该图编码变量之间的条件独立性以及编码条件分布的一组参数。此表示为开发概率推理(推理)和从数据学习概率分布的算法提供了基础。贝叶斯网络用于机器学习中的各种任务,包括聚类,超级分类,多维监督分类,异常检测和时间修改。他们还提供了估计分布算法的基础,这是启发式优化的一类进化算法。我们通过在神经科学,行业和生物启示中介绍应用程序来说明贝叶斯网络在可解释的机器学习和优化中的使用,涵盖了广泛的机器学习和优化任务。2021由Elsevier B.V.