b'we提出了一个以福利为中心的博览会加强学习环境,在该环境中,代理商享受一组受益人的矢量值得奖励。给定福利函数W(\ xc2 \ xb7),任务是选择一个策略\ xcb \ x86 \ xcf \ x80,该策略大约优化了从start state s 0,即\ xcb \ xcb \ x86 \ xcf \ xcf \ xcf \ x80 \ x80 \ x80 \ x80 \ x80 \ x80 \ x80 \ x80 \ x80 \ x80 \ x80 \ xmax \ xcf \ x80 w v \ xcf \ x80 1(s 0),v \ xcf \ x80 2(s 0),。。。,v \ xcf \ x80 g(s 0)。我们发现,福利最佳政策是随机的,依赖起始国家的。单个行动是错误是否取决于策略,因此错误的界限,遗憾分析和PAC-MDP学习不会容易概括为我们的设置。我们开发了对抗性的KWIK(KWIK-AF)学习模型,其中在每个时间步中,代理要么采取勘探行动或输出剥削策略,因此勘探行动的数量是有限的,并且每个利用策略都是\ xce \ xce \ xb5-Welfelfare-welfelfare-Wertal的最佳。最后,我们将PAC-MDP减少到Kwik-af,引入公平的显式探索漏洞利用者(E 4)学习者,并证明其Kwik-af学习了。
通过分层相关性传播增强核电站 AI 模型的可解释性 Seung Geun Kim a*、Seunghyoung Ryu a、Hyeonmin Kim b、Kyungho Jin b、Jaehyun Cho ba 应用人工智能实验室/b 韩国原子能研究院风险评估与管理研究团队,韩国大田儒城区大德大路 989 号街 111,34057 * 通讯作者:sgkim92@kaeri.re.kr 1.简介 随着人工智能 (AI) 技术的快速发展,各个领域的应用数量巨大。核领域也紧跟这一趋势,许多研究利用 AI 模型解决事件诊断和自动/自主操作等问题。然而,占据近期 AI 技术应用最大份额的深度神经网络 (DNN) 具有不透明且可解释性低的局限性。对于基于 DNN 的模型,很难了解模型的内部逻辑或模型如何从给定的输入推断出输出。由于这一限制,尽管基于 DNN 的模型的性能可以接受,但人们对将其实际应用于安全关键领域和与道德/法律问题相关的领域仍犹豫不决。为了克服可解释性低的限制,已经提出了许多可解释的人工智能 (XAI) 方法。XAI 方法可以提供详细的解释,例如模型的内部逻辑和输入与输出之间的关系。然而,尽管可解释性问题对于安全关键的核领域至关重要,但缺乏处理 XAI 的研究。在本研究中,为了提高核领域人工智能模型的可解释性和实用性,研究了分层相关性传播 (LRP) [1],它是 XAI 方法之一,与其他 XAI 方法相比,它在许多应用中表现出更好的性能。论文的其余部分组织如下。在第 2 章中,对 XAI 和 LRP 进行了简要说明。第 3 章描述了可行性检查实验,第 4 章总结了本文。 2. 前言 2.1 可解释人工智能 可解释人工智能 (XAI) 是一种使人类轻松理解 AI 模型的技术。大多数 AI 模型在数据处理和解决问题的方法方面与人类不同。例如,AI 模型识别具有像素 RGB 值的图像,而人类则不能。提出 XAI 是为了减轻理解 AI 模型内部过程或推断某些输出的原因的难度。
b'for \ xce \ xb2,\ xce \ xb3 \ xe2 \ x88 \ x88 \ x88 \ xce \ x93。我们可以将其视为将标签的中心移至\ xce \ xb2 \ xe2 \ x88 \ x92 1。我们说,如果\ xce \ xb2 \ xb2 \ xe2 \ xe2 \ x88 \ x88 \ x88 \ x88 \ x97 \ x97 \ xc2 \ xc2 \ xc2 \ xc2 \ xc2 \ xc2 \ xb5, \ xe2 \ x88 \ x88 \ xce \ x93,其中\ xce \ xb2 \ xe2 \ x88 \ x97表示pushforward。我们用prob \ xce \ x93(a \ xce \ x93)表示一组移位不变的概率度量。如果V是\ XEF \ XAC \ X81NITE集,我们可以考虑来自\ XCE \ X93的同构的SET HOM(\ XCE \ X93,SYM(V))到V的排列组。此集合有可能为空。Given \xcf\x83 \xe2\x88\x88 Hom(\xce\x93 , Sym( V )), we write the permutation which is the image of \xce\xb3 \xe2\x88\x88 \xce\x93 by \xcf\x83 \xce\xb3 .我们可以将导向图与\ xcf \ x83与Vertex Set V和I -LabeLed Edge(V,\ XCF \ X83 S I(V))相关联,每个I \ Xe2 \ X88 \ X88 \ X88 [R]和V \ XE2 \ X88 \ X88 \ X88 \ x88 v。任何\ xcf \ x83的图形都可以被认为是一个局部看起来像\ xce \ x93的\ xef \ xac \ x81nite系统,就像局部的大矩形网格看起来像Integer lattice Z r一样。\ xce \ x93或某些\ xcf \ x83的图可以具有自然的图形距离:一对顶点之间的距离是de \ xef \ xac \ x81,是它们之间的最小边数,忽略边缘方向。Let B \xcf\x83 ( v, R ) denote the closed radius- R ball centered at v \xe2\x88\x88 V , and similarly de\xef\xac\x81ne B \xce\x93 ( \xce\xb3, R ) for \xce\xb3 \xe2\x88\x88 \ xce \ x93。let \ xcf \ x83 \ xe2 \ x88 \ x88 hom(\ xce \ x93,sym(v))和x \ xe2 \ x88 \ x88 a v。\ xef \ xac \ x81nite与\ xef \ xac \ x81nite系统之间的对应关系是使用em-pirical Distributions建立的,我们现在是我们现在de \ xef \ xaC \ xac \ x81ne。对于任何V \ Xe2 \ x88 \ x88 V,有一种自然的方法可以将X提升到标签\ XCE \ XA0 \ XCF \ XCF \ X83 V X \ XE2 \ X88 \ X88 A \ XCE \ XCE \ X93,从将X V提起到根e。更准确地说,\ xce \ xa0 \ xcf \ x83 v x(\ xce \ xb3)= x \ xcf \ x83 \ xce \ xce \ xb3(v)。