缺乏置信度度量:最先进的深度学习方法的另一个特点是缺乏置信度度量。与基于贝叶斯的机器学习方法相比,大多数深度学习模型不提供模型不确定性的合理置信度度量。例如,在分类模型中,顶层(主要是 softmax 输出)中获得的概率向量通常被解释为模型置信度,参见 [26] 或 [35]。然而,像 softmax 这样的函数可能会导致对远离训练数据的点进行不合理的高置信度外推,从而提供一种虚假的安全感 [39]。因此,尝试将贝叶斯方法也引入 DNN 模型似乎是很自然的。由此产生的不确定性度量(或同义的置信度度量)依赖于给定数据权重的后验分布的近似值。作为此背景下的一种有前途的方法,变分技术(例如基于 Monte Carlo dropout [27])允许将这些贝叶斯概念转化为计算上可处理的算法。变分方法依赖于 Kullback-Leibler 散度来测量分布之间的差异。因此,所得的近似分布集中在单一模式周围,低估了该模式之外的不确定性。因此,对于给定实例的结果置信度度量仍然不令人满意,并且可能仍然存在误解高置信度的区域。
在设计过程中,人工智能 (AI) 的决策辅助只有当人类设计师正确利用 AI 输入时才会有效。然而,设计师经常会误判 AI 和/或他们自己的能力,导致错误地依赖 AI,从而出现糟糕的设计。为了避免这样的结果,了解设计师在 AI 辅助决策过程中对 AI 队友和自己的信心的演变至关重要。因此,这项工作进行了一项认知研究,以探索如何体验各种变化(未经通知)的 AI 性能水平,并且反馈会影响这些信心,从而影响接受或拒绝 AI 建议的决策。结果首先表明,设计师对 AI 代理的信心会随着 AI 性能不佳而变化,但不会随着 AI 性能良好而变化。有趣的是,设计师的自信最初不受 AI 准确性的影响;然而,当准确度发生变化时,无论变化方向如何,自信度都会下降。此外,这项研究发现,设计师倾向于从反馈中推断出有缺陷的信息,导致对人工智能和他们自己的自信度都不适当。这项研究还表明,对人工智能的信心和自信度会影响设计师以相反方向接受人工智能输入的概率。最后,通过将这项研究的结果与针对非设计任务进行的类似研究的结果进行比较,确定了只适用于设计的结果。总的来说,这项研究提供了有价值的见解,可能有助于检测设计师的动态信心及其在设计中对人工智能输入的误用。[DOI: 10.1115/1.4055123]
摘要 — 在本文中,我们研究了使用脑电图 (EEG) 信号进行物体检测任务中图像解释过程中人类的决策信心。我们开发了一个从 14 名受试者获取的 EEG 数据集。采用五种流行的 EEG 特征,即差分熵 (DE)、功率谱密度 (PSD)、差分不对称 (DASM)、有理不对称 (RASM) 和不对称 (ASM),以及两个分类器,即支持向量机 (SVM) 和带快捷连接的深度神经网络 (DNNS),来测量物体检测任务中的决策信心。分类结果表明,对于五个决策信心水平,带有 DNNS 模型的 DE 特征实现了 47.36% 的最佳准确率和 43.5% 的 F1 分数。对于极端信心水平,识别准确率达到 83.98%,平均 F1 分数为 80.93%。我们还发现,delta 波段的表现优于其他四个波段,并且前额叶区域和顶叶区域可能是代表物体检测任务中的决策信心的敏感大脑区域。
目的:我们研究了男同性恋、双性恋和其他男男性行为者 (GBMSM) 的疫苗信心与 COVID-19 疫苗接种之间的关联。方法:2021 年 5 月至 10 月,对参加 mSTUDY 的 249 名 GBMSM 进行了计算机辅助自我访谈——这是洛杉矶有药物使用史的 GBMSM 队列。使用疫苗信心指数收集数据。使用多变量对数二项回归评估了疫苗信心与 COVID-19 疫苗接种之间的关联。结果:三分之二 (64.7%) 的 GBMSM 报告接种了至少一剂 COVID-19 疫苗。疫苗信心与 COVID-19 疫苗接种呈正相关。参与者对政府信任和疫苗安全持中立态度。感知的健康益处和疫苗有效性与疫苗接种具有统计学显著相关性(调整后的患病率 [APR] = 1.59,95% 置信区间 [CI]:1.20–2.16;APR = 1.51,95% CI:1.07–2.15)。结论:公共卫生计划应优先考虑公共利益和疫苗有效性信息,以促进使用药物的 GBMSM 接种疫苗。
图 2. 网络扰动的影响。A. 半脑中的每个突触都有一个置信度分数,表明自动识别它们的机器学习算法的置信度。我们通过排除置信度分数低于某个阈值的突触来扰动网络。扰动网络中每条边的权重都是其原始权重的一小部分;这里显示的是这些权重比的分布。这种扰动导致整体边缘变弱,更高的阈值也会切断更多边缘(在 0.0 的箱中计数)。B. 扰动网络中发现的社区数量与原始网络中的数量相比。灰线表示相等。在更高的分辨率尺度下,随着扰动图变得弱连接,相对于原始网络发现了更多的簇。
逐点集中是计算每个状态-动作对的置信区间的标准技术 [Azar 等人,2017 年;Liu 等人,2021 年;Xie 等人,2021b 年;Cui 和 Du,2022 年]。然而,由于 NE 可以是混合策略,因此对 MARL 的直接扩展会受到多智能体诅咒的影响。与逐点集中技术不同,策略集中直接估计每个策略,这允许更严格的置信区间,从而避免对联合动作空间的依赖。我们在第 1.2 节中给出了技术概述。此外,我们表明策略置信界限始终是一个凸函数,因此经验最佳响应策略始终可以是确定性策略,这对计算效率至关重要。
结果:TYG指数较高的参与者的MACE发病率显着高。在Kaplan - Meier生存分析中也确定了TYG指数与MACE之间的正相关。Multivariate cox proportional hazards analysis indicated that the TyG index was independently associated with the increased risk of MACE, regardless of whether TyG was a continuous [TyG, per 1 − unit increase, HR (hazard ratio) 1.41, 95% CI (con fi dence interval) 1.22-1.62, P < 0.001] or categorical variable [quartile of TyG, the HR (95%CI)四分位数4为1.92(1.48-2.49),而四分位数为1作为参考]。此外,通过RCS模型显示了TYG指数与MACE的非线性关联,并且MACE的风险随着TYG指数一般的增加而增加(非线性P = 0.0215)。此外,TYG与DM(糖尿病)组和NO-DM组之间的MACE的关联中没有明显的相互作用。
12.1统计推断331 12.2取样分布332 12.3估计 - 人口的推理339 12.4人口的固定间隔平均平均值340 12.5人口百分比的固定间隔347 12.6独立样本平均值350 12.7的差异350 12.7次数35 35 353 12.9.9结论361 12.10问题363
结果:截至 2021 年 12 月,全国范围内至少接种 1 剂 COVID-19 疫苗的覆盖率为 79.3%,地理分布存在很大差异。未接种疫苗但可能接种 COVID-19 疫苗或不确定接种疫苗的人数比例最大的地区位于东南部和中西部(卫生和公共服务部第 4 和第 5 区)。这两个地区对 COVID-19 的担忧和对疫苗重要性的信心都有类似的时间趋势,尽管东南部在 2021 年 12 月对疫苗安全性的信心特别低,佛罗里达州最低(5.5%),北卡罗来纳州最高(18.0%)。未接种 COVID-19 疫苗的行为和社会驱动因素最强的相关性是 COVID-19 疫苗重要性的信心较低(调整后的患病率 = 5.19,95% CI = 4.93,5.47;东北部、西南部和山区西部最强,东南部和中西部最弱)。其他行为和社会驱动因素的疫苗接种相关性也因地区而异。