由于人工智能越来越多地用于高风险应用,因此可以解释使用的模型变得越来越重要。贝叶斯网络提供了基于概率理论的可靠人工智能的范式。他们提供了一种语义,该语义可以通过利用它们之间的条件独立性来实现与域变量相关的概率分布的声明性表示。该表示由有向的无环图组成,该图编码变量之间的条件独立性以及编码条件分布的一组参数。此表示为开发概率推理(推理)和从数据学习概率分布的算法提供了基础。贝叶斯网络用于机器学习中的各种任务,包括聚类,超级分类,多维监督分类,异常检测和时间修改。他们还提供了估计分布算法的基础,这是启发式优化的一类进化算法。我们通过在神经科学,行业和生物启示中介绍应用程序来说明贝叶斯网络在可解释的机器学习和优化中的使用,涵盖了广泛的机器学习和优化任务。2021由Elsevier B.V.
摘要:我们提出了一种基于多视图和多代表(MV – MR)的自我监督学习和知识蒸馏的新方法。MV-MR是基于从增强和非增强视图中可学习的嵌入之间依赖性的最大化,从增强视图中可学习的嵌入与从非杰出视图中的多个非可学习的表示之间最大化依赖性。我们表明,所提出的方法可用于有效的自我监督分类和模型不合时宜的知识蒸馏。与其他自我监督技术不同,我们的方法不使用任何对比度学习,聚类或停止梯度。MV – MR是一个通用框架,允许通过将图像多代表作为正规化器的图像使用,将约束纳入学习嵌入。所提出的方法用于知识蒸馏。MV – MR在线性评估设置中提供了STL10和CIFAR20数据集的最先进的自我监督性能。我们表明,使用基于剪辑模型的拟议知识蒸馏预测的低复杂性RESNET50模型可实现STL10和CIFAR100数据集的最新性能。
摘要:可见全色 (PAN) 和高光谱 (HS) 光谱范围之间差异较大,限制了反射域中的高光谱全色锐化方法,这显著导致 SWIR(1.0–2.5 µ m)光谱域的表示效果不佳。本研究提出了一种新颖的仪器概念,即在 SWIR II(2.0–2.5 µ m)光谱域中引入第二个 PAN 通道。提出了两种扩展融合方法来处理两个 PAN 通道,即 Gain-2P 和 CONDOR-2P:第一种方法是 Brovey 变换的扩展版本,而第二种方法在 Gain-2P 中添加了混合像素预处理步骤。通过遵循详尽的性能评估协议(包括全局、精细和局部数值分析以及监督分类),我们在近郊和城市数据集上评估了更新的方法。结果证实了第二个 PAN 通道的显著贡献(两个数据集的平均归一化间隙在反射域中提高了 45%,仅在 SWIR 域中提高了 60%),并揭示了 CONDOR-2P(与 Gain-2P 相比)在近郊数据集方面的明显优势。
计算社会科学(CSS)的实践通常依靠人标记的数据来调查监督的文本分类器。我们评估了研究人员使用来自生成大语言模型(LLM)的替代培训标签增强或替换人类生成的培训数据的潜力。我们介绍了推荐的工作流程,并通过复制14个分类任务和测量性能来测试此LLM应用程序。我们采用了来自高影响力期间CSS文章的新型英语文本分类数据集。由于这些数据集存储在受密码保护的档案中,因此我们的分析不太容易受到污染问题。对于每项任务,我们将使用GPT-4标签的监督分类器进行了比较,并用人类注释进行了微调的分类器,并与GPT-4和Mismtral-7b的标签进行了微调,并以较少的镜头在上下文中学习。我们的发现表明,在LLM生成的标签上微调的监督分类模型与通过人类注释者的标签进行了微调的模型相当。使用LLM生成标签的微调模型可以是构建监督文本分类器的快速,高效且具有成本效益的方法。
有人-无人协同 (MUM-T) 可定义为空中机器人 (人工智能体) 与人类飞行员 (自然智能体) 的协同,其中人类智能体不是权威控制者,而是合作的团队成员。据我们所知,尚无研究使用神经人体工程学方法 (即使用生理测量) 评估 MUM-T 场景对操作员心理工作量 (MW) 的影响,也未通过对这些测量进行分类来提供 MW 估计。此外,分类流程中很少考虑生理信号的非平稳性的影响,特别是在验证设计中。因此,本研究有两个目标:(i) 基于生理信号表征和估计 MUM-T 设置中的 MW;(ii) 评估验证程序对分类准确性的影响。在此背景下,开发了一个搜索和救援 (S&R) 场景,其中 14 名参与者扮演飞行员的角色,与三架 UAV(无人驾驶飞行器)合作。任务旨在诱发高和低 MW 水平,使用自我报告、行为和生理指标(即大脑、心脏和眼球运动特征)进行评估。基于这些生理特征的各种组合的监督分类管道进行了基准测试,并比较了两种验证程序(即不考虑时间的传统程序与考虑时间的生态程序
摘要在1948年,克劳德·香农(Claude Shannon)发表了一个数学系统,描述了自然语言字母与其后续顺序或语法结构之间的概率关系。通过计算称为n-grams的独特的,重复发生的字母序列,该语言模型用于从N-克频率概率表中生成可识别的英语句子。最近,N-Gram分析方法已成功地解决了从语言处理到基因组学的各个领域中的许多复杂问题。这样的示例是N-Gram频率模式和监督分类模型的共同使用来确定作者身份和窃。在这种方法论中,DNA是一种语言模型,其中核苷酸类似于单词字母和核苷酸n-gram的字母类似于句子的单词。由于DNA包含高度保守和可识别的核苷酸序列频率模式,因此该方法可以应用于各种分类和数据还原问题,例如基于未知的DNA片段鉴定物种。该方法的其他有用应用包括鉴定功能基因元件,序列污染和测序伪影。为此,我提出了DNANAMER,这是一种基于其N克频率模式的DNA序列的监督分类的广义和可扩展的方法论框架和分析工具包。
在过去的几年中,提出了几种量子机器学习算法,这些算法有望比经典算法实现量子加速。这些学习算法中的大多数要么假设量子访问数据——因此,如果不做出这些强有力的假设,量子加速是否仍然存在尚不清楚,要么本质上是启发式的,没有可证明的优势优于经典算法。在本文中,我们使用一种通用量子学习算法建立了一种严格的量子加速监督分类方法,该算法只需要经典访问数据。我们的量子分类器是一种传统的支持向量机,它使用容错量子计算机来估计核函数。数据样本被映射到量子特征空间,核条目可以估计为量子电路的跃迁幅度。我们构建了一个数据集系列,并表明,假设离散对数问题具有普遍的难度,没有一个经典学习器能够比随机猜测更好地对数据进行逆多项式分类。同时,量子分类器实现了高精度,并且对于由有限采样统计引起的内核条目中的附加错误具有很强的鲁棒性。
监督分类在很大程度上取决于人类注释的数据集。然而,在诸如毒性分类之类的主观任务中,这些注释通常在评估者之间表现出较低的一致性。注释通常是通过采用多数投票来确定单个地面真相标签的方法来汇总的。在主观任务中,汇总标签将导致标签有偏见,并且会导致有偏见的模型,这些模型可以忽略次要意见。先前的研究已经阐明了标签聚合的陷阱,并引入了一些解决这个问题的实用方法。最近提出的多种注释模型,该模型可以预测每个注释者的个体标签,因此很容易受到样本很少的注释者的不良确定。此问题在众包数据集中加剧了。在这项工作中,我们为主观分类任务的文本(AART)提出了注释者意识表示表示。我们的方法涉及注释者的学习表示,允许探索注释行为。我们展示了我们对指标方法的改进,这些指标评估了限制单个注释者观点的绩效。在方面,我们证明了与Others相比,评估环境化注释者的模型公平性的公平指标。1
这项研究的主要目的是评估信用卡欺诈检测领域机器学习算法的性能,然后根据各种性能指标对其进行比较。使用了七种不同的监督分类算法,包括逻辑回归,决策树,随机森林,Xgboost,幼稚的贝叶斯,K-Nearest邻居和支持向量机。这些算法的性能是通过对指标的全面评估来衡量的,包括准确性,精度,召回,F-SCORE,AUC和AUPRC值。此外,还使用ROC曲线和混淆矩阵来评估这些算法。数据制备阶段在这项研究中至关重要。数据不平衡问题是欺诈和非欺诈交易之间不平等的分布。解决这种不平衡对于成功的模型培训和随后的可靠结果至关重要。采用了各种技术,例如缩放和分布,随机的下采样,降低性降低和聚类,以确保对模型性能的准确评估及其有效概括的能力。结果,“随机森林”和“ K-Neartheard Neighbors”算法在这项研究中表现出最高的性能水平,精度率为97%。这项研究对正在进行的与财务欺诈的斗争做出了重大贡献,并为未来的研究工作提供了宝贵的指导。
有效管理海草栖息地需要有关海草状况和分布的详细信息。本文介绍了一项更大规模研究的第一步,该研究旨在评估波多黎各卡哈德穆埃托斯岛自然保护区内海草分布的长期变化。使用 WorldView-2 (WV-2) 图像和现场数据集对保护区内的海草床进行了高空间分辨率表征。WV-2 得出的海底反射率和水深测量数据用于进行基于对象的图像分析 (OBIA)。此分析的波段选择基于现场光谱水衰减测量。通过监督分类和上下文编辑对 OBIA 的结果多边形进行分类。使用 164 个采样点对图像进行了校准和验证。与传统的精度评估工具一起,创建了可靠性图,以提供评估地图精度的另一个指标。总体准确率为 96.59%,总海草准确率为 100%。海草床主要位于岛屿的西部和北部,主要由 Thalassia testudinum 和 Syringodium filiforme 组合组成。结果表明,光照可用性不是研究区域海草定植的限制因素,强波浪能可能是调节海草分布的重要因素。这张海草栖息地地图改进了之前的测绘工作,是该保护区的第一张高空间分辨率地图。事实证明,所使用的数据和方法对于在高度复杂的底栖环境中绘制海草栖息地地图非常有效。