摘要 — 机器学习模型在对未知数据集进行推理时,通常会对熟悉的组或相似的类集产生有偏差的输出。人们已经研究了神经网络的泛化以解决偏差,这也表明准确度和性能指标(例如精确度和召回率)有所提高,并改进了数据集的验证集。测试和验证集中包含的数据分布和实例在提高神经网络的泛化方面起着重要作用。为了生成无偏的 AI 模型,不仅应对其进行训练以实现高精度并尽量减少误报。目标应该是在计算权重时防止一个类/特征对另一个类/特征占主导地位。本文使用选择性得分和余弦相似度等指标研究了 AI 模型上最先进的对象检测/分类。我们专注于车辆边缘场景的感知任务,这些任务通常包括协作任务和基于权重的模型更新。分析是使用包括数据多样性差异、输入类的视点和组合的案例进行的。我们的结果表明,使用余弦相似度、选择性得分和不变性来衡量训练偏差具有潜力,这为开发未来车辆边缘服务的无偏 AI 模型提供了启示。索引术语 — 偏差、数据多样性、特征相似度、泛化、选择性得分
在现实条件下评估心理负荷是确保执行需要持续注意力的任务的工人表现的关键。先前的文献已经为此采用了脑电图 (EEG),尽管已经观察到脑负荷与脑电图的相关性因受试者和身体压力而异,因此很难设计出能够同时呈现不同用户可靠表现的模型。领域适应包括一组策略,旨在提高机器学习系统在训练时对未见数据的性能。然而,这些方法可能依赖于对所考虑的数据分布的假设,而这些假设通常不适用于 EEG 数据的应用。受这一观察的启发,在这项工作中,我们提出了一种策略来估计从不同受试者收集的数据中观察到的多种数据分布之间的两种差异,即边际和条件偏移。除了阐明对特定数据集成立的假设之外,使用所提出的方法获得的统计偏移估计值还可用于研究机器学习管道的其他方面,例如定量评估领域适应策略的有效性。具体来说,我们考虑了从在跑步机上跑步和在固定自行车上踩踏板时执行心理任务的个体收集的脑电图数据,并探索了通常用于减轻跨受试者变异性的不同标准化策略的影响。我们展示了不同的标准化方案对统计变化的影响,以及它们与在训练时对未见过的参与者进行评估的心理工作量预测准确性的关系。
摘要 — 由于脑电图 (EEG) 的受试者间/受试者内变异性,脑机接口 (BCI) 在实践中难以使用。通常,BCI 系统需要一种校准技术来获取受试者/会话特定数据,以便在每次使用系统时调整模型。这个问题被认为是 BCI 的一个主要障碍,最近出现了一种基于领域泛化的新策略来解决它。鉴于此,我们专注于开发一个 EEG 分类框架,该框架可以直接应用于来自未知域(即受试者)的数据,仅使用先前从不同受试者获得的数据。为此,在本文中,我们提出了一个框架,该框架采用开放集识别技术作为辅助任务,从源数据集中学习特定于主题的风格特征,同时帮助共享特征提取器将看不见的目标数据集的特征映射为新的看不见的域。我们的目标是在同一域中施加跨实例样式不变性,并降低潜在未见主体的开放空间风险,以提高共享特征提取器的泛化能力。我们的实验表明,使用域信息作为辅助网络可以提高泛化性能。临床相关性——本研究提出了一种提高独立于主体的 BCI 系统性能的策略。我们的框架可以帮助减少进一步校准的需要,并可用于一系列心理状态监测任务(例如神经反馈、癫痫发作的识别和睡眠障碍)。
偏向多数人群的算法偏差对机器学习在精准医疗中的应用构成了关键挑战。在本文中,我们评估了脑功能磁共振成像行为表型预测模型中的这种偏差。我们使用两个由混合族裔/种族组成的独立数据集(青春期前与成年)检查了预测偏差。当使用以白人美国人(WA)为主的数据训练预测模型时,非裔美国人(AA)的样本外预测误差通常高于 WA。这种对 WA 的偏差对应于模型学习到的更多类似 WA 的大脑行为关联模式。当仅使用 AA 训练模型时,与仅使用 WA 或相同数量的 AA 和 WA 参与者进行训练相比,AA 预测准确度有所提高,但仍低于 WA。总体而言,结果表明,需要谨慎对待当前大脑行为预测模型在少数族裔人群中的应用,并进行进一步研究。
本文内容(插入演示文稿、文章、视频等)是根据联邦教育部与堪萨斯州教育部达成的协议开发的。但是,这些内容不一定代表教育部的政策,您不应认为这些内容已获得堪萨斯州教育部或联邦政府的认可。TASN 自闭症和高等教育行为支持由堪萨斯州教育部特殊教育和职称服务部管理的 B 部分资金资助。TASN 自闭症和高等教育行为支持在其计划和活动中不会因种族、肤色、国籍、性别、残疾或年龄而歧视任何人。以下人员已被指定处理有关非歧视政策的问询:Keystone Learning Services 副主任,500 E. Sunflower,Ozawkie KS 66070,785.876.2214 12/16/21
我们提出了一种针对受保护或敏感因素实施 AI 公平性的新方法。该方法使用双重策略执行训练和表示改变 (TARA) 来缓解 AI 偏见的主要原因,包括:a) 通过对抗独立性使用表示学习改变来抑制数据表示对受保护因素的偏见依赖性;以及 b) 通过智能增强改变训练集以解决引起偏见的数据不平衡,通过使用生成模型,允许通过领域适应和潜在空间操纵对与代表性不足的人群相关的敏感因素进行精细控制。在图像分析上测试我们的方法时,实验表明 TARA 显著或完全消除了基线模型的偏差,同时优于具有相同信息量的其他竞争性消除偏差方法,例如,对于 Eye-PACS,(% 总体准确度,% 准确度差距) = (78.8, 0.5) vs. 基线方法的得分 (71.8, 10.5),对于 CelebA,(73.7, 11.8) vs. (69.1, 21.7)。此外,认识到当前用于评估消除偏差性能的指标的某些局限性,我们提出了新颖的联合消除偏差指标。我们的实验还证明了这些新指标在评估所提出方法的帕累托效率方面的能力。