8 美国马萨诸塞州贝尔蒙特麦克莱恩医院抑郁、焦虑和压力研究中心 9 美国爱达荷州莫斯科爱达荷大学商学院 10 瑞典斯德哥尔摩斯德哥尔摩经济学院 11 荷兰莱顿大学心理学系 12 德国巴伐利亚州慕尼黑路德维希马克西米利安大学统计学系 13 奥地利蒂罗尔州因斯布鲁克大学 14 华盛顿州西雅图大学 15 斯坦福大学元研究创新中心 (METRICS) 以及医学系、流行病学系、人口健康系、生物医学数据科学系和统计学系,美国加利福尼亚州斯坦福 16 康涅狄格大学,美国康涅狄格州斯托尔斯 17 法国巴黎萨克雷大学,伊维特河畔吉夫 18 阿姆斯特丹自由大学,荷兰北荷兰省 19 卡罗琳斯卡医学院,瑞典索尔纳 20 柏林欧洲医学与技术学院,德国柏林 21 慕尼黑大学统计学系和医学信息处理、生物统计学和流行病学研究所,德国巴伐利亚州慕尼黑 22 伦敦大学学院心理学和语言科学系,英国伦敦 WC1H 0AP,贝德福德路 26 号 23 伊利诺伊大学香槟分校,美国伊利诺伊州厄巴纳 24 弗吉尼亚大学法学院,美国弗吉尼亚州夏洛茨维尔 Massie Road 580 号 25 马克斯普朗克经验美学研究所,德国法兰克福 26 鲁汶大学,比利时鲁汶 27 欧洲工商管理学院,法国法兰西岛枫丹白露 28 蒂尔堡大学方法论和统计学系,荷兰蒂尔堡 29 达特茅斯学院,德国汉诺威美国新罕布什尔州 30 美国马萨诸塞州波士顿哈佛医学院精神病学系 31 法国法兰西岛伊维特河畔吉夫 Neurospin CEA 32 德国巴伐利亚州慕尼黑大学医学信息处理、生物统计学和流行病学研究所 33 荷兰格罗宁根大学 Nieuwenhuis 教育研究所
主观工作负荷和态势感知指标,如 NASA 任务负荷指数 (TLX) 和态势感知评分技术 (SART),经常用于人机系统评估。然而,这些评分的解释存在争议。在本研究中,通过比较操作员在执行场景后立即收集的评分和操作员通过视频回顾场景获得实际系统状态知识后收集的评分,调查了这些指标理论假设的经验证据。18 名有执照的控制室操作员参加了模拟器研究,运行了 12 个相对具有挑战性的场景。结果发现,在操作员获得事实场景知识后,对涉及内省的 TLX 项目的解释保持稳定,而对涉及对外部事件的感知的项目(如态势感知和表现)的解释则取决于操作员的场景知识。结果表明,操作员的评分可以区分心理努力、表现、挫折和态势感知。没有发现 SART 指数作为态势感知衡量标准的明确证据。相反,为本研究开发的主观情境意识测量方法与工作量不同,与操作员绩效相关,表明这种类型的测量方法值得未来研究其有效性。研究结果有助于制定测量程序
ocorre............................................................................................................................47
在外星任务中,低重力(0 < G < 1)对人体的影响会降低机组人员的幸福感,导致肌肉骨骼问题并影响他们执行任务的能力,尤其是在长期任务期间。迄今为止,关于低重力对人体运动影响的研究仅限于对下肢的实验。在这里,我们将知识库扩展到上肢,通过进行实验来评估低重力对参与者上肢身体疲劳和心理负荷的影响。我们的假设是,低重力既可以提高参与者的生产力,通过减少以耐力时间表示的整体身体疲劳,也可以减少心理负荷。任务强度-耐力时间曲线是在执行静态、动态、重复任务时,尤其是在坐姿下形成的。这项实验涉及 32 名健康参与者,没有肌肉骨骼系统的慢性问题,年龄为 33.59 ± 8.16 岁。使用收集的数据,为不同强度的任务构建了疲劳模型。此外,所有参与者都完成了 NASA - 任务负荷指数主观心理负荷评估,该评估揭示了执行不同任务时的主观负荷水平。我们在经验疲劳模型中发现了两种趋势,与男性和女性的力量能力差异有关。第一个趋势是耐力时间和重力 l 之间存在显着的正相关(p = 0.002)
研究文章|行为/认知认知障碍的网络结构:从主观认知下降到阿尔茨海默氏病https://doi.org/10.1523/jneurosci.1344-23.2023收到:2023年7月17日收到:2023年7月17日修订:2023年10月12日接受:2023年11月12日接受:2023年11月12日Copyright copyright the 2022 copyright the 2024 copyright the 2024 dive 2024
。cc-by-nc-nd 4.0国际许可证(未经同行评审证明)获得的是作者/资助者,他授予Biorxiv授予Biorxiv的许可,以永久显示预印本。这是此预印本版本的版权持有人,该版本发布于2025年2月10日。 https://doi.org/10.1101/2025.02.09.637302 doi:Biorxiv Preprint
Giorgia Tosi, 1, 2 Salvatore Nigro, 3 Daniele Urso, 3, 4 Spinosa victory, 3, 5 Valentina Gnoni, 3, 4 Marco Filardi, 3, 5 Francesco Giaquinto, 1 Ezia Rizzi, 1 Marika Iaia, 1 Luigi Macchitella, 6 Ylenia Chiarello, 3 Federico Ferrari, 3 Paola Angelelli,1 Daniele Romano,1,2 *和Giancarlo Logros 5 * 1人与社会科学系,萨伦多大学,LECCE 73100,意大利,2个心理学系,米兰 - 比科卡,米兰大学,20126年,米兰大学,20126年,意大利大学,意大利大学,3个中心疾病中心,神经性疾病中心和艾格·阿尔·阿尔德·阿尔·阿尔·阿尔·帕卡尔·帕卡尔·帕卡尔·帕卡尔·帕尔·普里克(Aging Al) 73039, Italy, 4 Department of Neurosciences, King 'S College London, Institute of Psychiatry, Psychology and Neuroscience, London Se5 8AF, United Kingdom, 5 Department of Basic Medicine, Neuroscience, and Sense Organs, University of Bari Aldo Moro, Bari 70121, Italy, and 6 scientific institute I.R.C.C.C.C.S.“ E. Medea” - 发育年龄和年轻人的严重残疾单位(发育神经病学和神经康复),Brindisi 72100,意大利
监督分类在很大程度上取决于人类注释的数据集。然而,在诸如毒性分类之类的主观任务中,这些注释通常在评估者之间表现出较低的一致性。注释通常是通过采用多数投票来确定单个地面真相标签的方法来汇总的。在主观任务中,汇总标签将导致标签有偏见,并且会导致有偏见的模型,这些模型可以忽略次要意见。先前的研究已经阐明了标签聚合的陷阱,并引入了一些解决这个问题的实用方法。最近提出的多种注释模型,该模型可以预测每个注释者的个体标签,因此很容易受到样本很少的注释者的不良确定。此问题在众包数据集中加剧了。在这项工作中,我们为主观分类任务的文本(AART)提出了注释者意识表示表示。我们的方法涉及注释者的学习表示,允许探索注释行为。我们展示了我们对指标方法的改进,这些指标评估了限制单个注释者观点的绩效。在方面,我们证明了与Others相比,评估环境化注释者的模型公平性的公平指标。1
摘要 智能代理必须能够传达意图并解释其决策过程,以建立信任、培养信心并改善人机团队动态。认识到这一需求,学术界和工业界正在迅速提出新的想法、方法和框架,以帮助设计更可解释的人工智能。然而,仍然没有标准化的指标或实验协议来对新方法进行基准测试,研究人员只能依靠自己的直觉或临时方法来评估新概念。在这项工作中,我们提出了第一个全面的(n=286)用户研究,测试了可解释机器学习的广泛方法,包括特征重要性、概率分数、决策树、反事实推理、自然语言解释和基于案例的推理,以及没有解释的基线条件。我们提供了可解释性对人机团队影响的第一个大规模实证证据。我们的研究结果将通过强调反事实解释的好处和可解释性置信度得分的缺点,帮助指导可解释性研究的未来。我们还提出了一种新颖的问卷,用于衡量人类参与者的可解释性,该问卷受到相关先前工作的启发,并与人机协作指标相关联。
现代电信网络使用多种传输系统提供广泛的语音服务。尤其是,数字技术的快速部署导致对评估新传输设备的传输特性的需求增加。在许多情况下,有必要确定某些新传输设备或对电话网络传输特性的修改的主观影响。本建议书描述了获取传输系统和组件主观评估的方法。建议书 G.113 包含有关可能发生的损伤的有用信息。建议书 P.11 讨论了传输损伤可能对电信网络和服务用户产生的影响。本建议书中描述的方法可用于估计建议书 G.113 中描述的设备损伤因子 (eifs) 或量化失真单位 (qdus)。