重复使用本文是根据创意共享归因(CC BY)许可的条款分发的。此许可证允许您在作品上分发,混音,调整和建立工作,只要您将作者归功于作者的原始作品。此处的更多信息和许可证的完整条款:https://creativecommons.org/licenses/
研究团队开发了自适应采样器ASr,一种基于任务多样性、熵和难度动态加权的分 布生成函数,以优化元学习模型的泛化性能,并为此提出了一种通用的元学习算法。 研究团队在多个基准数据集和不同学习场景下对所提方法进行了广泛实验,包括小 样本学习、跨域学习、多域学习和增量学习等,并从多个维度对方法的有效性、泛化性 、计算效率等进行了评估和对比,结果证明了所提方法在不同网络架构和元学习框架下 的优越性能和通用性。
摘要 各行业光电设备的特性以及降低成本的目标追求要求光电系统具有高可靠性。在这方面,可以通过可靠性分配问题来解决可靠性改进。必须提高子系统的可靠性,以确保符合设计人员的意见,满足要求以及定义的必要功能。本研究试图通过最大化系统可靠性和最小化成本来开发一个多目标模型,以研究设计阶段成本以及生产阶段成本。为了研究设计阶段可靠性改进的可行性,使用系统中有效的可行性因素,并将 sigma 水平指数纳入生产阶段作为可靠性改进难度因素。因此,考虑了子系统可靠性改进的优先级。通过设计结构矩阵研究子系统依赖程度,并将其与修正的关键性一起纳入模型的局限性中。通过目标规划将主模型转化为单目标模型。该模型在光电系统上实现,并对结果进行了分析。在该方法中,可靠性分配分为两个步骤。首先,根据分配权重确定子系统的可靠性范围。然后,根据子系统可靠性改进的成本和优先级启动改进。
摘要 目的是评估医生与电子健康记录 (EHR) 交互过程中任务需求、心理努力、任务难度和绩效之间的关系。 17 位医生执行了三个基于 EHR 的场景,任务需求各不相同。心理努力通过眼动追踪测量通过任务诱发瞳孔反应 (TEPR)、眨眼频率和注视速度来测量;任务难度(或用户行为)通过频繁的鼠标点击模式和任务流来测量;用户绩效使用两种类型的遗漏错误来量化:(i) 没有证据表明尝试完成任务的遗漏错误和 (ii) 有证据表明尝试但无法完成任务的遗漏错误。结果表明,任务需求显著增加心理努力,但没有增加任务难度。任务需求、心理努力和任务难度均可预测绩效。具体而言,(i) 没有证据表明尝试完成任务的任务需求、TEPR 和遗漏错误与 (ii) 有证据表明尝试但无法完成任务的眨眼频率、重复搜索点击和遗漏错误之间存在显著关系。总体而言,结果表明,医生在 EHR 交互过程中的表现受到任务要求和脑力劳动增加的负面影响。这凸显了除了 EHR 可用性改进之外,还需要实施适当的质量保证 (QA) 措施,以最大限度地减少遗漏错误并提高医生的表现。
摘要 随着人工智能 (AI) 在工业和社会中的广泛应用,有效的人机交互系统变得越来越重要。人类与人工智能交互的一个核心挑战是估计人类和人工智能代理在单个任务实例中的难度。这些估计对于评估每个代理的能力至关重要,因此需要促进有效的协作。到目前为止,人机交互领域的研究是独立估计人类和人工智能的感知难度。然而,人类和人工智能代理的有效互动取决于准确反映每个代理在实现有价值结果方面的感知难度的指标。迄今为止的研究尚未充分研究人类和人工智能感知难度的差异。因此,这项工作回顾了最近关于人机交互感知难度的研究以及一致比较每个代理感知难度的促成因素,例如创建相同的先决条件。此外,我们提出了一个实验设计来彻底检查两个代理的感知难度,并有助于更好地理解此类系统的设计。
摘要 本文提出了一种自适应任务难度分配方法,我们称之为平衡难度任务查找器 (BDTF)。其目的是通过平衡学习者的技能和任务难度来向学习者推荐任务,使学习者在学习过程中体验到心流状态。心流是心理学家指某人完全沉浸在某项活动中时的一种心理状态。心流状态是一个多学科的研究领域,不仅在心理学领域,而且在神经科学、教育、体育和游戏中都有研究。本文背后的想法是尝试以类似于 Elo 的国际象棋技能评级(Glickman 在 Am Chess J 3:59–102 中)和 TrueSkill(Herbrich 等人在 Advances in neuro information processing systems, 2006 中)的方式实现匹配游戏玩家的流畅状态,其中“匹配的玩家”应拥有类似的能力和技能,以保持游戏的积极性和参与度。 BDTF 将选择合适的对手或合适的游戏级别与自动选择学习任务的适当难度级别进行了类比。 作为一种智能辅导系统,该方法可用于从在线学习环境和电子学习到传统方法中的学习和记忆技术(例如调整延迟匹配以进行样本和间隔检索训练)的广泛应用,这些训练可用于患有痴呆症等记忆问题的人。
腹腔镜胆囊切除术 (LC) 是切除胆囊的标准手术。虽然该手术已发展成为一种相对安全且可耐受的日间手术,但有时可能会很困难,并且可能会出现并发症。复杂的胆结石疾病,如胆囊炎或胆结石性胰腺炎,是增加 LC 技术难度的危险因素。虽然可以对手术难度进行术前预测,但围手术期发现可能会令人惊讶。使用基于 AI 的模型了解手术场景的难度对于对手术性能进行基准测试和改进手术室规划非常重要。本研究旨在开发一种深度学习 (DL) 来预测腹腔镜胆囊切除术在特定手术发现上的难度。基于 Nassar 评分使用了难度分级量表。为了训练 DL 网络,从录制的视频中提取了帧。所有帧均标记为“胆囊”难度 1-3 级和“粘连”难度 1-3 级。排除由体外图像组成或胆囊不可见的帧。总共有 26.483 帧。ResNet 用作模型的主干。调整超参数以改善模型结果。多类和二元分类网络都经过了训练。训练用于分类胆囊难度(3 级)的网络比训练用于分类粘连难度的网络表现更好(准确率 74%)。可以对胆囊炎进行分类,准确率为 91%,对简单病例进行分类,准确率为 87%。本研究结果可作为进一步研究 LC 难度分类的起点。这是提高对手术场景理解并为 LC 外科医生提供基准的第一步。
在实际教育应用中,广泛需要对书籍级长文本进行可读性评估。然而,目前大多数研究都集中在段落级可读性评估,对超长文本的处理工作很少。为了更好地处理长序列的书籍文本并利用难度知识增强预训练模型,我们提出了一种新颖的模型 DSDR、难度感知片段预训练和难度多视图表示。具体来说,我们将所有书籍分成多个固定长度的片段,并采用无监督聚类来获得难度感知片段,这些片段用于重新训练预训练模型以学习难度知识。因此,长文本通过对具有不同难度级别的多个片段向量进行平均来表示。我们构建了一个新的儿童分级读物数据集来评估模型性能。我们提出的模型取得了令人满意的结果,优于传统的 SVM 分类器和几种流行的预训练模型。此外,我们的工作为书籍级可读性评估建立了一个新的原型,为未来相关研究提供了重要的基准。
关于问题难度估计的研究需要用于准确评估工具和其他模型出于不同的目的。近年来包括基于BERT(双向编码器表示),RNN(经常性神经网络)和其他分类模型的许多主题。传统的问题难度估计方法主要集中在语言和结构分析上,并接受了大型预先标记的问题及其难度水平的培训。本章提出了一种将这些常规技术与生成AI结合起来的方法,以实现更准确的问题难度估计。该方法的原则是,随着AI系统更深入地介入文档以提出问题,产生的问题可能更复杂或稀有
