摘要 自动更正是移动文本输入的标准功能。虽然最先进的自动更正方法的性能通常相对较高,但发生的任何错误都很麻烦,会中断文本输入流程,并挑战用户对过程的自主性。在本文中,我们描述了一个旨在自动识别和修复自动更正错误的系统。该系统包括一个多模态分类器,用于根据大脑活动、眼神注视和上下文信息检测自动更正错误,以及一种通过替换错误更正或建议替代方案来修复此类错误的策略。我们将这两个部分集成到一个通用的 Android 组件中,从而提出了一个研究自我修复端到端系统的研究平台。为了证明其可行性,我们进行了一项用户研究来评估我们方法的分类性能和可用性。
hal是一个多学科的开放访问档案,用于存款和传播科学研究文件,无论它们是否已发表。这些文件可能来自法国或国外的教学和研究机构,也可能来自公共或私人研究中心。
1602 CV: Biometrics, Face, Gesture & Pose Gaze Label Alignment: Alleviating Domain Shift for Gaze Estimation Guanzhong Zeng; Jingjing Wang; Zefu Xu; Pengwei Yin; Wenqi Ren; Di Xie; Jiang Zhu Saturday March 1, 12:30pm-2:30pm
摘要:驾驶舱监控不力已被确定为导致航空事故的重要因素。因此,改进飞行员的监控策略有助于提高飞行安全性。在两个不同的环节中,我们在全飞行模拟器中分析了专业航空公司飞行员的飞行性能和眼球运动。在预训练环节中,20 名飞行员以飞行员飞行 (PF) 的身份执行了手动进近场景,并根据其飞行性能分为三组:不稳定、标准和最准确。不稳定的飞行员对各种仪器的关注不足或过度。他们的视觉扫描模式数量低于设法稳定进近的飞行员。最准确的飞行员表现出更高的感知效率,注视时间更短,对重要主要飞行仪表的注视更多。大约 10 个月后,14 名飞行员返回进行后续训练。他们接受了一项短期培训计划,并执行了与预训练课程类似的手动方法。其中七人(实验组)收到了关于他们自己的表现和视觉行为(即在预训练课程期间)的个人反馈,以及从最准确的飞行员那里获得的各种数据,包括一段眼动追踪视频,其中显示了最准确的飞行员之一的有效视觉扫描策略。另外七人(对照组)收到了有关驾驶舱监控的一般指导。在训练后阶段,实验组的飞行表现更好(与对照组相比),其视觉扫描策略与最准确的飞行员的视觉扫描策略更加相似。总之,我们的结果表明,驾驶舱监控是手动飞行性能的基础,并且可以使用主要基于高度准确的飞行员的眼动示例的训练计划来改进它。
摘要。凝视估计模型概括的能力受到与凝视无关的各种因素的限制,尤其是当训练数据集受到限制时。当前的策略旨在通过不同的领域概括技术来应对这一挑战,但是由于仅依靠价值标签进行回归的风险,它们的成功有限。预训练的视觉模型的最新进展使我们促使我们利用可用的大量语义信息。我们提出了一种新颖的方法,将目光估计任务重新构架为视觉对准问题。我们所提出的框架,名为语言引导的凝视估计(LG DAIM),从富有的视觉模型的先前知识中学习了连续和几何敏感的特征,从而获得了凝视估计的益处。具体来说,LG凝视通过我们提出的多模式对比回归损失将视线特征与连续的linguistic特征相结合,该损失可定制不同负面样品的自适应重量。此外,为了更好地适应凝视估计任务的标签,我们提出了一种几何学意识到的插值方法,以获取更精确的凝视嵌入。通过广泛的实验,我们在四个不同的跨域评估任务中验证了框架的效果。
长期以来,眼球运动一直被研究作为了解人类大脑注意力机制的窗口,并作为新颖的人机界面提供。然而,并不是我们注视的所有东西都是我们想要与之互动的东西;这被称为凝视界面的点石成金问题。为了克服点石成金问题,目前的界面往往不依赖自然的凝视线索,而是使用停留时间或凝视手势。在这里,我们提出了一种完全由数据驱动的方法,用于仅基于自然凝视线索来解码人类对对象操作任务的意图。我们进行了数据收集实验,其中 16 名参与者被赋予操作和检查任务,这些任务将在他们面前的桌子上的各种物体上执行。受试者的眼球运动使用可穿戴眼球追踪器记录,允许参与者自由移动头部并注视场景。我们使用我们的 Semantic Fovea,一种卷积神经网络模型来获取场景中的物体及其与每一帧的凝视轨迹的关系。然后,我们评估数据并研究几种对意图预测的分类任务进行建模的方法。我们的评估表明,意图预测不是数据的简单结果,而是依赖于凝视线索的非线性时间处理。我们将该任务建模为时间序列分类问题,并设计双向长短期记忆 (LSTM) 网络架构来解码意图。我们的结果表明,我们可以仅从自然凝视线索和物体相对位置解码人类的运动意图,准确率为 91.9%。我们的工作证明了自然凝视作为人机交互的零 UI 界面的可行性,即用户只需自然地行动,而不需要与界面本身交互或偏离其自然的眼球运动模式。
摘要:长期以来,眼球注视追踪器因其在航空领域的实用性而受到广泛研究。到目前为止,已经在飞行电子显示器和模拟条件下头戴式显示系统的注视控制界面方面进行了大量研究。在本文中,我们介绍了在实际飞行条件下眼球注视追踪器的使用情况及其在此类使用条件和照明下的故障模式的研究。我们表明,具有最先进精度的商用现货 (COTS) 眼球注视追踪器无法提供超出一定眼部照明水平的注视估计。我们还表明,眼球注视追踪器的有限可用跟踪范围限制了它们即使在飞行员自然操作行为期间也无法提供注视估计。此外,我们提出了三种开发眼球注视追踪器的方法,这些方法旨在使用网络摄像头代替红外照明,旨在在高照度条件下发挥作用。我们展示了使用 OpenFace 框架开发的智能追踪器,在室内和室外条件下的交互速度方面,它提供了与 COTS 眼动追踪器相当的结果。
nglsync.cengage.com student01@ocpsmath2021discrete.comWelcome1 可以从试用版 NGLSync 门户访问这些帐户。学校名称应为“试用版学校”,密码为 Welcome1。一次只能有一个人使用模拟帐户查看。单击“启动课程”进入 WebAssign。选择我的电子书或滚动到页面底部并单击书籍封面进行查看。金融代数 Savvas Learning Company LLC 定量思维:用数字沟通 2e c2020 (Gaze) [FL Math for Data & Fin Lit - Regular]
图 4 凝视运动。 (a) 三种模式下参与者目光注视的示例。屏幕上显示 16 个字母数字字符,由 4×4 矩阵表示。每次试验在 16 个字符中有一个、三个或五个目标与声音呈现的单词相匹配。在单人模式下,屏幕上显示的红色圆圈表示参与者的注视点。在合作和竞争模式下,屏幕上两位参与者的注视点以红色和绿色圆圈区分。 (b) 单次试验中观察到的参与者扫描路径和注视热图的示例。虚线框在实验期间不可见,标记了目标的位置。请注意,观察者的注视点在实验期间不可见。 (c) 40 次试验的注视热图。 (d) 两位参与者眼动追踪热图之间的相似性。每个小提琴图(透明色)上都叠加了一个箱线图,显示了相似性度量的分布,包括单一、合作和竞争模式下的 Pearson's r、结构相似性指数度量 (SSIM) 和 Jaccard 相似性系数。黑色星号和线分别表示相似性的平均值和中位数。使用重复测量方差分析确定任务模式之间相似性的显著差异。
