计算机科学与工程系教职员工1学生,计算机科学与工程系2,3,4,5 Vidya Vikas工程技术研究所,印度卡纳塔克邦迈索鲁,摘要:在由一个物理挑战的人控制鼠标时,实际上是一个艰难的人。要为无法物理使用鼠标使用的人找到解决方案,我们建议使用眼动动作该鼠标光标控制。眼目光是使用眼动以控制鼠标的访问计算机的另一种方法。对于那些细触摸屏的人来说,鼠标无法访问,眼睛凝视是一种替代方法,可以使用眼睛的运动来操作用户计算机。眼运动可以被视为人力计算机通信的关键实时输入介质,这对于身体残疾的人尤为重要。为了提高用户计算机对话中眼睛跟踪技术的可靠性,移动性和可用性,使用网络摄像头提出了一种新颖的眼部控制系统,而无需使用任何额外的硬件。所提出的系统专注于仅使用用户的眼睛提供简单便捷的交互式模式。所提出的系统的使用流旨在完美遵循人类的自然习惯。提议的系统描述了虹膜的实现和光标的实现,该系统可根据IRIS位置进行,可用于使用网络摄像头在屏幕上控制光标,并使用Python关键字实施:脆弱性,Web应用程序,虚拟鼠标,人类计算机交互
摘要 - 对于扩展现实(XR)耳机,关键目的是3D空间中的自然交互,超出了传统的键盘,鼠标和触摸屏的方法。随着Apple Vision Pro的发布,现在广泛使用了一种新颖的互动范式,用户可以通过综合使用眼睛和手来无缝导航内容。然而,将这些方式融合会带来独特的设计挑战,因为它们的动态性质以及缺乏既定的原则和标准。在本文中,我们介绍了凝视 +捏互动技术的五个设计原理和问题,这是由人类计算机相互作用领域的眼手研究所启示的。设计原理包括劳动和简约时机等机制,这些机制对于可用性至关重要,以及对对象,间接相互作用和拖放的操纵的增强。无论是在设计,技术还是研究领域,此探索都为导航3D相互作用的不断发展的景观提供了宝贵的观点。
摘要 - 视频游戏和虚拟现实体验中虚拟角色的示威行为是现实主义和沉浸式的关键因素。的确,目光在与环境互动时扮演着许多角色。它不仅表明了角色在看什么,而且在言语和非语言行为以及使虚拟字符还活着中起着重要作用。凝视行为的自动计算是一个具有挑战性的问题,迄今为止,现有方法都无法在交互式环境中产生近实现的结果。 因此,我们提出了一种新型方法,该方法利用了与视觉显着性,注意力机制,accadic行为建模和头部凝视动画技术有关的几个不同领域的最新进展。 我们的方法阐明了这些进步,以收敛于多映射显着驱动的模型,该模型为非交流字符提供实时现实的凝视行为,以及与可自定义功能相比,其他用户控制,以构成各种各样的结果。 我们首先通过客观评估评估我们的方法的好处,该评估使用专门为此目的获得的眼睛跟踪数据集面对地面真理数据面对我们的视线模拟。 然后,与从真实演员捕获的凝视动画相比,我们依靠主观评估来衡量我们方法产生的凝视动画的现实水平。 我们的结果表明,我们的方法会生成视力行为,这些行为无法与捕获的凝视动画区分开。凝视行为的自动计算是一个具有挑战性的问题,迄今为止,现有方法都无法在交互式环境中产生近实现的结果。因此,我们提出了一种新型方法,该方法利用了与视觉显着性,注意力机制,accadic行为建模和头部凝视动画技术有关的几个不同领域的最新进展。我们的方法阐明了这些进步,以收敛于多映射显着驱动的模型,该模型为非交流字符提供实时现实的凝视行为,以及与可自定义功能相比,其他用户控制,以构成各种各样的结果。我们首先通过客观评估评估我们的方法的好处,该评估使用专门为此目的获得的眼睛跟踪数据集面对地面真理数据面对我们的视线模拟。然后,与从真实演员捕获的凝视动画相比,我们依靠主观评估来衡量我们方法产生的凝视动画的现实水平。我们的结果表明,我们的方法会生成视力行为,这些行为无法与捕获的凝视动画区分开。总的来说,我们认为这些结果将为实时应用程序的现实和连贯凝视动画的更自然和直观设计开辟道路。
摘要 空间定向障碍 (SD) 对飞行安全构成严重威胁。飞行员的注视行为表征了他的视觉感知和注意力,决定了能否成功应对这一现象。无论飞行员的经验或熟练程度如何,感官错觉都会导致仪表指示与飞行员“感觉”之间的差异。了解模拟器诱导的 SD 提示如何影响飞行员和非飞行员的注视行为是我们的兴趣所在,也是本研究的目标。使用 SD 飞行模拟器,40 名男性(20 名军事飞行员;20 名非飞行员)经历了 12 个飞行序列。我们测量并比较了两组(飞行员与非飞行员)和飞行类型(非 SD 与 SD 飞行)受试者对三种视觉和三种运动错觉的注视行为和飞行表现。仅在三种错觉(假地平线、躯体旋转和科里奥利)中应用 SD 提示,即可观察到与非 SD 飞行相比视觉注意力分布的差异。专业知识和飞行类型之间没有相互作用。除着陆外,飞行员的平均注视时间比非飞行员短。对于相同的 SD 飞行剖面,我们发现受试者的注视行为和飞行表现发生了变化。SD 提示以相同的方式影响飞行员和非飞行员;因此,成为驾驶飞机的专家并不会降低飞行员失去空间方向感的敏感性。眼动追踪技术可用于分析飞行员的注意力,以及更好地理解和训练飞行员在 SD 事件期间的飞行表现。
头部运动是 VR/AR 头戴设备的常见输入方式。然而,尽管它们使用户能够控制光标,但它们缺乏触发操作的集成方法。存在许多方法可以填补这一空白:专用的“点击器”、设备上的按钮、空中手势、停留、语音和基于将头部运动与视觉呈现的目标相匹配的新输入技术。这些提议多种多样,目前缺乏关于这些不同技术的性能、体验和偏好的实证数据。这妨碍了设计师选择合适的输入技术进行部署的能力。我们进行了两项研究来解决这个问题。一项 Fitts 定律研究比较了五种传统的选择技术,并得出结论:点击器(手动)和停留(免提)提供了精度、速度和物理负荷的最佳组合。一项后续研究将点击器和停留与运动匹配实现进行了比较。虽然点击器保持最快且停留最准确,但运动匹配可能在这两极之间提供有价值的折衷。
这篇论文由 ScholarWorks 的 Walden 论文和博士研究系列免费提供给您,供您开放访问。它已被 ScholarWorks 的授权管理员接受并收录在 Walden 论文和博士研究中。如需更多信息,请联系 ScholarWorks@waldenu.edu。
凝视估计方法由于测试和训练数据之间的域间隙,在跨不同领域进行评估时,经常会出现明显的表现降解。现有方法试图使用各种主要的概括方法来解决此问题,但由于凝视数据集的多样性有限,例如外观,可穿戴和图像质量,因此很少成功。为了克服这些限制,我们提出了一个名为Clip Gaze的新型框架,该框架利用预先训练的视觉模型来利用其可转移的知识。我们的框架是第一个利用视觉和语言跨模式的方法来进行凝视任务。具体来说,我们通过将其从凝视式的功能推开,可以通过语言描述灵活构建,从而提取了与凝视的功能。要学习更多合适的提示,我们建议一种个性化的上下文优化方法,以提示提示。此外,我们还利用凝视样本之间的关系来完善视线相关特征的分布,从而提高了凝视估计模型的概括能力。的实验实验表明,在四个跨域评估上,夹具凝视的表现出色。
眼目光跟踪传统上采用了相机来捕捉参与者的眼睛移动并表征其视觉固定。但是,凝视模式识别仍然具有挑战性。这既是凝视点的稀疏性,并且看似随机的方法参与者在没有设定任务的情况下以陌生的刺激来观看陌生的刺激。我们的论文提出了一种通过将固定的二维(x,y)坐标纳入一维希尔伯特曲线距离度量标准的二维(x,y)坐标,将眼睛注视到机器学习中的方法,使其非常适合实现机器学习。我们将这种方法与传统的基于网格的字符串替代技术进行比较,并在支持向量机和卷积神经网络中证明了实施示例。最后,将进行比较,以检查哪种方法的性能更好。结果表明,此方法既可以对大型数据集中的统计显着性进行动态量化扫描路径有用,又可以调查当参与者在免费观看实验中观察到的不熟悉刺激时,在共享自下而上处理中发现的相似性的细微差别。现实世界的应用程序可以包括与专业知识相关的眼光预测,医疗筛查和图像显着性识别。关键字:神经科学,眼动追踪,分形,支持向量机,卷积神经网络。
1 NB:为了促进本文的可读性,我们将其称为“具有ASC诊断或高自闭症性状的人”为“具有高自闭症特征的人”,因为这两个群体都在自闭症特征问卷上得分很高。这符合在本综述中同时包括临床和非临床研究的方法论选择(有关理由,请参见方法部分)。
