纸和笔仍然是系统工程师用来捕捉系统模型的最常用工具。它们提高了生产力并促进了协作和创造力,因为用户不需要遵守计算机辅助系统工程 (CASE) 工具中通常用于系统建模的正式符号。然而,将白板上绘制的模型数字化到 CASE 工具中仍然是一项困难且容易出错的活动,需要工具专家的知识。在过去十年中,从符号推理转向机器学习已成为许多领域提高软件应用程序性能的自然选择。自然素描和在线识别领域也不例外,大多数现有的素描识别器都依赖于预先训练的符号集来增加对识别器结果的信心。然而,这种性能的提高是以信任为代价的。缺乏信任直接源于神经网络结果缺乏可解释性,这阻碍了系统工程团队对其的接受。解决方案不仅应兼具性能和稳健性,还应赢得人类用户的毫无保留的支持和信任。虽然文献中的大多数作品都倾向于性能,但需要更好地将人类感知研究纳入方程式以恢复平衡。本研究提出了一种用于自然素描的方法和人机界面,使工程师能够使用交互式白板捕获系统模型。该方法结合了符号人工智能和机器学习的技术,以提高性能,同时不影响可解释性。该方法的关键概念是使用经过训练的神经网络在全局识别过程的上游将手写文本与几何符号分离,并使用合适的技术(OCR 或自动规划)分别识别文本和符号。该方法的主要优点是它不依赖任何其他交互方式(例如虚拟键盘)来注释具有文本属性的模型元素,并且保留了建模助手结果的可解释性。用户实验验证了界面的可用性。
摘要:沉浸式技术,尤其是增强现实(AR)和虚拟现实(VR),近年来已经显着发展,塑造了人类计算机相互作用的新领域。这些技术通过为用户提供独特而互动的体验来彻底改变娱乐,教育,医疗保健和零售等行业。虽然AR和VR具有相似之处,例如增强用户参与度和提供沉浸式体验,但它们在技术,应用和用户体验方面有很大差异。本文介绍了AR和VR的比较研究,研究了他们的技术基础,应用,挑战和潜在的未来发展。I.引言在过去的十年中,沉浸式技术已获得了显着的吸引力,而AR和VR处于这种转变的最前沿。这些技术允许用户以传统计算界面(例如屏幕和键盘)不能进行数字内容体验数字内容。通过将物理世界与虚拟元素(AR)混合或创建完全沉浸的虚拟环境(VR),这些技术重新定义了我们与数字内容的交互方式。ar和vr是扩展现实(XR)的更广泛类别的一部分,其中还包括混合现实(MR)。虽然AR和VR都经常串联使用,但它们具有不同的目的,并根据应用程序提供独特的优势。本文旨在探索AR和VR技术的演变,比较其能力,并评估它们对各个行业的影响。II。II。AR和VR 2.1的技术基础是什么是增强现实(AR)?增强现实(AR)是一项将数字信息(例如图像,声音或其他数据)叠加到现实世界中的技术。与虚拟现实不同,将用户沉浸在完全合成的环境中,AR通过添加用户可以实时与之交互的虚拟元素来增强现实世界。AR通常依赖于智能手机,平板电脑,智能眼镜或AR耳机等设备。这些设备使用摄像头和传感器来跟踪用户的环境并显示上下文信息。常见的AR应用程序包括导航辅助工具,PokémonGO等游戏以及互动培训模拟。
虚拟现实 (VR) 和增强现实 (AR) 技术越来越受欢迎。这些新技术的社会接受度具有重要意义,因为产品的成功很大程度上取决于技术是否被社会接受 [39]。尽管“接受度”或“一个人对使用技术的心理舒适度”似乎是一个简单的概念,但它背后可能隐藏着各种错综复杂的因素。为了研究社会中的技术接受度,先前的研究探讨了技术的“社会接受度”或“社会接受度”,定义为从执行者的角度 (即用户的感知) 在不同社会环境中使用新技术时感到的舒适或不适程度 [1, 33]。然而,这种方法可能无法让我们完全掌握社会接受度的构造:事实上,从用户的角度来看,社会接受度是用户自己对使用技术时在社交上感到舒适程度的感知。对于进一步理解社会接受度,额外衡量观察者(或旁观者)对新技术或新交互方式的接受程度可能很重要。了解这一点可能最终能让我们缓解用户在新的或习惯的社交环境中所经历的尴尬。因此,这一研究步骤可能有助于我们促进观察者对这些新技术的适应。尽管之前的研究已经调查了观察者在目睹用户操作新技术时对社会接受度的看法 [ 1 , 11 , 30 – 32 ],但据我们所知,目前还没有对这两种视角进行直接比较的研究,也没有明确的指导方针说明如果这两种视角不同,应该如何考虑。在本文中,我们研究了头戴式显示器 (HWD) 的社会接受度,因为它们正逐渐被用户所接受,并开始侵犯感知和与数字信息交互的传统方式。无论是在商业平台还是研究平台上,HWD 都已被证明可在多种情境中发挥作用 [3、4、10、21、27、35]。各种输入技术都被证明可以与 HWD 交互,包括强烈的泛音(如手势 [7]、头部运动 [13、18] 和语音命令 [18])到相对隐蔽的输入技术(如触摸板 [24] 和戒指 [9])。这些输入技术可能存在一些限制,通常是与情境相关的。例如,语音命令可能不适用于商务会议,而头部运动可能会引起他人不必要的注意,使表演者感到尴尬或不舒服。当然,更清楚地了解 HWD 输入法的社会接受度对于顺利促进技术采用至关重要。在本文中,我们从表演者(研究 1)和观察者(研究 2)的角度探讨了 HWD 输入的社会可接受性。更具体地说,我们探索用户和观察者对使用五种输入模式的看法,这些输入模式通常用于
近年来,人工智能 (AI) 在处理大量数据和产生可操作见解方面取得了惊人的进步。它对各个行业的影响是显而易见且显著的,影响、改善甚至彻底改变了整个行业。近几个月来,生成式人工智能的兴起及其根据给定输入或上下文生成新内容(例如自然语言文本或视频)的能力 [1],成倍地提高了人们对人工智能在创新、行业转型、新业务机会和运营简化方面所能提供的期望。许多生成式人工智能模型被打包为基础模型 (FM)。FM 有多种类型。有针对文本、图像、声音和视频的基础模型,但最著名的 FM 是面向文本的模型,称为大型语言模型 (LLM)。LLM 是人工深度神经网络,可以生成新的面向文本的数据。它们使用来自各种来源的大量文本数据进行训练,例如在线书籍、新闻文章、社交媒体帖子、编程代码和网页。LLM 在各种自然语言处理 (NLP) 任务中表现出色,例如文本摘要、问答、情感分析、代码生成和机器翻译。它们还可以生成富有创意和吸引力的文本,例如故事、诗歌、笑话、歌词、图像、音频和代码,所有这些都由基于文本的提示驱动。从行业角度来看,FM 可以彻底改变我们与软件产品和服务的交互方式。它们可以实现新形式的人机通信,例如对话代理和个人助理。它们还可以增强软件产品的功能和用户体验,例如搜索引擎、电子商务平台和社交媒体网络。Open AI 的 ChatGPT [2] 等产品的兴起表明这种技术对社会的影响有多么深远。人工智能的变革力量在许多企业中都显而易见,包括电信行业。多年来,人们观察到人工智能在电信用例中的重要性日益增加,从而导致了“人工智能原生电信公司”一词的兴起。爱立信最近的一份白皮书 [3] 将“人工智能原生”一词解释为具有“内在可信人工智能能力”的系统,其中人工智能是设计、部署、操作和维护功能的自然组成部分。FM 的强大功能和灵活性使其成为人工智能原生系统的明显基石。Lu 等人。AI 原生系统利用数据驱动和基于知识的生态系统,在该生态系统中创建和使用数据来产生新的基于 AI 的功能,在需要时用学习和自适应 AI 取代静态的、基于规则的机制”[3]。开发包含 FM 组件的软件产品可能会引入法律和知识产权 (IPR) 问题以及额外的工程复杂性。FM 的随机性、数据质量、模型大小、可信度、安全性、监管和隐私方面 [2] 放大了与软件生命周期相关的挑战。呼吁采取行动关注基于基础模型的系统的设计方面 [4],但这一领域需要研究和实践界的更多关注。本文从工程角度反思了利用电信网络中 FM 的 AI 原生系统及其相关影响。