摘要:本报告提出了计算机辅助语言学习 (CALL) 领域的最新研究成果。错误发音检测是计算机辅助发音训练 (CAPT) 系统的核心组件之一,而 CAPT 是 CALL 的一个子集。自动发音错误检测研究始于 20 世纪 90 年代,但由于计算能力的提高以及用于录制发音分析所需的语音的移动设备的普及,成熟的 CAPT 的开发在过去十年才得以加速。检测发音错误是一个很难解决的问题,因为没有正确和错误发音的正式定义。因此,通常会检测到韵律和音素错误,例如音素替换、插入和删除。此外,人们一致认为,学习发音应该注重说话者的清晰度,而不是听起来像 L1 英语说话者。最初,使用高斯混合模型-隐马尔可夫模型和深度神经网络-隐马尔可夫模型方法,基于后验似然(称为发音良好性)开发方法。与最近提出的基于 ASR 的端到端错误发音检测系统相比,这些系统实施起来很复杂。本研究的目的是使用连接主义时间分类 (CTC) 和基于注意的序列解码器创建端到端 (E2E) 模型。最近,E2E 模型在错误发音检测准确性方面显示出显着的提高。本研究将对基线模型 CNN-RNN-CTC、具有基于字符序列的注意解码器的 CNN-RNN-CTC 以及具有基于音素的解码器系统的 CNN-RNN-CTC 进行比较。这项研究将帮助我们决定一种更好的方法来开发一个有效的发音错误检测系统。关键词:CNN-RNN-CTC、语音处理、发音错误检测 简介:建立人与机器[Baranwal et al, ]或人与人或机器与机器[singh et al, 2020, singh et al, 2019]手势[Baranwal et al, 2017, Singh et al, 2018]、语音、面部表情[singh et al, 2018]等之间的通信。是重要的沟通媒介,其中语音(Baranwal et al, 2014, Baranwal et al, 2014)是人类交流最自然的形式。随着全球化的发展,外语学习市场大幅增长,其中之一就是英语发音学习。发音教学本质上是学生和老师之间的一对一互动,这对许多学生来说是难以承受的。因此,自动发音教学已成为一个热门的研究领域。自动识别发音错误和测量发音的研究工作始于 20 世纪 90 年代,从 90 年代末到 21 世纪初发生了一系列事件。2000 年初 CAPT 的商业化被证明存在问题,因此开发活动放缓。大约十三年前,随着计算能力的提高、智能化,人们的兴趣再次开始
摘要 — 激光超声检测是一种新颖的、非接触的、非破坏性的技术,用于评估微电子封装中焊料互连的质量。在该技术中,通过比较已知良好参考样本和被测样本的平面外位移信号(该信号由超声波传播产生)来识别焊料互连中的缺陷或故障。实验室规模的双光纤阵列激光超声检测系统已成功证明可以识别先进微电子封装(如芯片级封装、塑料球栅阵列封装和倒装芯片球栅阵列封装)中焊料互连中的缺陷和故障。然而,任何计量系统的成功都依赖于精确的数据,以便在微电子行业中发挥作用。本文使用量具重复性和再现性分析证明了双光纤阵列激光超声检测系统的测量能力。工业倒装芯片球栅阵列封装已用于使用激光超声检测系统进行实验,检测数据用于进行重复性和再现性分析。量具重复性和再现性研究也已用于选择已知的良好参考样品来与受试样品进行比较。
作者:M Gawlik-Kobylińska · 2021 · 被引用 11 次 — 特别是在化学、生物、放射和核 (CBRN) 安全与保障方面。2.化学传感器概述。由于化学危害构成威胁...
人工智能是在我们的生活中互动、理解和使用的许多不同技术之一 [1-4]。机器学习和自然语言处理等技术都是人工智能领域的一部分。每一种技术都在沿着自己的道路发展,当与数据、分析和自动化结合使用时,可以帮助企业实现目标,无论是改善客户服务还是优化供应链(Afraa Z. Attiah、Enas F. Khairullah[1])。人机交互是人工智能的一部分,人工智能是一个新兴技术领域,专注于设计和增强人机交互过程。人机交互广泛应用于许多领域,如医疗技术、机器人技术、城市设计、游戏和辅助技术,如巴西 Chambayil、Rajesh Singla、R Jha [2] 所示。人工智能在图像处理和面部识别方面发挥着重要作用,能够检测和识别图像和视频中的物体和图案。眼动追踪系统可以采用不同类型的图像处理 [1]。图像或图像序列包括输入数据,这些数据首先被获取并转换为数字形式。要执行下一个操作,必须增强图像,这可以通过应用不同的数学运算来实现。有许多系统,包括基于人类眼球运动和眨眼的应用程序。对眼球追踪系统的需求巨大,尤其是对于因受伤、生病或疾病而导致严重运动障碍的人[4]。该系统致力于缓解他们的残疾症状并创建自我表达工具。这项技术旨在减轻
© 编辑(如适用)和作者 2021。本书为开放获取出版物。开放获取 本书根据知识共享署名 4.0 国际许可证 (http://creativecommons.org/licenses/by/4.0/) 的条款获得许可,允许以任何媒体或格式使用、共享、改编、分发和复制,只要您给予原作者和来源适当的信用,提供知识共享许可证的链接并指明是否进行了更改。本书中的图像或其他第三方材料包含在本书的知识共享许可证中,除非在材料的致谢中另有说明。如果材料未包含在本书的知识共享许可证中,并且您的预期用途不被法定法规允许或超出允许用途,则您需要直接从版权所有者处获得许可。本出版物中使用一般描述性名称、注册名称、商标、服务标记等。即使没有具体声明,也不意味着这些名称不受相关保护法律和法规的约束,因此可以自由使用。出版商、作者和编辑可以放心地认为,本书中的建议和信息在出版之日是真实准确的。出版商、作者或编辑均不对此处包含的材料或可能出现的任何错误或遗漏提供明示或暗示的保证。出版商对已出版地图和机构隶属关系中的司法权主张保持中立。
2.1 选择性检测人体 该系统采用单次多框检测器 (SSD) 作为深度学习模型,仅检测图像中的人体。该系统能够学习通过现场测试收集的大量真实环境图像,并通过独自开发的调整技术检测人体,从而成功大幅提高检测率(即将人体检测为人体的比率),同时抑制误检。选择性检测人体不会对工作环境中存在的物体发出误报,因为工作环境中通常周围有各种物品和货物。因此,可以避免过多的警告。 2.2 自动切换近距离和远距离摄像机 根据叉车的速度自动切换近距离和远距离摄像机。这样可以适当设置监控区域,同时减轻操作员的负担。 2.3 检测通知 一旦检测到,蜂鸣器就会发出声音,提醒操作员附近有人。同时,该灯还会亮起,指示检测到的人所在的方向,从而敦促操作员用自己的眼睛或通过 Good Viewer(*) 屏幕确认安全性。 (*Good Viewer 是一种通过俯瞰叉车周围环境来确认安全性的支持系统。) 2.4 检测时防止叉车启动 如果在叉车停止时检测到有人,系统将阻止车辆启动,以防止发生事故。如果此预防措施干扰了工作进度,可以暂时关闭。此功能由与车辆控制集成的系统实现,因此是我们产品与其他公司类似产品不同的卖点,因为后者与车辆本身分开出售,本身不具备这种功能。 | 3. 未来发展
安全在医疗保健领域发挥着重要作用。防止对医疗保健基础设施的网络攻击已不再是微不足道的事情。任何电子医疗系统的安全性受损都可能对患者的健康造成严重损害。特别是在远程护理环境中,保护患者的远程监控系统至关重要,以确保他们遵循临床路径而不受任何外部入侵。人工智能 (AI) 在打击针对患者远程监控系统安全的网络攻击方面发挥着重要作用 [1、2、3]。监控和防止医疗保健网络攻击的系统不仅必须检测到攻击,还应该能够正确理解并向用户报告攻击。特别是,异常检测系统是一种著名的方法,它基于机器学习 (ML) 或深度学习 (DL) 方法对正常活动进行建模,以便以数据驱动的方式轻松检测到与标准的异常偏差。因此,在这样一个涉及多位医疗专业人士的敏感领域,除了检测威胁之外,通过适当的可解释性算法来表示和解释威胁也至关重要 [ 4 ]。此外,当前的检测模型和规则还不够成熟,无法识别尚未造成任何损害的早期入侵。入侵分析师利用先验知识推断事件背景,以发现事件
摘要。已经开发了基于相干检测的低成本激光检测系统,即使在明亮的背景光中,也能够检测到弱,连续的激光源。该系统由Mach - Zehnder干涉仪组成,其中一个手臂用压电的镜子修饰,以调节路径长度。我们介绍了确定激光波长并扩展检测器视野的方法。为了扩大视野,将锥镜添加到系统中,而相机的额外使用则可以研究传入激光束的方向。通过使用压电镜的调制幅度估计来自三个不同激光器的波长。可以实现360度水平视场的初步结果,并且可以用估计的角精度为5度确定激光束的方向。此外,可以用10 nm的精度确定波长。系统在635 nm处将系统交易的灵敏度转换为较大的视野,而最终的检测灵敏度等于70 nW(或1μW·cm -2)。©作者。由SPIE发表在创意共享归因4.0未体育许可下。全部或部分分配或复制此工作需要完全归因于原始出版物,包括其DOI。[doi:10.1117/1.oe.60.2.027106]