方法:总共有51名确认PAE的儿童(25名男性; 5.6±1.1岁)和116个未暴露的对照(57名男性; 4.6±1.2岁)进行了纵向扩散张量成像(DTI),总共来自PAE和381个对照组的参与者,共111次扫描。我们描绘了左右AF,并提取了平均分数各向异性(FA)和平均扩散率(MD)。使用年龄标准化的语音处理(PP)和NEPSY-II的加快命名(SN)评分评估了预阅读语言能力。线性混合效应模型以确定扩散指标与年龄,群体,性别和年龄相互作用之间的关系,并将受试者作为随机因素建模。二级混合效应模型分析评估了使用51个年龄和性别匹配的未暴露对照对白质微观结构和PAE对预读语言能力的影响。
精确的声道建模对于构建可解释语音处理和语言学的发音表征是必不可少的。然而,声道建模具有挑战性,因为许多内部发音器官被外部运动捕捉技术遮挡。实时磁共振成像 (RT-MRI) 可以测量语音过程中内部发音器官的精确运动,但由于标记方法耗时且计算成本高昂,MRI 的注释数据集大小有限。我们首先使用纯视觉分割方法为 RT-MRI 视频提出一种深度标记策略。然后,我们介绍一种使用音频来改进发声器官分割的多模态算法。我们共同为 MRI 视频分割中的声道建模设定了新的基准,并利用该基准为 75 位说话者的 RT-MRI 数据集发布了标签,将声道的带标签公共 RT-MRI 数据量增加了 9 倍以上。代码和数据集标签可在 rishiraij.github.io/multimodal-mri-avatar/ 找到。索引术语:发音语音、视听感知
对声带的准确建模对于构建可解释的语音处理和语言学的关节表达是必要的。但是,声带建模是具有挑战性的,因为许多内部铰接器都被外部运动捕获技术遮住了。实时磁共振成像(RT-MRI)允许在语音过程中测量膜枢纽器的精确运动,但是由于耗时和计算昂贵的标记方法,带注释的MRI数据集限制了大小。我们首先使用仅视觉分段的方法为RT-MRI视频提供了深刻的标签策略。然后,我们使用音频引入多模式算法,以改善人声铰接器的分割。一起,我们为MRI视频细分中的声带建模设定了一个新的基准测试,并使用它来发布75个扬声器RT-MRI数据集的标签,从而将人声道标记的公共RT-MRI数据增加到9。代码和数据集标签可以在rishiraij.github.io/ mult-opodal-mri-avatar/。索引术语:发音演讲,视听感知
信息技术 高性能全光网络 抗干扰通信链路 下一代信号光网络架构 集成语音和数据 信息安全 (INFOSEC) 语音处理 高性能计算 高性能通信 需求规范和分析 实时计算 无线移动网络 行为检测 机器学习 信息过滤和融合 集成互联网协议 (IP) 和异步传输模式 (ATM) 多播 可靠多播 带定向天线的无线网络 传感器网络 通信网络模拟 带宽管理 (服务质量) 高保证软件 基于分布式网络的战斗管理 支持具有单线程和多线程架构的统一和非统一内存访问的高性能计算 分布式、安全和移动信息基础设施 基于模拟的虚拟现实 高端、渐进式 HDTV 图像处理和分发 防御性信息战 虚拟现实/移动增强现实 3D 多模式交互 用于模拟的模型集成 (物理、环境、生物、心理) 指挥决策支持 数据融合
我们认为,我们的经济正面临历史的转折点,类似于始于 18 世纪的制造业工业革命。快速改进的技术变得更智能、更强大、更小、更轻便和更便宜。这些技术包括传感器、摄像头、语音处理、图像处理、生物识别、分析、移动和云技术、地理标记等,并且越来越多地由人工智能 (AI) 驱动。我们坚信,这些技术将共同改变几乎所有服务业。特别是服务机器人(虚拟和物理服务机器人)的出现与这些技术相结合将带来快速创新,有可能同时显着改善客户体验、服务质量和生产力(Wirtz 和 Zeithaml 2018)。自动化的服务交互使个性化、更高效和更有效的服务成为可能。此外,它们还可以让员工有更多时间从事更多人际、创造性和复杂的服务活动(Huang and Rust 2018)。这些技术几乎可以以零增量成本提供可扩展的服务产品(Wirtz et al 2019)。
每年,有近 125 万人死于车祸。平均每天有 3,287 人死亡,而且这个数字还在上升 [1]。据两家新闻媒体报道,分心驾驶是过去几十年来车祸的主要原因 [2; 3]。驾驶员现在比以往任何时候都更容易分心,他们经常因为移动设备、导航系统和复杂的控制系统而不再注意路况 [2]。据预测,如果不采取措施,到 2030 年,道路交通伤害将成为第五大死亡原因 [1]。因此,检测驾驶员分心事件非常重要。已经提出了各种视频(眼动追踪)和语音处理方法来检测驾驶员分心 [4; 5; 6; 7]。这些方法有时是不可行的。例如,在光线不足的情况下,视频处理方法效果较差,尤其是在夜间,驾驶员很可能不太关注路况。在赛车环境中,车手必须穿戴防火服和头盔来遮盖面部,这使得视频处理方法无效 [8]。驾驶过程中的高水平背景噪音(例如发动机、收音机或风噪)可能会降低声音处理方法的有效性。
Suresh P、Ravikumar O、Hari Krishna Mahesh K、Sri Aashritha S 摘要:近年来,搜索引擎在实时提取内容以供分析、理解等方面发挥着重要作用,并且也需要时间来处理。聊天机器人是使用人工智能以不同方式提取所需内容的另一种形式。本文的主要目的是从 wiki 平台中提取所需内容,并以语音和文本格式传递以便更好地理解。聊天机器人有无数种方式可以在大多数环境中提供更好的性能。即使在提供所需内容方面存在滞后。在本文中,人工智能以建议的可交付格式在更短的时间内提供所需信息。所提出的聊天机器人将有效地在现有数据库上工作,即使在同一个数据库中添加了更多信息。随着这些聊天机器人的出现,有需要的人可以获得他们自己所需的建议格式的最新正确信息。索引术语:聊天机器人、语音处理、人工智能、社交网站、维基、内容传递、深度学习。
诵读困难是一种神经发育障碍,其特征是阅读和/或拼写学习障碍(国际诵读困难协会,里昂等人,2003 年)。许多关于诵读困难的研究集中在语音处理缺陷(Griffiths 和 Snowling,2001 年;Pennington,2006 年;Vellutino 等人,2004 年),即处理单词的基本声音。尽管在这方面取得了很大进展,但对诵读困难的个体差异和其他认知过程(如语义处理)的研究较少。现有的阅读计算模型强调阅读是正字法、语音和语义处理系统动态交互的副产品。例如,并行分布式处理模型(Seidenberg 和 McClelland,1989 年)强调了这些系统的动态产品的重要性。朗读的双路径级联模型(Coltheart 等,2001)描述了三条阅读路径:非词汇阅读路径(通过字素到音素规则系统)、词汇非语义路径(通过正字法/音位输入词典)和词汇语义路径(通过语义系统)。
使用自动语音处理工具(包括自动语音识别(ASR))在过去几年中变得越来越流行。当相应的从业者使用时,此类工具在诊断和治疗方面提供了宝贵的帮助(例如,Middag,2012年;另请参见Van de Sandt-Koenderman,2011年),另一方面,另一方面,有助于更自动的医疗保健(Hönig和Nöth,2016年)。因此,使用内部ASR引擎,虚拟治疗师进行失语治疗(VirTheA)似乎是第一个使用ASR自动化为命名的语义练习的系统(Pompili等,2011)。该系统在欧洲葡萄牙语者的提名测试方面表现出了令人鼓舞的结果,这些葡萄牙语者具有不同类型的失语症,特别是高词验证率 - 平均82%的准确性(Abad等,2013)。它经历了各种评估和变化,并被SLT从业人员积极看待(Pompili等,2020)。Ballard及其同事(2019年)根据开源ASR引擎提出了一个针对澳大利亚英语的系统,在图片命名任务中达到了平均准确性的75%。Barbera
摘要 - 功能连接在现代神经科学中起着至关重要的作用。这种方式阐明了大脑的功能和结构方面,包括多种病理背后的机制。这样的病理学是精神分裂症,通常是听觉言语幻觉。通常通过观察语音处理过程中的功能连接来研究后者。在这项工作中,我们通过对三组人的深度学习在二分法聆听任务期间对功能连通性进行了深入研究:精神分裂症患者有或没有听觉的语言幻觉和健康的对照。我们提出了一个基于图形神经网络的框架,在该框架中,我们将脑电图数据表示为图域中的信号。框架允许一个到1)根据脑电图记录预测脑精神障碍,2)将听力状态与每个组的静止状态区分开,3)识别特征性的任务范围内的结合。实验结果表明,所提出的模型可以区分以最先进的性能的上述组。此外,它还为研究人员提供了有关每个组功能连接性的有意义的信息,我们在当前的域知识上验证了这些信息。