IEEE 是一个非盈利组织,是世界上最大的专业技术组织,致力于推动技术进步,造福人类。© 版权所有 2023 IEEE - 保留所有权利。使用本网站即表示您同意条款和条件。
摘要 - 传统上,音乐教育依赖于理论教学和乐谱。但是,集成实时音频分析和交互式学习工具引入了学生如何掌握音乐基础知识的范式转变。本文介绍了一个基于Web的交互式平台和用于教学印度古典音乐(ICM)基础知识的实时音频分析系统。该平台结合了一系列实验,每个实验旨在增强对音乐元素的理解,从简单的音乐音符到复杂的旋律。音频分析还使用DSP套件TMS320C6713实时进行。本文提供了简洁的概述,强调了这些信号处理技术在音乐教育中的重要性及其在革新互动音乐学习中的潜力。学生可以实验,构成和可视化音乐元素,促进创造力并更深入地欣赏音乐的细微差别。实时反馈可以增强学习经验,从而立即进行更正和改进。索引术语 - 印度古典音乐,TMS320,信号程序,互动学习,音乐教育
摘要 - 播放视频分析侧重于来自多个资源的流视频数据的实时分析,例如安全摄像机和具有视频功能的IoT设备。它涉及各种技术的应用,以从实时视频流中提取有价值的信息。边缘计算和云计算通过利用两端的计算资源来促进视频流分析,从而使高精度和低延迟均可有助于。但是,视频流动行为是动态的,并且在边缘和云中不断发展。网络条件,计算资源和视频内容可能会迅速变化,这使得连续调整分析方法至关重要,以提供准确的结果。以前的作品是基于深神经网络(DNN)或启发式算法的,从历史数据或合成数据中学习了适当的部署计划,用于流式传输视频分析应用程序,因此无法捕获动态。因此,我们提出了基于加强学习的方法,可以适应视频流行为的持续变化。为了确保在分布式环境中进行视频分析的可伸缩性,我们实现了Smotic G Ate 2,这是一个分布式流媒体视频分析系统,具有优化的处理管道和基于RL-RL-基于RL-RL-的控制器,以快速适应跨边缘和云的系统配置。在真实测试床上进行的实验表明,我们的方法优于基准,确保实时视频分析和在动态和分布式环境中的高精度。
摘要 - 飞行员和骑自行车的人是最脆弱的,但也是最不可预测的交通参与者。由于他们在高度自由度和方向突然变化的城市环境中移动的能力,他们的运动仍然具有挑战性。我们提出了一个驾驶员援助系统,以应对其中一些挑战。我们的系统由一个由各种自动编码器和长期短期内存网络制成的世界模型组成。世界模型从脆弱的流量参与者的角度获取视力和动作数据,并在提前一秒钟内生成其环境的视觉预测(图像)。我们系统的第二部分是一个基于变压器的描述系统,该系统采取了预测的感知,在这里,作为一个展示,如果汽车和易受伤害的交通参与者之间的碰撞似乎即将到来,则将其抽象为文本警告。我们的描述系统有助于将驾驶员的危险情况与上下文相关,并可以扩展到其他驾驶员援助系统,例如盲点检测。我们在使用CARLA的模拟中生成的数据集上评估了我们的系统。索引术语 - 自主驾驶,机器学习,视频描述,世界模型
Shankar Subramaniam,Akay Metin,Mark A. Anastasio,Bayley Basque,Paolo Bonato,Ashutosh Chilkoti,Jennifus R. Cochran,Vicki Colvin。乔丹·格林(Jordan Green),X。EdwardGuo,Isaac B. Hilton,Jay D. Humphrey,Chris R Johnson Bernhard Palsson,Eric J. Perreault,Rick Rabbitt,S.Tolias,Marjolein C.H.梅伦(Meulen)的货车,单词,戈尔达娜·沃瓦科维奇(Gordana Wind-Novacovic),约翰·A(John A.)White,Raimond Winslow,Zhang,Zhang,Charles Zukkoski,Michael I. Miller
主题2:使用深层神经网络人口趋势的人类跌倒检测使一对一的个人护理越来越不可持续。护理资助者正在寻找针对护理危机的成本有效解决方案。目前有床传感器,椅子占用和缺勤者,紧急和移动警报,手镯,但是这些依赖于客户激活它们或记住佩戴/激活它们。突然跌倒,无意识或不动的可能是不可能的。该项目旨在调查如何使用深层的神经网络技术来检测视频中的人类跌倒,进行危险的人类活动识别,并迅速确定由于崩溃/跌倒而迅速识别出危险的脆弱客户。该项目在于人类活动识别领域,但重点是在国内环境下进行秋季检测。主题3:将深度学习应用于单个粒子光散射模式的分类
观察是临床医学实践的基本组成部分。对神经科医生来说,观察运动尤为重要。帕金森病、多发性硬化症、中风、癫痫等疾病会以独特的方式影响人的运动。在某些情况下,患者声音的变化也包括在内——声音的变化是由言语运动的变化引起的。临床医生对特征性异常的检测及其严重程度的判断在诊断和预后评估或治疗反应中都起着核心作用。然而,这种做法依赖于有限的经验丰富的专家资源。此外,这些专家受到人类视觉判断的限制,无法可靠或准确地检测和测量运动中的细微变化 (Williams 等人,2023 年)。
•数据分析(音频,视频,数据岛) - 980将捕获所有音频数据包,视频数据和数据岛,时机数据和辅助数据,并将其显示为固定费率链接(FRL)数据包。•固定费率链接(FRL)数据分析 - 980将捕获固定速率链接(FRL)数据,并显示基础的TMDS数据元素。•TMDS数据分析 - 980只会捕获数据岛和视频帧。•协议分析 - 980将捕获TMD和固定速率链接(FRL)协议数据,例如序言和后卫频段数据。
•升级以添加视频分析(“实时”)功能•升级以添加视频生成器功能•增强源功能测试(包括深度捕获分析,DSC功能测试有线ID,HDR10+ CT,CEC,CEC,CEC,UHDA和游戏合规性测试) eARC functional testing for Tx • eARC functional testing for Rx • eARC compliance testing for Tx • eARC compliance testing for Rx • TMDS source compliance testing • TMDS sink compliance testing • FRL, FEC, DSC source compliance testing • FRL, FEC, DSC sink compliance testing • HDR function for sink display testing (includes HDR10+ compliance testing for displays).