1)Zhu,Zihan等。“ Nice-Slam:神经隐式可扩展编码的猛击。”IEEE/CVF计算机视觉和模式识别会议的会议记录。2022。尼斯 - 萨克1)
中风后言语和语言障碍(失语症)严重影响患者的生活质量。许多症状轻微的患者仍未得到诊断,而且由于医疗费用和/或服务不足,大多数人没有接受建议的强化治疗。自动语音识别 (ASR) 可以通过提高诊断率和在定制治疗期间提供反馈来帮助克服这些困难。然而,由于言语错误的高度可变性和训练数据集的稀缺,其性能通常不令人满意。本研究评估了最近发布的端到端模型 Whisper 在中风后失语症 (PWA) 患者中的表现。我们调整了它的超参数以实现失语症语音的最低字错误率 (WER)。与年龄匹配的对照组相比,PWA 中的 WER 显着更高(10.3% vs 38.5%,p < 0.001)。我们证明,通过表达性(外显命名和自发性言语生成)和接受性(书面和口头理解)语言评估,更严重的失语症与更严重的 WER 相关。中风病变大小不会影响 Whisper 的性能。考虑人口统计学因素、治疗持续时间和中风后时间的线性混合模型证实,左半球额叶病变患者的 Whisper 性能更差。我们讨论了这些发现对于如何在 PWA 中改进未来 ASR 的意义。
摘要。直接产生原始传感器的计划结果一直是长期以来的自动驾驶解决方案,最近引起了人们的关注。大多数现有的端到端自主驾驶方法将此问题分解为感知,运动预测和计划。但是,我们认为传统的渐进式管道仍然无法全面地对整个流量演化过程进行建模,例如,自我汽车与其他交通量之间的未来相互作用以及事先的结构轨迹。在本文中,我们探索了一种新的端到端自动驾驶范式,其中关键是预测自我汽车和周围环境如何发展给给定的场景。我们提出了Genad,这是一种生成框架,将自主驱动式驱动为生成的建模问题。我们提出了一个以实例为中心的场景令牌,它首先将周围的场景转换为地图意识到的实例令牌。然后,我们采用差异自动编码器来学习结构潜在空间中的未来轨迹分布,以进行先验建模。我们进一步采用时间模型来捕获潜在空间中的代理和自我运动,以生成更有效的未来轨迹。genad最终同时通过在实例令牌的条件下并使用学习的时间模型来生成期货的学习结构潜在空间中的采样分布来同时执行运动前词和计划。在广泛使用的Nuscenes基准上进行的广泛实验表明,拟议的Genad在以高效率上实现了以视觉为中心的端到端自动驾驶的状态表现。代码:https://github.com/wzzheng/genad。
•策略管理:最大程度地减少网络拥塞涉及防止一个细分市场的性能影响另一部分,以确保特定应用程序的一致和最佳性能。例如,在其专用细分市场上使用店内访客Wi-Fi不会干扰单独的细分市场上发生的信用卡交易速度。
从脑电信号进行语音解码是一项具有挑战性的任务,其中大脑活动被建模以估计声学刺激的显著特征。我们提出了 FESDE,一种从脑电信号进行完全端到端语音解码的新颖框架。我们的方法旨在根据脑电信号直接重建所听语音波形,其中不需要中间声学特征处理步骤。所提出的方法由脑电模块、语音模块和连接器组成。脑电模块学习更好地表示脑电信号,而语音模块从模型表示中生成语音波形。连接器学习连接脑电和语音的潜在空间分布。所提出的框架既简单又高效,允许单步推理,并且在客观指标上优于以前的工作。进行了细粒度的音素分析以揭示语音解码的模型特征。源代码可在此处获取:github.com/lee-jhwn/fesde。索引词:语音解码、语音合成、脑电图、神经活动、脑信号
动机:超过25年,基于学习的真核基因预测因子是由隐藏的马尔可夫模型(HMM)驱动的,这些模型(HMMS)直接输入了DNA序列。最近,Holst等。与他们的程序直升机一起证明,可以通过将深度学习层与单独的HMM后处理器相结合,可以改善Ab Insi算真核基因预测的准确性。结果:我们提出了Tiberius,这是一种新型的基于深度学习的Ab Initio基因预测因子,端到端将卷积和长期的短期记忆层与可区分的HMM层整合在一起。Tiberius使用自定义基因预测损失,并接受了哺乳动物基因组预测的培训,并对人类和两个基因组进行了评估。它显着胜过现有的从头算法,在人类基因组的基因水平下达到62%的F1分数,而下一个最佳AB始于方法的F1得分为21%。在从头模式下,提比略(Tiberius)预测了三个人类基因中两个的外显子内结构,而没有误差。非常明显,即使是Tiberius的Ab从头算精度也匹配Braker3的原始精度,Braker3使用RNA-Seq数据和蛋白质数据库。Tiberius高度平行的模型是最新的基因预测方法,在2小时内处理人类基因组。可用性和实施:https://github.com/gaius-augustus/tiberius contact:{lars.gabriel,mario.stanke}@uni-greifswald.de
不同职业群体工人的心理工作量(MWL)是不安全行为的主要和直接因素,这可能会导致严重的事故。估计MWL的新技术之一是基于脑电图信号的大脑计算机接口(BCI),这被视为认知状态的黄金标准。但是,涉及手工脑电图功能的估计系统是耗时的,不适合实时申请。这项研究的目的是提出一个最终的BCI框架以进行MWL估计。首先,提出了一种新的自动数据预处理方法,以消除无人干扰的人工制品。然后,一种名为EEG-TNET的新神经网络结构旨在从原始EEG中提取时间和频率信息。此外,进行了两种类型的实验和消融研究,以证明该模型的有效性。在主题依赖性实验中,双任务估计的估计准确性(无任务与任务)和三任任务估计(LO vs. MI与HI)分别达到99.82和99.21%。相反,在受试者无关的实验中,不同任务的准确性达到82.78和66.83%。此外,消融研究证明,预处理方法和网络结构对估计MWL具有显着贡献。所提出的方法在没有任何人类干预的情况下很方便,并且胜过其他相关研究,这成为降低人为因素风险的有效方法。
抽象的实时和效率路径计划对于所有机器人系统至关重要。,对于工业机器人而言,这更为重要,因为总体计划和执行时间直接影响生产线中的周期时间和自动化经济学。尽管在静态环境中问题可能并不复杂,但在计划时间和最佳性方面,经典方法在高维环境中是不可能的。碰撞检查在获得复杂环境中的路径计划的实时解决方案方面提出了另一个挑战。为了解决这些问题,我们提出了一个基于端到端的学习框架,即路径计划和碰撞检查网络(PPCNET)。PPCNET通过使用两个网络顺序计算航路点来生成路径:第一个网络生成了路点,第二个网络确定路径是否在路径的无碰撞段上。端到端培训过程基于模仿学习,该学习使用来自专家规划师的经验的数据聚合来同时培训两个网络。我们利用两种方法来训练一个有效近似确切几何碰撞检查功能的网络。最后,在两个不同的仿真环境中评估了PPCNET,并在用于BIN采摘应用程序的机器人臂上进行了实际实现。与最先进的路径规划方法相比,我们的结果通过以可比的成功率和路径长度大大减少了计划时间,显示出绩效的显着改善。