摘要。一种用于分析诗歌和散文韵律的新型计算机系统生成了不同的韵律概率模型,这些模型用于假设重建生成诗歌行的机制。计算机模型是使用基于散文节奏和特定韵律技巧的语言中的自然重音创建的。诗歌和模型之间的对应性或不对应性提供了有关韵律机制和诗歌节奏的语言(散文)资源的信息。本研究致力于研究不同语言的诗歌韵律,并与这种用于诗歌和散文节奏研究的新型计算机程序生成的模型进行比较。该程序用于分析德语、俄语和乌克兰语诗歌中的早期抑扬格,并观察不同语言中韵律机制之间的一些差异和相似之处。
韵律(声音表达的声音特性)传达了语言和副语言信息,例如说话者的意图(有关讽刺的情况,请参见Larrouy-Maestri等,2023a)和演讲者的情感状态(Banse&Scherer,1996)。韵律因此是人类交流的关键工具。1当涉及到情绪的交流时,假定信号的声学特性与某种情感或亲密状态的产生/感知之间的最小对应关系。2,例如,Bänziger等人提出的情绪表达和感知的有影响力的模型。(2015),基于Brunswik的镜头模型并改编自Scherer(2013a),区分了远端信息(即,通过对声音的声学分析来估算说话者的内部状态)和近端信息(即听众的感知)。它涉及通过声明提示的情绪声音交流所涉及的编码和解码过程(有关简介,另请参见Kamiloğlu&Sauter,2021年)。但是,声学
RMT:韵律计算素养工具 Dafydd Gibbon 韵律计算素养是声学语音学学生的重要目标,尤其是那些来自不富裕国家濒危语言社区的学生。有几种方便的“现成”韵律计算软件包,包括 Praat、ProsodyPro、Prosogram、ProZed、Winpitch 和许多方便的 Praat 脚本。但是,实验通常需要将这些软件包的功能与电子表格、R、Praat 脚本或 Python 进行小型混合交集。选择 Python 是为了能够将小型工具非混合、无缝地嵌入到更大的系统中进行探索性研究,因为它具有可扩展性,并且有大量的 Python 库可用于支持对过滤器和转换的深入洞察,而不是使用现成的复杂功能。工具包的设计标准是整体连贯性和结构清晰性。这些工具涵盖语音信号注释分析,以及语音信号幅度调制和频率调制解调的调制理论方法。通过提供距离测量和层次聚类技术,可以比较结果。该方法已在一系列出版物和教学中得到实践评估。
摘要:自现代计算的出现以来,研究人员一直在努力使人类 - 计算机接口(HCI)尽可能无缝。在各个方面都取得了进步,例如桌面隐喻(接口设计)和自然语言处理(输入)。最近受到关注的一个领域是语音激活及其推论,计算机生成的语音。尽管进行了数十年的研究和开发,但大多数计算机生成的声音仍然很容易识别为非人类的声音。语音中的韵律有两个主要组成部分 - 启动和节奏 - 通常缺乏计算机生成的声音。这项研究旨在通过结合人类语音的旋律和韵律元素来增强计算机生成的文本到语音算法。这项研究探讨了一种新颖的方法来通过使用机器学习,特别是LSTM神经网络来增加韵律,以在记录或生成的语音中添加副语言元素。目的是增加计算机生成的文本到语音算法的现实主义,增强电子阅读应用程序,并改善需要人工援助的人的人工声音。一台能够通过口语公告传达含义的计算机也将改善人工到计算机的互动。使用这种算法的应用程序可能包括改善高清音频编解码器,以进行电话,更新旧记录以及降低计算利用的障碍。结果令人鼓舞,基于LSTM的编码能够产生逼真的语音。这项研究通过通过实验室实验将算法分析和概括为模块化系统,以优化边缘案例中的组合和性能,以分析和概括算法为模块化系统,以进行数字语音改进。进一步的工作将涉及优化算法并将其性能与其他方法进行比较。
摘要 中国古典诗歌的自动生成一直是人工智能领域的难题。近年来,编码器-解码器模型为诗歌生成提供了一些可行的方法。但回顾以往的方法,仍存在两个主要问题:1)大多数都是单阶段生成方法,没有进一步的润色;2)它们很少考虑诗歌本身的限制,如声调、韵律。直观地看,一些中国古代诗人倾向于先写一首粗诗,然后再考虑其语义;而另一些人则先写一首语义诗,然后再细化其美学。在此基础上,为了更好地模仿人类的诗歌创作过程,我们提出了一种两阶段方法(即受限润色生成方法),其中每个阶段关注诗歌的不同方面(即语义和美学),从而可以生成更高质量的诗歌。这样,两阶段方法就发展成为两种对称的生成方法,即美学到语义的方法和语义到美学的方法。具体来说,我们设计了一种采样方法和一个门来制定声调和韵律的限制,这可以进一步改善生成的诗歌的节奏。实验结果表明,我们提出的两阶段方法在自动评估指标和人工评估指标方面都优于基线,特别是在声调和韵律方面取得了持续的改进。
参与者和方法:我们对26至38周的孕妇进行了一项观察性研究。妇女是在大学医院妇产科招募的。三十五名女性同意参加这项研究,26个音频记录是可剥削的。我们使用Covy和Raskin量表收集了产科和社会人口统计学数据,怀孕结果,焦虑和抑郁状态,以及使用怀孕和生活事件事件调查表中的感觉进行生活事件。每个参与者都独自一人录制录音机,并建议像在家那样随意与胎儿交谈。3分钟后,录音停止了。通过两种方法分析了录音:心理语言学家的注释和计算客观自动分析。
抽象的说话者使用韵律来解决歧义,但是如果韵律不能做出区分,该怎么办?我们探讨了(1)说话者如何采用韵律和手势提示来处理含义模棱两可的句子,以及(2)对歧义性提供有关交流效率和努力的视听性解决方案的见解。三十二名中国人被要求阐明22个模棱两可的普通话句子。一半可以使用韵律在语义上进行区分,而一半则不能。首先,参与者自发地阐明了所有模棱两可的句子,并向同盟国提供了解释,并揭示了他们的主要解释。其次,参与者每次都以暗示不同含义的提示指导,参与者两次表达了相同的模棱两可的句子。参与者的韵律提示和手势进行了编码和分析。结果表明,对于可以韵律区分的模棱两可的句子,参与者采用了各种韵律提示,例如暂停,音调,压力和口语率。此外,有51.85%的句子伴随着参考(标志性的指向)手势,而17.33%的句子伴随着非援助(Beat;互动)手势。然而,当韵律提示无法标记歧义时,参与者采取了更多的参考手势(97.30%),但非指南的手势却更少(1.28%)。总而言之,说话者采用多模式的方法来提高交流效率,而模式之间存在权衡。索引术语:韵律,手势,中文,权衡假设,多模式歧义,沟通效率和努力
在这项研究中,我们将概述近年来我们所做的有关语言和语音生产的神经解剖学相关性的实验工作。首先,我们将介绍与事件相关的功能磁神经成像和我们使用的实验范式的方法。然后,我们将介绍并讨论有关(1)语音运动控制,(2)发音复杂性,(3)韵律的神经解剖学相关性的实验结果,以及(4)义大利处理的神经认知底物。实验(1)和(2)表明,由SMA,运动皮层和小脑组成的预期大型运动语音网络仅在计划和执行简单的关节运动方面活跃。提高的关节复杂性会导致更集中的激活。此外,我们可以证明,只有语音运动的执行才能招募左前岛,而发音计划则没有。实验结果(3)的结果表明,控制韵律处理的横向化不是韵律(语言与情感)的功能,而是处理单元的更一般特征,例如韵律框架的大小,造成了不同皮质区域的激活。最后,在实验(4)中,我们提出了语音生产中句法处理的第一个结果。除了预期的Broca区域激活外,我们还发现了Wernicke地区和小脑中的激活。我们还找到了其他皮质区域激活的证据,这些证据少于脑力相关性的临床研究。这些领域和网络的认知相关性仍有待阐明。Q 2001 Elsevier Science Ltd.保留所有权利。Q 2001 Elsevier Science Ltd.保留所有权利。
解释歌词的可唱性是语言模型 (LM) 在歌词生成中一项重要但缺失的能力。这项能力使作曲家能够快速评估 LM 生成的歌词是否可以与旋律和谐地唱出来,并帮助歌手在练习过程中将歌词与旋律对齐。本文提出了 XAI-Lyricist,利用音乐韵律指导 LM 生成可唱的歌词并提供人类可理解的可唱性解释。我们使用 Transformer 模型在音乐韵律约束下生成歌词,并提供歌词韵律模式的演示作为可唱性解释。XAI-Lyricist 通过计算指标(困惑度、韵律-BLEU)和以人为本的研究(人类评分、平均唱歌时间和尝试次数)进行评估。实验结果表明,音乐韵律可以显著提高 LM 生成的歌词的可唱性。一项针对 14 名歌手的对照研究也证实了所提供的解释有助于他们比阅读纯文本歌词更快地理解歌词的可唱性。
21-23 23-01 01-03 03-05 05-07 07-09 21-23 23-01 01-03 03-05 05-07 07-09 035 035 035 018 018 035 060 060 060 018 018 035 035 035 018 018 035 060 060 060 018 018 035 22020 -03 22020 -02 7 7 7 7 7 7 7 7 7 7 7 7 7 22030 -04 23025 -02 * * * * * * * * * * * * * 23035 -05 24030 -03 210 210 210 230 230 220 210 210 210 230 230 220 23035 -05 24030 -03 09 09 09 09 09 10 09 09 09 09 09 10 25035 -07 25030 -05 26035 -08 26030 -07 * * * * * * * * * * * * * 27035 -10 27030 -08 LLLLLLLLLLLL 27035 -10 28035 -07 韵律 韵律 韵律 韵律 韵律 韵律 韵律齿圈 27035 -10 28040 -07 035-100 035-100 035-100 018-100 018-100 035-100 060-100 060-100 060-100 018-100 018-100 035-100 28035 -12 29045 -09 * * * * * * * * * * * * * 28035 -14 29045 -11 * * * * * * * * * * * 28035 -15 29050 -12