图 6 示例性注意力矩阵,可视化三位参与者在收敛时的注意力得分(来自随机选择的训练样本)(值越亮表示注意力得分越高)。解码器中的时间步长在 y 轴上表示,编码器的时间步长在 x 轴上表示。对角线结构表明注意力得分在时间域上是很好地对齐的,例如输出中的后续步骤关注输入中的后续步骤。该图还表明,填充输入 sEEG 序列(语音规划和理解)可能是不必要的,因为没有太多注意力放在第一个和最后一个输入步骤上。
在NLP中,已知基于单词或子字的文本语言模型表现优于其基于字符的同行。然而,在语音社区中,口语LMS的标准输入为20ms或40毫米的离散单元(比音素短)。从基于文字的LM中汲取灵感,我们基于单词大小连续值的音频嵌入来引入生成性口语模型(GSLM),该模型可以产生多样化和表现力的语言。这是通过用词汇嵌入函数代替词汇类型的查找,通过对比度损失的横熵损失以及k-nn Sampling的多项式采样。最终的模型是基于单词大小连续嵌入的第一个属性语言模型。其性能与自动指标和主观人类判断衡量的发电质量的离散单位GSLM相当。此外,由于其200ms的大型单元,它的内存效率高五倍。此外,词汇嵌入器之前和之后的嵌入在含明确和语义上是可解释的。1
摘要。人类活动识别在包括医疗保健和智能家居在内的各个领域都起着至关重要的作用。随着配备环境传感器的智能房屋的越来越多,人们对利用人工智能技术的兴趣越来越兴趣,以理解和认识到这些环境中的人类活动。但是,环境传感器收集的数据的规则和嘈杂性质提出了独特的挑战。为了应对这些挑战,我们建议使用接受传感器激活序列训练的预训练的嵌入式嵌入,通常是基于类似于GPT的架构的算法,以证明在智能家庭中日常生活的分类表现。此外,我们利用从一个环境中获得的知识来增强另一个环境的活动识别,研究转移学习的概念。结果表明,GPT变压器解码器的方法在多个数据集的精度和平衡精度方面优于其他算法。这些发现还突出了转移学习的潜力,从干净且大的数据集中,GPT跨解码器预先训练的嵌入在各种情况下显示出令人鼓舞的结果。
公开访问的人工智能(AI)大语模型(例如ChatGpt)的出现已引起了有关AI功能含义的全球对话。对AI的新兴研究提出了这样的假设,即创造潜力是一种独特的人类特征,因此,人类的看法与AI客观上能够创造的东西之间似乎存在脱节。在这里,我们旨在评估与AI相比人类的创造潜力。在本研究中,人类参与者(n = 151)和GPT-4为替代用途任务,后果任务和不同关联任务提供了反应。我们发现,与人类同行相比,AI在每个不同的思维测量中都具有更强的创造力。具体来说,当控制响应的流利度时,AI是更原始和精心制作的。目前的发现表明,与人类受访者相比,AI语言模型的当前状态具有更高的创造力。
摘要 本文旨在描述生成语言学 (GL) 对人工智能 (AI) 的贡献,并暗指语言学家和人工智能科学家之间关于语言学是属于人文学科还是科学的争论。在本文中,我将尽量不带语言学家的偏见,从独立的科学视角研究这一现象。本文向研究人员/读者介绍了人工智能所涉及的科学定理和原理,这些定理和原理属于 GL,特别是“乔姆斯基学派”。因此,它从句法、语义、语言能力、普遍语法、人类语言的计算系统、语言习得、人脑、编程语言(例如 Python)、大型语言模型和公正的人工智能科学家等方面提供了充分的证据,证明这一贡献是巨大的,而且这一贡献是不可否认的。本文的结论是,尽管 GL 对人工智能的贡献巨大,但仍然存在分歧点,包括语言输入的性质和类型。
于2023年12月20日收到; 2024年6月18日修订; 2024年8月20日接受。出版日期2024年8月26日;当前版本的日期2024年11月5日。这项工作得到了中国国家自然科学基金会(NSFC)的一部分,根据赠款62102099和授予U22A2054的赠款,部分由Guangzhou基础研究计划,根据Grant 2023A04J1699的赠款,一部分是由Guangdong Basic和Grant Indied Basic Research Foundation下的Grant 2023A151515151514 01137。这项研究也得到了新加坡国家研究基金会的一部分,部分由InfoComm媒体发展局在其未来的通信研发研究和发展方面的一部分,部分由国防科学组织(DSO)国家实验室根据AI新加坡计划,根据Grant FCP-NTU-RG-2022-010和Grant FCP-ASTRORE的GRANT FCP-ASTRASTAR TAIRISTION,在Grant FCP-NTU-RG-2022-010和下第1层在赠款RG87/22下,部分由NTU金融计算技术中心(NTU-CCTF)。这项研究也部分得到了Sutd SRG-ISTD-2021-165的支持,部分由Sutd-Zju的想法在Grant Sutd-Zju(VP)202102下的一部分,部分由新加坡教育部,新加坡教育部在SMU-SUTD下的22-SISSIS-SIS-SIS-SIS-SMU-048和STAIRITY pactiatiatiatiatiatiatiatiation in. Smu-sutd pransiatiatiatiatiatiations praintiatiatiatiatiatiations pransiatiatiatiatiationnif。NSF在Grant CNS-2148382下部分支持Shiwen Mao的工作。建议接受J. Ren。(通讯作者:Jiawen Kang。)
摘要 - 已引入了一种新的生成模型,基于扩散的生成模型(DGM),以增强语音。语音增强的有效性取决于各种因素,例如信噪比和噪声类型。在无法获得干净的参考信号的实际情况下,希望监视语音增强方法的有效性。本研究仅使用增强的语音信号调查了基于DGM的语音增强有效性的可能性。它提出了通过采用多个增强信号的相对差异的倒数来估计增强语音信号的标准不变信号渗透率。索引术语 - 言语增强,基于扩散的生成模型,增强语音信号的逆相对差异,si-sdr
