词汇习得是学习一门新语言的关键部分。然而,由于自然语言具有结构性、历史性和个体差异性,分离特定因素对词汇学习的影响可能具有挑战性。人工语言是解决这一问题的多功能工具,允许研究人员系统地操纵语言的属性并控制学习者的过去经验。在这里,我们回顾了人工语言如何用于研究双语词汇学习,特别关注语言输入(例如词汇属性)和语言经验(例如双语)的影响。我们还讨论了人工语言在双语研究中的优势和局限性,并为考虑使用人工语言的研究人员提供了资源。如果使用和解释得当,人工语言研究可以让我们了解与词汇学习相关的各种因素。
随着人工智能在商业中的应用,人工智能可以非常快速地处理查询,它们会立即处理查询并回复客户,当客户收到公司的及时回复时,企业也会同时获得客户的信任。众所周知,聊天机器人无法回答所有问题,但它们的帮助也非常有用,它可以快速协助他们并指导虚拟助手并询问如何处理和回复客户,从而为他们提供个性化支持。现在,通过使用算法,可以借助人工语言过程的促进来进行情感分析。它有助于发现不良事件、舆论分析和反馈。通过任何问题的结果,客户可以更好地理解,并可以识别他们的商品和服务。
但是,这种二分法是语言学和人工智能领域大量研究的基础前提,但它是错误的。至少有一种语言,梵语,在近 1000 年的时间里,是一种活生生的口语,拥有大量自己的文学作品。除了具有文学价值的作品外,梵语还有一种悠久的哲学和语法传统,直到本世纪仍以不减的活力存在。在语法学家的成就中,可以算作一种释义梵语的方法,它不仅在本质上,而且在形式上与当前的人工智能研究完全相同。本文表明,自然语言也可以作为一种人工语言,而人工智能领域的许多工作都是在重新发明一个千年前的轮子。
长期以来,人们一直认为只有人类才能创造和理解语言。但现在,人工语言模型 (LM) 首次实现了这一壮举。在这里,我们调查了 LM 在语言如何在大脑中实现的问题上提供的新思路。我们讨论了为什么 LM 可能与人类语言系统具有先验相似性。然后,我们总结了证据表明 LM 以与人类足够相似的方式表示语言信息,从而能够在语言处理过程中实现相对准确的大脑编码和解码。最后,我们研究了哪些 LM 属性(它们的架构、任务性能或训练)对于捕捉人类对语言的神经反应至关重要,并回顾了使用 LM 作为计算机模型生物来测试语言假设的研究。这些正在进行的研究使我们更接近于理解我们理解句子和用语言表达思想的能力背后的表征和过程。
长期以来,人们一直认为只有人类才能创造和理解语言。但现在,人工语言模型 (LM) 首次实现了这一壮举。在这里,我们调查了 LM 在语言如何在大脑中实现的问题上提供的新思路。我们讨论了为什么 LM 可能与人类语言系统具有先验相似性。然后,我们总结了证据表明 LM 以与人类足够相似的方式表示语言信息,从而能够在语言处理过程中实现相对准确的大脑编码和解码。最后,我们研究了哪些 LM 属性(它们的架构、任务性能或训练)对于捕捉人类对语言的神经反应至关重要,并回顾了使用 LM 作为计算机模型生物来测试语言假设的研究。这些正在进行的研究使我们更接近于理解我们理解句子和用语言表达思想的能力背后的表征和过程。
摘要 最近,处理自然语言的人工神经网络在需要句子级理解的任务中取得了前所未有的表现。因此,它们可以成为人类大脑中语言信息整合的有趣模型。我们回顾了将这些人工语言模型与人类大脑活动进行比较的研究,并评估了这种方法在多大程度上提高了我们对自然语言理解所涉及的神经过程的理解。主要得出两个结果。首先,词义的神经表征与人工神经网络使用的依赖于上下文的密集词向量一致。其次,人工神经网络中出现的处理层次与大脑大致匹配,但令人惊讶的是,不同研究之间的不一致。我们讨论了建立人工神经网络作为自然语言理解过程模型的当前挑战。我们建议在将表征映射到大脑数据时利用人工神经网络高度结构化的表征几何。
大量历时语料库的出现推动了越来越多的定量研究,这些研究针对语言的演变和意义的变化。本研究的核心量是文本中语言元素的标记频率,频率的变化反映了元素的流行程度或选择性适应度。然而,语料库频率可能会因各种原因而发生变化,包括纯粹的随机抽样效应,或者因为语料库由当代媒体和小说文本组成,其中的底层主题会随着文化和社会政治趋势而起伏不定。在本文中,我们引入了一个用于控制语料库中主题波动的简单模型——主题文化平流模型,并展示了它如何为词频随时间变化的变化提供可靠的基线。我们在跨越两个世纪的历时语料库和一个精心控制的人工语言变化场景中验证了该模型,然后用它来纠正历史时间序列中的主题波动。最后,我们利用该模型表明,新词的出现通常与热门话题的兴起相对应。这表明
这项研究通过最小的认知结构探索了通过语法诱导人类语言获取的认知机制,其简短且灵活的序列记忆是其最中心的特征。我们使用强化学习来识别人工语言中的单词流的句子。的结果证明了该模型可以识别频繁且内容丰富的多字块,重现自然语言获取的特征的能力。该模型成功地导航了不同程度的语言复合体,从而通过重复使用顺序模式来揭示有效的适应性,从而使挑战相结合。帕尔西姆树结构的出现提出了针对识别任务,平衡经济和信息的优化。认知建筑反映了人类记忆系统和决策过程的各个方面,从而增强了其认知能力。该模型在概括和语义表示方面表现出局限性,但其极简主义的性质为语言学习的某些基本机制提供了见解。我们的研究证明了这种简单的体系结构的力量,并强调了序列记忆在语言学习中的重要性。由于其他动物似乎没有忠实的序列记忆,这可能是理解为什么只有人类开发复杂语言的关键。
语言学习涉及暴露于不一致的系统 - 即存在多种模式或方法以标记某些含义的系统。不一致的系统通常会随着时间的流逝而变化更加规律 - 它们被系统化。然而,一些最近的研究报告说,学习者倾向于在输入中再现不一致,从而导致语言学习机制基本上是防腐剂的模型。我们使用一种新颖的范式进行了人工语言学习实验,以扩展我们对语言学习中系统化与保留机制的理解。参与者被教给两个数字标记系统,要么完全一致(系统的概率P为1.00)或不一致(一个系统的P = 0.875,另一个系统的p = 0.125,依此类推,依此类推,依此类推,依此类推,P = 0.75和P = 0.625)。一个标记系统是一个复数标记系统。另一个是一种类型的罕见的单态标记系统。在概括新项目时,参与者总体上产生的定期输出模式比较不一致的条件更一致,而对复数标记条件的输入状况要比单人标记的条件更多。对于单次标记条件,参与式的变化要比复数标记的变化要大得多。有些人系统地朝着更熟悉的模式系统化,有些是针对不太熟悉的模式系统化的,有些人与概率匹配没有显着差异。我们展示了一个具有两个免费参数的模型如何在任何给定情况下都可以在其系统化的倾向上有所不同。我们分析了与当前统计学习模型相关的变化,表明保存群岛学习模型以及所有具有单个自由参数的模型都无法捕获我们的结果。我们还讨论了对语言变化理论的影响。