摘要 本文旨在描述生成语言学 (GL) 对人工智能 (AI) 的贡献,并暗指语言学家和人工智能科学家之间关于语言学是属于人文学科还是科学的争论。在本文中,我将尽量不带语言学家的偏见,从独立的科学视角研究这一现象。本文向研究人员/读者介绍了人工智能所涉及的科学定理和原理,这些定理和原理属于 GL,特别是“乔姆斯基学派”。因此,它从句法、语义、语言能力、普遍语法、人类语言的计算系统、语言习得、人脑、编程语言(例如 Python)、大型语言模型和公正的人工智能科学家等方面提供了充分的证据,证明这一贡献是巨大的,而且这一贡献是不可否认的。本文的结论是,尽管 GL 对人工智能的贡献巨大,但仍然存在分歧点,包括语言输入的性质和类型。
著名评论家、麻省理工学院语言学家诺姆·乔姆斯基是过去十年中知识分子异议的典型代表之一,他列出了十种最常见、最有效的策略,这些策略是“隐藏的”议程通过媒体操纵民众而采取的。从历史上看,媒体已被证明是塑造舆论的高效手段。由于媒体的宣传和宣传,社会运动被创造或摧毁,战争被合理化,金融危机被缓和,一些其他意识形态潮流被激发,甚至媒体成为集体心理中现实的生产者。但如何发现最常见的策略来理解这些我们肯定参与其中的社会心理工具?幸运的是,乔姆斯基被赋予了综合和揭露这些做法的任务,其中一些更明显、更复杂,但似乎都同样有效,从某种角度来看,它们具有贬低性。鼓励愚蠢、促进内疚感、分散注意力或制造人为问题然后神奇地解决它们,这些只是这些策略中的一部分。
语言学是研究人类语言的科学。它力求确定人类语言中什么是必要的、什么是可能的、什么是不可能的。语言学家在努力确定各个语言的独特品质的同时,也在不断寻找语言的普遍性——这些属性的解释力可以跨越所有语言。语言学学科围绕句法(句子的组织原则)、形态学(单词的构造原则)、语义学(意义的研究)、语音学(语音的研究)、音系学(语言的声音模式)、历史语言学(语言随时间变化的方式)、社会语言学(语言与社会的相互作用)、心理语言学和神经语言学(语言在大脑中的表征)。目前,教职员工的研究涵盖整个领域,包括句法和语义的相互作用、语音学和音系学、语言接触、洋泾浜语和克里奥尔语、城市社会语言学以及句法过程的计算机类比等主题。
在巴西的葡萄牙人扩张,其可能的解释是区域性的变化,这使圣保罗秃鹰称为该国南部的乌鸦,而语言创新的根源正在大约200名语言学家的作品中出现。根据巴西葡萄牙人的创新,圣保罗大学(USP)的研究目前在葡萄牙没有同等学历,有时是如此强烈,有时如此强烈,似乎价值两三个,如波特尔(Porrrta)或卡尔恩(Carrrne)。仅在圣保罗的内部将R Caipira关联,但它是一种地理和历史性的不准确性,尽管Rsdowed R是Matuto Mazzaropi演员Matuto风格的32部电影的Matuto Mazzaropi演员的品牌之一,于1952年至1980年至1980年。沿着Paulista Bandeirantes寻找黄金的路线,语言学家在Minas Gerais,Mato Grosso,Mato Grosso,Mato Grosso do Sul,Paraná和Western Santa Catarina和Santa Catarina和Rio Grande Do Sul中发现了典型的R -SãoPaulo,形成了类似于8世纪的portuguese。那些有耐心和耳朵的人也可以在巴西中部和沿海城市中找到Chiado,这是Chiado的一项典型的Carioca演讲的特征,它于1808年与葡萄牙人一起出现,并且是代表法院讲话的声望的标志。甚至葡萄牙人也不是原始的:专家认为,使角落成为胫骨的chiado来自葡萄牙人钦佩的法国贵族。巴西葡萄牙语的历史正在阐明葡萄牙语的保存特征,例如L交换R f in R,导致Panta而不是植物。Camões在Oslusíadas录制了这种交流 - 长笛的鞋子中有一个弗拉特斯 - Paulista Singer兼词曲作者Adoniran Barbosa将她留在了各种作品中,诸如“ Frechada Do Your Your Look”,从Samba Tire到álvaro。在现场调查中,USP研究人员观察到,巴西和葡萄牙的居民,尤其是受过教育程度较低的居民,仍然以这种方式讲话。
语言已从多种角度进行了调查。语言学家将其描述为一种正式的系统,重点是从语音到语法,语义和语用学的水平。语言学家和心理学家都致力于关注语言处理时间过程的模型,以便可以在行为实验中测试这些心理语言模型。神经和认知科学家试图通过指定与语言相关的领域,“网络”,神经元组装及其相互作用来阐明语言的大脑机制。最近,在Feynman的见解“我无法创造的东西,我不了解”之后,显式具有生物学启发的建模和神经网络研究旨在模仿和解释人脑中的语言电路。这些努力建立在有关事件相关的大脑电位的神经科学数据中,以及在发生特定语言操作时激活的大脑基因座,其激活的时间过程以及局灶性脑病变的语言效应。
语义网技术能够用所需的语义丰富数据;然而,现有的本体和可用模型不能完全支持用户的特定领域需求。随着更多特定领域语义的出现,研讨会吸引了大量关注,以使历史图像可供公众访问。AI4HI-2020 研讨会的总体重点是应用人工智能、语义网技术(如本体、同义词库和受控词汇表)和语言资源来丰富和改善对与历史和文化遗产相关(但不限于)图像的访问。该研讨会提供了一个讨论研究结果的平台,包括实验、用例、经验、最佳实践、方法和使用人工智能和语义网技术处理历史图像的建议。研讨会吸引了来自许多利益相关者的论文,包括人工智能研究人员、NLP 专家、数字人文主义者、语言学家、计算机科学家和本体工程师,他们一起展示他们的工作并分享他们的经验。
SJ 和 Shi Yan 的代号似乎将卫星分为不同的功能。根据公开信息,中国历来使用 SJ 系列为已采用的系统或技术建立最佳操作实践和程序。例如,中国曾多次使用这些卫星来优化首次在其他中国系统上使用的技术。Shi Yan 卫星似乎在太空系统开发过程中发挥了更早的作用。中国已使用该系列在一个卫星平台上试运行多种新技术,专门用于开发高效有效载荷集成平台,并确定有效载荷的适用性。根据 SJ 和 Shi Yan 在技术开发过程中的不同作用来区分它们,也与对它们名称中使用的普通话单词进行更细致的解释相一致。“Shi Jian”确实是“实践”的意思,但作为名词,例如“最佳实践”,或“付诸实践”。一些中国语言学家反对将“Shi Yan”翻译为“实验”,因此“试点”或“试验”更适用。有关更多详细信息,请参阅上一节中的图 1 和图 2。
Gregory Crane Tufts大学,我们经常在语言研究中面临二分法:专注于一些用于精通和比较文学的语言,失去全球影响力或强调世界文学的广度,依赖翻译者。混合计算机人类系统提供了一条新路径。语言学家长期以来使用丰富的语言注释来使用未知的语言,但是这些注释是劳动密集型,有限且静态的。三代技术改变了这种情况。首先,可使用人和机器生成的引文网络的可嵌入文本的可嵌入文本。第二,机器学习的进步允许分析复杂的语言方面,例如语法和语义。第三大语言模型不仅为服务不足的语言提供了传统的机器翻译,还可以回答有关语言和文化背景的问题。这种不断发展的技术改变了我们与人类记录的互动,在理解和利用语言方面提供了新的挑战和机会。
当然,并非所有处理自然语言的系统都渴望实现自然语言理解。例如,从历史上看,信息检索系统在分析(索引)自由文本时从未尝试使用任何类型的自然语言处理 (NLP),更不用说需要语义关系的处理了。然而,面对大规模应用中性能下降的问题,此类系统的设计人员越来越多地尝试通过使用语言和语义资源来克服语言变化的问题(例如,表达“相同”想法的多种方式)和“单词”的多义性。不幸的是,计算语言学家使用知识库和词汇语义关系的声明性表示来支持相对受限领域的 NLP 系统所取得的适度成功,并没有在大规模信息检索系统的背景下重复。原因并不神秘:不存在一般、全面的语言知识库;没有人知道如何建立它们;即使有足够的理解,也没有人负担得起建立它们的费用;单词的“意义”数量和
始于 1929 年。1940 年,卢里亚准备了三卷关于感觉性失语症、语义性失语症和运动性失语症的著作。第一卷关于感觉性失语症的著作成为 1943 年医学博士学位论文答辩的基础(心理学博士学位论文于 1936 年通过)。第二卷关于语义性失语症的著作已经写好,但未完成 1 。第三卷的材料准备完毕,并于 1963 年部分出版。1943 年 8 月,卢里亚完成了《创伤性失语症理论论文集》2 。战后,《创伤性失语症》出版 [16]。近 30 年后,在他生命的尽头,卢里亚发表了《神经语言学的基本问题》[2],其中他对正常和异常条件下的语言大脑组织进行了更详细的解释。在这期间,他发表了许多直接或间接与语言和失语症主题相关的论文[2, 17–27]。事实上,在 20 世纪,卢里亚被认为是最有前途的语言学家。