语言学中的经济概念具有多种不同的价值和含义,可以从许多不同的角度进行考虑和研究。为了确定其多种解读,对经济一词进行了词汇和词源学定义,从整体上看,它揭示了一种积极的解释:经济意味着收益、节俭、负担减轻、节省;它被定义为管理好一所房子的规则,源于希腊语 oikÚs,意为“房子”,以及 nomÚs,来自 Èmein,意为“交付、分配”。这种关于管理好一所房子的资源的概念可以从社会层面隐喻性地转移到语言层面;在这个意义上,语言作为一个整体表现出一种适当的平衡,这是由所有内部和外部力量的正确分配而产生的,这些力量是习俗、语言变化、与不同现实的接触和其他各种因素不断引入的,从而导致改变和不规则,损害了交流。因此,语言的经济性对整个系统具有强大的控制功能,它以尽可能少的能量成本来实现。经济性的概念是所有生物体共有的趋势,可以称为最小努力原则,即倾向于用最少的努力来实现最大的结果,这样就不会浪费任何东西。除了是生物学原理外,这一原则也适用于语言行为,是语言进化的核心。在现代,安德烈·马丁内特(André Martinet)对经济性原则进行了研究和分析,并在音系学和句法学中测试了其多种应用,从而首次给出了一致的定义。
• 定义:名称识别和枚举 (NER) 是在文本中定位和分类特定实体的过程,包括个人、地点、企业、日期等的名称。• 印度语言中的重要性:NER 对于问答、信息提取和其他语言理解等活动至关重要。由于名称和实体种类繁多、音译问题和不同的单词边界,识别印度语言中的命名实体可能很困难。• 困难:一个主要困难是印度语言中没有用于 NER 的大量标记数据集,特别是对于资源匮乏的语言。由于复杂的名词短语和复合词在印度语言中很常见,NER 变得更加复杂。•方法:条件随机场 (CRF)、深度学习和迁移学习是研究人员用来为印度语言创建 NER 模型的一些方法。Indo NLP 项目等计划的目标是开发印度语言的 NER 模型和数据集。
量子计算最常见的形式化是电路模型,这是一种表示二维希尔伯特空间中酉矩阵的图解语言,有关简介请参阅 [20]。量子过程的验证需要量子电路的健全完备的方程理论,即通过生成器和关系对酉矩阵的完整表示。这是一个众所周知的难题。通过放宽酉性条件并允许所有线性映射,人们发现了至少三种不同的完整方程理论。ZX 演算在 [4] 中被引入,并被设计为范畴量子力学程序的一部分。它依赖于两个互补可观测量之间的相互作用。ZX 演算已被证明是一种推理量子过程的良好语言 [7, 11]。然而,寻找一套使其完整的规则已经开放很长时间,部分解决方案 [15] 涉及二级图形语言:ZW 演算 [12,5]。该演算建立在两个三部分纠缠类(GHZ 和 W 状态)之上,揭示了新的结构。后来又引入了另一种完整的图形语言,即 ZH 演算 [1],其灵感来自超图状态。与量子电路相比,这三种语言有一个重要的优势。流程和矩阵不仅仅用图表示,还要用图表示(因此称为图形语言)。同构图表示相同的量子演化。这一特性嵌入在“只有拓扑重要”范式中。这是一个微妙的特征:通常的图形语言(如量子电路)从给定的一组原语(通常是量子门)开始,输入和输出的概念对于这些原语来说很重要。当仅拓扑重要时,人们可以很容易地将输入切换到输出,反之亦然。
美国国土安全部 (DHS) 土著语言计划是加强拉丁美洲土著人的语言服务的一种手段,这些土著人在 DHS 计划、活动和行动中遇到并得到服务。DHS 认识到在其众多使命和职能中与英语能力有限 (LEP) 的人进行有效沟通的重要性,并致力于满足行政命令 13166《改善英语能力有限人士的服务获取途径》(2000 年 8 月 11 日)的要求。1 行政命令 13166 要求 DHS 为英语能力有限人士提供有意义的计划、服务和活动获取途径,同时符合且不过度加重该部门的基本使命。该部门的最新语言获取计划(可在 www.dhs.gov/language-access 上找到)描述了为英语能力有限人士提供此类有意义获取途径的语言获取要求和政策。这项土著语言计划详细说明了国土安全部将采取哪些关键措施来加强拉丁美洲土著人的语言使用,旨在补充更新后的语言使用计划。来自墨西哥、危地马拉和其他拥有大量土著人口的国家的移民数量显著增加。近年来,来自各个部门的报告和公众的民权投诉表明,有必要研究国土安全部如何加强为拉丁美洲土著语言使用者和其他稀有语言使用者提供的语言服务。2 因此,该计划侧重于加强国土安全部与拉丁美洲土著移民人口进行有效沟通的能力。在制定该计划时,国土安全部还研究了土著移民妇女和女孩的语言使用考虑因素,以支持国土安全部促进性别平等和防止移民制度中的性别歧视的目标。3
• 编译时间是“开销”:只做一次; • 翻译器可以进行优化; • 可以删除运行时不再需要的大量信息。 • 由于执行目标代码,调试时更难提供有用的反馈。 • 不易移植(例如,移植到不同的操作系统/架构/等)。 • 您知道哪些编译语言?
元素:字符编码 字符编码将字符映射到二进制数据(位/字节级别)。每个字符集使用一个或多个特定编码。系统必须知道使用哪种编码才能正确解释二进制数据所表示的内容。土著语言文本由由 Unicode 字符组成的字素(符号)字符串组成。这些字素可以使用 UTF-8(最好)或 UTF-16 编码编码为二进制数据。UTF-8 是 BC 政府系统的首选编码,因为它只使用一个字节存储所有 ASCII 字符,并且 BC 政府系统中的大多数文本数据都是 ASCII。多字符字素和土著语言非 ASCII 字符需要额外的字节。UTF-16 也是编码 Unicode 字符的标准,但每个字符需要 2 或 4 个字节。由于 UTF-8 对于主要使用 ASCII 字符的应用程序更有效,因此它是 BC 政府系统中首选的编码。