大型语言模型 (LLM) 在各个领域都变得至关重要,这强调了在代表性不足的语言中建立高质量模型的紧迫性。本研究探讨了低资源语言面临的独特挑战,例如数据稀缺、模型选择、评估和计算限制,特别关注土耳其语。我们进行了深入分析,以评估训练策略、模型选择和数据可用性对为代表性不足的语言设计的 LLM 性能的影响。我们的方法包括两种方法:(i) 调整最初用英语预训练的现有 LLM 以理解土耳其语;(ii) 使用土耳其语预训练数据从头开始开发模型,这两种方法均辅以在新的土耳其语指令调整数据集上进行监督微调,旨在增强推理能力。通过创建新的土耳其语 LLM 排行榜来评估这些方法的相对性能,其中包含评估不同推理和知识技能的基准。此外,我们在预训练和微调期间对数据和模型扩展进行了实验,同时强调跨语言知识迁移的能力,并解决在不同语言上微调时遇到的灾难性遗忘的挑战。我们的目标是提供在低资源语言环境中推进 LLM 框架的详细指南,从而使自然语言处理 (NLP) 的好处在全球范围内更容易获得。
2022 年 2 月 24 日,俄罗斯再次入侵乌克兰后,乌克兰驻土耳其大使瓦西里·博德纳尔 (Vasyl Bodnar) 要求土耳其关闭土耳其海峡——博斯普鲁斯海峡 (伊斯坦布尔)、马尔马拉海和达达尼尔海峡 (恰纳卡莱海峡)——禁止俄罗斯军舰通行。1 一周后,土耳其实际上关闭了海峡,禁止所有国家的军舰通行,但返回黑海母港的军舰除外。具体来说,土耳其外交部长梅夫吕特·恰武什奥卢宣布:“当土耳其不是冲突中的交战方时,它有权限制交战国军舰穿越海峡。如果军舰要返回黑海基地,则通道不会关闭。我们遵守蒙特勒规则。所有沿岸国和非沿岸国政府都被警告不要派遣军舰穿越海峡。”土耳其总统雷杰普·塔伊普·埃尔多安证实了外交部长的声明,并强调采取这些措施是为了“防止俄乌危机进一步升级”。2
土耳其伊斯坦布尔东部的土地利用模式 Coskun, M. Z. a. *,Musaoglu. a Saroglu a,E.,Bektas a a。ITU,土木工程学院,80626 Maslak,伊斯坦布尔,土耳其 – (coskun, nmusaoglu, saroglue, bektasfi @itu.edu.tr) 本研究是土耳其科学技术委员会 (TUBITAK) 资助项目的一部分,旨在分析伊斯坦布尔亚洲区国有土地的土地利用模式。本研究选定伊斯坦布尔亚洲区的一部分。研究区域位于博斯普鲁斯海峡东侧。本文使用了 1960-2001 年期间的 Corona Lansad TM 和 SPOT 5 影像对森林面积进行多时相分析。使用影像分类方法对卫星影像进行分类。分类后,森林面积被转换为矢量多边形,所有信息被传输到 GIS 媒体。将国有土地的现状与从卫星数据获得的情况进行了比较。通过查询分析了森林和国有土地的变化。查询分为两部分,分别是 1960、2002、2004 年和 1984、1992、1997 年。关键词:土地、伊斯坦布尔、GIS、遥感、国有、Corona Lansat、Spot 1. 1. 简介
纵观历史,尽管受到阿尔弗雷德·塞耶·马汉概念的影响,欧洲大陆和亚洲的海军一直面临一个简单的选择:要么建立一支均衡的舰队,在海上与另一支均衡的舰队交战,并在一场或多场“决战”中击败它,要么采取“不对称方法”,建立一支“不均衡”的海军,能够阻止敌人获得海上控制权,并保持自己的重要海上通信线(如果有的话)不受敌人海军力量的侵扰。就俄罗斯而言,远洋均衡海军时代以 1904-1905 年日俄战争的失败而告终。俄罗斯并没有失去建造主力舰的能力,也没有失去使用主力舰的背景。然而,战争发生在俄罗斯缺乏海军基础设施的地区——舰队基地,或者更重要的是,造船和维修设施。俄罗斯这些能力的主要来源是(现在仍然)位于该国的欧洲部分。1 出于各种原因,俄罗斯帝国没有足够的战略动机来恢复其在远东的海军实力,直到1945年苏联时代才恢复。1905年后俄罗斯的关键路线是彼得大帝在十八世纪前夕确定的路线:波罗的海(丹麦海峡)和黑海(博斯普鲁斯海峡和达达尼尔海峡)。这两条路线长期以来一直被用来运送俄罗斯的主要出口产品,小麦和