本文旨在通过研究两个最先进的生成模型(扩散模型和变压器)的适应来弥合这一差距,以在哈萨克州进行文本生成。扩散模型(例如denoising扩散概率模型)在英语的高质量和多样化的文本生成中显示出令人鼓舞的结果[2]。这项研究为哈萨克语和土耳其语的自然语言处理领域做出了宝贵的贡献,为确定语法类别提供了工具。它的优势在于使用机器学习算法和广泛的数据集,这些算法与语言处理的复杂性以及算法适用性的潜在局限性相平衡[3]。同样,在下游任务上进行了微调的经过验证的变压器在各种NLP基准测试中占主导地位[4]。尽管在释义数据集上进行了一些工作[5]。该研究重点介绍了基于样本的机器翻译的基本方面:确定句子之间的相似程度。这涉及将输入句子与数据库中的相应示例对齐,选择该句子的片段,然后对其进行调整或释义以产生预期的翻译[6]。所审查的文章介绍了搜索系统中信息检索技术的新的语言和算法解决方案的开发,考虑到语法和语义的元素,包括turkic文本[7]。该文档提供了总结哈萨克文文本的方法的详细描述[8],这些研究并不能解决我们解决的问题。此外,还有一些努力在哈萨克语[9]中定义语义上的单词[9],以及使用生成的预先训练的预先训练的变压器对哈萨克语文本生成的一些初步工作,THR研究涉及对哈萨克语的文本生成模型的经验评估,其特征在于其有限的资源和复杂的形态[10]。研究研究了哈萨克语的语法特征[11]。然而,这些作品都没有全面解决哈萨克(Hazakh)的文本发电挑战,这是一种低资源,形态上丰富的突厥语。
本文提供了有关使用Artifi Cial Intelligence Technologies和计算语言学方法的质量数字化背景下撰写哈萨克语语言的现代问题的信息。基于西里尔字母的哈萨克语当前字母的不正确性证明与其中包含西里尔字母有关,表示未包含在其声音结构中的音素。通过取代错误的字母来改革哈萨克的著作的必要性得到证实。错误和矛盾在基于拉丁字母的哈萨克字母的批准版本中显示,以及提出的字母作为替代批准的字母,其中重复了一些以前的错误。在这两种情况下,都没有对哈萨克语的声音系统进行分析和澄清,这是任何字母的基础。在这项研究中,为了澄清哈萨克语的音响系统,进行了实验,以确定哈萨克语声音的发音和声学特征,并在许多自然语言中使用的计算机程序。在表达分析中,特别注意元音,这引起了哈萨克的信件的各种矛盾。建议根据四个二进制特征使用元音的新分类,而不是根据三个二进制特征的传统分类。声学分析使用了共赋剂分析方法,该方法旨在识别频谱图中的某些共振体。实体。定量,联甲量对应于语音频谱中的最大值,并且通常以水平频段作为频谱图出现。在确定哈萨克语的声音系统的组成和分类效果:第一个基于拉丁字母:第一个基于土耳其字母基于图标记;第二个是基于使用Digraphs的英语字母。第二个选择方法可以解决使用Digraphs时出现的问题的方法。总而言之,提供了有关哈萨克斯坦正在进行和正在进行的工作的信息,该信息基于对哈萨克语的智能系统的创建,基于艺术智能和计算语言学的方法和技术,这些方法和计算语言学的结果是在来源列表中所反映的结果。
1。动物产品生产和加工技术系,兽医和畜牧技术学院,哈萨克斯坦阿斯塔纳市的哈萨克林塞夫林·阿诺特里奇研究大学; 2。哈萨克斯坦阿斯塔纳市的塞夫林哈萨克族人哈萨克林的兽医和畜牧技术学院兽医系; 3。兽医与生物技术系,兽医和畜牧技术学院,哈萨克斯坦阿斯塔纳市的哈萨克林·哈萨克林·阿克罗特大学研究大学; 4。哈萨克 - 中国联合生物学安全实验室,兽医和畜牧技术学院,哈萨克斯坦阿斯塔纳市的哈萨克林塞夫林·哈萨克林农业技术研究所。通讯作者:orken akibekov,电子邮件:orken.a.s@mail.ru共同作者:ru:r.uskenov@kazatu.edu.edu.kz,si:s.issabekekova@kazazatu.kz 06-06-2024,接受:26-09-2024,在线发布:31-10-2024
该研究包括五个封闭的模型(OpenAI的GPT 3.5和4,Google的Gemini 1.5 Pro,Yandexgpt 2和3)和两个开放型模型(Meta的Llama 2和Aya,是Cohere的大型多语言模型)。实验是在与不同任务相对应的六个数据集上进行的 - 问题回答,因果推理,中学数学问题,机器翻译和拼写校正。三个数据集是专门为这项研究准备的。正如预期的那样,哈萨克(Hazakh)任务上LLM的质量低于平行英语任务。GPT-4显示出最佳的结果,其次是双子座和AYA。通常,LLM在分类任务上的表现更好,例如回答多项选择问题,并与语言生成任务(例如拼写校正)斗争。因此,在线翻译服务(例如Google Translate)仍然是在哈萨克语和英语以及哈萨克语和俄罗斯之间翻译的更可靠的选择。我们预计更多了解哈萨克的LLM的出现,评估的方法和数据集变得至关重要。
IRI 设计并委托了一项互联网使用定性研究,该研究包括在哈萨克斯坦四个城市(阿斯塔纳、阿拉木图、阿特劳和奇姆肯特)进行的十二次焦点小组讨论。参与者包括互联网用户,他们的性别、年龄、教育程度、互联网使用能力和主要语言(俄语或哈萨克语)各不相同。主要研究目标是了解互联网对哈萨克斯坦人民的重要性和实用性以及互联网在当地媒体消费中的作用。其他研究目标是调查公民喜欢的互联网内容和内容语言,以及互联网关闭对哈萨克斯坦人的影响。哈萨克斯坦 Sange 研究中心进行了这项研究。与定性研究一样,本研究的结果不一定代表哈萨克斯坦所有人的意见。在本报告中,“哈萨克人”一词用于指代哈萨克族人,而“哈萨克斯坦人”一词用于指代哈萨克斯坦公民,包括少数民族。
IRI 设计并委托了一项互联网使用定性研究,该研究包括在哈萨克斯坦四个城市(阿斯塔纳、阿拉木图、阿特劳和奇姆肯特)进行的十二次焦点小组讨论。参与者包括互联网用户,他们的性别、年龄、教育程度、互联网使用能力和主要语言(俄语或哈萨克语)各不相同。主要研究目标是了解互联网对哈萨克斯坦人民的重要性和实用性以及互联网在当地媒体消费中的作用。其他研究目标是调查公民喜欢的互联网内容和内容语言,以及互联网关闭对哈萨克斯坦人的影响。哈萨克斯坦 Sange 研究中心进行了这项研究。与定性研究一样,本研究的结果不一定代表哈萨克斯坦所有人的意见。在本报告中,“哈萨克人”一词用于指代哈萨克族人,而“哈萨克斯坦人”一词用于指代哈萨克斯坦公民,包括少数民族。
摘要本文研究了外层空间技术在后苏联哈萨克斯坦的作用。它探讨了外在空间是全球相关性的技术人工制品,是一种现代性的后殖民恋物癖,被要求产生它代表的东西,即技术先进的哈萨克州国家的现实。文章表明,在成为一个太空国家的项目中,该国重申了主要的激励措施,这些激励措施在全球南方的后殖民环境中激发了核和太空计划的发展。它探讨了与俄罗斯的合作如何允许哈萨克斯坦在苏联太空遗产中享有其份额,而不是与之距离。该研究随后在后苏联背景之外的哈萨克斯坦太空计划中追溯了新的国际主义的兴起。本文有助于有关后殖民技术的辩论,并展示了如何使用外太空来增强后殖民民族意识形态的传统领域 - 本地主义和传统 - 技术和科学。最后,它描绘了哈萨克民间社会团体对太空计划的日益增长的抵制如何揭示了环境议程与深深的反帝国统治的“生态民族主义”的紧密联系,最终是反主主义的政治话语。
来自中国的储存设施和储存设施的储存设施太便宜,无法出售。 但大流行已经对工业活动和人类流动性造成了巨大的损失,道路和空中交通大大减少。 对石油的需求急剧下降,价格仍然很低。 总体而言,危机大会损害了依赖石油出口的经济体的可持续性。 例如,哈萨克·特尼(Hazakh Tenge)违反美元和欧元而急剧折旧,使银行体系和人民的生计负担。 在一个依赖进口商品和商品出口的国家中,薄弱的货币转化为经济麻烦。储存设施和储存设施的储存设施太便宜,无法出售。但大流行已经对工业活动和人类流动性造成了巨大的损失,道路和空中交通大大减少。对石油的需求急剧下降,价格仍然很低。总体而言,危机大会损害了依赖石油出口的经济体的可持续性。哈萨克·特尼(Hazakh Tenge)违反美元和欧元而急剧折旧,使银行体系和人民的生计负担。在一个依赖进口商品和商品出口的国家中,薄弱的货币转化为经济麻烦。
Moldir Tileshova 1,Zura Yessimsiitova 1 *,Feruza Alseitova 2,Zhanar Chunetova 3 *,Nariman Pravin 4,Zhanar Tileubayeva 1,Tolganay Ryskali 1,Gulmira Yeltay 1 1.哈萨克国立医科大学以S. D. Asfendiyarov命名,组织学系,TOLE BI 94,ALMATY,050000,哈萨克斯坦3. al-farabi哈萨克国立大学,生物学与生物技术学院分子生物学与遗传学系,阿尔玛蒂市Al-Farabi Avenue 93,哈萨克斯坦4. Kazakh-Russian Medical University, Faculty of Medicine, Department of Anatomy with Histology Courses, Abylaykhana 1/53, Almaty, 050004, Kazakhstan * Corresponding author's E-mail: zura1958@bk.ru, zhanar_chunetova79@mail.ru ABSTRACT The milk thistle Silybum Marianum (L.) Gaertn。 是具有许多治疗特性的药用植物之一。 silymarin是牛奶蓟植物的活性成分,该植物富含类黄酮和黄酮质化合物,其治疗作用在医学中被广泛提及。 该植物的种子提取物(称为水莲蛋白)可保护肝脏免受各种类型的中毒,包括阿甘那蘑菇和酒精。 然而,几项研究的结果表明,水莲蛋白也抑制了前列腺和肝癌的发展。 该植物由于其药用黄酮植物而非常重要,这些药物可有效治疗各种肝病,肝炎,血脂,糖尿病,心血管疾病,癌症等。哈萨克国立医科大学以S. D. Asfendiyarov命名,组织学系,TOLE BI 94,ALMATY,050000,哈萨克斯坦3.al-farabi哈萨克国立大学,生物学与生物技术学院分子生物学与遗传学系,阿尔玛蒂市Al-Farabi Avenue 93,哈萨克斯坦4.Kazakh-Russian Medical University, Faculty of Medicine, Department of Anatomy with Histology Courses, Abylaykhana 1/53, Almaty, 050004, Kazakhstan * Corresponding author's E-mail: zura1958@bk.ru, zhanar_chunetova79@mail.ru ABSTRACT The milk thistle Silybum Marianum (L.) Gaertn。是具有许多治疗特性的药用植物之一。silymarin是牛奶蓟植物的活性成分,该植物富含类黄酮和黄酮质化合物,其治疗作用在医学中被广泛提及。该植物的种子提取物(称为水莲蛋白)可保护肝脏免受各种类型的中毒,包括阿甘那蘑菇和酒精。然而,几项研究的结果表明,水莲蛋白也抑制了前列腺和肝癌的发展。该植物由于其药用黄酮植物而非常重要,这些药物可有效治疗各种肝病,肝炎,血脂,糖尿病,心血管疾病,癌症等。因此,本研究研究了牛奶蓟植物及其生物活性化合物的药理,植物化学和生理特性。在植物的三个部分中检查了植物化学提取物:种子,叶子和茎,并检查了其抗癌特性。的发现说明,在种子和茎中发现了总类黄酮,然后是植物的叶子。另外,这些结果表明,时间对这种植物中类黄酮量的影响以及其收获月因子对类黄酮水平的相互作用效应很明显。可以得出结论,在植物的种子提取物中观察到中和癌细胞的自由基的最高活性率。
结果:Maxent模型和RF模型确定了影响Betula Tianschanica潜在分布的主要环境因素。最大模型表明,较低的土壤层和高程中砾石体积的百分比是最重要的,而RF模型认为最潮湿的季度的高度和降水是最关键的。这两种模型都一致断言,高程是影响betula tianschanica分布的关键环境元素。曲线下的平均面积(AUC)得分分别为Maxent模型和RF分别为0.970和0.873,表明Maxent模型在预测精度中超过RF模型。因此,本研究采用了由Maxent模型建模的Betula Tianschanica的估计地理区域。按照最大模型的预期结果,Betula Tianschanica主要位于蒂安山山脉,伊利河盆地,伊斯西克 - 库尔湖,图班湖,图班河盆地,伊蒂斯河,乌尔蒂什河,乌尔ungur河,波格达山脉,鲍格达山脉,哈萨克山脉,哈萨克山脉,阿米尔河河流的米布尔特河的米德尔河河流,在所有情况下,栖息地区域均显示出增长,除了在SSP2-4.5方案下在2041 - 2060年期间观察到的下降。非常明显,在同一时间范围内的SSP58.5方案下,该区域显着扩展42.7%。相反,RF模型在总计