摘要。我们的生活现在围绕社会交流,并且由于阿拉伯文本非常复杂并且包含了许多方言,因此在阿拉伯社交媒体上很难识别出令人反感的语言。本文研究了机器学习模型的实施。使用了选择的分类器,包括决策树,支持向量机,随机森林和逻辑回归。在实验中使用了包含4505个推文的“ ARCYBC”数据集,以评估机器学习模型的性能。根据实验的结果,使用更多运行可以增强机器学习模型的性能,尤其是在精度和召回率方面。随着更多的运行,决策树(DT)和随机森林(RF)分类器显示出更好的回忆和精度,但是DT分类器显示出更好的精度。
hal是一个多学科的开放访问档案,用于存款和传播科学研究文件,无论它们是否已发表。这些文件可能来自法国或国外的教学和研究机构,也可能来自公共或私人研究中心。
阿拉伯语中的情感分析由于其复杂的形态,多种方言和有限的语言资源而面临独特的挑战。尽管在该领域进行了大量研究,但在情感分类中实现高精度仍然是一个紧迫的问题。在本文中,我们系统地回顾了2018年至2024年发表的阿拉伯产品评论的31项情感分析研究。我们专注于机器学习(ML)和深度学习(DL)技术的最新进步,研究方法,数据集以及取得的绩效结果。我们的评论将情感分析技术分类为基于词典的基于机器学习和混合方法,并特别强调了在阿拉伯情感分析中普遍使用ML模型。审查的研究采用了各种算法,包括幼稚的贝叶斯,决策树,SVM,CNN和Arabert模型等。此外,我们的分析强调了所利用的常见预处理和特征提取技术,以及用于确定这些模型功效的评估指标。尽管取得了显着进步,但我们的发现表明,许多现有方法都没有提供最佳结果。我们认为,未来的研究应考虑实施替代的机器学习模型,并利用全面的数据集,以增强阿拉伯情感分析中当前技术的准确性。
作者:Alice Bladh Fleihan主管:Temitayo Olatoye审查员:Magnus Levin术语:2024 Autumn 2024主题:英语语言学级别:BA课程代码:2en10e
WLAR 320用于专业目的的阿拉伯语(3个学分)本课程是为完成至少两年的现代标准阿拉伯语(MSA)的学生而设计的。该课程强调正式阿拉伯语用于专业目的的功能,重点是书面和口头生产。学生将接受实践技能的培训,包括编写电子邮件,正式信件,问卷调查和社交媒体帖子。除了通过口头演讲,访谈和与母语扬声器的协作项目提高阿拉伯语技巧外,学生还将通过频繁的书面作业来建立他们的阿拉伯写作技巧,这些书面作业强调工作场所的词汇和连接器(文章,短语或iDoms),以帮助学生理解和产生流畅的,互感,互动。量身定制的活动将加强基本的语法概念和结构,并帮助学生在学术和专业背景下(无论是亲自或在线)使用阿拉伯语建立信心。
背景:哮喘的全球患病率不断提高,需要有效的疾病管理,患者及其家人扮演核心角色。增强护理人员中的健康素养(HL)对于改善哮喘结果至关重要。目的:本研究旨在验证哮喘计算问卷(AR-ANQ)的阿拉伯语版本,以解决针对讲阿拉伯语人群的HL评估工具中的差距。患者和方法:共有400名哮喘儿童父母在门诊呼吸道诊所完成了AR-ANQ。验证性因素分析(CFA)和RASCH分析用于评估仪器的心理测量特性。结果:CFA支持AR-ANQ的一维结构,具有出色的模型拟合指数(χ²/DF = 4.6,SRMR = 0.02,CFI = 0.99,GFI = 0.99,TLI = 0.96)和高内部一致性(Cronbach'sα= 0.82)。RASCH分析进一步证明了心理鲁棒性,具有较高的人和分离可靠性(分别为0.74和0.99)和可接受的INFIT和服装统计。结论:哮喘计算问卷(AR-ANQ)的阿拉伯语版本是评估哮喘儿童父母健康素养的可靠且有效的工具。关键字:哮喘计算问卷,哮喘,健康素养,阿拉伯语,小儿
迅速的进步和广泛接受人工智能(AI)系统突出了一个紧迫的要求,以理解与AI相关的能力和潜在风险。鉴于AI研究中Arabic的语言复杂性,文化丰富性和代表性不足的状态,因此需要重点关注大型语言模型(LLMS)的效果和安全性。尽管他们的发展进展有所进展,但缺乏全面的信任评估基准,这在准确评估和证明阿拉伯语提示时提出了LLM的安全性。在本文中,我们介绍了Aratrust 1,这是阿拉伯语LLM的第一个全面的可信赖台。Aratrust包括522个人工编写的多项选择问题,这些问题解决了与真理,道德,隐私,非法活动,人类健康,身体健康,身体健康,不公平和冒犯性语言有关的各种维度。我们评估了针对我们的基准测试的一组LLM,以评估其可信度。gpt-4是最值得信赖的LLM,而开源模型(特别是ACEGPT 7B和JAIS 13B)努力在我们的基准测试中取得60%的分数。
社交媒体由于其广泛使用和独特的语言特征而成为自然语言处理(NLP)研究的重要重点。正常的社交媒体有限,特别是对于像阿拉伯语这样的形态丰富的语言,由于平行语料库有限,这仍然是一项复杂的任务。阿拉伯语通过现代标准阿拉伯语(MSA)和各种区域方言,共同称为方言阿拉伯语(DA),这使NLP的非正式性质和可变性变得复杂。本文介绍了Dial2MSA验证,这是DIAL2MSA数据集的扩展,其中包括验证的墨西哥湾,埃及人,列万坦和Maghrebi方言的翻译。我们评估了该数据集上SEQ2SEQ模型的性能,突出了状态模型在翻译阿拉伯语方言中的有效性。我们还通过错误分析提供见解,并概述将来的SEQ2SEQ模型和数据集开发的未来方向。DIAL2MSA验证的数据集可公开用于支持进一步的研究1。
摘要 – 当今时代人工智能应用的广泛使用为阿拉伯语这一广泛的语言领域以及将这些应用用于学习、生成和校对阿拉伯语的可能性创造了独特的机遇和挑战。主要研究问题是人工智能应用在阿拉伯语环境中的有效性和挑战。本研究测试了尽管存在挑战,但人工智能工具是否比传统方法更能增强阿拉伯语。使用谷歌学术的重点策略对研究进行了全面的文献综述,使用了“人工智能”和“阿拉伯语”等特定关键词,并选择了与人工智能在阿拉伯语教育、翻译和处理中的作用相关的研究。本研究揭示了人工智能应用与阿拉伯语之间的关系,包括对该领域已发表的研究的回顾,以确定使用这些应用的现实情况及其在服务阿拉伯语方面的有效性程度。