aratrust：对阿拉伯语中LLM的可信赖性的评估__

aratrust：对阿拉伯语中LLM的可信赖性的评估

可下载资源数量

已经购买

下载数量：1

单价	0 1.0
Coupon	100% 0%
Total	0 1.0

点击下载点击购买并下载

点击购买，资源将自动在新窗口打开.

机构名称：

aratrust：对阿拉伯语中LLM的可信赖性的评估

¥ 1.0

热度

迅速的进步和广泛接受人工智能（AI）系统突出了一个紧迫的要求，以理解与AI相关的能力和潜在风险。鉴于AI研究中Arabic的语言复杂性，文化丰富性和代表性不足的状态，因此需要重点关注大型语言模型（LLMS）的效果和安全性。尽管他们的发展进展有所进展，但缺乏全面的信任评估基准，这在准确评估和证明阿拉伯语提示时提出了LLM的安全性。在本文中，我们介绍了Aratrust 1，这是阿拉伯语LLM的第一个全面的可信赖台。Aratrust包括522个人工编写的多项选择问题，这些问题解决了与真理，道德，隐私，非法活动，人类健康，身体健康，身体健康，不公平和冒犯性语言有关的各种维度。我们评估了针对我们的基准测试的一组LLM，以评估其可信度。gpt-4是最值得信赖的LLM，而开源模型（特别是ACEGPT 7B和JAIS 13B）努力在我们的基准测试中取得60％的分数。

添加pdf代下载 VIP点击下载文件

aratrust：对阿拉伯语中LLM的可信赖性的评估

主要关键词

全面不足的阿拉伯语进展问题 AI LLM 非法活动重点身体健康相关的系统人工智能可信度语言有关的复杂性迅速的安全性 Aratrust 测试的测试全面的评估基准

aratrust：对阿拉伯语中LLM的可信赖性的评估PDF文件第1页

aratrust：对阿拉伯语中LLM的可信赖性的评估PDF文件第2页

aratrust：对阿拉伯语中LLM的可信赖性的评估PDF文件第3页

aratrust：对阿拉伯语中LLM的可信赖性的评估PDF文件第4页

aratrust：对阿拉伯语中LLM的可信赖性的评估PDF文件第5页

可下载资源数量

已经购买

下载数量：1

aratrust：对阿拉伯语中LLM的可信赖性的评估

aratrust：对阿拉伯语中LLM的可信赖性的评估

相关文件推荐

一项评估

评估U

雨碳评估 - 纯种伊达 - 伊达 -

连接评估结果

差价合约评估

了解评估

生命周期评估

评估报告

评估和绩效专家

咨询选项评估

评估指南

评估工具：

生命周期评估：

评估多用途C

评估有关预防患有

与手动评估相比

颤动的评估

评估...

小儿评估

机构评估

评估系统

评估知识和

评估...

评估与...

评估GEO-

评估活动

评估步骤

评估DeepSeek

3.1 评估活动

评估A356

XiaoMi-AI