antofact：通过本体驱动的强化学习揭示了LLM的奇妙事实

antofact：通过本体驱动的强化学习揭示了LLM的奇妙事实 - 骨骼

可下载资源数量

已经购买

下载数量：1

单价	0 1.0
Coupon	100% 0%
Total	0 1.0

点击下载点击购买并下载

点击购买，资源将自动在新窗口打开.

机构名称：

antofact：通过本体驱动的强化学习揭示了LLM的奇妙事实 - 骨骼

¥ 1.0

热度

大型语言模型（LLM）表现出了信息检索的熟练程度，而它们容易产生与现实冲突的不正确反应，这种现象被称为固有幻觉。关键挑战在于经过大量数据训练的LLM中不清楚和不可靠的事实分布。vreva-liment方法将事实检测任务视为一个问题 - 回答范式，在其中询问了LLMS有关FACTUAL知识并检查正确性的问题。但是，研究主要侧重于仅从几个特定领域（例如电影和运动）中得出测试用例，从而限制了对知识缺失的全面观察和对意外幻觉的分析。为了打扮这个问题，我们提出了构造，这是一个自适应框架，用于检测LLM的未知事实，致力于挖掘缺失知识的本体论级骨架。特定说明，我们认为LLM可以在缺失的事实中公开基于本体的相似性，并将五个代表知识图（kgs）作为基准。我们进一步设计了一种复杂的本体驱动的强化学习（ORL）机制，以自动与特定实体和关系产生易错的测试用例。Orl Mechamenism奖励KGS朝着可行的方向导航，以揭示事实错误。此外，经验努力表明，无论是否包括这些知识，主导的LLM都倾向于回答是的，而不是否定。使用32个代表性LLM的5个数据集上的实验结果表明，当前LLMS总体上缺乏事实。为了减轻LLM的过度自信，我们利用了无幻觉检测（HFD）策略来解决基线之间的不公平比较，从而提高了结果的稳健性。值得注意的是，CHATGPT在DBPEDIA上的事实错误率分别为51.6％，Yago的错误率分别为64.7％。另外，ORL机制显示出令人鼓舞的误差预测分数，大多数LLM的F1分数范围从70％到90％。与详尽的测试相比，ORL的平均召回率为80％，同时将评估时间降低35.29％至63.12％。

添加pdf代下载 VIP点击下载文件

antofact：通过本体驱动的强化学习揭示了LLM的奇妙事实 - 骨骼

主要关键词

缺失基准事实询问不可靠的 LLM 致力于训练的相似性信息检索问题正确性自适应可行的错误率驱动的实验结果本体论数据 LLMS 复杂的稳健性可靠的检测主导的提高幻觉不正确 ORL 幻觉的结果的数据集知识详尽的测试用例产生倾向于

antofact：通过本体驱动的强化学习揭示了LLM的奇妙事实 - 骨骼PDF文件第1页

antofact：通过本体驱动的强化学习揭示了LLM的奇妙事实 - 骨骼PDF文件第2页

antofact：通过本体驱动的强化学习揭示了LLM的奇妙事实 - 骨骼PDF文件第3页

antofact：通过本体驱动的强化学习揭示了LLM的奇妙事实 - 骨骼PDF文件第4页

antofact：通过本体驱动的强化学习揭示了LLM的奇妙事实 - 骨骼PDF文件第5页

可下载资源数量

已经购买

下载数量：1

antofact：通过本体驱动的强化学习揭示了LLM的奇妙事实 - 骨骼

antofact：通过本体驱动的强化学习揭示了LLM的奇妙事实 - 骨骼

相关文件推荐

强化学习驱动的数字孪生支持供应链决策

基于强化学习

强化学习：Q学习

强化学习（强化学习）

Tell-Drive：通过教师LLM引导深入强化学习

数据驱动方程发现揭示人类的非线性强化学习

AISYN：基于人工智能驱动的强化学习逻辑合成框架

持续强化学习

与安全强化学习

深度强化学习

通过基于模型的强化学习

强化学习：DQN

推进强化学习

深度强化学习

强化学习基盘

基于表示的强化学习

使用强化学习

深度强化学习

强化学习简介

控制理论与强化学习

深度强化学习

多代理强化学习

密集的深强化学习

基于模型的强化学习

贝叶斯强化学习

使用强化学习

AI驱动的学习平台对

深度学习、强化学习和 Q 学习

动态强化学习揭示了奖励学习过程中战略的时间依赖性转变

动态强化学习揭示了奖励学习过程中战略的时间依赖性转变

XiaoMi-AI