Loading...
机构名称:
¥ 5.0

随着大语言模型(LLM)的流行性升高,有必要评估其在非常相关的领域中的能力。我们提出了一个基于科学传播研究的综合评估框架,以评估LLM对气候变化问题的回答。我们的框架强调了表达和认识论充分性,对跨越8个尺寸和30个问题的LLM世代进行了精细分析。我们的评估任务是越来越多的Challenging问题的现实示例,在这些问题中,AI可以补充和提高人类绩效。我们介绍了可扩展监督的新颖协议,该协议依赖于AI援助和相关教育的评估者。我们在一系列不同的气候问题上评估了最近的一些LLM。我们的结果表明,在气候通讯领域,LLM的表面和认识论质量之间存在显着差距。

评估气候信息的大型语言模型

评估气候信息的大型语言模型PDF文件第1页

评估气候信息的大型语言模型PDF文件第2页

评估气候信息的大型语言模型PDF文件第3页

评估气候信息的大型语言模型PDF文件第4页

评估气候信息的大型语言模型PDF文件第5页

相关文件推荐

1900 年
¥4.0