考虑了人类评估框架___XiaoMi-AI 助力科研平台

考虑了人类评估框架

可下载资源数量

已经购买

下载数量：1

单价	0 2.0
Coupon	100% 0%
Total	0 2.0

点击下载点击购买并下载

点击购买，资源将自动在新窗口打开.

机构名称：

考虑了人类评估框架

¥ 2.0

热度

在该立场论文中，我们认为人类对生成大语言模型（LLM）的评估应是一个多学科的承诺，它借鉴了从学科（例如用户体验研究和人类行为心理学）的洞察力，以确保实验性设计和结果是可靠的。因此，这些评估的结论必须考虑诸如可用性，美学和认知偏见之类的因素。我们强调了齿状偏见如何将流利的信息和真实性混为一谈，以及认知不确定性如何影响诸如李克特等评级分数的可靠性。此外，评估应区分日益强大的大语言模型的能力和弱点，这需要有效的测试集。人类评估的范围性对于更广泛的采用也至关重要。因此，为了在生成NLP时代设计一个有效的人类评估系统，我们提出了考虑的考虑 - 人类评估框架，该框架由6个支柱组成 - con sistency，s coring cr i tera，s coring cr i tera，d ifferentiating，用户experience，r Esponsible和s calitible和s Calitia和s Calitia。

添加pdf代下载 VIP点击下载文件

考虑了人类评估框架

主要关键词

分数的 cr 生成人类考虑 coring Calitia 可靠的诸如广泛的有效的强大的评估的洞察力偏见多学科框架模型的心理学设计可靠性真实性多学科的不确定性学科语言 tera 认知考虑的评估可用性

考虑了人类评估框架PDF文件第1页

考虑了人类评估框架PDF文件第2页

考虑了人类评估框架PDF文件第3页

考虑了人类评估框架PDF文件第4页

考虑了人类评估框架PDF文件第5页

可下载资源数量

已经购买

下载数量：1

考虑了人类评估框架

考虑了人类评估框架

相关文件推荐

组织评估框架

影响评估框架

网络评估框架v3.2

持续改进评估框架 1.1 版

评估框架策略

评估知识状态的框架

连续人类共同进化的框架

人类 - 框架相互作用简介

通过交流改编：评估人类 -

EAL/D学校评估框架

评估人类协作：...

人类无人机的相互作用：考虑

评估新冠疫苗的考虑因素

K-12课程评估报告框架

编写评估框架或计划

澳大利亚MHealth应用程序评估框架

数据成熟度评估框架周期2.0

核心碳原理，评估框架和评估程序

核心碳原理，评估框架和评估程序

影响评估中的健康考虑因素

生成AI应用程序的评估框架

评估人类接触微塑料的情况和

基于安全系统的评估框架和分析方法

监测、评估、报告和改进框架

附件 6：监测与评估/问责框架

以评估为导向的战略规划框架

诊断测试价值的综合评估框架

原住民进步策略：评估框架

数字欧洲绩效与评估框架

评估危害指数：概念框架、好处……

XiaoMi-AI