• 系统使用哪种数据进行训练?• 训练数据的来源是什么?• 标签/基本事实是如何产生的?• 训练数据的样本量是多少?• 系统不使用哪些数据集?• 数据的潜在局限性/偏差是什么?• 训练数据的大小、比例或分布如何?
允许免费复制本作品的全部或部分以供个人或课堂使用,但不得出于营利或商业目的而复制或分发,且副本首页必须注明此声明和完整引文。必须尊重 ACM 以外的人拥有的本作品组成部分的版权。允许摘要并注明出处。以其他方式复制、重新发布、发布到服务器或重新分发到列表,需要事先获得特定许可和/或支付费用。向 permissions@acm.org 请求许可。