出于安全原因,我们必须慎重考虑是否公开发布 LLM 设计的某些方面。如果全部公开,就会引来不良分子试图利用生成式 AI 系统。但如果没有任何关于用于训练 LLM 的数据的信息,外部专家就无法评估由语言模型驱动的应用程序造成意外损害的可能性。Nomic 副总裁 Ben Schmidt 认为:“训练数据的选择反映了历史偏见,可能会造成各种危害。”Nomic 开发了用于搜索和可视化海量数据集的工具。Schmidt 补充道:“为了减轻这些危害,并做出明智的决定,确定模型不应用于何处,我们需要知道模型中存在哪些偏见。OpenAI 的选择让这成为不可能。”17
主要关键词