详细内容或原文请订阅后点击阅览
联邦培训:无妥协的生成AI
地方当局要求Messenger访问保护通信机密性的加密系统。
来源:OSP网站大数据新闻在企业中实施生成式人工智能系统时,您可以将训练数据传输给大型语言模型提供商来训练其专门版本,或者创建本地能力有限的小语言模型。如今,越来越多地使用更有效的联邦学习方法。其原理是,大型语言模型在存储的机密企业数据上进行训练,而不将其发送到模型提供商的云端。
这使得可以使用专有的公司信息和强大模型(如 GPT-4 或 Google Gemini)的一般知识,而无需担心受到损害。更重要的是,无需将 PB 级的信息移动到托管模型的云中。
例如,可以使用来自客户金融交易、仓库系统和供应链的数据以这种方式训练通用模型。因此,与组织本身开发的小型模型相比,它将能够为特定公司提供更多有用的信息,并做出更准确的预测。
联合方法可提供显着的成本效益 - 无需为 AI 部署单独的基础设施,也无需支付移动大量数据的成本。如今,有一些框架可以让您轻松实现内部小型语言模型与大型云语言模型之间的集成。这创建了一个混合架构,可以最大限度地降低风险,特别是对于处理敏感数据或在受监管行业中运营的组织而言。此外,这样的系统更简单,使其部署更容易、更快捷。
另一个优点是能够连接大型行业特定语言模型,这些模型通常由通用模型运营商以外的提供商托管。
