YaFSDP:Yandex 向所有人开放 AI 世界

YaFSDP 20% GPU 26%

来源:安全实验室新闻频道

Yandex 开发并在 GitHub 上公开发布了一个新工具 YaFSDP,旨在帮助从事人工智能工作的公司在训练大型语言模型 (LLM) 时优化资源。 YaFSDP 的主要优点:

YaFSDP
    加速并提高LLM训练过程的效率,节省高达20%的GPU资源,降低训练成本和时间。 是在训练 LLM 时优化 GPU 内存使用和改善 GPU 间通信的最有效的公开工具。 与之前版本的 FSDP 工具相比,学习速度提高了 26%。
  • 加速并提高LLM训练过程的效率,节省高达20%的GPU资源,降低训练成本和时间。
  • 是在训练 LLM 时优化 GPU 内存使用和改善 GPU 间通信的最有效的公开工具。
  • 是在训练 LLM 时优化 GPU 内存使用和改善 GPU 间通信的最有效的公开工具。

  • 与之前版本的 FSDP 工具相比,学习速度提高了 26%。
  • 与以前版本的 FSDP 工具相比,学习速度提高了 26%。

    “法学硕士培训是一个劳动密集型和资源密集型的过程,”Yandex 指出。 “机器学习工程师和开发自己的法学硕士的公司花费大量时间和 GPU 资源(相当于金钱)来训练这些模型。模型越大,训练所需的时间和费用就越多。”

    该公司估计,使用 YaFSDP 训练具有 700 亿个参数的模型可以节省大约 150 个 GPU 资源,相当于每月约 50 万至 150 万美元,具体取决于虚拟 GPU 供应商或平台。

    CatBoost
  • YTsaurus 是存储和处理 Yandex 数据的主要系统
  • YTsaurus AQLM