用于 Hugging Face 模型的流行 Python 库,易受中毒元数据攻击

这些开源库由 Salesforce、Nvidia 和 Apple 与瑞士集团创建。Hugging Face 模型中使用的流行 AI 和 ML Python 库中的漏洞,下载量达数千万次,允许远程攻击者在元数据中隐藏恶意代码。当加载包含中毒元数据的文件时,代码会自动执行。

来源:The Register _恶意软件

拥有数千万下载量的 Hugging Face 模型中使用的流行 AI 和 ML Python 库中的漏洞允许远程攻击者在元数据中隐藏恶意代码。当加载包含中毒元数据的文件时,代码会自动执行。

开源库 NeMo、Uni2TS 和 FlexTok 分别由 Nvidia、Salesforce 和 Apple 与瑞士联邦理工学院视觉智能和学习实验室 (EPFL VILAB) 合作创建。

所有三个库都使用 Hydra,这是另一个由 Meta 维护的 Python 库,通常用作机器学习项目的配置管理工具。具体来说,该漏洞涉及 Hydra 的 instantiate() 函数。

Palo Alto Networks 的 Unit 42 发现了这些安全漏洞,并将其报告给库的维护人员,维护人员随后发布了安全警告、修复程序,并在两个案例中发布了 CVE。虽然威胁追踪者表示,迄今为止,他们还没有看到任何对这些漏洞的野外滥用,但“攻击者有充分的机会利用它们。”

Unit 42 恶意软件研究工程师 Curtis Carmony 在周二的分析中写道:“开发人员通常会通过不同的微调和量化来创建自己的最先进模型变体,这些模型通常来自与任何信誉良好的机构无关的研究人员。” “攻击者只需要对现有的流行模型进行修改,以获得真正的或声称的好处,然后添加恶意元数据。”

另外,Hugging Face 不会像其他文件那样轻松访问元数据内容,也不会使用其安全张量或 NeMo 文件格式将文件标记为潜在不安全。

Hugging Face 上的模型使用了 100 多个不同的 Python 库,其中近 50 个使用 Hydra。卡莫尼写道:“虽然这些格式本身可能是安全的,但使用它们的代码中存在非常大的攻击面。”

如果我们收到任何其他公司的回复,我们将更新此故事。

九头蛇