从本地法学硕士到工具使用代理

使用 Gemma 4、Ollama、OpenAI Agents SDK 和 Tavily MCP 构建轻量级研究代理从本地 LLM 到工具使用代理的帖子首先出现在 Towards Data Science 上。

来源:走向数据科学

本地法学硕士。好的。

但在最初的几次聊天之后,您可能会想:我还能用它做什么?

那么,如何使用一些工具来使本地 LLM 代理化呢?

在这篇文章中,我们将探讨如何将本地法学硕士转变为使用工具的代理。具体来说,我们将使用

  • Gemma 4 模型(边缘友好变体)作为我们本地的法学硕士
  • Ollama 为当地法学硕士服务
  • 用于代理运行时的 OpenAI Agents SDK
  • Tavily 网络搜索 MCP 作为外部工具的一个示例
  • 我们将构建一个迷你深度研究代理,它可以根据用户问题搜索网络、收集证据并通过引用合成答案。

    在文章结束时,您将拥有一个可工作的本地深度研究代理和一个可重用的实现模式,用于将本地模型转变为本地 AI 代理。

    如果您对本地编码代理设置感兴趣,我之前介绍过 Gemma 4 + OpenCode。在这篇文章中,我们重点关注将本地模型连接到代理运行时和外部工具的更通用模式。

    1. 设置本地代理堆栈

    在编写代码之前,我们需要准备 4 件:Ollama、Gemma 4(特别是 Gemma 4 E4B 模型)、OpenAI Agents SDK 和 Tavily MCP。

    首先,让我们安装 Ollama。

    在 Windows 上,您可以从 Ollama 官方网站下载安装程序:

    https://ollama.com/download

    或者在 PowerShell 中使用 winget:

    winget 安装 Ollama.Ollama

    在 Linux 上,Ollama 可以通过以下方式安装:

    “curl -fsSL https://ollama.com/install.sh | sh”

    安装后,请检查:

    ollama --version

    在 Windows 上,请记住从“开始”菜单启动 Ollama。一旦运行,本地 API 端点就可用。

    接下来,我们拉取本地模型。在这里,我们使用 Gemma 4 E4B 变体:

    ollama pull gemma4:e4b

    Gemma 4 有多种变体。 E4B 模型非常适合我们的目的,因为它在设计时考虑了边缘/本地代理工作流程。我的机器配备 NVIDIA RTX 2000 Ada 笔记本电脑 GPU,带有约 8 GB VRAM。如果您的机器受到更多限制,您可以尝试更轻的 E2B 变体:

    ollama pull gemma4:e2b
    pip install openai-agents

    2.1 模型