为什么我们没有看到任何主流游戏使用 LLM 驱动的 AI NPC?

因为这很难……我们在过去四年中一直致力于这项工作。制作一个简单的概念验证 (PoC) 很容易(我们已经见过很多),但要将其完善到生产级别,需要付出 1,000 倍的努力,因为会出现更深层次的复杂性:1) 成本:通过 API 使用 LLM 意味着有人必须为每个玩家每小时支付数千个代币。是的,你可以在玩家的 GPU 上运行较小的 LLM(例如 Mistral、Llama3 8b),但质量和功能可能不足以提供引人入胜的叙事和游戏玩法。2) 现在还为时过早:GPT-3.5 才 1.5 年,GPT-4 才 1 年。3) 当前的 LLM:它们可能无法在长时间的游戏会话中运行多智能体叙事。上下文大小不足以一致地保存场景历史。 LLM 只能完美地关注上下文中的某些指令,并且经常产生幻觉。4)多模式 LLM(带视觉):您可能需要这些来解锁空间推理并更好地适应游戏环境。对于 LLM 驱动的 NPC 来说,要从根本上改变游戏玩法 - 使它们变得不可或缺,就像止痛药而不是单纯的维生素一样 - 它们必须做的不仅仅是增强;它们必须是至关重要的,实现没有 LLM 驱动的 AI NPC 的游戏是无法实现的(如果没有 VR,Beat Saber 就不会是现在的样子)。NPC 需要彼此互动,并与环境互动。NPC 必须始终了解周围环境,避免与他们的过去或游戏机制不支持的行为相关的任何矛盾。NPC 的

来源:Marek Rosa - Goodai博客

因为这很难...

因为这很难...

我们在过去四年中致力于这项工作。

我们在过去四年中致力于这项工作。

制作一个简单的概念验证 (PoC) 很容易(我们已经见过很多),但将其完善到生产级别需要付出 1,000 倍的努力,其中会出现更深的复杂性:

制作一个简单的概念验证 (PoC) 很容易(我们已经见过很多),但将其完善到生产级别需要付出 1,000 倍的努力,其中会出现更深的复杂性:

1) 成本:通过 API 使用 LLM 意味着有人必须为每个玩家每小时支付数千个代币。是的,你可以在玩家的 GPU 上运行较小的 LLM(例如 Mistral、Llama3 8b),但其质量和功能可能不足以实现引人入胜的叙事和游戏玩法。

1) 成本: 通过 API 使用 LLM 意味着有人必须为每个玩家每小时支付数千个代币。 是的,你可以在玩家的 GPU 上运行较小的 LLM(例如 Mistral、Llama3 8b),但其质量和功能可能不足以实现引人入胜的叙事和游戏玩法。

2) 现在还为时过早:GPT-3.5 只有 1.5 年的历史,而 GPT-4 只有 1 年的历史。

2) 现在还为时过早: GPT-3.5 只有 1.5 年的历史,而 GPT-4 只有 1 年的历史。

3) 当前的 LLM:它们可能无法在长时间的游戏会话中运行多智能体叙述。上下文大小不足以持续保存场景历史。LLM 只能完美地关注上下文中的某些指令,并且经常产生幻觉。

3) 当前的 LLM: 它们可能无法在长时间的游戏会话中运行多智能体叙述。上下文大小不足以持续保存场景历史。LLM 只能完美地关注上下文中的某些指令,并且经常产生幻觉。

4) 多模态 LLM(带视觉):您可能需要这些来解锁空间推理并更好地扎根于游戏环境。

4) 多模态 LLM(带视觉): 您可能需要这些来解锁空间推理并更好地扎根于游戏环境。