GPT-4O中的可避免和不可避免的随机性

探索GPT-4O中的随机性来源,从已知的可控且无法控制的是可控制的。邮政在GPT-4O中避免的随机性可避免的随机性,首先是迈向数据科学的。

来源:走向数据科学

当然,GPT-4O的输出中有随机性。毕竟,在选择每个令牌时,模型从概率分布中采样。但是我不明白的是,这些概率本身并不确定。即使有一致的提示,固定种子和温度设置为零,GPT-4O仍然会引入微妙而令人沮丧的随机性。

没有解决问题的问题,如果他们愿意的话,它甚至可能无法解决问题,这样我们就可以清楚地了解这篇文章的发展方向。在此过程中,我们将检查GPT-4O输出中的所有随机性来源,这将要求我们将采样过程分解为低水平。我们将指出这个问题(概率各不相同),并严格审查Openai关于确定论的官方指导。

可以

首先,让我们谈谈为什么确定论很重要。确定论意味着相同的输入总是产生相同的输出,例如数学函数。尽管LLM的创造力通常是可取的,但确定论仍具有至关重要的目的:研究人员需要它来进行可复制的实验,开发人员以验证报告的结果,并促使工程师审议其更改。没有它,您就会想知道不同的输出是您的调整还是随机数发生器的情绪波动。

翻转硬币

我们将在这里非常简单,并提示GPT-4O(API中的GPT-4O-2024-08-06)的最新版本:

GPT-4O-2024-08-06

翻转硬币。仅返回头或尾巴。

用llms翻转硬币本身就是一个引人入胜的话题(例如,参考文献中的2024年,参见van koevering&Kleinberg),但是在这里,我们将其用作一个简单的二进制问题,可以探索确定性或缺乏。

这是我们的第一次尝试。

运行代码给了我头。也许您会得到尾巴,或者如果您真的很幸运,那么有趣的事情要有趣得多。

尾巴 OpenAI_API_KEY 响应。选择[0] .message.content
HeadSheadSheadSheadSheadSheadSheadSheadSheadSheadSheadSheadsheadss
某物 t He