详细内容或原文请订阅后点击阅览
使用本地法学硕士发现高性能算法
我如何利用我的 MacBook 和本地法学硕士,利用开源模型探索高效代码生成的新领域。这篇文章《使用本地法学硕士发现高性能算法》首先出现在《走向数据科学》上。
来源:走向数据科学从小我就对绘画着迷。让我印象深刻的不仅是绘画行为本身,还有每幅画都可以不断改进的想法。我记得我的绘画风格达到了非常高的水平。然而,一旦我达到了完美的顶峰,我就会尝试看看如何进一步改进这幅画——唉,结果是灾难性的。
从那时起,我始终牢记同样的口头禅:“完善和迭代,你就会达到完美”。在大学里,我的方法是多次读书,扩展我的知识,寻找其他来源,寻找每个概念中隐藏的含义。今天,我将同样的理念应用于人工智能/机器学习和编码。
我们知道矩阵乘法(此处为简单起见,使用 matmul)是任何人工智能过程的核心部分。过去我开发了 LLM.rust,这是 Karpathy 的 LLM.c 的 Rust 镜像。 Rust 实现中最难的点是矩阵乘法。由于我们必须执行数千次迭代来微调基于 GPT 的模型,因此我们需要高效的 matmul 运算。为此,我不得不使用 BLAS 库,实施不安全的策略来克服限制和障碍。 Rust 中 unsafe 的使用违背了 Rust 的哲学,这就是为什么我一直在寻找更安全的方法来改进 matmul 。
因此,从 Sam Altman 的言论中汲取灵感 - “询问 GPT 如何创造价值” - 我决定要求当地的法学硕士生成、基准测试和迭代他们自己的算法,以创建更好的、原生的 Rust matmul 实现。
挑战有一些限制:
所有 cod 实现都可以在此 Github 存储库中找到。这是一个正在进行的实验,将进行许多更改/改进。
