minimax M1:具有一半计算功率的DeepSeek-R1的新挑战者

上海的AI初创企业Minimax通过推出Minimax-M1进入了推理模型的市场,据称它比竞争对手DeepSeek-R1更有效。这不仅仅是另一个AI模型,它是试图证明您可以通过更少的资源来完成更多的工作。 Minimax是由技术巨头Tencent和[…] Minimax M1的支持的Minimax:DeepSeek-R1的新挑战者,其中一半的计算能力首先出现在AI新闻中。

来源:AI新闻
minimax M1是世界上第一个带有混合性 - 卡氏架构和4560亿参数的开放推理模型。该模型可以处理100万个令牌的上下文长度,其比DeepSeek R1大八倍。源代码通过github和拥抱面。 这不仅仅是另一个AI模型,它是试图证明您可以通过更少的资源来完成更多的工作。 Minimax得到了技术巨头Tencent和Alibaba的支持,他将自己定位为强大的竞争对手,可以在中国人工智能市场上进行DeepSeek。 该公司声称,M1在几个基准中都超过了所有封闭的中国竞争对手。但是也有限制。在测试事实知识的SimpleQA基准测试中,M1的性能明显比DeepSeek-R1仅为18.5%,而30.1%。 它表明,在所有领域中,没有任何模型都是完美的。具有4560亿参数的最小值 - text-01上的技术架构和效率构建使用混合混合物(MOE)体系结构实施了“闪电注意”机制,以使更快的计算ACT仅459亿。 DeepSeek-R1100%的25%上下文长度为100万Tokens125,000 Tokensutdattakapacity80 0​​00 Tokens 64,000 Tokens 64,000 Token培训成本和效率仅51夜,仅51 night of Deeps Seek-Ress比较$ 51,$ 534,700代表$ 51 nightible,与534,700的成本相比,相比,$ 51 minimax通过github使M1作为开源代码可用,并用两个版本为40k,另一个具有80