AI 快讯 编译自 the_decoder #模型发布#开源#MiniMax

MiniMax M3 开源模型发布:百万 token 上下文窗口,挑战闭源模型性能

中国 AI 公司 MiniMax 发布 M3 开源模型,首次在开放权重模型中实现百万 token 上下文窗口、顶级编程能力和原生多模态。本文解读 M3 的技术亮点、对中文开发者的意义,以及与国产同类模型的对比。

编译发布 2026/06/01 原文发布 2026/06/01

一句话看懂

MiniMax 发布 M3 开源模型,拥有百万 token 上下文窗口、顶级编程能力和原生多模态,首次在开放权重领域挑战闭源模型。

详细发生了什么

中国 AI 公司 MiniMax 于 2026 年 6 月 1 日发布了其最新模型 M3。MiniMax 称 M3 是首个结合了顶级编程性能、百万 token 上下文窗口和原生多模态能力的开放权重模型。这意味着开发者可以下载模型权重,在本地或自有基础设施上部署,而不必依赖 API 调用。

M3 的上下文窗口达到 1,000,000 token,足以一次性处理整本长篇小说或大型代码库。在编程基准测试中,M3 的表现与 GPT-4o 和 Claude 3.5 Sonnet 等闭源模型相当,甚至在某些任务上超越。此外,M3 原生支持图像、音频等多模态输入,无需额外模块。

MiniMax 此前以视频生成模型(如 MiniMax Video)闻名,M3 的发布标志着其向通用大语言模型的战略扩展。模型权重将在 Hugging Face 等平台开放,但具体许可证细节尚未完全公布。

中文圈视角

对中文开发者来说,M3 的发布有几个直接利好。首先,百万 token 上下文窗口意味着可以一次性处理超长中文文档(如法律合同、学术论文),而无需分片或摘要,这在国产模型中尚属首次。其次,开放权重模式让国内企业可以在私有服务器上部署,避免数据出境风险,符合数据安全法规。

与国产同类模型对比:DeepSeek V2 和 Kimi 的上下文窗口分别为 128K 和 200K,远低于 M3 的 1M;智谱 GLM-4 虽支持多模态,但非开放权重。M3 在编程能力上对标 GPT-4o,对国内开发者社区是重要补充。不过,MiniMax 的生态和社区支持尚不及 DeepSeek 和智谱,实际使用中可能遇到工具链兼容性问题。

一个中文圈尚未广泛讨论的盲点:M3 的多模态能力是否支持中文 OCR 和文档理解?若支持,将极大提升国内办公自动化场景的效率。此外,MiniMax 的 API 定价策略尚未公布,若价格合理,可能吸引一批从 OpenAI 迁移的用户。

几条值得记住的细节

  • M3 是首个开放权重模型同时实现百万 token 上下文、顶级编程和多模态。
  • 上下文窗口为 1,000,000 token,可处理约 75 万汉字。
  • 编程性能在 HumanEval 等基准上与 GPT-4o 和 Claude 3.5 Sonnet 持平。
  • 模型权重将在 Hugging Face 开放,具体许可证待公布。
  • MiniMax 此前以视频生成模型闻名,M3 是其首个通用大语言模型。

一句话总结

M3 让中文开发者首次拥有百万 token 上下文的开放权重模型,在编程、长文档处理和多模态场景中提供了闭源模型的可行替代。