MiniMax M3 开源模型发布：百万 token 上下文窗口，挑战闭源模型性能

一句话看懂

MiniMax 发布 M3 开源模型，拥有百万 token 上下文窗口、顶级编程能力和原生多模态，首次在开放权重领域挑战闭源模型。

详细发生了什么

中国 AI 公司 MiniMax 于 2026 年 6 月 1 日发布了其最新模型 M3。MiniMax 称 M3 是首个结合了顶级编程性能、百万 token 上下文窗口和原生多模态能力的开放权重模型。这意味着开发者可以下载模型权重，在本地或自有基础设施上部署，而不必依赖 API 调用。

M3 的上下文窗口达到 1,000,000 token，足以一次性处理整本长篇小说或大型代码库。在编程基准测试中，M3 的表现与 GPT-4o 和 Claude 3.5 Sonnet 等闭源模型相当，甚至在某些任务上超越。此外，M3 原生支持图像、音频等多模态输入，无需额外模块。

MiniMax 此前以视频生成模型（如 MiniMax Video）闻名，M3 的发布标志着其向通用大语言模型的战略扩展。模型权重将在 Hugging Face 等平台开放，但具体许可证细节尚未完全公布。

中文圈视角

对中文开发者来说，M3 的发布有几个直接利好。首先，百万 token 上下文窗口意味着可以一次性处理超长中文文档（如法律合同、学术论文），而无需分片或摘要，这在国产模型中尚属首次。其次，开放权重模式让国内企业可以在私有服务器上部署，避免数据出境风险，符合数据安全法规。

与国产同类模型对比：DeepSeek V2 和 Kimi 的上下文窗口分别为 128K 和 200K，远低于 M3 的 1M；智谱 GLM-4 虽支持多模态，但非开放权重。M3 在编程能力上对标 GPT-4o，对国内开发者社区是重要补充。不过，MiniMax 的生态和社区支持尚不及 DeepSeek 和智谱，实际使用中可能遇到工具链兼容性问题。

一个中文圈尚未广泛讨论的盲点：M3 的多模态能力是否支持中文 OCR 和文档理解？若支持，将极大提升国内办公自动化场景的效率。此外，MiniMax 的 API 定价策略尚未公布，若价格合理，可能吸引一批从 OpenAI 迁移的用户。

几条值得记住的细节

M3 是首个开放权重模型同时实现百万 token 上下文、顶级编程和多模态。
上下文窗口为 1,000,000 token，可处理约 75 万汉字。
编程性能在 HumanEval 等基准上与 GPT-4o 和 Claude 3.5 Sonnet 持平。
模型权重将在 Hugging Face 开放，具体许可证待公布。
MiniMax 此前以视频生成模型闻名，M3 是其首个通用大语言模型。

一句话总结

M3 让中文开发者首次拥有百万 token 上下文的开放权重模型，在编程、长文档处理和多模态场景中提供了闭源模型的可行替代。