AI 快讯 编译自 interconnects #行业分析#开源模型#模型对比

2026年AI趋势:开源模型落后闭源、Gemini未追上Claude Code、美国开源崛起

Nathan Lambert分析2026年AI格局:开源模型在智能体能力上仍落后闭源,Gemini未追上Claude Code,美国开源模型借Gemma 4等崛起,中国实验室资源受限。对中文用户意味着国产模型需在特定场景差异化竞争。

编译发布 2026/05/26 原文发布 2026/05/26

一句话看懂

2026年AI竞争加剧:开源模型在真实智能体场景落后闭源12个月以上,美国开源借Gemma 4崛起,中国实验室受资源限制难追前沿。

详细发生了什么

AI研究员Nathan Lambert在5月26日的文章中,对2026年AI趋势做出六点预测。核心观点是:开源模型与闭源模型的差距在真实使用中比基准测试显示的更大。Opus 4.5在Claude Code中的智能体表现(2025年12月)至今没有开源模型能匹敌,预计差距可能持续12个月以上。Google的Gemini 3.5 Flash也未能在编程智能体领域挑战Claude Code和Codex。

美国开源模型正在崛起:Nvidia的Nemotron、Google的Gemma 4(采用Apache 2.0许可)在同等规模下超越或持平长期主导的Qwen 3.5/3.6。中国实验室(如Kimi、DeepSeek、Qwen)受资源限制,短期内无法像美国大厂那样大规模扩展训练。Mythos模型在软件工程和网络安全领域是里程碑,但作者不认为今年会有开源版本。

Anthropic和OpenAI的竞争将白热化:GPT 5.5更智能,Codex App体验出色;Claude在写作任务上仍占优。AI正在推动公司走向两极:大公司凭借资源持续突破前沿,小公司(如Interconnects)利用智能体放大专业能力。

中文圈视角

这篇文章对中文AI圈有几点重要启示:

  1. 国产模型在智能体场景的差距被量化:作者指出开源模型在真实agent任务上落后闭源12个月以上,而国内主流开源模型(Qwen、DeepSeek等)正是这一阵营的主力。这意味着在编程助手、自动化办公等高频场景,国产模型短期内难以匹敌Claude Code或Codex。用户需要调整预期:国产模型更适合低成本、自动化的企业级任务,而非驱动知识工作者的核心工具。

  2. 美国开源崛起对国产模型的挑战:Gemma 4采用Apache 2.0许可,性能超越Qwen 3.5/3.6,正在侵蚀国产模型在开源社区的主导地位。国内开发者过去习惯使用Qwen系列,但若Gemma生态持续完善(工具链、社区支持),可能分流用户。国产模型需在中文优化、特定行业(如政务、教育)建立壁垒,而非单纯拼基准。

  3. 资源限制是国产模型的硬伤:作者明确说中国实验室资源远不及美国大厂(Google约25%算力、Meta 11%等),且Mythos级别的模型短期内不会开源。这意味着国内用户依赖的“免费强大开源模型”可能面临天花板。对中文用户而言,更现实的选择是关注国产闭源模型(如通义千问、豆包)在垂直场景的优化,而非期待开源模型全面追赶。

  4. 监管与人才流动的影响:文章提到中国扩大了对顶尖AI研究人员的出境限制,这可能会进一步减缓国内创新速度。同时,美国将Anthropic列为供应链风险,显示AI技术正被大国博弈裹挟。中文用户需关注数据合规和模型可用性变化。

几条值得记住的细节

  • 开源模型在智能体场景落后闭源约5-6个月,预计差距扩大到12个月以上。
  • Google的Gemini 3.5 Flash未能成为Claude Code或Codex的竞争对手。
  • Gemma 4采用Apache 2.0许可,在同等规模下超越Qwen 3.5/3.6。
  • 中国实验室(Kimi、DeepSeek等)资源严重受限,无法快速扩大训练规模。
  • Mythos模型在软件工程和网络安全领域是里程碑,但今年不会开源。

一句话总结

开源模型在真实智能体能力上落后闭源一年以上,国产模型需在垂直场景寻找差异化,而非盲目追赶通用基准。