告别Ai2:Open Language Model(Olmo)团队核心成员离职,反思开放研究路径
Nathan Lambert宣布离开艾伦人工智能研究所(Ai2),回顾参与Olmo模型、Tülu 3等项目的经历,分享开放研究对AI安全与扩散的价值,并探讨学术与工业之间的独特定位。
一句话看懂
Nathan Lambert离开艾伦人工智能研究所(Ai2),他曾主导Olmo系列模型和Tülu 3项目,强调开放研究对AI安全与普及的重要性。
详细发生了什么
Nathan Lambert,Ai2的Olmo模型团队核心成员,于近日正式离职。他在告别信中回顾了自己从UC Berkeley博士到HuggingFace,再到Ai2的职业轨迹。Lambert在Ai2期间主导了Olmo系列开源语言模型的开发,特别是Tülu 3项目,该项目首次在70B规模上成功应用DPO(直接偏好优化),并提出了可验证奖励强化学习(RLVR)概念。他还创建了RewardBench评估基准。Lambert强调,Ai2在学术与工业之间的独特定位使其能够以开放方式影响AI技术,确保技术安全地惠及更多人。他未来将继续致力于开放生态系统的协调与实用化。
中文圈视角
对中文AI社区而言,Lambert的离职传递了几个关键信号。首先,Olmo系列作为完全开源的大模型,其技术路线(如RLVR)对国内厂商(如DeepSeek、智谱)有直接参考价值——开源模型在特定场景下可以接近甚至超越闭源模型。其次,Ai2的“开放研究”模式与国内ModelScope等平台理念相似,但执行深度不同:Ai2不仅开放模型权重,还开放训练细节和评估方法。国内用户若想复现类似工作,可直接使用Olmo的代码和数据集,无需依赖闭源API。最后,Lambert提到的“独立声音”在AI地缘政治背景下尤为重要,中文社区需要更多类似Ai2的独立研究机构,避免过度依赖海外闭源模型。
几条值得记住的细节
- Lambert在Ai2期间主导了Tülu 3项目,首次在70B规模上成功应用DPO,并提出了RLVR概念。
- 他创建的RewardBench成为奖励模型评估的基准之一。
- Olmo 3原计划2025年6-7月发布,但因推理模型浪潮延迟,最终成功训练了更大规模的模型。
- Lambert在Ai2期间发送的Slack消息量比公司任何其他成员多40%,被授予“The Cat Herder”称号。
- 他未来仍将留在西雅图,继续从事开放生态系统的协调工作。
一句话总结
Lambert的离职提醒我们:开放研究需要持续投入,而中文社区应抓住机会,借鉴Olmo等项目的经验,构建自主可控的开源生态。