🤖 AI 跟我学 新手入门
AI 快讯 编译自 simon_willison #模型发布#功能更新#工具评测

llm-gemini 0.31 发布:Gemini 3.1 Flash-Lite 模型正式可用,不再预览

llm-gemini 0.31 版本更新,将 Gemini 3.1 Flash-Lite 模型从预览状态转为正式发布。该模型主打低成本、低延迟,适合轻量级任务。本文解读更新内容,并分析对中文开发者的实用价值与替代方案。

编译发布 2026/05/21 原文发布 2026/05/07

一句话看懂

llm-gemini 0.31 发布,Gemini 3.1 Flash-Lite 模型正式可用,不再需要预览标签。

详细发生了什么

llm-gemini 0.31 是一个小版本更新,核心变化只有一条:gemini-3.1-flash-lite 模型从预览状态转为正式发布(GA)。这意味着开发者可以放心在生产环境中使用该模型,而无需担心预览模型的稳定性或服务中断风险。

该模型最早于 2026 年 3 月以预览形式推出,定位是 Gemini 系列中最轻量、最便宜的选项,适合对延迟和成本敏感的场景。据作者推测,正式版模型与预览版相比没有功能变化,只是去掉了“预览”标签。

llm-gemini 是 Simon Willison 开发的命令行工具 LLM 的插件,用于在终端中调用 Google Gemini 系列模型。本次更新通过 pip 即可升级:pip install -U llm-gemini

中文圈视角

对于中文开发者,这个更新意味着多了一个低成本、低门槛的 AI 模型选项。Gemini 3.1 Flash-Lite 的定价远低于 Gemini Pro 系列,适合中文文本分类、简单问答、内容摘要等轻量任务。但需要注意:

  1. 网络访问:调用 Google Gemini API 需要稳定的海外网络环境,国内用户可能需要代理或使用中转服务。
  2. 国产平替:如果无法访问 Google API,可以考虑国内类似产品:百度文心一言的 ERNIE Lite、阿里通义千问的 Qwen-Lite 等,同样主打低成本。
  3. 命令行工具:LLM 本身是一个 Python 工具,中文用户如果熟悉 CLI 环境,可以快速集成到工作流中,但相比国内流行的 API 调用方式(如直接 HTTP 请求),LLM 的生态更偏向英文用户。
  4. 模型能力:Flash-Lite 适合简单任务,复杂推理或中文长文本生成可能不如 Gemini Pro 或国产大模型,建议按需选择。

几条值得记住的细节

  • 模型名:gemini-3.1-flash-lite,正式版与预览版功能一致。
  • 升级方式:pip install -U llm-gemini
  • 定位:Gemini 系列中最轻量、最便宜的模型,适合低成本场景。
  • 发布时间:2026 年 5 月 7 日。
  • 作者:Simon Willison,LLM 工具的作者。

一句话总结

如果你用 LLM 工具且需要低成本模型,升级后即可稳定使用 Gemini 3.1 Flash-Lite。