llm-gemini 0.31 发布：Gemini 3.1 Flash-Lite 模型正式可用，不再预览

一句话看懂

llm-gemini 0.31 发布，Gemini 3.1 Flash-Lite 模型正式可用，不再需要预览标签。

llm-gemini 0.31 是一个小版本更新，核心变化只有一条：gemini-3.1-flash-lite 模型从预览状态转为正式发布（GA）。这意味着开发者可以放心在生产环境中使用该模型，而无需担心预览模型的稳定性或服务中断风险。

该模型最早于 2026 年 3 月以预览形式推出，定位是 Gemini 系列中最轻量、最便宜的选项，适合对延迟和成本敏感的场景。据作者推测，正式版模型与预览版相比没有功能变化，只是去掉了“预览”标签。

llm-gemini 是 Simon Willison 开发的命令行工具 LLM 的插件，用于在终端中调用 Google Gemini 系列模型。本次更新通过 pip 即可升级：pip install -U llm-gemini。

对于中文开发者，这个更新意味着多了一个低成本、低门槛的 AI 模型选项。Gemini 3.1 Flash-Lite 的定价远低于 Gemini Pro 系列，适合中文文本分类、简单问答、内容摘要等轻量任务。但需要注意：

网络访问：调用 Google Gemini API 需要稳定的海外网络环境，国内用户可能需要代理或使用中转服务。
国产平替：如果无法访问 Google API，可以考虑国内类似产品：百度文心一言的 ERNIE Lite、阿里通义千问的 Qwen-Lite 等，同样主打低成本。
命令行工具：LLM 本身是一个 Python 工具，中文用户如果熟悉 CLI 环境，可以快速集成到工作流中，但相比国内流行的 API 调用方式（如直接 HTTP 请求），LLM 的生态更偏向英文用户。
模型能力：Flash-Lite 适合简单任务，复杂推理或中文长文本生成可能不如 Gemini Pro 或国产大模型，建议按需选择。

如果你用 LLM 工具且需要低成本模型，升级后即可稳定使用 Gemini 3.1 Flash-Lite。