LLM 0.32a2 发布:支持 OpenAI 推理模型 /v1/responses 端点,显示推理过程
LLM 命令行工具 0.32a2 版本上线,核心更新是 GPT-5 等推理模型改用 /v1/responses 端点,支持跨 tool call 推理,并可在终端彩色显示推理 token。了解新功能及对中文开发者的实用价值。
一句话看懂
LLM 0.32a2 让 OpenAI 推理模型(如 GPT-5)改用 /v1/responses 端点,终端可彩色显示推理过程,并支持跨 tool call 推理。
详细发生了什么
Simon Willison 维护的命令行工具 LLM 发布了 0.32a2 版本(alpha)。本次更新最关键的变动是:大多数具备推理能力的 OpenAI 模型现在使用 /v1/responses 端点,而非传统的 /v1/chat/completions。这一改动主要针对 GPT-5 类模型,使得跨 tool call 的推理可以交错进行。
具体到用户体验:当你用 LLM 对 OpenAI 推理模型发起 prompt 时,终端会以不同颜色(区别于标准错误输出)显示总结后的推理 token。如果你不想看到这些推理过程,可以使用 -R 或 --hide-reasoning 标志将其隐藏。
此外,该版本还包含其他多项改进(详见 GitHub release),但推理端点切换是最值得关注的核心变化。
中文圈视角
对于中文开发者来说,LLM 是一个轻量级的命令行 AI 工具,支持多种模型后端(OpenAI、Anthropic、本地模型等)。本次更新直接受益的是使用 OpenAI 推理模型的用户——如果你在终端里用 LLM 调用 GPT-5 或 o1 系列,现在能直观看到模型“思考”的过程,这对调试 prompt 和理解模型行为非常有帮助。
国内用户需要注意:LLM 本身是开源工具,无需梯子即可安装,但调用 OpenAI 模型仍需科学上网或使用代理。如果你主要使用国产模型(如 DeepSeek、Kimi、智谱),LLM 也支持通过插件接入,但本次更新仅针对 OpenAI 的推理模型。
一个值得关注的盲点:目前国内大模型厂商(如 DeepSeek R1、Qwen 的推理版本)尚未公开提供类似 /v1/responses 的端点来暴露推理 token。这意味着在“可解释性”这个维度上,OpenAI 又领先了一步。对于需要审计模型推理过程的企业用户(如金融、医疗),这一功能可能成为选型时的加分项。
几条值得记住的细节
- 核心变更:推理模型从
/v1/chat/completions切换到/v1/responses端点。 - 推理 token 会以不同颜色显示在 stderr 中,默认开启。
- 使用
-R或--hide-reasoning可隐藏推理过程。 - 该功能主要针对 GPT-5 类模型,支持跨 tool call 推理。
- LLM 0.32a2 为 alpha 版本,可能包含不稳定因素。
一句话总结
如果你用 LLM 调用 OpenAI 推理模型,升级后就能在终端看到模型思考过程,调试更直观。