LLM 0.32a2 发布：支持 OpenAI 推理模型 /v1/responses 端点，显示推理过程

一句话看懂

LLM 0.32a2 让 OpenAI 推理模型（如 GPT-5）改用 /v1/responses 端点，终端可彩色显示推理过程，并支持跨 tool call 推理。

详细发生了什么

Simon Willison 维护的命令行工具 LLM 发布了 0.32a2 版本（alpha）。本次更新最关键的变动是：大多数具备推理能力的 OpenAI 模型现在使用 /v1/responses 端点，而非传统的 /v1/chat/completions。这一改动主要针对 GPT-5 类模型，使得跨 tool call 的推理可以交错进行。

具体到用户体验：当你用 LLM 对 OpenAI 推理模型发起 prompt 时，终端会以不同颜色（区别于标准错误输出）显示总结后的推理 token。如果你不想看到这些推理过程，可以使用 -R 或 --hide-reasoning 标志将其隐藏。

此外，该版本还包含其他多项改进（详见 GitHub release），但推理端点切换是最值得关注的核心变化。

中文圈视角

对于中文开发者来说，LLM 是一个轻量级的命令行 AI 工具，支持多种模型后端（OpenAI、Anthropic、本地模型等）。本次更新直接受益的是使用 OpenAI 推理模型的用户——如果你在终端里用 LLM 调用 GPT-5 或 o1 系列，现在能直观看到模型“思考”的过程，这对调试 prompt 和理解模型行为非常有帮助。

国内用户需要注意：LLM 本身是开源工具，无需梯子即可安装，但调用 OpenAI 模型仍需科学上网或使用代理。如果你主要使用国产模型（如 DeepSeek、Kimi、智谱），LLM 也支持通过插件接入，但本次更新仅针对 OpenAI 的推理模型。

一个值得关注的盲点：目前国内大模型厂商（如 DeepSeek R1、Qwen 的推理版本）尚未公开提供类似 /v1/responses 的端点来暴露推理 token。这意味着在“可解释性”这个维度上，OpenAI 又领先了一步。对于需要审计模型推理过程的企业用户（如金融、医疗），这一功能可能成为选型时的加分项。

几条值得记住的细节

核心变更：推理模型从 /v1/chat/completions 切换到 /v1/responses 端点。
推理 token 会以不同颜色显示在 stderr 中，默认开启。
使用 -R 或 --hide-reasoning 可隐藏推理过程。
该功能主要针对 GPT-5 类模型，支持跨 tool call 推理。
LLM 0.32a2 为 alpha 版本，可能包含不稳定因素。

一句话总结

如果你用 LLM 调用 OpenAI 推理模型，升级后就能在终端看到模型思考过程，调试更直观。