Kimi Code 上下文管理:长会话不丢思路的 3 招
Kimi Code 上下文怎么管?讲透 /clear、/compact、AGENTS.md 三招用法,配合长上下文模型让你跨会话也能续上昨天的思路,不丢任务进度
30 秒了解:Kimi Code 上下文是什么、为什么要管
Kimi Code 上下文 = 当前会话里 AI「记得」的所有内容,包括你说过的话、它读过的文件、跑过的命令输出、看过的报错。 一旦上下文塞满(默认接近 128K-256K token 区间),Kimi Code 会自动截断旧内容,思路就会断片:你昨天讨论好的方案、它读过的核心文件结构、约定的命名规范,全部「失忆」。
这件事在长任务里特别明显。你跟 Kimi Code 一起重构一个模块,干到第 40 分钟它突然问你「这个项目用什么测试框架?」——之前明明告诉过它三次,但旧消息已经被挤出窗口。
这篇按官方 sessions 文档 + 实战经验,给你 3 招把长会话「续」起来:分会话、压缩历史、外挂记忆。如果你还没装 Kimi Code,先看 Kimi Code CLI 怎么用。
准备工作:先搞清楚 3 个核心概念
1. 什么是「上下文窗口」
每个大模型有一个固定的「能一次记住多少 token」的容量,叫上下文窗口。Kimi K2 系列在 AI 编程 CLI 里属于长上下文阵营,单次会话能塞下相当多的代码和对话。但长不等于无限——窗口塞满后旧内容必然被丢弃。
2. 什么会「吃」上下文
按吃 token 的速度从快到慢:
| 内容 | token 占用 |
|---|---|
| 完整读一个大文件(几千行) | 极高 |
跑 ls -R 或长 grep 输出 | 高 |
| 多轮工具调用累计(每次 tool call 的输入输出都进上下文) | 高 |
| 你和 AI 的自然语言对话 | 中 |
| AGENTS.md / CLAUDE.md 这种小型项目说明 | 低 |
知道这个就明白:别让 AI 没事乱翻文件——读没必要的内容会快速消耗上下文。
3. 什么是「会话」(session)
一次启动 kimi 到你退出 CLI 之间,就是一个 session。所有上下文都在这个 session 里。退出之后默认不会持久化——下次进来就是空的。
想跨会话续上,必须用下面 3 招其中一个或组合用。
招式 1:用 /clear 主动开新会话,不要硬撑
很多人长会话不顺手,第一反应是「再多问几句它就懂了」。错。塞了一堆错误尝试的上下文,AI 越往后越乱。
什么时候用 /clear
- 任务已经做完了,要开始一个新的不相关任务
- 你和 AI 在某个方向上「鬼打墙」,对话越长越乱
- AI 已经基于错误前提走出去几轮,回不来了
- 上下文用量达到 70-80%,但当前任务可以告一段落
怎么用
在 CLI 里直接输入:
/clear
它会清空当前会话的对话历史,但保留:
- 你的登录状态(不用重新
/login) - AGENTS.md(重新启动会重新读)
- 当前工作目录
相当于「关掉再打开一个干净的 Kimi Code」,但更快。
配合一个「交接 prompt」
/clear 之前最好让 Kimi Code 自己总结一份「下一会话用的简报」:
我准备 /clear 重启会话。在清空之前,请帮我写一段「交接简报」给下一会话的 Kimi Code,包括:
- 我们刚才做了什么任务,做到哪一步
- 关键的决策和原因(比如「选了 zod 不选 yup,因为…」)
- 下一步应该做什么
- 有哪些坑或约定后来者要注意
格式:纯文本、3-6 段,让下一个会话的 AI 5 分钟内能续上。
复制它输出的简报,/clear,重启会话,第一条消息把简报粘进去——AI 立刻进入状态,跟没断过一样。
招式 2:用 /compact 压缩历史,保留思路丢冗余
/clear 是「全清空」,太极端。日常更常用的是 /compact——AI 自己把历史对话压缩成摘要,保留关键决策,扔掉冗余的工具输出。
什么时候用
- 上下文用了一半,但当前任务还没做完,不想清空
- 已经读了一堆文件、跑了一堆命令,原始输出占用太多
- 想继续讨论但希望节省 token 提速
怎么用
/compact
Kimi Code 会扫描整个对话历史,生成一份摘要替换掉冗长的中间步骤。压缩前可能是:
用户:读一下 src/api/auth.ts
助手:[完整文件内容 800 行]
用户:再读 src/api/user.ts
助手:[完整文件内容 600 行]
用户:现在告诉我 auth 的逻辑
助手:[详细分析]
压缩后大致是:
[摘要:已读 auth.ts 和 user.ts,发现 auth 用 JWT,过期 7 天,refresh token 存 Redis]
用户:现在告诉我 auth 的逻辑
助手:[详细分析]
token 用量直接砍到 1/3 到 1/10。
/compact 的限制
- AI 摘要可能丢细节——重要的字段名、文件路径建议人工再提一次
- 大块完整代码不会保留——下一步要改代码先重新读
- 不适合「需要回放完整推理路径」的场景(比如调试一个微妙 bug)
招式 3:用 AGENTS.md 把「该记的」搬到外挂记忆
上面两招是「会话内」的优化。但项目层面的事——「这个项目用 pnpm」「commit 走 Conventional Commits」「src/legacy/ 不要碰」——每个会话都靠对话告诉 AI 太浪费。搬到 AGENTS.md 里,每次启动自动读。
Kimi Code 的 AGENTS.md 跟 CLAUDE.md 怎么写 思路完全一致:
AGENTS.md 该放什么
# 项目说明
Next.js 14 + tRPC 的后台管理系统,团队 5 人
# 关键命令
- 开发:pnpm dev
- 测试:pnpm test
- 构建:pnpm build
- 部署:pnpm deploy:prod
# 约定
- commit 用 Conventional Commits(feat: / fix: / docs:)
- 新 API 放 src/server/api/routers/
- 不要修改 src/legacy/ 目录(在迁移中)
- 测试覆盖率不低于 70%
# 常见坑
- 改 prisma schema 后必须跑 pnpm prisma migrate
- 改环境变量后必须重启 dev server
AGENTS.md 不该放什么
- 完整 API 文档(太长,让 AI 需要时自己读 src)
- 详细业务逻辑(让 AI 看代码)
- 每个文件干啥(保持 200 行以内)
控制在 200 行以内是经验值——超过 AI 会读不完整或不重视。
/init 自动生成
/init
第一次进项目跑这条,Kimi Code 会扫描整个项目,自动生成一份 AGENTS.md 草稿。你通读一遍、删错的加缺的,commit 进 git 就行。
长任务的标准节奏:3 招组合用
放在一起,一个完整的「干 3 小时连续重构」节奏:
| 时间点 | 动作 |
|---|---|
| T+0 | kimi 启动,自动读 AGENTS.md |
| T+0 | 第一条 prompt 描述任务全貌(写得详细些) |
| T+30 分钟 | 检查上下文用量(看 CLI 提示),约 30% |
| T+60 分钟 | 用量 50% → 跑 /compact 压一次 |
| T+90 分钟 | 完成一个子任务里程碑,让 AI 输出「阶段总结」 |
| T+120 分钟 | 用量 70% → 让 AI 写「交接简报」→ /clear → 粘简报继续 |
| T+180 分钟 | 任务完成 → /quit 退出 |
按这个节奏走,3 小时不会断片。
实战:长重构任务的开场 prompt
直接复制下面这段当开场白,能让 Kimi Code 一开始就进入「长任务」模式:
你好。今天要做一个 2-3 小时的重构任务,我希望我们按节奏走。
任务全貌:把 src/api/legacy/ 下所有用 callback 的接口改成 async/await。涉及约 25 个文件。
请先按下面 4 步走,做完停:
- 读 AGENTS.md,用一句话总结你接收到的约定
- 跑 grep -r “function.*callback” src/api/legacy/ 列出所有要改的文件
- 把 25 个文件分成 5 批,每批 5 个,用列表给我
- 估算每批要多久
每完成一批做这 3 件事:
- 跑 pnpm test 确认绿
- git commit 一个里程碑 commit
- 告诉我「已完成第 N 批,剩余 X 批」
如果上下文用量超过 60%,主动提议 /compact。如果超过 80%,主动写交接简报准备 /clear。
不要一次性改完全部 25 个,按批走。
这种「自带节奏控制」的 prompt 在 Kimi Code 和 Claude Code 上都通用,是长任务的标配。
常见坑 + 解决办法
| 现象 | 原因 | 解决 |
|---|---|---|
| AI 突然「忘了」之前说的事 | 上下文被截断 | 提前 /compact,或写交接简报 /clear |
/compact 后 AI 改错文件路径 | 摘要丢了文件位置细节 | 重要路径在 prompt 里再说一次 |
| 长会话越来越慢 | 上下文太大,每轮都要重处理 | 定期 /compact,或直接 /clear 续 |
| 退出后回来全没了 | session 不持久化 | 用 AGENTS.md + 交接简报 |
| AI 重复读同一个文件 | 没记住已读过 | 在 prompt 里说「你已经读过 X,不用重读」 |
Kimi Code 上下文 vs Claude Code 上下文
两个工具的思路很像,但有些差异:
| 维度 | Kimi Code | Claude Code |
|---|---|---|
| 上下文窗口 | 长上下文是 Kimi 强项 | 200K(部分 1M) |
| 压缩命令 | /compact | /compact(同名) |
| 清空命令 | /clear | /clear(同名) |
| 持久记忆文件 | AGENTS.md | CLAUDE.md |
| 跨会话恢复 | 靠交接 prompt | 靠交接 prompt + Projects |
| 自动汇报用量 | 接近上限会提示 | 接近上限会提示 |
详细横评看 AI 写代码完全指南。
下一步
- Kimi Code 入门 → Kimi Code CLI 怎么用
- Kimi Code 是什么 → Kimi Code 是什么
- Kimi Code 接入 VS Code → Kimi Code VS Code 指南
- AGENTS.md 的写法(思路通 CLAUDE.md)→ CLAUDE.md 怎么写
- Kimi 全功能 → Kimi 全功能教程
- 国产 AI 全景 → 国产 AI 大全
常见问题
Q:Kimi Code 的上下文窗口具体多大? A:基于 Kimi K2 系列模型,单次会话能塞下相当大的代码量和对话——属于国产 AI 编程 CLI 里的长上下文阵营。具体数字以官方为准,但实战中你会发现「比 GPT-4 时代宽松不少」。
Q:/compact 会不会把重要的代码丢掉?
A:会丢一部分。AI 倾向保留「决策和结论」,丢掉「中间过程」。重要代码、关键路径、约定细节建议在 prompt 里再提一次。
Q:可以禁用自动压缩吗?
A:Kimi Code 默认到上限才自动截断,你可以主动控制——用 /compact 主动压、用 /clear 主动清。完全禁用没必要——窗口塞满 AI 表现一定下降。
Q:会话历史能导出吗?
A:Kimi Code 的对话默认在本地有日志,具体路径看 /help 或文档。但「能导出」不等于「能续」——回放历史不会自动加进新会话上下文,你得手动整理成交接简报。
Q:和 Claude Code 上下文管理思路有差异吗?
A:90% 一致——同样的 /compact、/clear、外挂记忆文件三件套。差异主要是模型本身:Kimi 长上下文是优势,但每次工具调用的 token 计费不同,长会话成本结构略有差异。