Kimi Code 上下文管理：长会话不丢思路的 3 招

30 秒了解：Kimi Code 上下文是什么、为什么要管

Kimi Code 上下文 = 当前会话里 AI「记得」的所有内容，包括你说过的话、它读过的文件、跑过的命令输出、看过的报错。 一旦上下文塞满（默认接近 128K-256K token 区间），Kimi Code 会自动截断旧内容，思路就会断片：你昨天讨论好的方案、它读过的核心文件结构、约定的命名规范，全部「失忆」。

这件事在长任务里特别明显。你跟 Kimi Code 一起重构一个模块，干到第 40 分钟它突然问你「这个项目用什么测试框架？」——之前明明告诉过它三次，但旧消息已经被挤出窗口。

这篇按官方 sessions 文档 + 实战经验，给你 3 招把长会话「续」起来：分会话、压缩历史、外挂记忆。如果你还没装 Kimi Code，先看 Kimi Code CLI 怎么用。

准备工作：先搞清楚 3 个核心概念

1. 什么是「上下文窗口」

每个大模型有一个固定的「能一次记住多少 token」的容量，叫上下文窗口。Kimi K2 系列在 AI 编程 CLI 里属于长上下文阵营，单次会话能塞下相当多的代码和对话。但长不等于无限——窗口塞满后旧内容必然被丢弃。

2. 什么会「吃」上下文

按吃 token 的速度从快到慢：

内容	token 占用
完整读一个大文件（几千行）	极高
跑 `ls -R` 或长 grep 输出	高
多轮工具调用累计（每次 tool call 的输入输出都进上下文）	高
你和 AI 的自然语言对话	中
AGENTS.md / CLAUDE.md 这种小型项目说明	低

知道这个就明白：别让 AI 没事乱翻文件——读没必要的内容会快速消耗上下文。

3. 什么是「会话」（session）

一次启动 kimi 到你退出 CLI 之间，就是一个 session。所有上下文都在这个 session 里。退出之后默认不会持久化——下次进来就是空的。

想跨会话续上，必须用下面 3 招其中一个或组合用。

招式 1：用 `/clear` 主动开新会话，不要硬撑

很多人长会话不顺手，第一反应是「再多问几句它就懂了」。错。塞了一堆错误尝试的上下文，AI 越往后越乱。

什么时候用 `/clear`

任务已经做完了，要开始一个新的不相关任务
你和 AI 在某个方向上「鬼打墙」，对话越长越乱
AI 已经基于错误前提走出去几轮，回不来了
上下文用量达到 70-80%，但当前任务可以告一段落

怎么用

在 CLI 里直接输入：

/clear

它会清空当前会话的对话历史，但保留：

你的登录状态（不用重新 /login）
AGENTS.md（重新启动会重新读）
当前工作目录

相当于「关掉再打开一个干净的 Kimi Code」，但更快。

配合一个「交接 prompt」

/clear 之前最好让 Kimi Code 自己总结一份「下一会话用的简报」：

📋 Prompt 模板

我准备 /clear 重启会话。在清空之前，请帮我写一段「交接简报」给下一会话的 Kimi Code，包括：

我们刚才做了什么任务，做到哪一步
关键的决策和原因（比如「选了 zod 不选 yup，因为…」）
下一步应该做什么
有哪些坑或约定后来者要注意

格式：纯文本、3-6 段，让下一个会话的 AI 5 分钟内能续上。

复制它输出的简报，/clear，重启会话，第一条消息把简报粘进去——AI 立刻进入状态，跟没断过一样。

招式 2：用 `/compact` 压缩历史，保留思路丢冗余

/clear 是「全清空」，太极端。日常更常用的是 /compact——AI 自己把历史对话压缩成摘要，保留关键决策，扔掉冗余的工具输出。

什么时候用

上下文用了一半，但当前任务还没做完，不想清空
已经读了一堆文件、跑了一堆命令，原始输出占用太多
想继续讨论但希望节省 token 提速

怎么用

/compact

Kimi Code 会扫描整个对话历史，生成一份摘要替换掉冗长的中间步骤。压缩前可能是：

用户：读一下 src/api/auth.ts
助手：[完整文件内容 800 行]
用户：再读 src/api/user.ts  
助手：[完整文件内容 600 行]
用户：现在告诉我 auth 的逻辑
助手：[详细分析]

压缩后大致是：

[摘要：已读 auth.ts 和 user.ts，发现 auth 用 JWT，过期 7 天，refresh token 存 Redis]
用户：现在告诉我 auth 的逻辑
助手：[详细分析]

token 用量直接砍到 1/3 到 1/10。

`/compact` 的限制

AI 摘要可能丢细节——重要的字段名、文件路径建议人工再提一次
大块完整代码不会保留——下一步要改代码先重新读
不适合「需要回放完整推理路径」的场景（比如调试一个微妙 bug）

招式 3：用 AGENTS.md 把「该记的」搬到外挂记忆

上面两招是「会话内」的优化。但项目层面的事——「这个项目用 pnpm」「commit 走 Conventional Commits」「src/legacy/ 不要碰」——每个会话都靠对话告诉 AI 太浪费。搬到 AGENTS.md 里，每次启动自动读。

Kimi Code 的 AGENTS.md 跟 CLAUDE.md 怎么写思路完全一致：

AGENTS.md 该放什么

# 项目说明

Next.js 14 + tRPC 的后台管理系统，团队 5 人

# 关键命令

- 开发：pnpm dev
- 测试：pnpm test  
- 构建：pnpm build
- 部署：pnpm deploy:prod

# 约定

- commit 用 Conventional Commits（feat: / fix: / docs:）
- 新 API 放 src/server/api/routers/
- 不要修改 src/legacy/ 目录（在迁移中）
- 测试覆盖率不低于 70%

# 常见坑

- 改 prisma schema 后必须跑 pnpm prisma migrate
- 改环境变量后必须重启 dev server

AGENTS.md 不该放什么

完整 API 文档（太长，让 AI 需要时自己读 src）
详细业务逻辑（让 AI 看代码）
每个文件干啥（保持 200 行以内）

控制在 200 行以内是经验值——超过 AI 会读不完整或不重视。

`/init` 自动生成

/init

第一次进项目跑这条，Kimi Code 会扫描整个项目，自动生成一份 AGENTS.md 草稿。你通读一遍、删错的加缺的，commit 进 git 就行。

长任务的标准节奏：3 招组合用

放在一起，一个完整的「干 3 小时连续重构」节奏：

时间点	动作
T+0	`kimi` 启动，自动读 AGENTS.md
T+0	第一条 prompt 描述任务全貌（写得详细些）
T+30 分钟	检查上下文用量（看 CLI 提示），约 30%
T+60 分钟	用量 50% → 跑 `/compact` 压一次
T+90 分钟	完成一个子任务里程碑，让 AI 输出「阶段总结」
T+120 分钟	用量 70% → 让 AI 写「交接简报」→ `/clear` → 粘简报继续
T+180 分钟	任务完成 → `/quit` 退出

按这个节奏走，3 小时不会断片。

实战：长重构任务的开场 prompt

直接复制下面这段当开场白，能让 Kimi Code 一开始就进入「长任务」模式：

📋 Prompt 模板

你好。今天要做一个 2-3 小时的重构任务，我希望我们按节奏走。

任务全貌：把 src/api/legacy/ 下所有用 callback 的接口改成 async/await。涉及约 25 个文件。

请先按下面 4 步走，做完停：

读 AGENTS.md，用一句话总结你接收到的约定
跑 grep -r “function.*callback” src/api/legacy/ 列出所有要改的文件
把 25 个文件分成 5 批，每批 5 个，用列表给我
估算每批要多久

每完成一批做这 3 件事：

跑 pnpm test 确认绿
git commit 一个里程碑 commit
告诉我「已完成第 N 批，剩余 X 批」

如果上下文用量超过 60%，主动提议 /compact。如果超过 80%，主动写交接简报准备 /clear。

不要一次性改完全部 25 个，按批走。

这种「自带节奏控制」的 prompt 在 Kimi Code 和 Claude Code 上都通用，是长任务的标配。

常见坑 + 解决办法

现象	原因	解决
AI 突然「忘了」之前说的事	上下文被截断	提前 `/compact`，或写交接简报 `/clear`
`/compact` 后 AI 改错文件路径	摘要丢了文件位置细节	重要路径在 prompt 里再说一次
长会话越来越慢	上下文太大，每轮都要重处理	定期 `/compact`，或直接 `/clear` 续
退出后回来全没了	session 不持久化	用 AGENTS.md + 交接简报
AI 重复读同一个文件	没记住已读过	在 prompt 里说「你已经读过 X，不用重读」

Kimi Code 上下文 vs Claude Code 上下文

两个工具的思路很像，但有些差异：

维度	Kimi Code	Claude Code
上下文窗口	长上下文是 Kimi 强项	200K（部分 1M）
压缩命令	`/compact`	`/compact`（同名）
清空命令	`/clear`	`/clear`（同名）
持久记忆文件	AGENTS.md	CLAUDE.md
跨会话恢复	靠交接 prompt	靠交接 prompt + Projects
自动汇报用量	接近上限会提示	接近上限会提示

详细横评看 AI 写代码完全指南。

下一步

Kimi Code 入门 → Kimi Code CLI 怎么用
Kimi Code 是什么 → Kimi Code 是什么
Kimi Code 接入 VS Code → Kimi Code VS Code 指南
AGENTS.md 的写法（思路通 CLAUDE.md）→ CLAUDE.md 怎么写
Kimi 全功能 → Kimi 全功能教程
国产 AI 全景 → 国产 AI 大全

常见问题

Q：Kimi Code 的上下文窗口具体多大？ A：基于 Kimi K2 系列模型，单次会话能塞下相当大的代码量和对话——属于国产 AI 编程 CLI 里的长上下文阵营。具体数字以官方为准，但实战中你会发现「比 GPT-4 时代宽松不少」。

Q：/compact 会不会把重要的代码丢掉？ A：会丢一部分。AI 倾向保留「决策和结论」，丢掉「中间过程」。重要代码、关键路径、约定细节建议在 prompt 里再提一次。

Q：可以禁用自动压缩吗？ A：Kimi Code 默认到上限才自动截断，你可以主动控制——用 /compact 主动压、用 /clear 主动清。完全禁用没必要——窗口塞满 AI 表现一定下降。

Q：会话历史能导出吗？ A：Kimi Code 的对话默认在本地有日志，具体路径看 /help 或文档。但「能导出」不等于「能续」——回放历史不会自动加进新会话上下文，你得手动整理成交接简报。

Q：和 Claude Code 上下文管理思路有差异吗？ A：90% 一致——同样的 /compact、/clear、外挂记忆文件三件套。差异主要是模型本身：Kimi 长上下文是优势，但每次工具调用的 token 计费不同，长会话成本结构略有差异。