🤖 AI 跟我学 新手入门

Kimi Code 上下文管理:长会话不丢思路的 3 招

Kimi Code 上下文怎么管?讲透 /clear、/compact、AGENTS.md 三招用法,配合长上下文模型让你跨会话也能续上昨天的思路,不丢任务进度

发布 2026/05/19 📎 参考官方文档

30 秒了解:Kimi Code 上下文是什么、为什么要管

Kimi Code 上下文 = 当前会话里 AI「记得」的所有内容,包括你说过的话、它读过的文件、跑过的命令输出、看过的报错。 一旦上下文塞满(默认接近 128K-256K token 区间),Kimi Code 会自动截断旧内容,思路就会断片:你昨天讨论好的方案、它读过的核心文件结构、约定的命名规范,全部「失忆」。

这件事在长任务里特别明显。你跟 Kimi Code 一起重构一个模块,干到第 40 分钟它突然问你「这个项目用什么测试框架?」——之前明明告诉过它三次,但旧消息已经被挤出窗口。

这篇按官方 sessions 文档 + 实战经验,给你 3 招把长会话「续」起来:分会话、压缩历史、外挂记忆。如果你还没装 Kimi Code,先看 Kimi Code CLI 怎么用

准备工作:先搞清楚 3 个核心概念

1. 什么是「上下文窗口」

每个大模型有一个固定的「能一次记住多少 token」的容量,叫上下文窗口。Kimi K2 系列在 AI 编程 CLI 里属于长上下文阵营,单次会话能塞下相当多的代码和对话。但长不等于无限——窗口塞满后旧内容必然被丢弃。

2. 什么会「吃」上下文

按吃 token 的速度从快到慢:

内容token 占用
完整读一个大文件(几千行)极高
ls -R 或长 grep 输出
多轮工具调用累计(每次 tool call 的输入输出都进上下文)
你和 AI 的自然语言对话
AGENTS.md / CLAUDE.md 这种小型项目说明

知道这个就明白:别让 AI 没事乱翻文件——读没必要的内容会快速消耗上下文。

3. 什么是「会话」(session)

一次启动 kimi 到你退出 CLI 之间,就是一个 session。所有上下文都在这个 session 里。退出之后默认不会持久化——下次进来就是空的。

想跨会话续上,必须用下面 3 招其中一个或组合用。

招式 1:用 /clear 主动开新会话,不要硬撑

很多人长会话不顺手,第一反应是「再多问几句它就懂了」。错。塞了一堆错误尝试的上下文,AI 越往后越乱。

什么时候用 /clear

  • 任务已经做完了,要开始一个新的不相关任务
  • 你和 AI 在某个方向上「鬼打墙」,对话越长越乱
  • AI 已经基于错误前提走出去几轮,回不来了
  • 上下文用量达到 70-80%,但当前任务可以告一段落

怎么用

在 CLI 里直接输入:

/clear

它会清空当前会话的对话历史,但保留:

  • 你的登录状态(不用重新 /login
  • AGENTS.md(重新启动会重新读)
  • 当前工作目录

相当于「关掉再打开一个干净的 Kimi Code」,但更快。

配合一个「交接 prompt」

/clear 之前最好让 Kimi Code 自己总结一份「下一会话用的简报」:

📋 Prompt 模板

我准备 /clear 重启会话。在清空之前,请帮我写一段「交接简报」给下一会话的 Kimi Code,包括:

  1. 我们刚才做了什么任务,做到哪一步
  2. 关键的决策和原因(比如「选了 zod 不选 yup,因为…」)
  3. 下一步应该做什么
  4. 有哪些坑或约定后来者要注意

格式:纯文本、3-6 段,让下一个会话的 AI 5 分钟内能续上。

复制它输出的简报,/clear,重启会话,第一条消息把简报粘进去——AI 立刻进入状态,跟没断过一样。

招式 2:用 /compact 压缩历史,保留思路丢冗余

/clear 是「全清空」,太极端。日常更常用的是 /compact——AI 自己把历史对话压缩成摘要,保留关键决策,扔掉冗余的工具输出。

什么时候用

  • 上下文用了一半,但当前任务还没做完,不想清空
  • 已经读了一堆文件、跑了一堆命令,原始输出占用太多
  • 想继续讨论但希望节省 token 提速

怎么用

/compact

Kimi Code 会扫描整个对话历史,生成一份摘要替换掉冗长的中间步骤。压缩前可能是:

用户:读一下 src/api/auth.ts
助手:[完整文件内容 800 行]
用户:再读 src/api/user.ts  
助手:[完整文件内容 600 行]
用户:现在告诉我 auth 的逻辑
助手:[详细分析]

压缩后大致是:

[摘要:已读 auth.ts 和 user.ts,发现 auth 用 JWT,过期 7 天,refresh token 存 Redis]
用户:现在告诉我 auth 的逻辑
助手:[详细分析]

token 用量直接砍到 1/3 到 1/10。

/compact 的限制

  • AI 摘要可能丢细节——重要的字段名、文件路径建议人工再提一次
  • 大块完整代码不会保留——下一步要改代码先重新读
  • 不适合「需要回放完整推理路径」的场景(比如调试一个微妙 bug)

招式 3:用 AGENTS.md 把「该记的」搬到外挂记忆

上面两招是「会话内」的优化。但项目层面的事——「这个项目用 pnpm」「commit 走 Conventional Commits」「src/legacy/ 不要碰」——每个会话都靠对话告诉 AI 太浪费。搬到 AGENTS.md 里,每次启动自动读。

Kimi Code 的 AGENTS.md 跟 CLAUDE.md 怎么写 思路完全一致:

AGENTS.md 该放什么

# 项目说明

Next.js 14 + tRPC 的后台管理系统,团队 5 人

# 关键命令

- 开发:pnpm dev
- 测试:pnpm test  
- 构建:pnpm build
- 部署:pnpm deploy:prod

# 约定

- commit 用 Conventional Commits(feat: / fix: / docs:)
- 新 API 放 src/server/api/routers/
- 不要修改 src/legacy/ 目录(在迁移中)
- 测试覆盖率不低于 70%

# 常见坑

- 改 prisma schema 后必须跑 pnpm prisma migrate
- 改环境变量后必须重启 dev server

AGENTS.md 不该放什么

  • 完整 API 文档(太长,让 AI 需要时自己读 src)
  • 详细业务逻辑(让 AI 看代码)
  • 每个文件干啥(保持 200 行以内)

控制在 200 行以内是经验值——超过 AI 会读不完整或不重视。

/init 自动生成

/init

第一次进项目跑这条,Kimi Code 会扫描整个项目,自动生成一份 AGENTS.md 草稿。你通读一遍、删错的加缺的,commit 进 git 就行。

长任务的标准节奏:3 招组合用

放在一起,一个完整的「干 3 小时连续重构」节奏:

时间点动作
T+0kimi 启动,自动读 AGENTS.md
T+0第一条 prompt 描述任务全貌(写得详细些)
T+30 分钟检查上下文用量(看 CLI 提示),约 30%
T+60 分钟用量 50% → 跑 /compact 压一次
T+90 分钟完成一个子任务里程碑,让 AI 输出「阶段总结」
T+120 分钟用量 70% → 让 AI 写「交接简报」→ /clear → 粘简报继续
T+180 分钟任务完成 → /quit 退出

按这个节奏走,3 小时不会断片。

实战:长重构任务的开场 prompt

直接复制下面这段当开场白,能让 Kimi Code 一开始就进入「长任务」模式:

📋 Prompt 模板

你好。今天要做一个 2-3 小时的重构任务,我希望我们按节奏走。

任务全貌:把 src/api/legacy/ 下所有用 callback 的接口改成 async/await。涉及约 25 个文件。

请先按下面 4 步走,做完停:

  1. 读 AGENTS.md,用一句话总结你接收到的约定
  2. 跑 grep -r “function.*callback” src/api/legacy/ 列出所有要改的文件
  3. 把 25 个文件分成 5 批,每批 5 个,用列表给我
  4. 估算每批要多久

每完成一批做这 3 件事:

  • 跑 pnpm test 确认绿
  • git commit 一个里程碑 commit
  • 告诉我「已完成第 N 批,剩余 X 批」

如果上下文用量超过 60%,主动提议 /compact。如果超过 80%,主动写交接简报准备 /clear。

不要一次性改完全部 25 个,按批走。

这种「自带节奏控制」的 prompt 在 Kimi Code 和 Claude Code 上都通用,是长任务的标配。

常见坑 + 解决办法

现象原因解决
AI 突然「忘了」之前说的事上下文被截断提前 /compact,或写交接简报 /clear
/compact 后 AI 改错文件路径摘要丢了文件位置细节重要路径在 prompt 里再说一次
长会话越来越慢上下文太大,每轮都要重处理定期 /compact,或直接 /clear
退出后回来全没了session 不持久化用 AGENTS.md + 交接简报
AI 重复读同一个文件没记住已读过在 prompt 里说「你已经读过 X,不用重读」

Kimi Code 上下文 vs Claude Code 上下文

两个工具的思路很像,但有些差异:

维度Kimi CodeClaude Code
上下文窗口长上下文是 Kimi 强项200K(部分 1M)
压缩命令/compact/compact(同名)
清空命令/clear/clear(同名)
持久记忆文件AGENTS.mdCLAUDE.md
跨会话恢复靠交接 prompt靠交接 prompt + Projects
自动汇报用量接近上限会提示接近上限会提示

详细横评看 AI 写代码完全指南

下一步

常见问题

Q:Kimi Code 的上下文窗口具体多大? A:基于 Kimi K2 系列模型,单次会话能塞下相当大的代码量和对话——属于国产 AI 编程 CLI 里的长上下文阵营。具体数字以官方为准,但实战中你会发现「比 GPT-4 时代宽松不少」。

Q:/compact 会不会把重要的代码丢掉? A:会丢一部分。AI 倾向保留「决策和结论」,丢掉「中间过程」。重要代码、关键路径、约定细节建议在 prompt 里再提一次。

Q:可以禁用自动压缩吗? A:Kimi Code 默认到上限才自动截断,你可以主动控制——用 /compact 主动压、用 /clear 主动清。完全禁用没必要——窗口塞满 AI 表现一定下降。

Q:会话历史能导出吗? A:Kimi Code 的对话默认在本地有日志,具体路径看 /help 或文档。但「能导出」不等于「能续」——回放历史不会自动加进新会话上下文,你得手动整理成交接简报。

Q:和 Claude Code 上下文管理思路有差异吗? A:90% 一致——同样的 /compact/clear、外挂记忆文件三件套。差异主要是模型本身:Kimi 长上下文是优势,但每次工具调用的 token 计费不同,长会话成本结构略有差异。