24 讲路线 · 与 S05 配对

D05: Context Compression 深挖 · 上下文压缩

本讲在 S05 主线之上，聚焦实现细节、边界条件与自测；导图与主线相同模块，便于对照。

建议：先读完 S05，再按下方顺序走读源码与练习。

模块导图（与 S05 同源，便于对照）：摘要策略、触发时机与信息损失

🔬 深挖目标

压缩是「有损优化」：何时触发、压缩谁、保留什么信号、如何向模型隐瞒损失，决定 Agent 是否突然变笨。

压缩发生在「下一轮模型调用前」；若与工具并行交织，确认压缩器看到的消息视图是否包含尚未提交的 tool_result。

D01 思考题从原理答了危害与解法谱系；本章补实现侧锚点（重建源码中的命名，便于你走读）：

触发前计量：compactConversation 入口处的 tokenCountWithEstimation(messages)——先量化再决定是否压缩。
可插桩：executePreCompactHooks / post 阶段让自定义策略改写压缩指令，而不是黑箱改数组。
切段与重放：通过 compact 边界类消息（参见源码中 createCompactBoundaryMessage、SystemCompactBoundaryMessage）让后续轮次仍知道「哪些历史已被摘要替代」。

完整摘录与走读清单见专题 · Compact 硬读。

给出一种「压缩后模型必然做错」的场景，并说明如何改策略避免。

摘要把失败测试的唯一关键栈帧行或用户刚约定的接口签名删掉，只保留「测试失败」四字；下一轮模型会按错误假设改代码，越改越偏。

摘要由「小模型」与「规则」各有什么工程代价？

方式	代价 / 风险
小模型摘要	多一次推理费用与延迟；摘要质量波动；需防「摘要再幻觉」；要版本化 prompt 与回归测例。
规则 / 模板	开发维护规则表成本高；对非标输出脆弱；但确定性高、可测，适合合规场景。

实务上常混合：规则做硬截断与结构化字段提取，小模型只负责把「已截断块」压成短摘要。