
工作原理
Cline 在对话过程中监控令牌使用情况。当接近限制时,他会:- 创建已发生的所有事情的全面摘要
- 保留所有技术细节、代码更改和决策
- 用摘要替换对话历史
- 从他离开的地方继续
为什么这很重要
以前,Cline 在达到上下文限制时会截断较早的消息。这意味着会丢失对话中较早的重要上下文。 现在通过摘要:- 所有技术决策和代码模式都得到保留
- 文件更改和项目上下文保持完整
- Cline 记住他所做的一切
- 你可以不间断地处理更大的项目
技术细节
摘要通过你配置的 API 提供商使用你已经使用的相同模型进行。它利用提示缓存来最小化成本。 不同的模型对自动摘要何时启动有不同的上下文窗口阈值。你可以在 context-window-utils.ts 中看到阈值是如何确定的。成本考虑
摘要利用对话中现有的提示缓存,因此成本与任何其他工具调用大致相同。 由于大多数输入令牌已经被缓存,你主要为摘要生成(输出令牌)付费,这使得它非常具有成本效益。使用检查点恢复上下文
你可以使用检查点从摘要发生之前恢复你的任务状态。这意味着你永远不会真正丢失上下文 - 你总是可以回滚到对话的以前版本。在摘要工具调用之前编辑消息将类似于检查点工作,允许你将对话恢复到那个时间点。
下一代模型支持
自动压缩使用高级的基于 LLM 的摘要,我们发现这对于下一代模型效果显著更好。我们目前为以下模型支持此功能:- Claude 4 系列
- Gemini 2.5 系列
- GPT-5
- Grok 4
使用其他模型时,即使在设置中启用了自动压缩,Cline 也会自动回退到标准的基于规则的上下文截断方法。

