Solon v4.0.3

compression（上下文压缩）配置指南

</> markdown

2026年7月8日上午8:59:12

SolonCode 在长任务、多文件分析、多轮工具调用时会积累大量上下文。Compression 用于把较早的对话与工具结果摘要化，减少模型上下文压力。

1、相关配置

配置项	默认值	说明
`sessionWindowSize`	`8`	新任务带入最近几条历史消息（对话历史窗口大小）
`summaryWindowSize`	`40`	消息数量达到阈值后触发摘要压缩（压缩消息触发数）
`summaryWindowToken`	`60000`	内容长度达到阈值后触发摘要压缩（压缩词元触发数）
`summaryModel`	空	指定摘要模型，空则使用当前模型

2、推荐值

模型上下文	summaryWindowSize （压缩触发消息数）	summaryWindowToken （压缩触发词元数）	策略
128k	30 - 40	24,000 - 32,000	均衡配置，适合多数编码任务
256k	40 - 60	48,000 - 128,000	保留更多工具链路，适合复杂重构
1m	100 - 150	128,000+	降低压缩频率，注意成本与延迟

3、调参建议

任务经常忘记刚读过的文件：适当调大 summaryWindowSize。
模型报上下文超限：调小 summaryWindowToken。
压缩摘要成本太高或速度变慢：调大阈值，减少触发频率。
小模型执行复杂任务不稳定：降低 sessionWindowSize，减少历史干扰。

4、排查现象

现象	可能原因	建议
AI 反复读取同一文件	上下文窗口太小或摘要过早	调大窗口或提示它先做文件索引
长任务后答非所问	摘要质量不足	使用更强的 `summaryModel`
费用明显增加	上下文保留过多	调小窗口和 token 阈值