compression(上下文压缩)配置指南
2026年6月15日 上午12:12:18
SolonCode 在长任务、多文件分析、多轮工具调用时会积累大量上下文。Compression 用于把较早的对话与工具结果摘要化,减少模型上下文压力。
1、相关配置
| 配置项 | 默认值 | 说明 |
|---|---|---|
sessionWindowSize | 8 | 新任务带入最近几条历史消息 |
summaryWindowSize | 40 | 消息数量达到阈值后触发摘要压缩(压缩消息触发数) |
summaryWindowToken | 60000 | 内容长度达到阈值后触发摘要压缩(压缩词元触发数) |
summaryModel | 空 | 指定摘要模型,空则使用当前模型 |

2、推荐值
| 模型上下文 | summaryWindowSize | summaryWindowToken | 策略 |
|---|---|---|---|
| 20k | 10 - 15 | 8,000 - 12,000 | 小上下文,频繁压缩,避免溢出 |
| 100k | 30 - 40 | 24,000 - 32,000 | 均衡配置,适合多数编码任务 |
| 200k | 50 - 60 | 48,000 - 64,000 | 保留更多工具链路,适合复杂重构 |
| 1m | 100 - 150 | 128,000+ | 降低压缩频率,注意成本与延迟 |
3、调参建议
- 任务经常忘记刚读过的文件:适当调大
summaryWindowSize。 - 模型报上下文超限:调小
summaryWindowToken。 - 压缩摘要成本太高或速度变慢:调大阈值,减少触发频率。
- 小模型执行复杂任务不稳定:降低
sessionWindowSize,减少历史干扰。
4、排查现象
| 现象 | 可能原因 | 建议 |
|---|---|---|
| AI 反复读取同一文件 | 上下文窗口太小或摘要过早 | 调大窗口或提示它先做文件索引 |
| 长任务后答非所问 | 摘要质量不足 | 使用更强的 summaryModel |
| 费用明显增加 | 上下文保留过多 | 调小窗口和 token 阈值 |