Solon v4.0.2

compression(上下文压缩)配置指南

</> markdown
2026年6月15日 上午12:12:18

SolonCode 在长任务、多文件分析、多轮工具调用时会积累大量上下文。Compression 用于把较早的对话与工具结果摘要化,减少模型上下文压力。

1、相关配置

配置项默认值说明
sessionWindowSize8新任务带入最近几条历史消息
summaryWindowSize40消息数量达到阈值后触发摘要压缩(压缩消息触发数)
summaryWindowToken60000内容长度达到阈值后触发摘要压缩(压缩词元触发数)
summaryModel指定摘要模型,空则使用当前模型

2、推荐值

模型上下文summaryWindowSizesummaryWindowToken策略
20k10 - 158,000 - 12,000小上下文,频繁压缩,避免溢出
100k30 - 4024,000 - 32,000均衡配置,适合多数编码任务
200k50 - 6048,000 - 64,000保留更多工具链路,适合复杂重构
1m100 - 150128,000+降低压缩频率,注意成本与延迟

3、调参建议

  • 任务经常忘记刚读过的文件:适当调大 summaryWindowSize
  • 模型报上下文超限:调小 summaryWindowToken
  • 压缩摘要成本太高或速度变慢:调大阈值,减少触发频率。
  • 小模型执行复杂任务不稳定:降低 sessionWindowSize,减少历史干扰。

4、排查现象

现象可能原因建议
AI 反复读取同一文件上下文窗口太小或摘要过早调大窗口或提示它先做文件索引
长任务后答非所问摘要质量不足使用更强的 summaryModel
费用明显增加上下文保留过多调小窗口和 token 阈值