Chain of Density:渐进式内容压缩
什么是 Chain of Density?
Chain of Density (CoD) 是一种迭代式摘要技术:
- •通过多轮迭代逐步压缩内容
- •每轮增加信息密度
- •保持可读性的同时最大化信息量
核心理念
普通摘要的问题:
- •可能遗漏关键信息
- •信息密度不可控
- •一次生成难以优化
CoD 的解决方案:
- •分多轮逐步压缩
- •每轮增加 1-2 个关键实体
- •保持长度基本不变
CoD 工作流程
第1轮:生成初始摘要(较为宽泛)
↓
第2轮:增加具体细节,替换通用描述
↓
第3轮:进一步压缩,增加关键数据
↓
第4轮:最终优化,确保无信息遗漏
↓
输出:高密度、信息丰富的摘要
标准 CoD 提示模板
请对以下文章进行 5 轮迭代式摘要:
文章:
{文章内容}
要求:
- 每轮摘要约 80-100 字
- 每轮比上一轮增加 1-2 个具体实体/数据
- 用更具体的表述替换通用描述
- 最终摘要应信息密集但仍可读
请输出所有 5 轮摘要,并标注每轮新增的关键信息。
实战示例
原文(技术博客)
某公司发布了新的 AI 产品,性能很好,价格合理...(假设有完整内容)
CoD 迭代过程
第1轮(信息密度:低) 某公司发布了一款新的人工智能产品,该产品在性能和价格方面都有竞争力,预计将对行业产生影响。
第2轮(+公司名、产品名) OpenAI 发布了 GPT-5,该产品在性能和价格方面具有竞争力,预计将对 AI 行业产生影响。
第3轮(+具体性能数据) OpenAI 发布 GPT-5,推理速度提升 3 倍、成本降低 50%,支持百万级上下文,预计重塑 AI 行业格局。
第4轮(+时间、对比) 2024年3月,OpenAI 发布 GPT-5:推理速度比 GPT-4 快 3 倍、API 成本降低 50%、支持 100 万 token 上下文,超越 Claude 3 成为最强模型。
第5轮(最终) 2024年3月12日,OpenAI 发布 GPT-5:推理速度 3 倍于 GPT-4、API 价格下调 50%至 $0.01/1K token、上下文窗口达 100 万 token,Benchmark 全面超越 Claude 3,企业版即日开放。
CoD 最佳实践
1. 识别关键实体类型
- •人物:具体姓名、职位
- •数字:具体数据、百分比
- •时间:日期、时间段
- •地点:具体位置
- •专有名词:产品名、公司名
2. 替换策略
| 通用表述 | 高密度表述 | |---------|-----------| | 某公司 | Google/OpenAI | | 大幅提升 | 提升 300% | | 最近 | 2024年3月 | | 很多用户 | 超过 100 万用户 | | 效果很好 | 准确率达 95% |
3. 保持可读性
- •避免堆砌数据
- •保持句子流畅
- •信息密度 ≠ 信息堆积
应用场景
- •📰 新闻摘要
- •📚 论文速读
- •📊 报告提炼
- •💼 会议纪要
练习
用 CoD 方法为以下内容生成摘要:
今天公司召开了季度总结会议,讨论了多项业务进展...(假设有完整内容)
完成 5 轮迭代,每轮标注新增的关键信息。
小结
- •CoD 通过迭代逐步提升信息密度
- •每轮用具体实体替换通用表述
- •平衡密度与可读性
- •适合需要高效信息传递的场景
下一课我们将学习 ReAct 框架。