Search results for "TOKEN"
oggi
05:14
1

Ramp Labs 提出多智能体记忆共享新方案,Token 消耗最高降低 65%

Ramp Labs发布的研究成果「Latent Briefing」通过压缩大模型KV缓存,实现多智能体系统高效记忆共享,降低Token消耗并提高准确率。在LongBench v2测试中,该方法成功减少Worker模型Token消耗65%,且提升整体准确率约3个百分点,压缩耗时仅为1.7秒。这项技术在不同文档场景下表现优异。
Altro