قدّمت Ramp Labs حلاً جديدًا لمشاركة الذاكرة بين وكلاء متعددين، حيث يتم خفض استهلاك الرموز (Token) إلى حدٍ أقصى أقل بنسبة 65%
أطلقت Ramp Labs نتائج بحثها «Latent Briefing» التي تُحقق مشاركة ذاكرة فعّالة في أنظمة متعددة العوامل عبر ضغط ذاكرة التخزين المؤقت لـ KV للنماذج الكبيرة، مما يُقلل استهلاك الـ Token ويرفع الدقة. في اختبارات LongBench v2، نجح هذا الأسلوب في خفض استهلاك Token لنموذج العامل Worker بنسبة 65%، كما رفع الدقة الإجمالية بنحو 3 نقاط مئوية، وكانت مدة الضغط 1.7 ثانية فقط. تُظهر هذه التقنية أداءً ممتازًا في سيناريوهات مختلفة للوثائق.
GateNews·منذ 3 س

