🍀 Spring Date with Fortune, Prizes with Raffle! Growth Value Phase 1️⃣ 7️⃣ Spring Raffle Carnival Begins!
Seize Spring's Good Luck! 👉 https://www.gate.com/activities/pointprize?now_period=17
🌟 How to Participate?
1️⃣ Enter [Square] personal homepage, click the points icon next to your avatar to enter [Community Center]
2️⃣ Complete Square or Hot Chat tasks such as posting, commenting, liking, speaking to earn growth value
🎁 Every 300 points can raffle once, 10g gold bars, Gate Red Bull gift box, VIP experience card and more prizes waiting for you to win!
Details 👉 https://www.gate.com/ann
LangChain 讓 AI 代理能自主掌控自己的記憶管理
Terrill Dicki
2026年3月12日 01:55
LangChain的深度代理SDK現在允許AI模型自行決定何時壓縮其上下文窗口,減少在長時間運行的代理工作流程中的手動干預。
LangChain已發布其深度代理SDK的更新,賦予AI模型自主管理記憶的能力。該新功能於2026年3月11日宣布,允許代理自主觸發上下文壓縮,而非依賴固定的令牌閾值或手動用戶命令。
此變化解決了代理開發中的一個持續難題:上下文窗口在不合時宜的時候填滿。目前的系統通常在接近模型上下文限制的85%時進行記憶壓縮——這可能發生在重構過程中或在複雜的調試會話中。時機不當會導致上下文丟失和工作流程中斷。
為何時機重要
上下文壓縮並不新鮮。這項技術用濃縮的摘要取代較舊的訊息,以保持代理在令牌限制內。但何時進行壓縮與是否壓縮一樣重要。
LangChain的實現識別出幾個最佳壓縮時機:用戶轉換焦點的任務邊界、從大量研究內容中提取結論後,或在開始長篇多檔案編輯之前。代理本質上學會在開始繁瑣工作前先整理清理,而不是在空間不足時慌亂。
2024年12月由Factory AI發表的研究支持這一方法。他們的分析發現,結構化摘要——保持上下文連貫性而非激進截斷——對於像除錯這樣的複雜代理任務至關重要。維持工作流程結構的代理在性能上明顯優於僅使用簡單截斷的方法。
技術實現
該工具作為Deep Agents SDK(Python)的中介軟體發布,並與現有的CLI集成。開發者將其加入代理配置中:
系統會保留可用上下文的10%作為最新訊息,同時對之前的內容進行摘要。LangChain內建安全機制——完整的對話歷史會保留在代理的虛擬檔案系統中,若壓縮出錯可進行恢復。
內部測試顯示,代理在觸發壓縮時較為保守。LangChain用他們的Terminal-bench-2基準測試和使用LangSmith追蹤的自定義評估套件驗證了此功能。當代理自主壓縮時,通常選擇能改善工作流程連續性的時機。
更廣的意義
此次發布反映了代理架構哲學的更廣泛轉變。LangChain明確引用了Richard Sutton的“苦澀教訓”——即利用計算的通用方法隨著時間推移往往優於手工調整的方法。
不再由開發者細緻配置代理何時管理記憶,框架將此決策委託給模型本身。這是一個押注:像GPT-5.4這樣的模型已經具備足夠的推理能力,能可靠地做出這些操作決策。
對於構建長時間運行或交互式代理的開發者來說,該功能可通過SDK選擇啟用,並在CLI中使用/compact命令。實際效果是:工作流程中斷更少,對用戶來說也不需要過多手動干預上下文限制,因為大多數終端用戶根本不理解這些限制。
圖片來源:Shutterstock