تحليل Berkeley GEPA: يمكن للذكاء الاصطناعي تعلم مهام جديدة دون تحديث الأوزان، بتكلفة تدريب أقل بـ35 مرة مقارنة بالتعلم التعزيزي (RL)

قدّمت فرق بحثية من جامعة كاليفورنيا في بيركلي طريقة جديدة لتدريب نماذج الذكاء الاصطناعي؛ حيث تم قبول GEPA في ICLR 2026 كبحث Oral. لا تقوم GEPA بتحديث أوزان النموذج ولا تتطلب تدريبًا على وحدات معالجة الرسوميات (GPU)، بل تستخدم LLM واحدًا “يقوم بقراءة سجلات التدريب” لإعادة كتابة مطالبات نظام الذكاء الاصطناعي بشكل متكرر، ما يتيح التفوق بمتوسط 6% على أساليب التعلم المعزز السائدة في 6 مهام، مع تحقيق تفوقٍ يصل إلى 20%، وبتراجع عدد محاولات التدريب المطلوبة (rollouts) بمقدار 35 مرة. بعد أن قامت مجتمعات هندسة الذكاء الاصطناعي بتنظيم نتائج البحث ونشرها، أثارت نقاشًا على منصة X، وقد تم دمجها حاليًا في DSPy كمحسّن من الدرجة الأولى.

GEPA ما الذي تفعله: تحويل سجلات التدريب إلى مواد تعليمية بدل الاكتفاء بالنظر إلى الدرجات

تتمثل سير العمل في طرق التعلم المعزز التقليدية (مثل GRPO) في: جعل الذكاء الاصطناعي ينفّذ المهمة مرة واحدة، ثم إعطاء درجة “+1 أو -1” بناءً على النتائج، وبعدها تعديل أوزان النموذج بشكل متكرر باستخدام هذه الدرجة. المشكلة هي أن تشغيل الذكاء الاصطناعي للمهمة مرة واحدة غالبًا ما يتضمن خطوات استدلال تصل إلى آلاف الرموز (tokens)، واستدعاءات للأدوات، ورسائل أخطاء—وكل هذه التفاصيل الغنية يتم ضغطها في درجة واحدة، بينما تُهمل معلومات العملية. لذلك يحتاج التعلم المعزز إلى تكرار التشغيل لآلاف المرات حتى يصل إلى التقارب.

نهج GEPA عكس ذلك: بعد أن ينهي الذكاء الاصطناعي المهمة في كل مرة، يقوم بتسليم كامل تسلسل العملية (الاستدلال، استدعاءات الأدوات، سجلات الإبلاغ عن الأخطاء) حرفيًا إلى LLM آخر “يقوم بالتأمل” ليقرأه. يقوم LLM الخاص بالتأمل بدور مهندس معماري يقرأ سجلات التشغيل (log)؛ إذ يحدد أين وقع الخطأ، ولماذا وقع، وكيف ينبغي تعديل المطالبات، ثم يعيد كتابة المطالبات الخاصة بذلك الجزء مباشرة. في النهاية، رغم أن تشغيل المهمة يتم مرة واحدة فقط، فإن كمية الإشارة التي تستخلصها GEPA تكون أكبر بكثير من الدرجة الواحدة التي يحصل عليها التعلم المعزز.

لماذا تُحقق نتائج أفضل: تحويل “إعطاء الدرجة” إلى “قراءة كامل تسلسل العملية”

تتفوق GEPA في 6 مهام على GRPO بمتوسط 6%، وبحد أقصى 20%. وبالمقارنة مع مُحسّن مطالبات رئيسي آخر MIPROv2، فإنها تتفوق أيضًا بأكثر من 10% (مع تحسن 12% على معيار المسائل الرياضية AIME-2025). والأهم من ذلك هو تكلفة التدريب: للوصول إلى أداء مماثل، تحتاج GEPA إلى عدد rollouts (تشغيل كامل للمهمة) أقل بمقدار 35 مرة.

ومن بيانات أخرى أيضًا: بعد دمج GEPA مع DSPy، يمكن لـ “Full Program Adapter” تحسين كامل برنامج DSPy (بما في ذلك signature والأجزاء والمخطط التحكمي)، وعند معيار الرياضيات MATH تحقق GEPA نسبة دقة تبلغ 93%، متجاوزة بشكل كبير طريقة ChainOfThought الأصلية في DSPy التي بلغت 67%. كما تُظهر GEPA أداءً ممتازًا بشكل خاص في سير عمل متعدد الوحدات (agents متعددة الوحدات مترابطة)—إذ يمكنها بدقة تحديد وحدة بعينها عند حدوث خطأ وإعادة كتابة مطالباتها، بدلًا من ضبط النظام بالكامل.

من سيبدأ بالاستفادة أولًا: DSPy كمواطن من الدرجة الأولى، وGitHub مفتوح المصدر

تم نشر كود GEPA مفتوحًا على GitHub، وتم دمجه ضمن إطار عمل DSPy بصيغة dspy.GEPA، كما تم نشره بشكل مستقل كمكتبة Python. يضم فريق البحث باحثين عبر مؤسسات مثل UC Berkeley وStanford وNotre Dame وAnthropic وغيرها، ومن بين مؤلفي الورقة Matei Zaharia (المؤسس المشارك لـ Databricks، وهو المؤلف الرئيسي لـ DSPy) وOmar Khattab (المؤلف الرئيسي لـ DSPy).

بالنسبة لمجتمع المطورين، تقدم GEPA حلًا جديدًا لمعضلة “لدينا عدد كبير من rollouts لكننا لا نعرف كيفية الاستفادة منها”—إذ إن معظم الفرق قد راكمت عشرات الآلاف من سجلات تشغيل الـ agents للمهام، لكن بخلاف تصفح بضع سجلات عند حدوث خطأ لمعرفة سبب الخلل، لا توجد طريقة منهجية لتحويل هذه السجلات إلى تحسينات في النموذج. الملاحظة التالية تتمثل في مدى تطبيق GEPA فعليًا داخل سير عمل agents على مستوى الشركات (مثل أتمتة خدمة العملاء، أو الإصلاح التلقائي للبرمجيات)، وما إذا كانت ستظهر تطبيقات مناظر لـ GEPA خارج إطار DSPy.

ظهر تحليل Berkeley GEPA: لا تُحدِّث الأوزان لكي يتعلم الذكاء الاصطناعي مهمة جديدة، بتكلفة تدريب أقل 35 مرة مقارنةً بالتعلم المعزز—بأول مرة على موقع سلسلة الأخبار ABMedia.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

تطلق Particle Network خريطة طريق الحسابات الشاملة، وتطرح حزمة تطوير الإيداع الشاملة (SDK) وحسابات وكيل ذكاء اصطناعي

وفقاً لـChainCatcher، أطلقت Particle Network اليوم خارطة طريق المرحلة التالية للحسابات الشاملة (Universal Accounts)، مقدمة منتجين جديدين خلال الأشهر المقبلة: Universal Deposit SDK، الذي يمكّن المطورين من إضافة إيداعات متعددة السلاسل بحوالي 10 أسطر من الشيفرة، وUniversal Agent Accounts،

GateNewsمنذ 4 س

إطلاق برنامج ذكاء اصطناعي من Roblox لمنافسة Unity وEpic Games

وفقاً لـ Bloomberg، تطلق Roblox برنامجاً جديداً للذكاء الاصطناعي للتنافس مع Unity Technologies وEpic Games، اللتين تهيمن محركاتهما على تطوير ألعاب بميزانيات كبيرة. قال الرئيس التنفيذي Dave Baszucki إن الأداة تهدف إلى مساعدة المبدعين على إنشاء ألعاب متعددة اللاعبين برسومات فوتوغرافية واقعية بسهولة أكبر، مدعومة بـ ar

GateNewsمنذ 9 س

الأسطول البحري الأمريكي يوقّع عقداً بقيمة تقارب 100 مليون دولار مع Domino Data Lab لتأمين الكشف عن الألغام في مضيق هرمز

وفقاً لوكالة أنباء شينخوا، وقّعت قيادة أنظمة الحرب المعلوماتية التابعة للبحرية الأميركية مؤخراً عقداً مع شركة للذكاء الاصطناعي مقرها سان فرانسيسكو هي Domino Data Lab لاقتناء ونشر حلول برمجيات تعلّم الآلة. تبلغ قيمة العقد قرابة 100 مليون دولار إذا تم تنفيذه بالكامل، ويهدف إلى

GateNewsمنذ 11 س

XAI Grok يدعم الأصوات المخصّصة: استنساخ مدته دقيقتان والتحقق من الهوية على مرحلتين

أطلقت xAI Grok Custom Voices، حيث يمكن عبر وحدة التحكم تسجيل صوت لمدة نحو دقيقة واحدة، وإنتاج نموذج صوتي مخصص جاهز للاستخدام في TTS وVoice Agent API خلال دقيقتين. وتم في الوقت نفسه طرح Grok 4.3 وVoice Library. ولمنع الاستنساخ، تستخدم المنصة تحققاً على مرحلتين: يقرأ المستخدم جملة للتحقق أولاً، ثم تتم مقارنة speaker embedding لضمان أن الشخص نفسه فقط يمكنه إنشاء الصوت. ويُوحّد Voice Library إدارة الأصوات المخصصة والأصوات المبنية مسبقاً، ويضم أكثر من 80 نوعاً وبـ 28 لغة، مع التوسع لاحقاً.

ChainNewsAbmediaمنذ 13 س

إصدار سطح المكتب من OpenAI Codex يضيف وظيفة الحيوانات الأليفة: 3 تلميحات للحالات، والتفريخ بحسب لغة الاستخدام

طرحت OpenAI إصدار سطح المكتب من Codex مؤخرًا ميزة «الحيوانات الأليفة» (Pets)، ما يتيح للمطورين أثناء البرمجة الإحاطة الفورية بحالة مهام Codex عبر شخصيات متحركة عائمة. ووفقًا لوثائق OpenAI الرسمية، فإن تراكب الحيوانات الأليفة (overlay) يقوم بتبديل 3

ChainNewsAbmediaمنذ 14 س

مُنصة MoonPay تطلق بطاقة MoonAgents، وهي ماستركارد افتراضية لوكلاء الذكاء الاصطناعي، يوم الجمعة

ووفقاً لما ذكرته The Block، أطلقت MoonPay بطاقة MoonAgents Card، وهي بطاقة خصم افتراضية من ماستركارد، يوم الجمعة. صُممت البطاقة لتخدم كلًا من وكلاء الذكاء الاصطناعي والمستخدمين، إذ تحوّل العملات المستقرة إلى عملة ورقية عند نقطة الدفع، وتمكّن من الإنفاق لدى أي تاجر عبر الإنترنت في أنحاء العالم يقبل ماستركارد. البطاقة هي

GateNews05-02 13:51
تعليق
0/400
لا توجد تعليقات