تسريب مذكرة داخلية من Tencent: النموذج الأحدث Hy3 استخدم Claude Code في مرحلة ما بعد التدريب

robot
إنشاء الملخص قيد التقدم

وفقًا لمراقبة Beating، نقلت “The Information” عن مصادر مطلعة ومذكرات داخلية لشركة Tencent أن موظفي Tencent استخدموا Claude Code من Anthropic خلال مرحلة ما بعد التدريب لنموذج Hy3، على الرغم من أن Anthropic حظرت بشكل واضح تقديم الخدمات التجارية للشركات الصينية بحجة الأمن القومي.

يعد Hy3 هو أقوى نموذج لغة كبير في سلسلة Tencent Hunyuan حتى الآن، مع معمارية MoE تحتوي على 295 مليار معلمة، وانضم في نهاية العام الماضي بقيادة يوان شونيو، كبير علماء الذكاء الاصطناعي في Tencent. في مرحلة RLHF (التعلم المعزز بناءً على ملاحظات الإنسان)، نظم Tencent موظفيه ليكونوا مقيمين بشريين، ووفرت المذكرات الداخلية إرشادات لتثبيت Claude Code، مع حد أقصى للاستخدام لكل شخص هو “آلاف الرموز”.

لا يعتقد موظفو Tencent أن هذا ينتمي إلى عملية التقطير (تدريب نموذج أضعف باستخدام مخرجات نموذج قوي). نهجهم هو: تقديم نفس مشكلة برمجية لنموذجين مجهولين، وتقييمهما بشكل أعمى؛ وفي الوقت نفسه، يستخدمون Claude Code في الوقت الحقيقي لإنشاء أمثلة سلوك عالية الجودة كمرجع، للمساعدة في تصفية الردود منخفضة الجودة. أكد موظفو العديد من شركات الذكاء الاصطناعي أن استخدام نماذج رائدة في الصناعة كمرجع في مرحلة ما بعد التدريب هو ممارسة شائعة.

قال متحدث باسم Anthropic إن فريق الأمان في الشركة “يراقب بنشاط هجمات التقطير، ويتخذ إجراءات على الفور عند اكتشافها”، لكنه لم يرد مباشرة على مسألة استخدام Tencent لـ Claude Code. الطريقة الشائعة للشركات والمطورين الصينيين للحصول على Claude هي من خلال وسطاء، أو عبر التسجيل باستخدام أرقام هواتف غير صينية أو بطاقات ائتمان. وقد شددت Anthropic في بداية هذا الشهر متطلبات التحقق من الهوية، بحيث يُطلب من بعض المستخدمين تقديم وثائق رسمية صادرة عن الحكومة وصور شخصية لهم.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت