العقود الآجلة
وصول إلى مئات العقود الدائمة
TradFi
الذهب
منصّة واحدة للأصول التقليدية العالمية
الخیارات المتاحة
Hot
تداول خيارات الفانيلا على الطريقة الأوروبية
الحساب الموحد
زيادة كفاءة رأس المال إلى أقصى حد
التداول التجريبي
مقدمة حول تداول العقود الآجلة
استعد لتداول العقود الآجلة
أحداث مستقبلية
"انضم إلى الفعاليات لكسب المكافآت "
التداول التجريبي
استخدم الأموال الافتراضية لتجربة التداول بدون مخاطر
إطلاق
CandyDrop
اجمع الحلوى لتحصل على توزيعات مجانية.
منصة الإطلاق
-التخزين السريع، واربح رموزًا مميزة جديدة محتملة!
HODLer Airdrop
احتفظ بـ GT واحصل على توزيعات مجانية ضخمة مجانًا
منصة الإطلاق
كن من الأوائل في الانضمام إلى مشروع التوكن الكبير القادم
نقاط Alpha
تداول الأصول على السلسلة واكسب التوزيعات المجانية
نقاط العقود الآجلة
اكسب نقاط العقود الآجلة وطالب بمكافآت التوزيع المجاني
أصدرت DeepSeek أحدث بحثها "mHC: Manifold-Bound-Constrained Hyper-Connections" في بداية العام، وشارك المؤسس ليانغ وينفينغ أيضا. هذه مقالة تقنية سهلة الفهم حول البنية الأساسية، ويتم فهم أبرز النقاط الأساسية كما يلي:
أولا، تم تحسين استقرار تدريب النماذج الكبيرة بشكل كبير. أداء الاتصال المتبقي المطور (HC) السابق كان قويا بالفعل، لكن هناك نقطة ألم - عملية التدريب سهلة الانهيار، وmHC يحل هذه المشكلة من خلال آلية تقييد متعدد الأسطح، مما يسمح للنموذج بالحفاظ على استقرار التدريب في تحسين هيكلي أعمق.
ثانيا، هذا ليس مجرد تكديس أداء، بل إعادة تفكير من مستوى البنية التحتية. من خلال تقديم طوبولوجيا جديدة مع الاتصال الفائق، يتم تحسين قدرة التعميم ومتانة النموذج مع الحفاظ على الكفاءة الحسابية.
ببساطة، mHC تعني جعل النماذج الكبيرة تعمل بثبات وسرعة ودقة. لهذا له أهمية مرجعية معينة لاتجاه تحسين النماذج في القطاع بأكمله.
---
قيد التشكيل، أشعر أخيرًا أن هناك من ملأ حفرة HC
---
ليانغ وينفينغ يعود للأضواء، هذه الفكرة لها بعض المعنى
---
ليس مجرد تراكم الأداء، بل إعادة الهيكلة، هذا هو القوة الحقيقية
---
انتظر، هل يعني ذلك أن mHC هو "طالب مثالي" للنموذج الكبير؟
---
تحسين الهيكل الطوبولوجي، يبدو أن هناك شيء ما
---
التدريب بدون انهيار هو الطريق الصحيح، مشكلة HC السابقة أخيرًا تم حلها
---
ما هو مبدأ قيد التشكيل، هل يمكنك شرحه بشكل مبسط للناس العاديين
---
مرة أخرى، هو ابتكار في الهيكلية، مع مراعاة الأداء، هذه المجموعة من الأساليب فعلاً جيدة
---
أخيرًا، وجد شخص ما حلاً لمشكلة انهيار التدريب، إعجاب
---
أشعر أن الطريق المتمثل في تراكم المعلمات أكثر موثوقية بكثير
---
هل لديك بيانات محددة حول تحسين القدرة على التعميم، أم أن الأمر يتطلب انتظار تفاصيل الورقة العلمية مرة أخرى
---
الأشياء التي شارك فيها ليانغ ونفنغ، نظرة سريعة عليها تظهر أنها ذات طابع خاص
---
إعادة التفكير من مستوى الهيكلية، هذا هو التقدم الحقيقي في التقنية
---
أشعر أن سقف الصناعة قد تم رفعه مرة أخرى إلى مستوى أعلى
---
التدريب المستقر هو حقًا مشكلة كبيرة، إذا تم حلها بشكل كامل سيكون أمرًا رائعًا
هذه المرة، DeepSeek فعلاً فكر في مستوى الخوارزمية، وليس مجرد تراكم المعلمات
الورقة التي شارك فيها ليانغ وينفنغ مختلفة تمامًا، لقد تم كسر حاجز الاستقرار بعد فترة طويلة
أن يكون الأداء مستقرًا وسريعًا ودقيقًا، هذه هي الثلاث كلمات التي يجب على الصناعة أن تتأمل فيها
هذه هي الابتكار الحقيقي، وليس تلك الدعايات الفارغة والسطحية
الركض بثبات، بسرعة، ودقة، يبدو مغريًا جدًا، لكن هل يمكن حقًا التحمل؟
فكرة قيد التقييد المنحني مثيرة للاهتمام، أشعر أنني وجدت الطريق الصحيح
هل مرة أخرى ليانغ وينفنغ يشارك؟ هؤلاء الأشخاص في DeepSeek فعلاً يتنافسون بشدة
هل يمكن تطبيق هذا التحسين في التدريب الفعلي، أم سيظل مجرد نقاش نظري على الورق؟
---
mHC يبدو قويًا حقًا، يجب أن أفهم بشكل جيد تقنية قيد الشكل
---
مرة أخرى DeepSeek، هذا الإيقاع سريع جدًا لدرجة لا تصدق
---
التدريب بدون انهيار هو الحاجة الحقيقية، الأداء القوي بدون فائدة
---
انتظر، كيف يتم تنفيذ بنية الطوبولوجيا الفائقة بشكل محدد؟
---
ثلاثة عناصر أساسية: الثبات، السرعة، الدقة، إذا تمكنوا حقًا من تحقيق ذلك، فذلك يستحق الثناء
---
مقالة أخرى، إنتاجية DeepSeek هذا العام قوية جدًا
---
كيف أعتقد أن قيد الشكل هو تقنية متقدمة...
---
ببساطة، هل تم حل الأخطاء غير المحلولة الآن؟
---
إنها ابتكار في العمارة مرة أخرى، وDeepSeek تعمل بجد حقا
---
قيود المانيفولد؟ يبدو الأمر عميقا، لكن التأثير رائحته حقا
---
من المهم جدا ألا ينهار التدريب، وكانت HC بالفعل عرضة للمشاكل من قبل
---
هل ارتفعت التعميمات والمتانة؟ هذا مختلف جدا
---
اركض بثبات، اركض بسرعة، اركض بدقة، تلخص في جملة واحدة
---
هل يمكن استخدام هذا الشيء للفرق الصغيرة، أم أن المصانع الكبيرة فقط يمكنها استخدامه
---
الطوبولوجيا المترابطة الفائقة تبدو وكأنها تحل المشكلة الأساسية
---
يمكن تحسين كفاءة الحوسبة دون فقدان، وهذا أمر مبتكر حقا
---
DeepSeek سيظهر مرة أخرى، وباقي Home Must لن يستطيع اللحاق