Ф'ючерси
Сотні безстрокових контрактів
TradFi
Золото
Одна платформа для світових активів
Опціони
Hot
Торгівля ванільними опціонами європейського зразка
Єдиний рахунок
Максимізуйте ефективність вашого капіталу
Демо торгівля
Вступ до ф'ючерсної торгівлі
Підготуйтеся до ф’ючерсної торгівлі
Ф'ючерсні події
Заробляйте, беручи участь в подіях
Демо торгівля
Використовуйте віртуальні кошти для безризикової торгівлі
Запуск
CandyDrop
Збирайте цукерки, щоб заробити аірдропи
Launchpool
Швидкий стейкінг, заробляйте нові токени
HODLer Airdrop
Утримуйте GT і отримуйте масові аірдропи безкоштовно
Launchpad
Будьте першими в наступному великому проекту токенів
Alpha Поінти
Ончейн-торгівля та аірдропи
Ф'ючерсні бали
Заробляйте фʼючерсні бали та отримуйте аірдроп-винагороди
Інвестиції
Simple Earn
Заробляйте відсотки за допомогою неактивних токенів
Автоінвестування
Автоматичне інвестування на регулярній основі
Подвійні інвестиції
Прибуток від волатильності ринку
Soft Staking
Earn rewards with flexible staking
Криптопозика
0 Fees
Заставте одну криптовалюту, щоб позичити іншу
Центр кредитування
Єдиний центр кредитування
Центр багатства VIP
Преміальні плани зростання капіталу
Управління приватним капіталом
Розподіл преміальних активів
Квантовий фонд
Квантові стратегії найвищого рівня
Стейкінг
Стейкайте криптовалюту, щоб заробляти на продуктах PoS
Розумне кредитне плече
Кредитне плече без ліквідації
Випуск GUSD
Мінтинг GUSD для прибутку RWA
DeepSeek на початку року опублікував новий документ «mHC: Manifold-Constrained Hyper-Connections», у створенні якого також брав участь засновник Лян Веньфен. Це глибока та доступна стаття про технології нижнього рівня архітектури, основні моменти яких можна зрозуміти так:
По-перше, стабільність тренування великих моделей значно покращилася. Попередній HC (оновлена версія залишкових з'єднань) дійсно був потужним, але мав один недолік — процес тренування легко руйнувався. mHC вирішує цю проблему за допомогою механізму обмеження на многовимірність, що дозволяє моделі зберігати стабільність під час глибшої структурної оптимізації.
По-друге, це не просто накопичення показників, а переосмислення з точки зору базової архітектури. Вводячи нову топологію супер-з'єднань, яка зберігає обчислювальну ефективність, модель покращує здатність до узагальнення та стійкість.
Простими словами, mHC — це дозволяє великим моделям бути стабільними, швидкими та точними одночасно. Це має певне значення для напрямку оптимізації моделей у всій галузі.
---
Що стосується обмежень маніфольду, здається, нарешті хтось заповнив цю прогалину у HC
---
Лян Веньфенг знову щось замишляє, ця ідея досить цікава
---
Не просто нагромадження продуктивності, а нова архітектура — ось справжня сила
---
Зачекайте, так кажучи, mHC — це "зразковий учень" великої моделі?
---
Що стосується оптимізації топологічної структури, виглядає досить перспективно
---
Головне — щоб тренування не зірвалося, і проблема HC нарешті вирішена
---
Який принцип лежить в основі обмежень маніфольду, можете пояснити простим людям?
---
Знову інновації в архітектурі та баланс у продуктивності — ця комбінація дійсно хороша
---
Нарешті хтось взявся за проблему краху тренування, лайк
---
Відчувається, що цей шлях з накопиченням параметрів набагато надійніший
---
Чи є конкретні дані щодо підвищення здатності до узагальнення, чи знову чекати деталей статті?
---
Що стосується участі Лян Веньфена, навіть швидкий огляд дає відчуття справжності
---
Переглянути з архітектурної точки зору — ось справжній прогрес у технологіях
---
Відчувається, що межа галузі знову піднялася на новий рівень
---
Стабільне тренування справді велика проблема, було б круто, якби це вдалося вирішити кардинально
DeepSeek цього разу дійсно замислився на рівні алгоритмів, а не просто накопиченням параметрів
Стаття, у якій брав участь Лян Веньфен, відрізняється, стабільність — нарешті подолана після такої довгої боротьби
Зі стабільністю, швидкістю та точністю — саме ці три слова, вся індустрія має задуматися
Це справжнє новаторство, а не ті порожні рекламні слова
Бігти стабільно, швидко і точно — звучить досить привабливо, але чи справді зможе триматися?
Ідея з обмеженнями на многовимірні простори цікава, здається, знайшли правильний шлях
Знову залучений Лян Веньфен? Команда DeepSeek справді дуже наполеглива
До речі, чи зможе цей покращений підхід бути застосований у реальному тренуванні, а не залишитися на папері?
---
mHC виглядає дуже безжально, і я маю зрозуміти трюк з обмеженням у многообразі
---
Знову DeepSeek, цей ритм справді неймовірно швидкий
---
Тренування справді потрібне, незалежно від того, наскільки сильні результати
---
Зачекайте, а як саме реалізується топологія гіперзв'язку?
---
Стабільно, швидко і майже трійця — якщо ви справді можете це зробити, варто похвалитися
---
Ще одна стаття — DeepSeek цього року — досить жорстка публікація
---
Як обмеження в колекторах відчуваються як чорна технологія...
---
Говорячи прямо, невирішена помилка тепер вирішена
---
Чи корисна ця штука для маленьких моделей, чи це просто хороша новина для великих?
---
Знову архітектурні інновації, DeepSeek дійсно вкладає зусилля
---
Обмеження маніфольду? Звучить складно, але ефект дійсно класний
---
Ключовим є те, що тренування не зривається, раніше HC дійсно був схильний до проблем
---
Загальна здатність до узагальнення та стійкість покращилися? Тоді це дійсно щось інше
---
Робота стабільна, швидка та точна, коротко кажучи — це геніально
---
Чи можна цю технологію застосувати невеликим командам, чи вона підходить лише великим корпораціям
---
Відчуття, що топологія суперзв’язків справді вирішує базові проблеми
---
Обчислювальна ефективність не знижується, а ще й підвищує продуктивність, ось справжня інновація
---
DeepSeek знову збирається підняти хвилю, інші компанії мають йти в ногу або ні