Фьючерсы
Доступ к сотням фьючерсов
TradFi
Золото
Одна платформа мировых активов
Опционы
Hot
Торги опционами Vanilla в европейском стиле
Единый счет
Увеличьте эффективность вашего капитала
Демо-торговля
Введение в торговлю фьючерсами
Подготовьтесь к торговле фьючерсами
Фьючерсные события
Получайте награды в событиях
Демо-торговля
Используйте виртуальные средства для торговли без риска
Запуск
CandyDrop
Собирайте конфеты, чтобы заработать аирдропы
Launchpool
Быстрый стейкинг, заработайте потенциальные новые токены
HODLer Airdrop
Удерживайте GT и получайте огромные аирдропы бесплатно
Launchpad
Будьте готовы к следующему крупному токен-проекту
Alpha Points
Торгуйте и получайте аирдропы
Фьючерсные баллы
Зарабатывайте баллы и получайте награды аирдропа
Инвестиции
Simple Earn
Зарабатывайте проценты с помощью неиспользуемых токенов
Автоинвест.
Автоинвестиции на регулярной основе.
Бивалютные инвестиции
Доход от волатильности рынка
Мягкий стейкинг
Получайте вознаграждения с помощью гибкого стейкинга
Криптозаймы
0 Fees
Заложите одну криптовалюту, чтобы занять другую
Центр кредитования
Единый центр кредитования
DeepSeek в начале года опубликовала новую работу «mHC: Manifold-Constrained Hyper-Connections», в которой также принял участие основатель Лян Вэньфэн. Это глубокая и понятная статья о технологиях базовой архитектуры, основные моменты можно понять так:
Во-первых, стабильность обучения больших моделей значительно повысилась. Ранее HC (усовершенствованная версия остаточных связей) действительно показывал впечатляющие результаты, но имел один недостаток — процесс обучения легко срывался. mHC решает эту проблему с помощью механизма ограничения на многообразие, что позволяет модели сохранять стабильность обучения при более глубокой структурной оптимизации.
Во-вторых, это не просто наращивание производительности, а переосмысление с точки зрения базовой архитектуры. Ввод новой топологической структуры гипер-связей позволяет одновременно сохранять вычислительную эффективность и повышать обобщающую способность и устойчивость модели.
Проще говоря, mHC — это способ сделать большие модели одновременно стабильными, быстрыми и точными. Это имеет определенное значение для направления оптимизации моделей в всей индустрии.
---
Этот набор ограничений на многообразия, кажется, наконец-то кто-то заполнил пробелы HC
---
Лян Вэньфэн снова замышляет что-то, у этой идеи есть потенциал
---
Это не просто наращивание производительности, а переработка архитектуры — вот настоящая сила
---
Подождите, так говоря, mHC — это "отличник" среди больших моделей?
---
Оптимизация топологической структуры выглядит многообещающе
---
Главное — чтобы обучение не срывало, и проблема HC наконец решена
---
Механизм ограничения многообразия — как он работает, может объяснить обычным людям?
---
Это и инновационная архитектура, и баланс производительности, эта комбинация действительно хороша
---
Проблема с сбоем обучения наконец-то решена, лайк
---
Чувствую, что путь с наращиванием параметров гораздо надежнее
---
Есть ли конкретные данные по улучшению обобщающей способности, или снова придется ждать деталей статьи?
---
Вещи, в которых участвовал Лян Вэньфэн, при беглом взгляде уже чувствуется его стиль
---
Переосмысление с архитектурной точки зрения — это действительно прогресс в технологиях
---
Чувствую, что потолок индустрии снова поднялся на новый уровень
---
Стабильное обучение — действительно большая проблема, было бы здорово, если бы это удалось решить полностью
DeepSeek в этот раз действительно подумал на уровне алгоритмов, а не просто наращивал параметры
Статья с участием Лян Вэньфэна — это нечто особенное, стабильность, которая так долго казалась недостижимой, наконец-то достигнута
Работает стабильно, быстро и точно — всего три слова, и всей индустрии стоит задуматься
Это настоящее инновационное достижение, а не пустые слова и реклама
Быстрое и стабильное выполнение, точность — звучит очень заманчиво, но действительно ли можно это удержать
Идея с ограничением на многообразие кажется интересной, кажется, что нашли подход
Опять участвует Лян Вэньфэн? Команда DeepSeek действительно очень конкурентоспособна
Кстати, смогут ли такие улучшения быть реализованы в реальных тренировках, а не останутся лишь на бумаге в виде научных статей
---
mHC выглядит очень жестоко, и мне нужно понять трюк с ограничениями многообразия
---
Это снова DeepSeek, этот ритм действительно невероятно быстрый
---
Тренировки действительно необходимы, независимо от того, насколько сильны результаты
---
Постойте, а как именно реализуется топология гиперсвязи?
---
Стабильный, быстрый и почти тройный, если вы действительно можете это сделать, стоит похвастаться
---
Ещё одна статья, выпуск DeepSeek в этом году, довольно яркий
---
Как ограничения многообразия ощущаются как чёрная технология...
---
Говоря прямо, нерешённая ошибка теперь решена
---
Это полезно для маленьких моделей или это просто хорошие новости для крупных?
---
Опять архитектурные инновации, DeepSeek действительно вкладывает силы
---
Ограничение многообразия? Звучит сложно, но эффект действительно впечатляет
---
Ключевым является обучение без сбоев, ранее HC действительно часто возникали проблемы
---
Обобщение и устойчивость улучшились? Тогда это действительно другое дело
---
Работает стабильно, быстро и точно, коротко и ясно — отлично подытожено
---
Можно ли это использовать небольшой команде, или только крупные компании смогут применить
---
Топология сверхсоединений кажется серьезным решением базовых проблем
---
Эффективность вычислений не падает, а производительность повышается — вот настоящее инновационное решение
---
DeepSeek снова собирается в бой, остальные компании должны ли поспевать