2025-09-19 01:52:05

Тонкая настройка DeepSeek 🐳 с двумя Mac Studios + MLX 🚀

Мы используем параллелизм по конвейеру, чтобы разделить полную модель размером 671 ГБ между двумя устройствами.

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .

10 Лайков

Награда
10
5
Репост
Поделиться

комментарий

0/400

SquidTeacher

· 18ч назад

671g это для ядерной бомбы?

Посмотреть ОригиналОтветить0

LiquidityWizard

· 09-19 02:22

теоретически субоптимальная параллелизация, честно говоря... потеря эффективности ~31.4% по моим расчетам

Посмотреть ОригиналОтветить0

HashBard

· 09-19 02:20

вен мак студио биты нвидиа фр...

Посмотреть ОригиналОтветить0

BlockchainRetirementHome

· 09-19 02:14

Две машины m2 осмеливаются тренировать большие модели

Посмотреть ОригиналОтветить0

MiningDisasterSurvivor

· 09-19 02:13

Ничего страшного, занимаюсь моделированием, Катастрофа майнинга уже пережил, ничего не страшно.

Посмотреть ОригиналОтветить0

Популярные темыПодробнее
#Fed Cuts Rates By 25 Bps
42K Популярность
#BTC Reserve Market Impact
49.9K Популярность
#XRP ETF Goes Live
48.3K Популярность
#My Pick In RWA
38.3K Популярность
#Gate Alpha Lucky Pool Phase 8
7.1K Популярность

Закрепить

Карта сайта