Тонкая настройка DeepSeek 🐳 с двумя Mac Studios + MLX 🚀



Мы используем параллелизм по конвейеру, чтобы разделить полную модель размером 671 ГБ между двумя устройствами.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 5
  • Репост
  • Поделиться
комментарий
0/400
SquidTeachervip
· 18ч назад
671g это для ядерной бомбы?
Посмотреть ОригиналОтветить0
LiquidityWizardvip
· 09-19 02:22
теоретически субоптимальная параллелизация, честно говоря... потеря эффективности ~31.4% по моим расчетам
Посмотреть ОригиналОтветить0
HashBardvip
· 09-19 02:20
вен мак студио биты нвидиа фр...
Посмотреть ОригиналОтветить0
BlockchainRetirementHomevip
· 09-19 02:14
Две машины m2 осмеливаются тренировать большие модели
Посмотреть ОригиналОтветить0
MiningDisasterSurvivorvip
· 09-19 02:13
Ничего страшного, занимаюсь моделированием, Катастрофа майнинга уже пережил, ничего не страшно.
Посмотреть ОригиналОтветить0
  • Закрепить