Тонке налаштування DeepSeek 🐳 з двома Mac Studios + MLX 🚀
Ми використовуємо паралелізм конвеєра для розподілу повної моделі обсягом 671 ГБ між двома пристроями.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
10 лайків
Нагородити
10
5
Репост
Поділіться
Прокоментувати
0/400
SquidTeacher
· 18год тому
671g це для ядерної зброї?
Переглянути оригіналвідповісти на0
LiquidityWizard
· 09-19 02:22
теоретично субоптимальна паралелізація, чесно кажучи... втрати ефективності ~31.4% за моїми розрахунками
Переглянути оригіналвідповісти на0
HashBard
· 09-19 02:20
Wen Mac Studio перемагає NVIDIA FR...
Переглянути оригіналвідповісти на0
BlockchainRetirementHome
· 09-19 02:14
Дві машини m2 наважуються на великі моделі
Переглянути оригіналвідповісти на0
MiningDisasterSurvivor
· 09-19 02:13
Нічого, просто граюся з моделями, Катастрофа майнінгу вже пережив, нічого не боюся.
Тонке налаштування DeepSeek 🐳 з двома Mac Studios + MLX 🚀
Ми використовуємо паралелізм конвеєра для розподілу повної моделі обсягом 671 ГБ між двома пристроями.