使用两个 Mac Studio + MLX 🚀 微调 DeepSeek 🐳



我们使用管道并行性将完整的671GB模型分割到两个设备上。
查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 5
  • 转发
  • 分享
评论
0/400
大鱿鱼讲师vip
· 20小时前
671g是在搞核弹吗
回复0
LiquidityWizardvip
· 09-19 02:22
理论上并不理想的并行化,老实说……根据我的计算,效率损失约为31.4%
查看原文回复0
HashBardvip
· 09-19 02:20
温 Mac 工作室击败 NVIDIA FR...
查看原文回复0
区块链养老院院长vip
· 09-19 02:14
两台m2就敢炼大模型
回复0
矿难幸存者vip
· 09-19 02:13
没事折腾跑模型 矿难都经历过啥都不怕了
回复0
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)