2025-09-19 01:52:05

使用两个 Mac Studio + MLX 🚀 微调 DeepSeek 🐳

我们使用管道并行性将完整的671GB模型分割到两个设备上。

查看原文

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

10人点赞了这条动态

赞赏
10
5
转发
分享

评论

0/400

大鱿鱼讲师

· 20小时前

671g是在搞核弹吗

回复0

LiquidityWizard

· 09-19 02:22

理论上并不理想的并行化，老实说……根据我的计算，效率损失约为31.4%

查看原文回复0

HashBard

· 09-19 02:20

温 Mac 工作室击败 NVIDIA FR...

查看原文回复0

区块链养老院院长

· 09-19 02:14

两台m2就敢炼大模型

回复0

矿难幸存者

· 09-19 02:13

没事折腾跑模型矿难都经历过啥都不怕了

回复0

热门话题查看更多
#美联储降息25个基点
4.7万热度
#BTC战略储备市场影响
4.8万热度
#XRP ETF上线
4.8万热度
#RWA赛道，你押谁
3.8万热度
#Gate Alpha幸運獎池第八期
7123 热度