Tam 671GB'lık modeli iki cihaz arasında bölmek için pipeline paralelliği kullanıyoruz.
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
10 Likes
Reward
10
5
Repost
Share
Comment
0/400
SquidTeacher
· 21h ago
671g nükleer silah mı yapıyor?
View OriginalReply0
LiquidityWizard
· 09-19 02:22
teorik olarak alt-optimale paralelleştirme açıkçası... verim kaybı ~%31.4 hesaplarıma göre
View OriginalReply0
HashBard
· 09-19 02:20
wen mac studio beats nvidia fr...
Reply0
BlockchainRetirementHome
· 09-19 02:14
İki m2 ile büyük modelleri eğitmeye cesaret ediyorsunuz.
View OriginalReply0
MiningDisasterSurvivor
· 09-19 02:13
Sorun değil, model çalıştırmakla meşgulüm. Maden faciası yaşadım, artık hiçbir şeyden korkmuyorum.
Finetune DeepSeek 🐳 ile iki Mac Studio + MLX 🚀
Tam 671GB'lık modeli iki cihaz arasında bölmek için pipeline paralelliği kullanıyoruz.