Finetune DeepSeek 🐳 dengan dua Mac Studios + MLX 🚀
Kami menggunakan paralelisme pipeline untuk membagi model lengkap 671GB di dua perangkat.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
11 Suka
Hadiah
11
5
Posting ulang
Bagikan
Komentar
0/400
SquidTeacher
· 09-20 07:19
Apakah 671g sedang membuat bom nuklir?
Lihat AsliBalas0
LiquidityWizard
· 09-19 02:22
secara teoritis paralelisasi suboptimal sejujurnya... kehilangan efisiensi ~31,4% menurut perhitungan saya
Lihat AsliBalas0
HashBard
· 09-19 02:20
wen mac studio beats nvidia fr...
Balas0
BlockchainRetirementHome
· 09-19 02:14
Dua unit m2 berani melatih model besar
Lihat AsliBalas0
MiningDisasterSurvivor
· 09-19 02:13
Tidak masalah bermain-main dengan model, Bencana Tambang sudah pernah dialami, jadi tidak takut lagi.
Finetune DeepSeek 🐳 dengan dua Mac Studios + MLX 🚀
Kami menggunakan paralelisme pipeline untuk membagi model lengkap 671GB di dua perangkat.