Aperfeiçoe o DeepSeek 🐳 com duas Mac Studios + MLX 🚀
Usamos paralelismo de pipeline para dividir o modelo completo de 671GB entre dois dispositivos.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
10 Curtidas
Recompensa
10
5
Repostar
Compartilhar
Comentário
0/400
SquidTeacher
· 14h atrás
671g está a fazer uma bomba nuclear?
Ver originalResponder0
LiquidityWizard
· 09-19 02:22
teoricamente paralelização subótima para ser honesto... perda de eficiência ~31,4% pelos meus cálculos
Ver originalResponder0
HashBard
· 09-19 02:20
wen mac studio beats nvidia fr...
Responder0
BlockchainRetirementHome
· 09-19 02:14
Duas máquinas m2 já se atrevem a treinar grandes modelos
Ver originalResponder0
MiningDisasterSurvivor
· 09-19 02:13
Não tem problema, estou a experimentar correr modelos. Já passei por um desastre na mina, por isso não tenho medo de nada.
Aperfeiçoe o DeepSeek 🐳 com duas Mac Studios + MLX 🚀
Usamos paralelismo de pipeline para dividir o modelo completo de 671GB entre dois dispositivos.