2025-09-19 01:52:05

Aperfeiçoe o DeepSeek 🐳 com duas Mac Studios + MLX 🚀

Usamos paralelismo de pipeline para dividir o modelo completo de 671GB entre dois dispositivos.

Ver original

Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.

10 Curtidas

Recompensa
10
5
Repostar
Compartilhar

Comentário

0/400

SquidTeacher

· 14h atrás

671g está a fazer uma bomba nuclear?

Ver originalResponder0

LiquidityWizard

· 09-19 02:22

teoricamente paralelização subótima para ser honesto... perda de eficiência ~31,4% pelos meus cálculos

Ver originalResponder0

HashBard

· 09-19 02:20

wen mac studio beats nvidia fr...

Responder0

BlockchainRetirementHome

· 09-19 02:14

Duas máquinas m2 já se atrevem a treinar grandes modelos

Ver originalResponder0

MiningDisasterSurvivor

· 09-19 02:13

Não tem problema, estou a experimentar correr modelos. Já passei por um desastre na mina, por isso não tenho medo de nada.

Ver originalResponder0

TendênciasVer projetos
#Fed Cuts Rates By 25 Bps
48.7K Popularidade
#BTC Reserve Market Impact
49.3K Popularidade
#XRP ETF Goes Live
49.3K Popularidade
#My Pick In RWA
38.3K Popularidade
#Gate Alpha Lucky Pool Phase 8
6.9K Popularidade

Marcar