Aperfeiçoe o DeepSeek 🐳 com duas Mac Studios + MLX 🚀
Usamos paralelismo de pipeline para dividir o modelo completo de 671GB entre dois dispositivos.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
9 Curtidas
Recompensa
9
4
Repostar
Compartilhar
Comentário
0/400
LiquidityWizard
· 23h atrás
teoricamente paralelização subótima para ser honesto... perda de eficiência ~31,4% pelos meus cálculos
Ver originalResponder0
HashBard
· 23h atrás
wen mac studio beats nvidia fr...
Responder0
BlockchainRetirementHome
· 23h atrás
Duas máquinas m2 já se atrevem a treinar grandes modelos
Ver originalResponder0
MiningDisasterSurvivor
· 23h atrás
Não tem problema, estou a experimentar correr modelos. Já passei por um desastre na mina, por isso não tenho medo de nada.
Aperfeiçoe o DeepSeek 🐳 com duas Mac Studios + MLX 🚀
Usamos paralelismo de pipeline para dividir o modelo completo de 671GB entre dois dispositivos.