Aperfeiçoe o DeepSeek 🐳 com duas Mac Studios + MLX 🚀
Usamos paralelismo de pipeline para dividir o modelo completo de 671GB entre dois dispositivos.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
9 gostos
Recompensa
9
4
Republicar
Partilhar
Comentar
0/400
LiquidityWizard
· 23h atrás
teoricamente paralelização subótima para ser honesto... perda de eficiência ~31,4% pelos meus cálculos
Ver originalResponder0
HashBard
· 23h atrás
wen mac studio beats nvidia fr...
Responder0
BlockchainRetirementHome
· 23h atrás
Duas máquinas m2 já se atrevem a treinar grandes modelos
Ver originalResponder0
MiningDisasterSurvivor
· 23h atrás
Não tem problema, estou a experimentar correr modelos. Já passei por um desastre na mina, por isso não tenho medo de nada.
Aperfeiçoe o DeepSeek 🐳 com duas Mac Studios + MLX 🚀
Usamos paralelismo de pipeline para dividir o modelo completo de 671GB entre dois dispositivos.