Finetune DeepSeek 🐳 dengan dua Mac Studios + MLX 🚀
Kami menggunakan paralelisme pipeline untuk membagi model lengkap 671GB di dua perangkat.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
9 Suka
Hadiah
9
4
Posting ulang
Bagikan
Komentar
0/400
LiquidityWizard
· 23jam yang lalu
secara teoritis paralelisasi suboptimal sejujurnya... kehilangan efisiensi ~31,4% menurut perhitungan saya
Lihat AsliBalas0
HashBard
· 23jam yang lalu
wen mac studio beats nvidia fr...
Balas0
BlockchainRetirementHome
· 23jam yang lalu
Dua unit m2 berani melatih model besar
Lihat AsliBalas0
MiningDisasterSurvivor
· 23jam yang lalu
Tidak masalah bermain-main dengan model, Bencana Tambang sudah pernah dialami, jadi tidak takut lagi.
Finetune DeepSeek 🐳 dengan dua Mac Studios + MLX 🚀
Kami menggunakan paralelisme pipeline untuk membagi model lengkap 671GB di dua perangkat.