Тонкая настройка DeepSeek 🐳 с двумя Mac Studios + MLX 🚀



Мы используем параллелизм по конвейеру, чтобы разделить полную модель размером 671 ГБ между двумя устройствами.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 4
  • Репост
  • Поделиться
комментарий
0/400
LiquidityWizardvip
· 23ч назад
теоретически субоптимальная параллелизация, честно говоря... потеря эффективности ~31.4% по моим расчетам
Посмотреть ОригиналОтветить0
HashBardvip
· 23ч назад
вен мак студио биты нвидиа фр...
Посмотреть ОригиналОтветить0
BlockchainRetirementHomevip
· 23ч назад
Две машины m2 осмеливаются тренировать большие модели
Посмотреть ОригиналОтветить0
MiningDisasterSurvivorvip
· 23ч назад
Ничего страшного, занимаюсь моделированием, Катастрофа майнинга уже пережил, ничего не страшно.
Посмотреть ОригиналОтветить0
  • Закрепить