Остання архітектура Nvidia GB200 NVL72 демонструє переконливі переваги у продуктивності для навантажень штучного інтелекту. Запускаючи модель DeepSeek R1, чіп досягає пропускної здатності 7 707 токенів за секунду — приблизно у 6,5 рази швидше за B200 і значно випереджає конкуренційні рішення, такі як AMD MI355X, який максимум досягає близько 272 токенів за секунду на тому ж бенчмарку. Ця ефективність пропускної здатності важлива для масштабних операцій інференції, де метрики токенів за секунду безпосередньо впливають на економіку розгортання. Розрив у продуктивності для обчислень з піковою потужністю ще більше зростає, при цьому NVL72 забезпечує до 28 разів переваги у продуктивності. Для GPU-інтенсивних застосувань у криптовалютній сфері — будь то обслуговування моделей, обробка даних або обчислювальна валідація — ці покращення чипсету суттєво змінюють співвідношення вартості до обчислень.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
12 лайків
Нагородити
12
5
Репост
Поділіться
Прокоментувати
0/400
TokenCreatorOP
· 01-07 21:04
ngl цього разу nvdia дійсно вразила, 28-кратна різниця у продуктивності, AMD — кров'ю їсть землю
DeepSeek працює так швидко, знизилися витрати на обчислення, скільки ж можна зекономити... Саме тому всі скуповують GPU
Гонка за обчислювальні потужності у криптовалютному світі знову посилилася, хто не має трохи nvdia — той відстає
7707 токенів, хей, цю цифру я маю зберегти, щоб потім похвалитися
28 разів, друзі, я прямо зараз куплю акції nvidia
Переглянути оригіналвідповісти на0
HodlTheDoor
· 01-05 18:55
nvidia знову виграла, amd дійсно не справляється, як наздогнати різницю у 28 разів
Переглянути оригіналвідповісти на0
DarkPoolWatcher
· 01-05 18:49
nvidia ця хвиля GB200 дійсно вражає, deepseek працює дуже швидко... але чи не здається вам, що цифра 28 разів трохи перебільшена?
---
6.5 рази швидше за B200 — це дійсно комфортно, AMD цього разу був побитий... у криптовалютному світі, хто займається обчислювальною потужністю, ймовірно, вже змінює чіпи
---
Зачекайте, чи дійсно token/s може безпосередньо визначати вартість розгортання? Здається, ще потрібно враховувати споживану потужність
---
Якщо б у криптовалютному світі використовували цю річ для верифікації, скільки б це зекономило... хтось рахував?
---
Я просто хочу знати, коли можна буде купити NVL72, зараз конкуренція за чіпи як за Маотай
---
Як рахується 28-кратна пікова потужність, різні бенчмарки, правильно? Здається, цей порівняльний показник трохи перебільшений
---
deepseek працює так швидко... але для майнерів головне — співвідношення потужності та споживання, без цих даних усе марно
Переглянути оригіналвідповісти на0
AllInDaddy
· 01-05 18:38
Різниця у продуктивності NVL72 така велика, що AMD доведеться плакати... Але повертаючись до питання, чи справді цей чіп може знизити витрати на розгортання моделей? Чи це знову просто маркетинг?
Переглянути оригіналвідповісти на0
MidnightSnapHunter
· 01-05 18:26
Nvidia цього разу справді серйозна, з понад 7000 токенів/с прямо переважає AMD, але чесно кажучи, вартість розгортання все ще залежить від подальшого ланцюга постачання чіпів.
Остання архітектура Nvidia GB200 NVL72 демонструє переконливі переваги у продуктивності для навантажень штучного інтелекту. Запускаючи модель DeepSeek R1, чіп досягає пропускної здатності 7 707 токенів за секунду — приблизно у 6,5 рази швидше за B200 і значно випереджає конкуренційні рішення, такі як AMD MI355X, який максимум досягає близько 272 токенів за секунду на тому ж бенчмарку. Ця ефективність пропускної здатності важлива для масштабних операцій інференції, де метрики токенів за секунду безпосередньо впливають на економіку розгортання. Розрив у продуктивності для обчислень з піковою потужністю ще більше зростає, при цьому NVL72 забезпечує до 28 разів переваги у продуктивності. Для GPU-інтенсивних застосувань у криптовалютній сфері — будь то обслуговування моделей, обробка даних або обчислювальна валідація — ці покращення чипсету суттєво змінюють співвідношення вартості до обчислень.