Хоча я б стверджував, що це не зовсім передає те, що можуть насправді новітні моделі. Моя думка? І r1, і варіанти GPT з відкритим кодом значно відстають від новіших ітерацій Claude, коли йдеться про виконання цих конкретних завдань. Різниця в продуктивності більш помітна, ніж люди можуть очікувати - особливо в сценаріях з нюансованим міркуванням. Ми спостерігаємо справжнє розходження в кривих можливостей тут.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
8 лайків
Нагородити
8
4
Репост
Поділіться
Прокоментувати
0/400
OnchainDetective
· 4год тому
Не зовсім погоджуюсь, клауд дійсно потужний, але, здається, здатність до міркування r1 недооцінюють.
Переглянути оригіналвідповісти на0
MidnightTrader
· 4год тому
ні, Клод справді перевершує інших, а r1 - це просто надмірне вихваляння.
Переглянути оригіналвідповісти на0
NFTFreezer
· 4год тому
ну, Клод справді крутий, але якщо чесно, те, що стосується r1, трохи перебільшене.
Переглянути оригіналвідповісти на0
LuckyHashValue
· 5год тому
нах, Клауде, це справді розриває, те, що в r1, трохи перебільшено.
Чудова робота над цим дослідженням!
Хоча я б стверджував, що це не зовсім передає те, що можуть насправді новітні моделі. Моя думка? І r1, і варіанти GPT з відкритим кодом значно відстають від новіших ітерацій Claude, коли йдеться про виконання цих конкретних завдань. Різниця в продуктивності більш помітна, ніж люди можуть очікувати - особливо в сценаріях з нюансованим міркуванням. Ми спостерігаємо справжнє розходження в кривих можливостей тут.