Bu araştırmadaki harika çalışmanız için tebrikler!
Yine de, bunun en son modellerin gerçekten neler yapabileceğini tam olarak yansıttığını düşünmüyorum. Benim görüşüm? Hem r1 hem de açık kaynaklı GPT varyantları, bu özel görevleri yerine getirme konusunda daha yeni Claude iterasyonlarının *belirgin şekilde* gerisinde kalıyor. Performans farkı, insanların bekleyebileceğinden daha belirgin—özellikle incelikli akıl yürütme senaryolarında. Burada yetenek eğrilerinde gerçek bir ayrışma görüyoruz.
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
8 Likes
Reward
8
4
Repost
Share
Comment
0/400
OnchainDetective
· 4h ago
Katılmıyorum, Claude bu sefer gerçekten güçlü ama R1'in akıl yürütme yeteneği hafife alınıyor gibi.
View OriginalReply0
MidnightTrader
· 4h ago
nah claude gerçekten diğerlerini dövüyor, r1 o tuzağı tamamen abartmış.
View OriginalReply0
NFTFreezer
· 4h ago
nah claude gerçekten harika, r1 o tuzak için açıkçası biraz abartılmış.
View OriginalReply0
LuckyHashValue
· 4h ago
nah claude gerçekten ezdi, r1 o tuzak biraz abartıldı
Bu araştırmadaki harika çalışmanız için tebrikler!
Yine de, bunun en son modellerin gerçekten neler yapabileceğini tam olarak yansıttığını düşünmüyorum. Benim görüşüm? Hem r1 hem de açık kaynaklı GPT varyantları, bu özel görevleri yerine getirme konusunda daha yeni Claude iterasyonlarının *belirgin şekilde* gerisinde kalıyor. Performans farkı, insanların bekleyebileceğinden daha belirgin—özellikle incelikli akıl yürütme senaryolarında. Burada yetenek eğrilerinde gerçek bir ayrışma görüyoruz.