Bien que je soutienne que cela ne rend pas tout à fait compte de ce que les modèles de pointe peuvent vraiment faire. Mon avis ? Les r1 et les variantes GPT open-source sont *significativement* en retard par rapport aux nouvelles itérations de Claude en ce qui concerne la gestion de ces tâches spécifiques. L'écart de performance est plus prononcé que ce que les gens pourraient attendre, en particulier dans des scénarios de raisonnement nuancé. Nous observons ici une véritable divergence dans les courbes de capacité.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
8 J'aime
Récompense
8
4
Reposter
Partager
Commentaire
0/400
OnchainDetective
· Il y a 4h
Je ne suis pas trop d'accord, Claude a effectivement été impressionnant cette fois-ci, mais les capacités de raisonnement de R1 ont été sous-estimées, non ?
Voir l'originalRépondre0
MidnightTrader
· Il y a 4h
nah claude est vraiment au-dessus des autres, la piège r1 était purement exagérée.
Voir l'originalRépondre0
NFTFreezer
· Il y a 4h
nah claude est vraiment incroyable, pour être honnête, le piège de r1 a été un peu surestimé.
Voir l'originalRépondre0
LuckyHashValue
· Il y a 4h
nah claude vraiment écrase, la piège r1 a été un peu trop exagérée.
Excellent travail sur cette recherche !
Bien que je soutienne que cela ne rend pas tout à fait compte de ce que les modèles de pointe peuvent vraiment faire. Mon avis ? Les r1 et les variantes GPT open-source sont *significativement* en retard par rapport aux nouvelles itérations de Claude en ce qui concerne la gestion de ces tâches spécifiques. L'écart de performance est plus prononcé que ce que les gens pourraient attendre, en particulier dans des scénarios de raisonnement nuancé. Nous observons ici une véritable divergence dans les courbes de capacité.