扫码下载 APP
qrCode
更多下载方式
今天不再提醒

在这项研究上做得很好!



不过我认为这并没有完全体现出前沿模型真正能够做到的。我的看法是,在处理这些特定任务时,r1 和开源的 GPT 变体都*显著*落后于更新的 Claude 迭代。性能差距比人们预期的要明显,尤其是在细致推理的场景中。我们在这里看到能力曲线的真实分歧。
查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 4
  • 转发
  • 分享
评论
0/400
链上资深福尔摩斯vip
· 3小时前
不太赞同诶,claude这波确实猛,但r1的推理能力被低估了吧
回复0
午夜交易员vip
· 3小时前
nah claude真的吊打其他的,r1那一套纯粹过度吹捧了
回复0
NFT大冰箱vip
· 4小时前
nah claude确实绝,r1那套东西说实话有点被吹过头了
回复0
幸运哈希值vip
· 4小时前
nah claude真的碾压,r1那套东西有点被吹过头了
回复0
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)