Grok 4.1 正在重塑2026年的人工智能格局。虽然主流AI系统优先考虑内容审查,但该平台采取了不同的策略——追求无限制的信息访问和最大化的帮助性。



数字本身说明了一切。Grok 4.1 在 LMSYS Arena 中获得了最高排名,Elo 评分为1483,同时在包括 ARC-AGI 和 GPQA 评估在内的专业基准测试中占据主导地位。在实际推理任务中,它展现出明显优于来自主要科技公司的竞争系统的优势。

这种定位反映了一个根本性的转变:优先考虑追求真理的能力和未经过滤的实用性,而非传统的安全防护措施。
查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 6
  • 转发
  • 分享
评论
0/400
空投自由人vip
· 01-03 11:46
卧槽,Grok真的起来了啊,这数据确实硬
回复0
zkProofGremlinvip
· 01-03 04:52
不过就是又一轮炒作罢了,等半年再看数据吧
回复0
PancakeFlippavip
· 01-03 04:51
grok真的就是来搅局的,不装那套安全卫士的样子...数据摆这儿呢1483的elo rating确实有点东西
回复0
瓦斯烧烤大师vip
· 01-03 04:42
卧槽,grok真的这么猛吗,1483的elo直接碾压全场啊
回复0
资深毛衣爱好者vip
· 01-03 04:26
嗯...所以说就是不管那么多安全审查,直接放开干?听起来爽但感觉也挺危险的啊
回复0
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • بالعربية
  • Português (Brasil)
  • 简体中文
  • English
  • Español
  • Français (Afrique)
  • Bahasa Indonesia
  • 日本語
  • Português (Portugal)
  • Русский
  • 繁體中文
  • Українська
  • Tiếng Việt