想過Grok-4飽和GPQA嗎?還沒!



同樣的問題,當以自由形式評估時,Grok-4 並不比其較小的模型更好。
GROK-8.37%
NOT-13.26%
FORM1-5.49%
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 9
  • 分享
留言
0/400
破产打工人vip
· 07-14 15:30
建议重训练咯
回復0
跑路预警官vip
· 07-13 22:15
饱和就完蛋!
回復0
Web3产品经理vip
· 07-13 19:20
兄弟,grok-4 的增长曲线显示出经典的收益递减迹象……就像每个第一季度的 SaaS 产品一样
查看原文回復0
MEVSandwichMakervip
· 07-11 21:24
这不就是套皮的LLM
回復0
OneBlockAtATimevip
· 07-11 21:23
大的也翻车 狠狠打脸
回復0
GasWranglervip
· 07-11 21:22
啧.. 典型的过度炒作模型扩展,没有实证的吞吐量提升
查看原文回復0
签名焦虑症vip
· 07-11 21:16
坐等跑个分看看呗
回復0
汤米老师vip
· 07-11 21:16
呵 还以为能吊打其他模型呢
回復0
Degen4Breakfastvip
· 07-11 21:09
啧 还不如LLAMA-2呢
回復0
查看更多
交易,隨時隨地
qrCode
掃碼下載 Gate APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)