Grok-4 GPQA'yı doyurdu mu? Henüz değil!



Aynı sorular, serbest biçimde değerlendirildiğinde, Grok-4 daha küçük modellerinden daha iyi değildir.
GROK3.51%
NOT3.31%
FORM1-8.27%
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • 9
  • Share
Comment
0/400
BankruptWorkervip
· 07-14 15:30
Yeniden eğitim öneriyorum.
View OriginalReply0
RugpullAlertOfficervip
· 07-13 22:15
Doymuşsan bitti!
View OriginalReply0
Web3ProductManagervip
· 07-13 19:20
bruh grok-4 üzerindeki büyüme eğrisi klasik azalan getiri belirtileri gösteriyor... tıpkı her q1 saas ürünü gibi
View OriginalReply0
MEVSandwichMakervip
· 07-11 21:24
Bu, tuzaklı LLM değil mi?
View OriginalReply0
OneBlockAtATimevip
· 07-11 21:23
Büyükler de devrildi, sert bir şekilde yüzümüze vurdu.
View OriginalReply0
GasWranglervip
· 07-11 21:22
pfft.. tipik olarak ampirik verim artışı olmadan abartılan model ölçeklendirme
View OriginalReply0
SignatureAnxietyvip
· 07-11 21:16
Biraz bekleyip puanları görmek iyi olur.
View OriginalReply0
TommyTeachervip
· 07-11 21:16
Heh, diğer modelleri geride bırakabileceğini sanıyordum.
View OriginalReply0
Degen4Breakfastvip
· 07-11 21:09
Tüh, LLAMA-2'den daha iyi değil.
View OriginalReply0
View More
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate app
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)