Apakah Grok-4 sudah menjenuhkan GPQA? Belum!



Pertanyaan yang sama, ketika dievaluasi secara bebas, Grok-4 tidak lebih baik daripada model-modelnya yang lebih kecil.
GROK-8.11%
NOT-12.93%
FORM1-5.83%
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • 9
  • Bagikan
Komentar
0/400
BankruptWorkervip
· 07-14 15:30
Disarankan untuk melakukan pelatihan ulang.
Lihat AsliBalas0
RugpullAlertOfficervip
· 07-13 22:15
Jenuh sudah selesai!
Lihat AsliBalas0
Web3ProductManagervip
· 07-13 19:20
bruh kurva pertumbuhan di grok-4 menunjukkan tanda-tanda klasik dari pengembalian yang semakin menurun... sama seperti setiap produk saas q1
Lihat AsliBalas0
MEVSandwichMakervip
· 07-11 21:24
Ini bukan jebakan kulit LLM
Lihat AsliBalas0
OneBlockAtATimevip
· 07-11 21:23
Besar juga mengalami kegagalan, sangat menyakitkan.
Lihat AsliBalas0
GasWranglervip
· 07-11 21:22
pfft.. model skala yang terlalu dipromosikan tanpa keuntungan throughput yang empiris
Lihat AsliBalas0
SignatureAnxietyvip
· 07-11 21:16
Duduk menunggu untuk melihat hasilnya.
Lihat AsliBalas0
TommyTeachervip
· 07-11 21:16
Hah, saya pikir bisa mengalahkan model lain.
Lihat AsliBalas0
Degen4Breakfastvip
· 07-11 21:09
Zeh, lebih baik LLAMA-2.
Lihat AsliBalas0
Lihat Lebih Banyak
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)