¿Pensaste que Grok-4 saturó GPQA? ¡Aún no!



Las mismas preguntas, cuando se evalúan de forma libre, Grok-4 no es mejor que sus modelos más pequeños.
GROK0.33%
NOT2.35%
FORM1-2.83%
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 9
  • Compartir
Comentar
0/400
BankruptWorkervip
· 07-14 15:30
Se sugiere reentrenar.
Ver originalesResponder0
RugpullAlertOfficervip
· 07-13 22:15
¡Estar saturado es el fin!
Ver originalesResponder0
Web3ProductManagervip
· 07-13 19:20
bruh la curva de crecimiento en grok-4 está mostrando signos clásicos de rendimientos decrecientes... al igual que cada producto saas del primer trimestre
Ver originalesResponder0
MEVSandwichMakervip
· 07-11 21:24
Esto no es más que un LLM trampa.
Ver originalesResponder0
OneBlockAtATimevip
· 07-11 21:23
Los grandes también se equivocan, golpeando fuerte en la cara.
Ver originalesResponder0
GasWranglervip
· 07-11 21:22
pfft.. típico modelo sobredimensionado sin ganancias de rendimiento empíricas
Ver originalesResponder0
SignatureAnxietyvip
· 07-11 21:16
Esperemos a ver cómo va el puntaje.
Ver originalesResponder0
TommyTeachervip
· 07-11 21:16
Oh, pensé que podía superar a otros modelos.
Ver originalesResponder0
Degen4Breakfastvip
· 07-11 21:09
啧 还不如LLAMA-2呢
Responder0
Ver más
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)