AltcoinArchitect
vip

Pensou que o Grok-4 saturou o GPQA? Ainda não!



As mesmas perguntas, quando avaliadas de forma livre, o Grok-4 não é melhor do que os seus modelos menores.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • 9
  • Compartilhar
Comentário
0/400
BankruptWorkervip
· 07-14 15:30
Sugiro re-treinar.
Ver originalResponder0
RugpullAlertOfficervip
· 07-13 22:15
Saturado, e acabou!
Ver originalResponder0
Web3ProductManagervip
· 07-13 19:20
bruh a curva de crescimento do grok-4 está a mostrar sinais clássicos de retornos decrescentes... tal como todos os produtos saas do primeiro trimestre
Ver originalResponder0
MEVSandwichMakervip
· 07-11 21:24
Isso não é apenas um LLM de armadilha.
Ver originalResponder0
OneBlockAtATimevip
· 07-11 21:23
Grande também falha, dá um tapa na cara.
Ver originalResponder0
GasWranglervip
· 07-11 21:22
pfft.. típico modelo escalonado supervalorizado sem ganhos empíricos de throughput
Ver originalResponder0
SignatureAnxietyvip
· 07-11 21:16
Vamos esperar para ver como vai correr.
Ver originalResponder0
TommyTeachervip
· 07-11 21:16
Ah, pensei que poderia superar outros modelos.
Ver originalResponder0
Degen4Breakfastvip
· 07-11 21:09
Zé, não é melhor que o LLAMA-2.
Ver originalResponder0
Ver projetos
  • Marcar
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)