Grok-4 đã bão hòa GPQA chưa? Chưa đâu!



Những câu hỏi tương tự, khi được đánh giá tự do, Grok-4 không tốt hơn các mô hình nhỏ hơn của nó.
GROK-2.11%
NOT-2%
FORM111.11%
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 9
  • Chia sẻ
Bình luận
0/400
BankruptWorkervip
· 07-14 15:30
Đề nghị đào tạo lại nào
Xem bản gốcTrả lời0
RugpullAlertOfficervip
· 07-13 22:15
Bão hòa thì xong!
Xem bản gốcTrả lời0
Web3ProductManagervip
· 07-13 19:20
bruh đường cong tăng trưởng trên grok-4 đang hiển thị những dấu hiệu kinh điển của việc giảm lợi nhuận... giống như mọi sản phẩm saas q1
Xem bản gốcTrả lời0
MEVSandwichMakervip
· 07-11 21:24
Đây không phải là bẫy da của LLM sao?
Xem bản gốcTrả lời0
OneBlockAtATimevip
· 07-11 21:23
Lớn cũng lật xe, đánh mạnh vào mặt.
Xem bản gốcTrả lời0
GasWranglervip
· 07-11 21:22
pfft.. mô hình mở rộng quá mức điển hình mà không có lợi ích thực nghiệm về thông lượng
Xem bản gốcTrả lời0
SignatureAnxietyvip
· 07-11 21:16
Ngồi chờ xem điểm số chạy thử nhé.
Xem bản gốcTrả lời0
TommyTeachervip
· 07-11 21:16
Hả? Còn tưởng có thể đánh bại các mô hình khác chứ.
Xem bản gốcTrả lời0
Degen4Breakfastvip
· 07-11 21:09
啧 还不如LLAMA-2呢
Trả lời0
Xem thêm
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)