Mô hình AI lớn phát triển đa dạng, phát triển dễ nhưng thương mại hóa khó.

robot
Đang tạo bản tóm tắt

Cuộc chiến hỗn loạn trong lĩnh vực AI: Từ Transformer đến Đại chiến trăm mô hình

Tháng trước, trong ngành công nghiệp AI đã nổ ra một cuộc "chiến tranh động vật" khốc liệt. Một bên là mô hình lạc đà không bướu do một ông lớn công nghệ phát hành, vì tính chất mã nguồn mở mà được các nhà phát triển yêu thích. Bên còn lại là mô hình lớn có tên "Diều Hâu", sau khi ra mắt vào tháng 5 đã vượt qua lạc đà không bướu để đứng đầu bảng xếp hạng LLM mã nguồn mở.

Thú vị là, nhà phát triển của "Falcon" không phải là một công ty công nghệ, mà là một viện nghiên cứu ở Các Tiểu vương quốc Ả Rập Thống nhất. Bộ trưởng Trí tuệ Nhân tạo của Các Tiểu vương quốc Ả Rập Thống nhất sau đó đã được chọn vào danh sách "100 người có ảnh hưởng nhất trong lĩnh vực AI" của tạp chí Time.

Hiện nay, lĩnh vực AI đã bước vào giai đoạn "quần ma loạn vũ". Chỉ cần có đủ tiềm lực tài chính, các quốc gia và doanh nghiệp đều đang xây dựng mô hình ngôn ngữ lớn của riêng mình. Chỉ riêng tại các quốc gia Vùng Vịnh, không chỉ có một người chơi trong cuộc cạnh tranh này.

Có nhà đầu tư phàn nàn: "Ngày xưa không coi trọng sự đổi mới mô hình kinh doanh của Internet, cảm thấy không có rào cản. Không ngờ khởi nghiệp với mô hình lớn công nghệ cứng, vẫn là cuộc chiến trăm mô hình..."

Vốn dĩ được coi là công nghệ cứng khó khăn, sao bây giờ lại trở thành tình hình một quốc gia một mẫu, nở rộ khắp nơi?

Transformer đã thay đổi quy tắc trò chơi

Hiện nay, các quốc gia và doanh nghiệp có thể theo đuổi giấc mơ về mô hình lớn đều nhờ vào bài báo nổi tiếng được công bố vào năm 2017 mang tên "Attention Is All You Need". Bài báo này đã công khai thuật toán Transformer, trở thành điểm khởi đầu cho cơn sốt AI hiện tại. Những mô hình lớn ngày nay, bất kể quốc tịch, đều được xây dựng dựa trên nền tảng của Transformer.

Trước đó, "dạy máy đọc sách" luôn là một bài toán học thuật được công nhận. Con người khi đọc không chỉ chú ý đến các từ và câu hiện tại, mà còn kết hợp với ngữ cảnh để hiểu. Các mạng nơ-ron sớm khó có thể làm được điều này, cho đến khi sự xuất hiện của mạng nơ-ron hồi tiếp (RNN) vào năm 2014 đã có những bước đột phá.

Tuy nhiên, RNN gặp vấn đề về hiệu suất kém, khó xử lý một lượng lớn tham số. Sự xuất hiện của Transformer đã giải quyết vấn đề này, nó sử dụng mã hóa vị trí thay thế cho thiết kế vòng lặp của RNN, thực hiện tính toán song song, nâng cao đáng kể hiệu suất đào tạo. Sự thay đổi này đã đưa AI vào kỷ nguyên của các mô hình lớn.

Transformer nhanh chóng trở thành giải pháp chủ đạo trong lĩnh vực xử lý ngôn ngữ tự nhiên. Nó đã biến các mô hình lớn từ nghiên cứu lý thuyết thành một vấn đề thuần túy kỹ thuật - chỉ cần có đủ sức mạnh tính toán và dữ liệu, bất kỳ công ty nào có khả năng kỹ thuật đều có thể xây dựng mô hình lớn.

Như một nhà khoa học máy tính đã nói, AI đang trở thành một công nghệ phổ quát, tương tự như điện và internet. Mặc dù một số mô hình lớn của các công ty vẫn dẫn đầu, nhưng các nhà phân tích dự đoán rằng các gã khổng lồ công nghệ khác cũng sẽ sớm tạo ra sản phẩm có trình độ tương đương.

Suy nghĩ đằng sau cuộc chiến mô hình

Tính đến tháng 7 năm nay, số lượng mô hình lớn trong nước đã đạt 130, vượt qua cả Mỹ. Ngoài hai nước Trung-Mỹ, một số quốc gia giàu có hơn cũng đã ra mắt mô hình lớn của riêng họ, như Nhật Bản, Các Tiểu vương quốc Ả Rập Thống nhất, Ấn Độ, Hàn Quốc, v.v.

Tình huống này gợi nhớ đến thời kỳ bong bóng Internet. Nhưng việc tham gia dễ dàng không có nghĩa là ai cũng có thể trở thành ông lớn trong thời đại AI. Lấy mô hình lớn mã nguồn mở làm ví dụ, cộng đồng nhà phát triển năng động chính là lợi thế cạnh tranh cốt lõi của nó. Một ông lớn mạng xã hội hiểu rõ điều này, loạt mô hình lớn mã nguồn mở của họ đã trở thành tiêu chuẩn trong lĩnh vực này.

Tuy nhiên, hầu hết các mô hình lớn vẫn có khoảng cách rõ rệt về hiệu suất so với các sản phẩm hàng đầu. Kết quả kiểm tra AgentBench mới nhất cho thấy điểm số của người đứng thứ hai còn chưa bằng hai phần ba của người đứng đầu. Khoảng cách này xuất phát từ đội ngũ nhà khoa học xuất sắc và kinh nghiệm tích lũy lâu dài mà các công ty hàng đầu sở hữu.

Khả năng cốt lõi của mô hình lớn không chỉ nằm ở số lượng tham số, mà còn ở việc xây dựng hệ sinh thái ( đối với mô hình mã nguồn mở ) hoặc khả năng suy luận thuần túy ( đối với mô hình mã nguồn đóng ). Khi cộng đồng mã nguồn mở phát triển, hiệu suất của các mô hình lớn có thể có xu hướng đồng nhất.

Thách thức lớn hơn nằm ở việc thương mại hóa. Ngoại trừ một vài trường hợp ngoại lệ, hầu hết các công ty AI vẫn chưa tìm ra mô hình lợi nhuận sau khi đầu tư một khoản chi phí khổng lồ. Ngay cả những công ty dẫn đầu ngành cũng gặp khó khăn trong việc định giá sản phẩm AI.

Chi phí tính toán cao đã trở thành rào cản cho sự phát triển của ngành. Theo ước tính, chi tiêu hàng năm của các công ty công nghệ toàn cầu cho cơ sở hạ tầng mô hình lớn có thể vượt xa doanh thu mà nó mang lại, tạo ra một khoảng cách lớn.

Mặc dù các sản phẩm đột phá của một số công ty đã tạo ra cuộc cách mạng AI này, nhưng vẫn có nghi ngờ về giá trị mà chỉ riêng việc đào tạo các mô hình lớn có thể mang lại. Khi sự cạnh tranh gia tăng và số lượng mô hình mã nguồn mở ngày càng nhiều, các nhà cung cấp mô hình lớn thuần túy có thể phải đối mặt với áp lực lớn hơn.

Giống như sự thành công của iPhone 4 không chỉ nằm ở bộ vi xử lý của nó, mà còn vì nó có thể chạy nhiều ứng dụng khác nhau. Giá trị thực sự của lĩnh vực AI có thể cũng sẽ được thể hiện trong các ứng dụng cụ thể.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 5
  • Chia sẻ
Bình luận
0/400
SignatureCollectorvip
· 08-03 13:36
Nhóm ma quái nhảy múa? Không bằng gọi là trăm mô hình đua xe
Xem bản gốcTrả lời0
GateUser-2fce706cvip
· 08-01 18:24
Công thức làm giàu ngay trước mắt, những gì không nắm bắt được đều là đồ ngốc.
Xem bản gốcTrả lời0
CoffeeOnChainvip
· 08-01 18:24
Hả, lại trở thành trò chơi tư bản rồi.
Xem bản gốcTrả lời0
MEV_Whisperervip
· 08-01 18:16
Làm ai đâu có vui bằng giao dịch tiền điện tử.
Xem bản gốcTrả lời0
NFT_Therapyvip
· 08-01 18:13
Ôi trời, có nhiều tiền thật vui!
Xem bản gốcTrả lời0
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)