Model AI besar bermunculan, penurunan ambang teknologi memicu persaingan global

Dunia AI dipenuhi dengan banyak pahlawan, era "Pertempuran Seratus Model" telah tiba

Bulan lalu, terjadi "Pertarungan Hewan" di dunia AI. Di satu sisi ada Llama yang diluncurkan oleh Meta, yang sangat disukai oleh pengembang karena fitur open-source-nya. Di sisi lain, ada model besar bernama Falcon, yang setelah diluncurkan pada bulan Mei tahun ini, berhasil mengalahkan Llama dan menduduki puncak daftar peringkat LLM open-source.

Menariknya, pengembang Falcon adalah Institut Riset Inovasi Teknologi di ibu kota UEA, Abu Dhabi. Menteri Kecerdasan Buatan UEA kemudian terpilih dalam daftar "100 Orang Paling Berpengaruh di Bidang AI" yang disusun oleh majalah Time.

Saat ini, bidang AI telah memasuki tahap persaingan yang ketat. Negara dan perusahaan dengan kekuatan finansial tertentu sedang membangun versi lokal ChatGPT. Hanya di kawasan Teluk, Arab Saudi baru saja membeli lebih dari 3000 chip H100 untuk pelatihan LLM bagi universitas domestik.

Situasi ini membuat orang bertanya-tanya: Mengapa teknologi keras yang sulit yang dijanjikan, malah berubah menjadi "satu negara satu model"?

Transformer mengubah aturan permainan

Pada tahun 2017, delapan ilmuwan komputer dari Google mempublikasikan algoritma Transformer dalam makalah berjudul "Attention Is All You Need", yang menjadi katalisator untuk gelombang AI kali ini. Saat ini, semua model besar, termasuk seri GPT, dibangun di atas dasar Transformer.

Revolusi Transformer terutama memiliki dua poin: yang pertama adalah menggunakan pengkodean posisi menggantikan desain berulang, yang memungkinkan perhitungan paralel dan secara signifikan meningkatkan efisiensi pelatihan; yang kedua adalah lebih lanjut meningkatkan kemampuan pemahaman konteks.

Ini mengubah model besar dari penelitian teoretis menjadi masalah rekayasa. Elemen rekayasa seperti data, skala komputasi, dan arsitektur model menjadi kunci dalam kompetisi AI. Selama perusahaan memiliki kemampuan teknis tertentu, mereka dapat mengembangkan model besar.

Perdebatan Sumber Terbuka dan Sumber Tertutup

Saat ini, "Perang Model Besar" telah menjadi kenyataan. Hingga Juli, jumlah model besar di Tiongkok mencapai 130, melebihi 114 di Amerika Serikat. Negara lain seperti Jepang, India, dan Korea Selatan juga telah memiliki model besar mereka sendiri.

Namun, masuk itu mudah, tetapi sukses itu sulit. Mengambil Falcon sebagai contoh, meskipun peringkatnya lebih tinggi dari Llama, namun sulit untuk mengatakan bahwa itu memberikan dampak nyata pada Meta. Untuk model besar open-source, komunitas pengembang yang aktif adalah kekuatan inti. Meta sudah memiliki tradisi open-source, dan dalam pengelolaan komunitas, mereka lebih unggul.

Tentu saja, meningkatkan kinerja juga merupakan salah satu jalan. Namun saat ini, sebagian besar LLM masih memiliki jarak yang jelas dengan GPT-4. Dalam uji AgentBench terbaru, GPT-4 dengan skor 4,41 jauh di depan, sementara peringkat kedua Claude hanya 2,77, dan model sumber terbuka lainnya umumnya berada di sekitar 1 poin.

Yang menyebabkan perbedaan ini adalah tim ilmuwan luar biasa dari OpenAI dan pengalaman yang terakumulasi selama bertahun-tahun. Inti dari model besar terletak pada pembangunan ekosistem ( sumber terbuka ) atau kemampuan penalaran murni ( tertutup ).

Ketidakseimbangan Biaya dan Pendapatan

Saat ini, industri model besar secara umum menghadapi masalah ketidakseimbangan serius antara biaya dan pendapatan. Menurut perkiraan Sequoia Capital, pengeluaran perusahaan teknologi global untuk infrastruktur model besar bisa mencapai 200 miliar dolar AS per tahun, sementara pendapatan tahunan model besar maksimal hanya 75 miliar dolar AS, sehingga terdapat kekurangan setidaknya 125 miliar dolar AS.

Bahkan raksasa perangkat lunak seperti Microsoft dan Adobe juga menghadapi kerugian dalam produk AI. Sebagian besar perusahaan model besar, setelah investasi yang sangat besar, masih belum menemukan model keuntungan yang jelas.

Seiring meningkatnya persaingan homogen dan semakin banyaknya model sumber terbuka, penyedia model besar yang murni mungkin menghadapi tekanan yang lebih besar. Di masa depan, nilai AI mungkin akan lebih banyak terwujud dalam skenario aplikasi spesifik, bukan pada model itu sendiri.

GPT2.29%
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • 5
  • Bagikan
Komentar
0/400
0xSherlockvip
· 08-06 18:26
Lebih menarik daripada uang
Lihat AsliBalas0
WhaleMinionvip
· 08-06 17:20
Perang baru saja dimulai
Lihat AsliBalas0
SignatureDeniedvip
· 08-06 17:05
Teknologi tidak mengenal batasan negara
Lihat AsliBalas0
LuckyBearDrawervip
· 08-06 17:03
Uang dapat menyelesaikan segalanya
Lihat AsliBalas0
SelfStakingvip
· 08-06 16:59
Perdagangan Mata Uang Kripto tidak sebaik membuat model
Lihat AsliBalas0
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)