Harga API model besar mengalami penurunan drastis, produsen dalam negeri memicu gelombang penurunan harga.

Gelombang Penurunan Harga untuk Inferensi Model Besar

Pada 21 Mei, Alibaba Cloud mengumumkan penurunan besar-besaran harga panggilan API untuk model komersialisasi dan model sumber terbuka Tongyi Qianwen. Di antaranya, harga input untuk model utama Qwen-Long turun dari 0,02 yuan/seribu token menjadi 0,5 yuan/juta token, penurunan mencapai 97%. Langkah penurunan harga ini menarik perhatian luas di industri.

Sebenarnya, Tongyi Qianwen bukanlah model besar pertama yang menerapkan pengurangan harga untuk pengembang. Sejak bulan Mei, beberapa penyedia model besar telah meluncurkan produk harga rendah atau langkah-langkah pengurangan harga: API model Deep Queso di bawah salah satu perusahaan hanya dipatok sekitar satu persen dari harga GPT-4-Turbo; harga panggilan produk model GLM-3Turbo dari salah satu perusahaan turun dari 5 yuan/ juta tokens menjadi 1 yuan/ juta tokens; salah satu perusahaan meluncurkan model baru yang kinerjanya sebanding dengan GPT-4 Turbo, yang dibuka gratis untuk semua pengguna, dengan kecepatan panggilan API meningkat dua kali lipat tetapi harga dikurangi setengah; harga input inferensi model utama salah satu perusahaan hanya 0,0008 yuan/seribu Tokens; salah satu perusahaan mengumumkan bahwa dua model utama mereka sepenuhnya gratis; salah satu perusahaan mengumumkan bahwa API mereka dibuka secara permanen gratis.

Penurunan harga umum API model besar mungkin berasal dari kemajuan teknologi inferensi dan penurunan biaya. Tren ini secara objektif memberikan lebih banyak pilihan kepada pengembang, yang membantu mempromosikan pengembangan aplikasi AI yang lebih luas.

Sementara itu, Ali Tongyi juga telah meluncurkan serangkaian model bahasa besar dengan berbagai skala, dengan jumlah parameter berkisar dari 500 juta hingga 110 miliar. Model kecil seperti 0.5B, 1.8B, dll. dapat diterapkan di perangkat mobile dan PC, model besar seperti 72B, 110B dapat mendukung aplikasi tingkat perusahaan dan penelitian, sementara model menengah seperti 32B mencari keseimbangan antara kinerja, efisiensi, dan penggunaan memori. Selain itu, Tongyi juga telah membuka sumber beberapa model khusus seperti pemahaman visual, pemahaman audio, kode, dan ahli campuran. Langkah-langkah ini akan memberikan dukungan yang kuat untuk berbagai skenario aplikasi AI.

"Penurunan harga + sumber terbuka" secara bertahap menjadi konsensus di antara produsen model besar global. Strategi ini diharapkan dapat mengatasi dua masalah utama yang dihadapi pengembang aplikasi AI: harga API model besar yang terlalu tinggi, dan kualitas model sumber terbuka yang tidak memadai, sehingga mendorong kemakmuran aplikasi AI secara menyeluruh.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • 8
  • Bagikan
Komentar
0/400
RegenRestorervip
· 5jam yang lalu
Sudah digulung.
Lihat AsliBalas0
WhaleMistakervip
· 07-21 04:06
Apakah harga listrik juga harus turun!
Lihat AsliBalas0
LonelyAnchormanvip
· 07-19 17:33
Bergulir sampai berdarah!
Lihat AsliBalas0
rugpull_ptsdvip
· 07-19 17:32
play people for suckers tidak bisa lagi, ya
Lihat AsliBalas0
DEXRobinHoodvip
· 07-19 17:31
dunia kripto yang kelam harus berperang harga
Lihat AsliBalas0
NftDeepBreathervip
· 07-19 17:31
Sekali lagi akan mulai berputar, kan!
Lihat AsliBalas0
Degentlemanvip
· 07-19 17:22
Gulung mati sudah
Lihat AsliBalas0
BearMarketGardenervip
· 07-19 17:08
Mulai perang harga ya
Lihat AsliBalas0
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)