Harga API model besar mengalami penurunan drastis, produsen dalam negeri memicu gelombang penurunan harga.

2025-07-19 17:03:13

Gelombang Penurunan Harga untuk Inferensi Model Besar

Pada 21 Mei, Alibaba Cloud mengumumkan penurunan besar-besaran harga panggilan API untuk model komersialisasi dan model sumber terbuka Tongyi Qianwen. Di antaranya, harga input untuk model utama Qwen-Long turun dari 0,02 yuan/seribu token menjadi 0,5 yuan/juta token, penurunan mencapai 97%. Langkah penurunan harga ini menarik perhatian luas di industri.

Sebenarnya, Tongyi Qianwen bukanlah model besar pertama yang menerapkan pengurangan harga untuk pengembang. Sejak bulan Mei, beberapa penyedia model besar telah meluncurkan produk harga rendah atau langkah-langkah pengurangan harga: API model Deep Queso di bawah salah satu perusahaan hanya dipatok sekitar satu persen dari harga GPT-4-Turbo; harga panggilan produk model GLM-3Turbo dari salah satu perusahaan turun dari 5 yuan/ juta tokens menjadi 1 yuan/ juta tokens; salah satu perusahaan meluncurkan model baru yang kinerjanya sebanding dengan GPT-4 Turbo, yang dibuka gratis untuk semua pengguna, dengan kecepatan panggilan API meningkat dua kali lipat tetapi harga dikurangi setengah; harga input inferensi model utama salah satu perusahaan hanya 0,0008 yuan/seribu Tokens; salah satu perusahaan mengumumkan bahwa dua model utama mereka sepenuhnya gratis; salah satu perusahaan mengumumkan bahwa API mereka dibuka secara permanen gratis.

Penurunan harga umum API model besar mungkin berasal dari kemajuan teknologi inferensi dan penurunan biaya. Tren ini secara objektif memberikan lebih banyak pilihan kepada pengembang, yang membantu mempromosikan pengembangan aplikasi AI yang lebih luas.

Sementara itu, Ali Tongyi juga telah meluncurkan serangkaian model bahasa besar dengan berbagai skala, dengan jumlah parameter berkisar dari 500 juta hingga 110 miliar. Model kecil seperti 0.5B, 1.8B, dll. dapat diterapkan di perangkat mobile dan PC, model besar seperti 72B, 110B dapat mendukung aplikasi tingkat perusahaan dan penelitian, sementara model menengah seperti 32B mencari keseimbangan antara kinerja, efisiensi, dan penggunaan memori. Selain itu, Tongyi juga telah membuka sumber beberapa model khusus seperti pemahaman visual, pemahaman audio, kode, dan ahli campuran. Langkah-langkah ini akan memberikan dukungan yang kuat untuk berbagai skenario aplikasi AI.

"Penurunan harga + sumber terbuka" secara bertahap menjadi konsensus di antara produsen model besar global. Strategi ini diharapkan dapat mengatasi dua masalah utama yang dihadapi pengembang aplikasi AI: harga API model besar yang terlalu tinggi, dan kualitas model sumber terbuka yang tidak memadai, sehingga mendorong kemakmuran aplikasi AI secara menyeluruh.

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

23 Suka

Hadiah
23
9
Bagikan

Komentar

0/400

AirdropHunterKing

· 07-22 16:33

Era gratis telah tiba, tunggu untuk Kupon Klip

Lihat AsliBalas0

RegenRestorer

· 07-22 05:48

Sudah digulung.

Lihat AsliBalas0

WhaleMistaker

· 07-21 04:06

Apakah harga listrik juga harus turun!

Lihat AsliBalas0

LonelyAnchorman

· 07-19 17:33

Bergulir sampai berdarah!

Lihat AsliBalas0

rugpull_ptsd

· 07-19 17:32

play people for suckers tidak bisa lagi, ya

Lihat AsliBalas0

DEXRobinHood

· 07-19 17:31

dunia kripto yang kelam harus berperang harga

Lihat AsliBalas0

NftDeepBreather

· 07-19 17:31

Sekali lagi akan mulai berputar, kan!

Lihat AsliBalas0

Degentleman

· 07-19 17:22

Gulung mati sudah

Lihat AsliBalas0

BearMarketGardener

· 07-19 17:08

Mulai perang harga ya

Lihat AsliBalas0

Lihat Lebih Banyak

Topik
1/3
1BTC & ETH Launchpool Yield Exceeds 3%
26k Popularitas
2White House Crypto Report
12k Popularitas
3Growth Points Draw Round 12 Opens
7k Popularitas
4Fed Holds Rates Decision
7k Popularitas
5Alpha Points System Opens
16k Popularitas

Sematkan

peta situs