Gelombang Penurunan Harga untuk Inferensi Model Besar
Pada 21 Mei, Alibaba Cloud mengumumkan penurunan besar-besaran harga panggilan API untuk model komersialisasi dan model sumber terbuka Tongyi Qianwen. Di antaranya, harga input untuk model utama Qwen-Long turun dari 0,02 yuan/seribu token menjadi 0,5 yuan/juta token, penurunan mencapai 97%. Langkah penurunan harga ini menarik perhatian luas di industri.
Sebenarnya, Tongyi Qianwen bukanlah model besar pertama yang menerapkan pengurangan harga untuk pengembang. Sejak bulan Mei, beberapa penyedia model besar telah meluncurkan produk harga rendah atau langkah-langkah pengurangan harga: API model Deep Queso di bawah salah satu perusahaan hanya dipatok sekitar satu persen dari harga GPT-4-Turbo; harga panggilan produk model GLM-3Turbo dari salah satu perusahaan turun dari 5 yuan/ juta tokens menjadi 1 yuan/ juta tokens; salah satu perusahaan meluncurkan model baru yang kinerjanya sebanding dengan GPT-4 Turbo, yang dibuka gratis untuk semua pengguna, dengan kecepatan panggilan API meningkat dua kali lipat tetapi harga dikurangi setengah; harga input inferensi model utama salah satu perusahaan hanya 0,0008 yuan/seribu Tokens; salah satu perusahaan mengumumkan bahwa dua model utama mereka sepenuhnya gratis; salah satu perusahaan mengumumkan bahwa API mereka dibuka secara permanen gratis.
Penurunan harga umum API model besar mungkin berasal dari kemajuan teknologi inferensi dan penurunan biaya. Tren ini secara objektif memberikan lebih banyak pilihan kepada pengembang, yang membantu mempromosikan pengembangan aplikasi AI yang lebih luas.
Sementara itu, Ali Tongyi juga telah meluncurkan serangkaian model bahasa besar dengan berbagai skala, dengan jumlah parameter berkisar dari 500 juta hingga 110 miliar. Model kecil seperti 0.5B, 1.8B, dll. dapat diterapkan di perangkat mobile dan PC, model besar seperti 72B, 110B dapat mendukung aplikasi tingkat perusahaan dan penelitian, sementara model menengah seperti 32B mencari keseimbangan antara kinerja, efisiensi, dan penggunaan memori. Selain itu, Tongyi juga telah membuka sumber beberapa model khusus seperti pemahaman visual, pemahaman audio, kode, dan ahli campuran. Langkah-langkah ini akan memberikan dukungan yang kuat untuk berbagai skenario aplikasi AI.
"Penurunan harga + sumber terbuka" secara bertahap menjadi konsensus di antara produsen model besar global. Strategi ini diharapkan dapat mengatasi dua masalah utama yang dihadapi pengembang aplikasi AI: harga API model besar yang terlalu tinggi, dan kualitas model sumber terbuka yang tidak memadai, sehingga mendorong kemakmuran aplikasi AI secara menyeluruh.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
Harga API model besar mengalami penurunan drastis, produsen dalam negeri memicu gelombang penurunan harga.
Gelombang Penurunan Harga untuk Inferensi Model Besar
Pada 21 Mei, Alibaba Cloud mengumumkan penurunan besar-besaran harga panggilan API untuk model komersialisasi dan model sumber terbuka Tongyi Qianwen. Di antaranya, harga input untuk model utama Qwen-Long turun dari 0,02 yuan/seribu token menjadi 0,5 yuan/juta token, penurunan mencapai 97%. Langkah penurunan harga ini menarik perhatian luas di industri.
Sebenarnya, Tongyi Qianwen bukanlah model besar pertama yang menerapkan pengurangan harga untuk pengembang. Sejak bulan Mei, beberapa penyedia model besar telah meluncurkan produk harga rendah atau langkah-langkah pengurangan harga: API model Deep Queso di bawah salah satu perusahaan hanya dipatok sekitar satu persen dari harga GPT-4-Turbo; harga panggilan produk model GLM-3Turbo dari salah satu perusahaan turun dari 5 yuan/ juta tokens menjadi 1 yuan/ juta tokens; salah satu perusahaan meluncurkan model baru yang kinerjanya sebanding dengan GPT-4 Turbo, yang dibuka gratis untuk semua pengguna, dengan kecepatan panggilan API meningkat dua kali lipat tetapi harga dikurangi setengah; harga input inferensi model utama salah satu perusahaan hanya 0,0008 yuan/seribu Tokens; salah satu perusahaan mengumumkan bahwa dua model utama mereka sepenuhnya gratis; salah satu perusahaan mengumumkan bahwa API mereka dibuka secara permanen gratis.
Penurunan harga umum API model besar mungkin berasal dari kemajuan teknologi inferensi dan penurunan biaya. Tren ini secara objektif memberikan lebih banyak pilihan kepada pengembang, yang membantu mempromosikan pengembangan aplikasi AI yang lebih luas.
Sementara itu, Ali Tongyi juga telah meluncurkan serangkaian model bahasa besar dengan berbagai skala, dengan jumlah parameter berkisar dari 500 juta hingga 110 miliar. Model kecil seperti 0.5B, 1.8B, dll. dapat diterapkan di perangkat mobile dan PC, model besar seperti 72B, 110B dapat mendukung aplikasi tingkat perusahaan dan penelitian, sementara model menengah seperti 32B mencari keseimbangan antara kinerja, efisiensi, dan penggunaan memori. Selain itu, Tongyi juga telah membuka sumber beberapa model khusus seperti pemahaman visual, pemahaman audio, kode, dan ahli campuran. Langkah-langkah ini akan memberikan dukungan yang kuat untuk berbagai skenario aplikasi AI.
"Penurunan harga + sumber terbuka" secara bertahap menjadi konsensus di antara produsen model besar global. Strategi ini diharapkan dapat mengatasi dua masalah utama yang dihadapi pengembang aplikasi AI: harga API model besar yang terlalu tinggi, dan kualitas model sumber terbuka yang tidak memadai, sehingga mendorong kemakmuran aplikasi AI secara menyeluruh.