Büyük model çıkarım tarafında fiyat düşüşü dalgası geliyor
21 May'da, Alibaba Cloud, Tongyi Qianwen ticari modeli ve açık kaynak modelinin API çağrı fiyatlarını önemli ölçüde düşürdüğünü duyurdu. Bu kapsamda, ana model Qwen-Long'un giriş fiyatı 0.02 yuan/1000 token'dan 0.5 yuan/1 milyon token'a düştü ve bu, %97'lik bir azalmaya tekabül ediyor. Bu fiyat indirim kararı sektörde geniş bir ilgi uyandırdı.
Aslında, Tongyi Qianwen geliştiricilere indirim uygulayan ilk büyük model değil. Mayıs ayından bu yana birçok büyük model üreticisi düşük fiyatlı ürünler veya indirim önlemleri sunmaya başladı: Bir şirketin derin arama modeli API fiyatı, GPT-4-Turbo'nun yaklaşık yüzde biri kadar; bir şirketin GLM-3Turbo model ürününün çağrı fiyatı, 5 yuan/milyon token'dan 1 yuan/milyon token'a düştü; bir şirket, GPT-4 Turbo ile karşılaştırılacak performansa sahip yeni bir model sundu, tüm kullanıcılara ücretsiz olarak açtı, API çağrı hızını iki kat artırdı ancak fiyatı yarıya indirdi; bir şirketin ana modelinin çıkarım girişi fiyatı 0.0008 yuan/1000 token'a kadar düştü; bir şirket, iki ana modelinin tamamen ücretsiz olduğunu duyurdu; bir şirket API'sinin sonsuza dek ücretsiz açık olacağını duyurdu.
Büyük model API'lerinin genel fiyat düşüşü, muhtemelen çıkarım teknolojisindeki ilerlemeler ve maliyetlerdeki azalmadan kaynaklanmaktadır. Bu eğilim, geliştiricilere daha fazla seçenek sunarak AI uygulamalarının geniş çapta geliştirilmesini desteklemektedir.
Bu arada, Ali Tongyi, 500 milyon ile 110 milyar arasında değişen parametre aralıklarına sahip farklı ölçeklerde bir dizi büyük dil modeli de tanıttı. 0.5B, 1.8B gibi küçük modeller mobil cihazlar ve PC'lerde dağıtılabilirken, 72B, 110B gibi büyük modeller kurumsal ve araştırma düzeyindeki uygulamaları destekleyebilir, 32B gibi orta ölçekli modeller ise performans, verimlilik ve bellek kullanımı arasında denge arayışındadır. Ayrıca, Tongyi, görsel anlama, ses anlama, kod ve karma uzmanlar gibi birçok özel modeli de açık kaynak olarak sundu. Bu girişimler, çeşitli AI uygulama senaryolarına güçlü bir destek sağlayacak.
"Fiyat düşürme + açık kaynak" giderek küresel büyük model üreticilerinin ortak görüşü haline geliyor. Bu strateji, AI uygulama geliştiricilerinin karşılaştığı iki büyük sorunu çözmeyi umuyor: büyük model API fiyatlarının çok yüksek olması ve açık kaynak modellerinin kalitesinin yetersiz olması, böylece AI uygulamalarının kapsamlı bir şekilde gelişmesini teşvik ediyor.
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
19 Likes
Reward
19
7
Share
Comment
0/400
WhaleMistaker
· 23h ago
Elektrik fiyatları da düşüş yaşamalı mı!
View OriginalReply0
LonelyAnchorman
· 07-19 17:33
Kan dökülene kadar!
View OriginalReply0
rugpull_ptsd
· 07-19 17:32
insanları enayi yerine koymak değil mi
View OriginalReply0
DEXRobinHood
· 07-19 17:31
kripto dünyası karanlıkta fiyat savaşı vermek zorundadır
Büyük model API fiyatları büyük ölçüde düştü, yerli üreticiler indirim dalgası başlattı.
Büyük model çıkarım tarafında fiyat düşüşü dalgası geliyor
21 May'da, Alibaba Cloud, Tongyi Qianwen ticari modeli ve açık kaynak modelinin API çağrı fiyatlarını önemli ölçüde düşürdüğünü duyurdu. Bu kapsamda, ana model Qwen-Long'un giriş fiyatı 0.02 yuan/1000 token'dan 0.5 yuan/1 milyon token'a düştü ve bu, %97'lik bir azalmaya tekabül ediyor. Bu fiyat indirim kararı sektörde geniş bir ilgi uyandırdı.
Aslında, Tongyi Qianwen geliştiricilere indirim uygulayan ilk büyük model değil. Mayıs ayından bu yana birçok büyük model üreticisi düşük fiyatlı ürünler veya indirim önlemleri sunmaya başladı: Bir şirketin derin arama modeli API fiyatı, GPT-4-Turbo'nun yaklaşık yüzde biri kadar; bir şirketin GLM-3Turbo model ürününün çağrı fiyatı, 5 yuan/milyon token'dan 1 yuan/milyon token'a düştü; bir şirket, GPT-4 Turbo ile karşılaştırılacak performansa sahip yeni bir model sundu, tüm kullanıcılara ücretsiz olarak açtı, API çağrı hızını iki kat artırdı ancak fiyatı yarıya indirdi; bir şirketin ana modelinin çıkarım girişi fiyatı 0.0008 yuan/1000 token'a kadar düştü; bir şirket, iki ana modelinin tamamen ücretsiz olduğunu duyurdu; bir şirket API'sinin sonsuza dek ücretsiz açık olacağını duyurdu.
Büyük model API'lerinin genel fiyat düşüşü, muhtemelen çıkarım teknolojisindeki ilerlemeler ve maliyetlerdeki azalmadan kaynaklanmaktadır. Bu eğilim, geliştiricilere daha fazla seçenek sunarak AI uygulamalarının geniş çapta geliştirilmesini desteklemektedir.
Bu arada, Ali Tongyi, 500 milyon ile 110 milyar arasında değişen parametre aralıklarına sahip farklı ölçeklerde bir dizi büyük dil modeli de tanıttı. 0.5B, 1.8B gibi küçük modeller mobil cihazlar ve PC'lerde dağıtılabilirken, 72B, 110B gibi büyük modeller kurumsal ve araştırma düzeyindeki uygulamaları destekleyebilir, 32B gibi orta ölçekli modeller ise performans, verimlilik ve bellek kullanımı arasında denge arayışındadır. Ayrıca, Tongyi, görsel anlama, ses anlama, kod ve karma uzmanlar gibi birçok özel modeli de açık kaynak olarak sundu. Bu girişimler, çeşitli AI uygulama senaryolarına güçlü bir destek sağlayacak.
"Fiyat düşürme + açık kaynak" giderek küresel büyük model üreticilerinin ortak görüşü haline geliyor. Bu strateji, AI uygulama geliştiricilerinin karşılaştığı iki büyük sorunu çözmeyi umuyor: büyük model API fiyatlarının çok yüksek olması ve açık kaynak modellerinin kalitesinin yetersiz olması, böylece AI uygulamalarının kapsamlı bir şekilde gelişmesini teşvik ediyor.