Наступ хвилі зниження цін на моделі великих обчислень
21 травня Alibaba Cloud оголосила про значне зниження цін на API виклики для своєї комерційної моделі Tongyi Qianwen та відкритої моделі. Зокрема, ціна вводу основної моделі Qwen-Long знизилася з 0,02 юаня за тисячу токенів до 0,5 юаня за мільйон токенів, що становить зниження на 97%. Ця цінова ініціатива викликала широкий інтерес в індустрії.
Насправді, Tongyi Qianwen не є першим великим моделлю, яка знижує ціни для розробників. З травня кілька виробників великих моделей випустили низькоцінові продукти або заходи зі зниження цін: API моделі глибокого пошуку одного з компаній коштує лише близько одного відсотка від ціни GPT-4-Turbo; ціна на виклик моделі GLM-3Turbo однієї з компаній знизилася з 5 юанів/мільйон токенів до 1 юаня/мільйон токенів; одна компанія випустила нову модель з продуктивністю, що зрівнюється з GPT-4 Turbo, яка безкоштовно доступна для всіх користувачів, швидкість виклику API збільшена вдвічі, але ціна знижена вдвічі; основна модель однієї з компаній має ціну вхідних запитів до 0.0008 юаня/тисячу токенів; одна компанія оголосила, що її дві основні моделі повністю безкоштовні; одна компанія оголосила, що її API безкоштовно доступний назавжди.
Загальне зниження цін на API великих моделей, ймовірно, є наслідком прогресу у технології інференції та зменшення витрат. Ця тенденція об'єктивно надає розробникам більше можливостей, що сприяє широкій розробці AI-додатків.
Водночас, Aliyun також представила ряд великих мовних моделей різного масштабу, параметри яких варіюються від 500 мільйонів до 110 мільярдів. Невеликі моделі, такі як 0,5B, 1,8B тощо, можуть бути розгорнуті на мобільних пристроях та ПК, великі моделі, такі як 72B, 110B, можуть підтримувати корпоративні та наукові застосування, а середні моделі, такі як 32B, шукають баланс між продуктивністю, ефективністю та використанням пам'яті. Крім того, Aliyun відкрила вихідний код для кількох спеціалізованих моделей, таких як розуміння зображень, розуміння аудіо, коду та змішаних експертів. Ці заходи нададуть потужну підтримку для різноманітних сценаріїв застосування ШІ.
"Зниження цін + відкритий код" поступово стає спільною думкою глобальних виробників великих моделей. Ця стратегія має на меті вирішити дві основні проблеми, з якими стикаються розробники AI-додатків: надто висока ціна API великих моделей та недостатня якість відкритих моделей, що, в свою чергу, сприятиме загальному процвітанню AI-додатків.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
Ціни на API великих моделей значно знижені, на внутрішньому ринку компанії почали ціну знижувати.
Наступ хвилі зниження цін на моделі великих обчислень
21 травня Alibaba Cloud оголосила про значне зниження цін на API виклики для своєї комерційної моделі Tongyi Qianwen та відкритої моделі. Зокрема, ціна вводу основної моделі Qwen-Long знизилася з 0,02 юаня за тисячу токенів до 0,5 юаня за мільйон токенів, що становить зниження на 97%. Ця цінова ініціатива викликала широкий інтерес в індустрії.
Насправді, Tongyi Qianwen не є першим великим моделлю, яка знижує ціни для розробників. З травня кілька виробників великих моделей випустили низькоцінові продукти або заходи зі зниження цін: API моделі глибокого пошуку одного з компаній коштує лише близько одного відсотка від ціни GPT-4-Turbo; ціна на виклик моделі GLM-3Turbo однієї з компаній знизилася з 5 юанів/мільйон токенів до 1 юаня/мільйон токенів; одна компанія випустила нову модель з продуктивністю, що зрівнюється з GPT-4 Turbo, яка безкоштовно доступна для всіх користувачів, швидкість виклику API збільшена вдвічі, але ціна знижена вдвічі; основна модель однієї з компаній має ціну вхідних запитів до 0.0008 юаня/тисячу токенів; одна компанія оголосила, що її дві основні моделі повністю безкоштовні; одна компанія оголосила, що її API безкоштовно доступний назавжди.
Загальне зниження цін на API великих моделей, ймовірно, є наслідком прогресу у технології інференції та зменшення витрат. Ця тенденція об'єктивно надає розробникам більше можливостей, що сприяє широкій розробці AI-додатків.
Водночас, Aliyun також представила ряд великих мовних моделей різного масштабу, параметри яких варіюються від 500 мільйонів до 110 мільярдів. Невеликі моделі, такі як 0,5B, 1,8B тощо, можуть бути розгорнуті на мобільних пристроях та ПК, великі моделі, такі як 72B, 110B, можуть підтримувати корпоративні та наукові застосування, а середні моделі, такі як 32B, шукають баланс між продуктивністю, ефективністю та використанням пам'яті. Крім того, Aliyun відкрила вихідний код для кількох спеціалізованих моделей, таких як розуміння зображень, розуміння аудіо, коду та змішаних експертів. Ці заходи нададуть потужну підтримку для різноманітних сценаріїв застосування ШІ.
"Зниження цін + відкритий код" поступово стає спільною думкою глобальних виробників великих моделей. Ця стратегія має на меті вирішити дві основні проблеми, з якими стикаються розробники AI-додатків: надто висока ціна API великих моделей та недостатня якість відкритих моделей, що, в свою чергу, сприятиме загальному процвітанню AI-додатків.