Os preços da API de grandes modelos foram significativamente reduzidos, levando as empresas nacionais a iniciar uma onda de reduções de preços.

A onda de redução de preços para inferência de grandes modelos chegou

No dia 21 de maio, a Alibaba Cloud anunciou uma redução significativa nos preços das chamadas API para seu modelo comercial e modelo de código aberto Tongyi Qianwen. Entre eles, o preço de entrada do modelo principal Qwen-Long caiu de 0,02 yuan/ mil tokens para 0,5 yuan/ milhão de tokens, uma redução de até 97%. Essa medida de redução de preços gerou ampla atenção na indústria.

Na verdade, Tongyi Qianwen não é o primeiro grande modelo a implementar reduções de preço para desenvolvedores. Desde maio, várias empresas de grandes modelos lançaram produtos de baixo custo ou medidas de redução de preço: a API do modelo Deep Queso sob uma certa empresa tem um preço de cerca de um por cento do GPT-4-Turbo; o preço de chamada do modelo GLM-3Turbo de uma certa empresa caiu de 5 yuan/um milhão de tokens para 1 yuan/um milhão de tokens; uma certa empresa lançou um novo modelo com desempenho comparável ao GPT-4 Turbo, que foi aberto gratuitamente a todos os usuários, com a velocidade de chamada da API dobrada, mas o preço reduzido pela metade; o preço de entrada da inferência do modelo principal de uma certa empresa é tão baixo quanto 0,0008 yuan/ mil tokens; uma certa empresa anunciou que seus dois principais modelos são totalmente gratuitos; uma certa empresa anunciou que sua API será aberta gratuitamente para sempre.

A redução geral dos preços das APIs de grandes modelos pode ser atribuída ao avanço das tecnologias de inferência e à diminuição dos custos. Esta tendência oferece objetivamente mais opções aos desenvolvedores, ajudando a promover o desenvolvimento amplo de aplicações de IA.

Entretanto, a Alibaba Tongyi lançou uma série de modelos de linguagem de diferentes tamanhos, com parâmetros variando de 500 milhões a 110 bilhões. Modelos pequenos, como 0,5B e 1,8B, podem ser implantados em dispositivos móveis e PCs, enquanto modelos grandes, como 72B e 110B, suportam aplicações de nível empresarial e de pesquisa. Modelos de médio porte, como 32B, buscam um equilíbrio entre desempenho, eficiência e uso de memória. Além disso, a Tongyi também abriu o código de vários modelos especializados, como compreensão visual, compreensão de áudio, código e especialistas mistos. Estas iniciativas proporcionarão um forte suporte para diversos cenários de aplicação de IA.

"Redução de preços + código aberto" está gradualmente a tornar-se um consenso entre os fabricantes de grandes modelos em todo o mundo. Esta estratégia promete resolver dois grandes problemas enfrentados pelos desenvolvedores de aplicações de IA: o preço elevado das APIs de grandes modelos e a qualidade insuficiente dos modelos de código aberto, impulsionando assim a prosperidade abrangente das aplicações de IA.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • 9
  • Republicar
  • Partilhar
Comentar
0/400
AirdropHunterKingvip
· 07-22 16:33
A era de aproveitar chegou, aguardando Cupões de Recorte
Ver originalResponder0
RegenRestorervip
· 07-22 05:48
Rolou, não é?
Ver originalResponder0
WhaleMistakervip
· 07-21 04:06
Os preços da eletricidade também devem cair!
Ver originalResponder0
LonelyAnchormanvip
· 07-19 17:33
Rolando até sangrar!
Ver originalResponder0
rugpull_ptsdvip
· 07-19 17:32
fazer as pessoas de parvas não dá mais, certo?
Ver originalResponder0
DEXRobinHoodvip
· 07-19 17:31
No mundo crypto, é preciso lutar por uma guerra de preços.
Ver originalResponder0
NftDeepBreathervip
· 07-19 17:31
Vai começar a enrolar de novo, não é?
Ver originalResponder0
Degentlemanvip
· 07-19 17:22
Morreu de tanto rolar
Ver originalResponder0
BearMarketGardenervip
· 07-19 17:08
Está a começar a guerra de preços!
Ver originalResponder0
Ver mais
  • Pino
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)