A onda de redução de preços para inferência de grandes modelos chegou
No dia 21 de maio, a Alibaba Cloud anunciou uma redução significativa nos preços das chamadas API para seu modelo comercial e modelo de código aberto Tongyi Qianwen. Entre eles, o preço de entrada do modelo principal Qwen-Long caiu de 0,02 yuan/ mil tokens para 0,5 yuan/ milhão de tokens, uma redução de até 97%. Essa medida de redução de preços gerou ampla atenção na indústria.
Na verdade, Tongyi Qianwen não é o primeiro grande modelo a implementar reduções de preço para desenvolvedores. Desde maio, várias empresas de grandes modelos lançaram produtos de baixo custo ou medidas de redução de preço: a API do modelo Deep Queso sob uma certa empresa tem um preço de cerca de um por cento do GPT-4-Turbo; o preço de chamada do modelo GLM-3Turbo de uma certa empresa caiu de 5 yuan/um milhão de tokens para 1 yuan/um milhão de tokens; uma certa empresa lançou um novo modelo com desempenho comparável ao GPT-4 Turbo, que foi aberto gratuitamente a todos os usuários, com a velocidade de chamada da API dobrada, mas o preço reduzido pela metade; o preço de entrada da inferência do modelo principal de uma certa empresa é tão baixo quanto 0,0008 yuan/ mil tokens; uma certa empresa anunciou que seus dois principais modelos são totalmente gratuitos; uma certa empresa anunciou que sua API será aberta gratuitamente para sempre.
A redução geral dos preços das APIs de grandes modelos pode ser atribuída ao avanço das tecnologias de inferência e à diminuição dos custos. Esta tendência oferece objetivamente mais opções aos desenvolvedores, ajudando a promover o desenvolvimento amplo de aplicações de IA.
Entretanto, a Alibaba Tongyi lançou uma série de modelos de linguagem de diferentes tamanhos, com parâmetros variando de 500 milhões a 110 bilhões. Modelos pequenos, como 0,5B e 1,8B, podem ser implantados em dispositivos móveis e PCs, enquanto modelos grandes, como 72B e 110B, suportam aplicações de nível empresarial e de pesquisa. Modelos de médio porte, como 32B, buscam um equilíbrio entre desempenho, eficiência e uso de memória. Além disso, a Tongyi também abriu o código de vários modelos especializados, como compreensão visual, compreensão de áudio, código e especialistas mistos. Estas iniciativas proporcionarão um forte suporte para diversos cenários de aplicação de IA.
"Redução de preços + código aberto" está gradualmente a tornar-se um consenso entre os fabricantes de grandes modelos em todo o mundo. Esta estratégia promete resolver dois grandes problemas enfrentados pelos desenvolvedores de aplicações de IA: o preço elevado das APIs de grandes modelos e a qualidade insuficiente dos modelos de código aberto, impulsionando assim a prosperidade abrangente das aplicações de IA.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
23 gostos
Recompensa
23
9
Republicar
Partilhar
Comentar
0/400
AirdropHunterKing
· 07-22 16:33
A era de aproveitar chegou, aguardando Cupões de Recorte
Ver originalResponder0
RegenRestorer
· 07-22 05:48
Rolou, não é?
Ver originalResponder0
WhaleMistaker
· 07-21 04:06
Os preços da eletricidade também devem cair!
Ver originalResponder0
LonelyAnchorman
· 07-19 17:33
Rolando até sangrar!
Ver originalResponder0
rugpull_ptsd
· 07-19 17:32
fazer as pessoas de parvas não dá mais, certo?
Ver originalResponder0
DEXRobinHood
· 07-19 17:31
No mundo crypto, é preciso lutar por uma guerra de preços.
Os preços da API de grandes modelos foram significativamente reduzidos, levando as empresas nacionais a iniciar uma onda de reduções de preços.
A onda de redução de preços para inferência de grandes modelos chegou
No dia 21 de maio, a Alibaba Cloud anunciou uma redução significativa nos preços das chamadas API para seu modelo comercial e modelo de código aberto Tongyi Qianwen. Entre eles, o preço de entrada do modelo principal Qwen-Long caiu de 0,02 yuan/ mil tokens para 0,5 yuan/ milhão de tokens, uma redução de até 97%. Essa medida de redução de preços gerou ampla atenção na indústria.
Na verdade, Tongyi Qianwen não é o primeiro grande modelo a implementar reduções de preço para desenvolvedores. Desde maio, várias empresas de grandes modelos lançaram produtos de baixo custo ou medidas de redução de preço: a API do modelo Deep Queso sob uma certa empresa tem um preço de cerca de um por cento do GPT-4-Turbo; o preço de chamada do modelo GLM-3Turbo de uma certa empresa caiu de 5 yuan/um milhão de tokens para 1 yuan/um milhão de tokens; uma certa empresa lançou um novo modelo com desempenho comparável ao GPT-4 Turbo, que foi aberto gratuitamente a todos os usuários, com a velocidade de chamada da API dobrada, mas o preço reduzido pela metade; o preço de entrada da inferência do modelo principal de uma certa empresa é tão baixo quanto 0,0008 yuan/ mil tokens; uma certa empresa anunciou que seus dois principais modelos são totalmente gratuitos; uma certa empresa anunciou que sua API será aberta gratuitamente para sempre.
A redução geral dos preços das APIs de grandes modelos pode ser atribuída ao avanço das tecnologias de inferência e à diminuição dos custos. Esta tendência oferece objetivamente mais opções aos desenvolvedores, ajudando a promover o desenvolvimento amplo de aplicações de IA.
Entretanto, a Alibaba Tongyi lançou uma série de modelos de linguagem de diferentes tamanhos, com parâmetros variando de 500 milhões a 110 bilhões. Modelos pequenos, como 0,5B e 1,8B, podem ser implantados em dispositivos móveis e PCs, enquanto modelos grandes, como 72B e 110B, suportam aplicações de nível empresarial e de pesquisa. Modelos de médio porte, como 32B, buscam um equilíbrio entre desempenho, eficiência e uso de memória. Além disso, a Tongyi também abriu o código de vários modelos especializados, como compreensão visual, compreensão de áudio, código e especialistas mistos. Estas iniciativas proporcionarão um forte suporte para diversos cenários de aplicação de IA.
"Redução de preços + código aberto" está gradualmente a tornar-se um consenso entre os fabricantes de grandes modelos em todo o mundo. Esta estratégia promete resolver dois grandes problemas enfrentados pelos desenvolvedores de aplicações de IA: o preço elevado das APIs de grandes modelos e a qualidade insuficiente dos modelos de código aberto, impulsionando assim a prosperidade abrangente das aplicações de IA.