Os preços da API de grandes modelos foram significativamente reduzidos, levando as empresas nacionais a iniciar uma onda de reduções de preços.

2025-07-19 17:03:13

A onda de redução de preços para inferência de grandes modelos chegou

No dia 21 de maio, a Alibaba Cloud anunciou uma redução significativa nos preços das chamadas API para seu modelo comercial e modelo de código aberto Tongyi Qianwen. Entre eles, o preço de entrada do modelo principal Qwen-Long caiu de 0,02 yuan/ mil tokens para 0,5 yuan/ milhão de tokens, uma redução de até 97%. Essa medida de redução de preços gerou ampla atenção na indústria.

Na verdade, Tongyi Qianwen não é o primeiro grande modelo a implementar reduções de preço para desenvolvedores. Desde maio, várias empresas de grandes modelos lançaram produtos de baixo custo ou medidas de redução de preço: a API do modelo Deep Queso sob uma certa empresa tem um preço de cerca de um por cento do GPT-4-Turbo; o preço de chamada do modelo GLM-3Turbo de uma certa empresa caiu de 5 yuan/um milhão de tokens para 1 yuan/um milhão de tokens; uma certa empresa lançou um novo modelo com desempenho comparável ao GPT-4 Turbo, que foi aberto gratuitamente a todos os usuários, com a velocidade de chamada da API dobrada, mas o preço reduzido pela metade; o preço de entrada da inferência do modelo principal de uma certa empresa é tão baixo quanto 0,0008 yuan/ mil tokens; uma certa empresa anunciou que seus dois principais modelos são totalmente gratuitos; uma certa empresa anunciou que sua API será aberta gratuitamente para sempre.

A redução geral dos preços das APIs de grandes modelos pode ser atribuída ao avanço das tecnologias de inferência e à diminuição dos custos. Esta tendência oferece objetivamente mais opções aos desenvolvedores, ajudando a promover o desenvolvimento amplo de aplicações de IA.

Entretanto, a Alibaba Tongyi lançou uma série de modelos de linguagem de diferentes tamanhos, com parâmetros variando de 500 milhões a 110 bilhões. Modelos pequenos, como 0,5B e 1,8B, podem ser implantados em dispositivos móveis e PCs, enquanto modelos grandes, como 72B e 110B, suportam aplicações de nível empresarial e de pesquisa. Modelos de médio porte, como 32B, buscam um equilíbrio entre desempenho, eficiência e uso de memória. Além disso, a Tongyi também abriu o código de vários modelos especializados, como compreensão visual, compreensão de áudio, código e especialistas mistos. Estas iniciativas proporcionarão um forte suporte para diversos cenários de aplicação de IA.

"Redução de preços + código aberto" está gradualmente a tornar-se um consenso entre os fabricantes de grandes modelos em todo o mundo. Esta estratégia promete resolver dois grandes problemas enfrentados pelos desenvolvedores de aplicações de IA: o preço elevado das APIs de grandes modelos e a qualidade insuficiente dos modelos de código aberto, impulsionando assim a prosperidade abrangente das aplicações de IA.

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.

23 gostos

Recompensa
23
9
Republicar
Partilhar

Comentar

0/400

AirdropHunterKing

· 07-22 16:33

A era de aproveitar chegou, aguardando Cupões de Recorte

Ver originalResponder0

RegenRestorer

· 07-22 05:48

Rolou, não é?

Ver originalResponder0

WhaleMistaker

· 07-21 04:06

Os preços da eletricidade também devem cair!

Ver originalResponder0

LonelyAnchorman

· 07-19 17:33

Rolando até sangrar!

Ver originalResponder0

rugpull_ptsd

· 07-19 17:32

fazer as pessoas de parvas não dá mais, certo?

Ver originalResponder0

DEXRobinHood

· 07-19 17:31

No mundo crypto, é preciso lutar por uma guerra de preços.

Ver originalResponder0

NftDeepBreather

· 07-19 17:31

Vai começar a enrolar de novo, não é?

Ver originalResponder0

Degentleman

· 07-19 17:22

Morreu de tanto rolar

Ver originalResponder0

BearMarketGardener

· 07-19 17:08

Está a começar a guerra de preços!

Ver originalResponder0

Ver mais

Tópico
#July PPI Beats Expectations
14k Popularidade
#ETH ETFs Top $30B
14k Popularidade
#Gate Alpha Peak Trading Competition
139k Popularidade
#Gate Releases August Reserves Report
20k Popularidade
#BTC Hits New ATH
89k Popularidade

Pino