#GateSquareDaily #Deepseek #AIPriceWar #AIAgents


A Guerra de Preços de IA Aquece
O V4 da DeepSeek reduz os preços do mercado, e os efeitos em cadeia já se mostram

Um novo fronte abriu-se na corrida de IA, e não se trata de benchmarks. Trata-se de preço.

Em 24 de abril de 2026, a DeepSeek, com sede em Hangzhou, lançou versões de pré-visualização da sua família de modelos V4: V4-Pro e V4-Flash. Ambos são de peso aberto, licenciados pelo MIT, e suportam uma janela de contexto de 1 milhão de tokens. A manchete, porém, é o custo.

1. Quão agressivo é o corte?

A precificação da API da DeepSeek redefine o piso para modelos de classe fronteira:
• V4-Flash: $0,14 por milhão de tokens de entrada, $0,28 por milhão de tokens de saída • V4-Pro: $1,74 por milhão de tokens de entrada, $3,48 por milhão de tokens de saída
Compare isso com os líderes atuais nos EUA: GPT-5.5 está avaliado em $5 de entrada / $30 de saída por milhão de tokens, enquanto Claude Opus 4.6 funciona a $25 por milhão de tokens de saída. Gemini 3.1 Pro fica em $2 de entrada / $12 de saída.

Em termos simples: V4-Pro custa aproximadamente um sétimo do Claude Opus 4.6 e quase um nono do GPT-5.5 em tokens de saída. V4-Flash é 12,4 vezes mais barato que o Pro, enquanto fica apenas 1,6 pontos atrás dele no SWE-bench Verified. Para os desenvolvedores, essa é a diferença entre um orçamento de IA de 4 meses que dura 7 anos na mesma utilização.

A empresa afirmou que o V4-Pro “iguala modelos líderes em várias áreas” e melhora as capacidades de agentes para tarefas de múltiplas etapas. Testes independentes colocam o V4-Pro em 80,6% no SWE-bench Verified, a 0,2 pontos do Claude Opus 4.6. Ele lidera no LiveCodeBench com 93,5%.

2. Por que isso importa: Três pontos de pressão

Adoção Pode Acelerar
A $0,28 por milhão de tokens de saída, o V4-Flash torna viáveis casos de uso de alto volume: processamento de documentos, análise de bases de código, ciclos de agentes. Startups que estavam fora do alcance do raciocínio de classe GPT-5 agora podem executar cargas de trabalho de produção por 1/10 do custo. O contexto de 1 milhão de tokens significa repositórios de código inteiros ou processos legais cabem numa única solicitação.

Rivais Enfrentam Compressão de Margens
Laboratórios ocidentais já estão aumentando preços e limitando uso para gerenciar a demanda. A movimentação da DeepSeek força uma escolha: reduzir preços e comprimir margens, ou ceder espaço de mercado para desenvolvedores. A diferença de preço não é de 10% ou 20% — é de 7 a 9 vezes em saída. Para empresas que constroem fluxos de trabalho agenticos, o custo por token agora é uma linha de custo, não um erro de arredondamento.

Narrativas de IA Ganham Impulso, Incluindo IA Cripto
Inferência barata muda a economia dos agentes de IA. Se você consegue rodar um modelo de 1,6T de parâmetros por $3,48 por milhão de tokens de saída, agentes on-chain, redes de inferência descentralizadas e projetos de tokens de IA de repente têm um caminho para custos unitários sustentáveis. O V4 é licenciado pelo MIT e de peso aberto, o que significa que qualquer pessoa com GPUs pode hospedar localmente. Isso elimina o lock-in de fornecedores e alinha-se com a tese de composabilidade do cripto.

Hardware também faz parte da história. A Huawei anunciou suporte completo para o V4 em seus chips Ascend 950 no mesmo dia. A DeepSeek validou o modelo tanto em GPUs Nvidia quanto em NPUs Huawei Ascend. A empresa afirmou que os preços do Pro podem cair drasticamente uma vez que os supernós Ascend 950 sejam implantados em escala na segunda metade de 2026. Uma stack de IA doméstica chinesa — modelos mais chips — reduz ainda mais os custos e diminui a dependência de hardware dos EUA.

3. Os Compromissos
O V4-Pro não é o melhor em tudo. No SWE-bench Pro, que mede engenharia de software no mundo real, o Opus 4.7 lidera com 64,3% contra 55,4% do V4-Pro. Em tarefas de raciocínio profundo, o GPT-5.5 ainda mantém uma vantagem. A DeepSeek reconhece que “restrições na capacidade de computação de alto nível” estão limitando a produção do Pro no lançamento.

E há o contexto regulatório: o Departamento de Estado dos EUA alertou globalmente sobre a suposta destilação de modelos de IA dos EUA por parte da China um dia antes do lançamento do V4. A OpenAI e a Anthropic acusaram a DeepSeek de destilar seus modelos. A DeepSeek não respondeu a essas alegações.

4. O que acontece a seguir
1. Pilotos empresariais: Espere que os CFOs reexecutem modelos de ROI. Se o V4-Pro entregar 95% da capacidade por 10% do custo, “suficiente” será a vitória para muitas tarefas. 2. Momentum de código aberto: Com 1,6T de parâmetros, licença MIT e pesos do Hugging Face, o V4 torna-se o maior modelo aberto disponível. Ajustes finos e implantações privadas ficam mais fáceis. 3. Diversificação de hardware: Suporte completo ao Ascend sinaliza que a stack de IA da China está amadurecendo. Se a Huawei produzir em volume, desenvolvedores chineses poderão construir sem Nvidia. 4. Resposta de preços: Acompanhe a OpenAI, Anthropic e Google. Manter o preço enquanto um modelo aberto atinge 80,6% no SWE-bench a 1/9 do custo não é um equilíbrio estável.

Esta é uma guerra de preços, mas também uma mudança de estratégia. O V4 da DeepSeek não afirma superar o GPT-5.5 ou o Claude Opus 4.7 em todos os benchmarks. Ele afirma estar próximo o suficiente, ser aberto e radicalmente mais barato. Nos últimos dois anos, a suposição era que modelos de fronteira requerem orçamentos de fronteira. O V4 rompe esse vínculo.

Se a adoção seguir o preço, então a demanda por inferência, uso de agentes e aplicativos integrados de IA — incluindo tokens de IA cripto — todos se expandirão. Os concorrentes terão que responder em custo, não apenas em capacidade. E a narrativa de que IA avançada deve rodar em chips dos EUA acaba de receber um contraexemplo.

A guerra de IA não é mais apenas sobre quem tem o modelo mais inteligente. Trata-se de quem torna a inteligência acessível.
Ver original
post-image
post-image
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • 8
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
ShizukaKazu
· 17m atrás
Basta avançar 👊
Ver originalResponder0
Crypto_Buzz_with_Alex
· 1h atrás
2026 GOGOGO 👊
Responder0
Ryakpanda
· 3h atrás
Basta avançar 👊
Ver originalResponder0
Falcon_Official
· 4h atrás
LFG 🔥
Responder0
Falcon_Official
· 4h atrás
Para a Lua 🌕
Ver originalResponder0
HighAmbition
· 4h atrás
bom 👍
Ver originalResponder0
world_oneday
· 4h atrás
Para a Lua 🌕
Ver originalResponder0
world_oneday
· 4h atrás
2026 GOGOGO 👊
Responder0
  • Fixar