10 de abril, o blog oficial DeepSeek publicou um artigo apresentando o DeepSeek V4, o modelo flagship que será lançado pela DeepSeek. Este modelo não só ultrapassa os limites de escala de parâmetros, mas também promete uma eficiência sem precedentes. Espera-se que o DeepSeek V4 possa processar 1 trilhão de (parâmetros 1M), suporte nativamente dados multimodais, incluindo texto, imagens, vídeos e áudio, e tenha uma janela de contexto de 1 milhão de tokens (equivalente a 15-20 romances completos), tornando-o um concorrente direto dos gigantes ocidentais, como GPT-5.4 da OpenAI e Claude Opus 4.5 da Anthropic. Os preços da API para o DeepSeek V4 são de 10 a 50 vezes mais baratos do que o GPT-5.4 e o Claude Opus 4.5; espera-se que o DeepSeek V4 seja lançado com código aberto sob a licença Apache 2.0. O DeepSeek V4 pode funcionar localmente em sistemas com duas RTX 4090 ou uma RTX 5090. Além disso, a DeepSeek apresentou três inovações revolucionárias para o DeepSeek V4: 1. Memória de engrama; 2. Hipers conexões limitadas de diversidade (mHC); 3. Mecanismo de atenção esparso (DSA) e indexador Lightning. Além disso, na declaração oficial, a DeepSeek observa que, devido às restrições rigorosas de exportação dos EUA para GPUs de alta qualidade da NVIDIA (como B300 e H200), a DeepSeek otimizou o V4 para depender principalmente de chips produzidos na China para sua implementação. Embora o treinamento inicial ainda pudesse usar hardware NVIDIA (como, por exemplo, H800), o modelo foi altamente otimizado para chips Huawei Ascend 950PR e Cambricon MLU.

Ver original
post-image
post-image
post-image
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar