A jogada da Tencent foi incrível, o modelo de tradução de 1,8B de parâmetros consegue atingir um nível próximo ao de 32B, além de suportar versões leves de 2 bits e 1,25 bits.


Executar no celular sem dificuldades, essa jogada realmente levou a experiência de grandes modelos para uma faixa acessível.
Parece que o tamanho do modelo não é o único padrão, modelos menores também podem ter grande potencial, e aplicações de IA no celular vão decolar no futuro.
Essa estratégia da Tencent foi muito precisa, controlou os custos e garantiu a eficácia, a competição por grandes modelos está mudando para uma rota de otimização.
Ver original
post-image
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar