a xAI lançou a sua API Grok Voice, permitindo que os desenvolvedores criem aplicações de voz interativas que podem ouvir, compreender e responder em linguagem natural. A nova funcionalidade suporta conversas de voz em tempo real com reconhecimento de fala multilíngue, oferecendo aos utilizadores acesso a cinco vozes distintas—Ara, Rex, Sal, Eve e Leo—cada uma projetada para clareza e qualidade de som natural. A baixa latência garante interações suaves, enquanto as ferramentas de pesquisa Web e X integradas permitem que as aplicações acessem informações atuais durante as conversas. Isto abre possibilidades para aplicações de IA orientadas por voz em várias plataformas e casos de uso.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • 3
  • Republicar
  • Partilhar
Comentar
0/400
GasWaster69vip
· 2025-12-18 10:59
grok voice api já foi lançado, mais um monte de pessoas vai começar a experimentar, mas será que realmente há alguém usando?
Ver originalResponder0
EthMaximalistvip
· 2025-12-17 20:58
A API de voz do grok foi lançada, com cinco opções de voz, o que é bastante variado, mas as aplicações realmente utilizáveis terão que esperar um pouco mais. A maioria dos desenvolvedores provavelmente ainda está observando.
Ver originalResponder0
TestnetScholarvip
· 2025-12-17 20:52
A API de som foi lançada, com cinco opções de timbre disponíveis, parece boa, só não sei como é a latência.
Ver originalResponder0
  • Fixar