xAI выпустила свой API Grok Voice, позволяющий разработчикам создавать интерактивные голосовые приложения, которые могут слушать, понимать и отвечать на естественном языке. Новая возможность поддерживает голосовые разговоры в реальном времени с многоязычным распознаванием речи, предоставляя пользователям доступ к пяти различным голосам — Ara, Rex, Sal, Eve и Leo, каждый из которых разработан для ясности и естественного звучания. Низкая задержка обеспечивает плавное взаимодействие, а встроенные инструменты поиска Web и X позволяют приложениям получать актуальную информацию во время разговоров. Это открывает возможности для голосовых AI-приложений на различных платформах и в различных сценариях использования.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
21 Лайков
Награда
21
3
Репост
Поделиться
комментарий
0/400
GasWaster69
· 2025-12-18 10:59
grok voice api вышел, и снова куча людей собирается начать экспериментировать, но действительно ли кто-то им пользуется?
Посмотреть ОригиналОтветить0
EthMaximalist
· 2025-12-17 20:58
grok voice API вышел, пять вариантов голосов довольно разнообразные, но действительно применимые решения придется подождать, большинство разработчиков, вероятно, все еще наблюдают за ситуацией
Посмотреть ОригиналОтветить0
TestnetScholar
· 2025-12-17 20:52
Вышел API звука, доступно пять вариантов звучания, звучит неплохо, только не знаю, как с задержкой
xAI выпустила свой API Grok Voice, позволяющий разработчикам создавать интерактивные голосовые приложения, которые могут слушать, понимать и отвечать на естественном языке. Новая возможность поддерживает голосовые разговоры в реальном времени с многоязычным распознаванием речи, предоставляя пользователям доступ к пяти различным голосам — Ara, Rex, Sal, Eve и Leo, каждый из которых разработан для ясности и естественного звучания. Низкая задержка обеспечивает плавное взаимодействие, а встроенные инструменты поиска Web и X позволяют приложениям получать актуальную информацию во время разговоров. Это открывает возможности для голосовых AI-приложений на различных платформах и в различных сценариях использования.