Владение данными: почему этот гигант искусственного интеллекта превосходит специализированные стартапы голосового ИИ

Гонка за создание идеального голосового помощника на базе ИИ разгорается, стартапы и технологические гиганты вкладывают миллиарды в платформы разговорного ИИ. Но в то время как такие компании, как SoundHound AI, добиваются впечатляющих успехов в узких, специализированных рынках, они сталкиваются с фундаментальной проблемой, которая может ограничить их долгосрочный рост: недостатком всеобъемлющих обучающих данных. Тем временем, один технологический колосс уже обладает инфраструктурой, активами данных и ресурсами, чтобы доминировать в этой новой области — и, возможно, даже пока не пытается этого делать.

История успеха голосового ИИ в ресторанах

SoundHound AI продемонстрировала настоящие инновации там, где это важно — в решении реальных проблем клиентов. Каждый, кто сталкивался с разочарованием из-за автоматического телефонного меню, понимает проблему, которую решает компания: большинство голосовых систем не умеют распознавать естественную речь, особенно в шумных условиях.

Компания превратила эту проблему в конкурентное преимущество. Ее платформа голосового заказа, внедренная в White Castle, достигает на 32% большей точности, чем человеческие сотрудники, обеспечивает обслуживание на 85% быстрее и приносит примерно $58 000 ежегодной экономии затрат на каждую точку. Этот успех вышел за рамки быстрого питания: системы телефонных заказов теперь работают в Five Guys и Red Lobster.

Это не мелкие достижения. SoundHound подтвердил, что агентный ИИ — ИИ, способный понимать контекст и реагировать разумно — работает в условиях высокой нагрузки взаимодействий с клиентами. Компания даже расширила эту технологию в свою платформу Amelia 7 AI, которая набирает популярность в сфере страховых и финансовых услуг поддержки клиентов.

Выход за рамки ниши: проблема данных

Здесь стартап сталкивается с преградой. Хотя SoundHound усовершенствовала голосовой ИИ для ресторанных заказов — относительно ограниченной области с известным набором меню — масштабировать эту технологию для обработки бесконечного разнообразия сценариев обслуживания клиентов гораздо сложнее.

Чтобы создать действительно универсального голосового ИИ-агента для разных отраслей, компании нужны обучающие данные, отражающие тысячи различных индустрий, сценариев и проблем клиентов. Транскрипты ресторанных разговоров сами по себе недостаточны для обучения ИИ, чтобы он мог справляться с запросами по страховым претензиям, технической поддержке, спорам по счетам или любыми другими сценариями, которые должна уметь решать универсальная платформа.

Технологии — чат-боты на базе LLM, программное обеспечение распознавания голоса и голосовые помощники — уже не являются эксклюзивной собственностью. Компании вроде Apple (с Siri) постоянно совершенствуют свои продукты, создавая сильное конкурентное давление. Без уникальных данных у SoundHound есть очень ограниченные сроки для разработки чего-то действительно лучше, чем то, что могут создать уже устоявшиеся игроки.

Еще более важно, что финансовое положение SoundHound ограничивает его возможности. Компания убыточна и имеет отрицательный денежный поток, что маловероятно позволит ей позволить себе дорогое лицензирование сторонних LLM или крупные сделки по приобретению данных. Еще хуже, что количество ее акций за три года удвоилось из-за размывания доли руководством для финансирования приобретений — признак ограниченности капитала, из-за чего конкурировать с более обеспеченными соперниками становится все сложнее.

Колосс с защитой данных

Здесь на сцену выходит Amazon. Гигант электронной коммерции стал пионером в области голосовых помощников с Alexa, а также обладает богатым опытом интеграции ИИ в облачную платформу Amazon Web Services. В прошлом году Amazon представила Alexa+ с улучшенными возможностями ИИ, а также внесла изменения в политику конфиденциальности, требующие от всех пользователей Alexa разрешить загрузку своих голосовых разговоров в облако для анализа и обучения ИИ.

С технической точки зрения, этот сдвиг был необходим — облачная обработка критична для сложных моделей ИИ. Но практический результат оказался значительным: Amazon теперь контролирует огромный резерв данных реальных голосовых взаимодействий по множеству тем, с разными акцентами, фонами и сценариями.

Ранние отзывы показывают, что этот преимущество в данных уже приносит плоды. Пользователи отмечают, что Alexa+ отвечает быстрее и точнее, чем предыдущие версии, что напрямую связано с расширенным набором обучающих данных. Amazon создала своего рода «цикл данных»: больше пользователей — больше данных для обучения — лучшее качество работы Alexa — привлечение еще большего числа пользователей.

Что уже есть у Amazon: полностью функционирующая агентная голосовая платформа, огромные базы данных распознавания голоса, облачная инфраструктура, оптимизированная для обработки миллиардов запросов, и финансовые ресурсы в десятки миллиардов долларов. Компания может в любой момент переключиться на корпоративный сервис поддержки, телекоммуникационные системы или любой смежный рынок, если руководству захочется.

Инвестиционные выводы

Для инвесторов эта ситуация — предостережение. Хотя прогресс SoundHound в области ресторанного голосового ИИ действительно впечатляет, компания находится в очень невыгодной позиции по сравнению с колоссом, который контролирует как технологию, так и данные, необходимые для создания более продвинутых систем.

Команда Motley Fool Stock Advisor недавно составила список из 10 лучших акций на ближайшие годы — и интересно, что Amazon в нем не оказалась. Это может означать, что даже профессиональные аналитики скептически настроены относительно краткосрочных перспектив Amazon или что другие возможности предлагают более взрывной потенциал роста.

Очевидно одно: в рынках ИИ, где владение данными определяет конкурентное преимущество, специализированные стартапы сталкиваются с структурными проблемами, которые невозможно преодолеть только капиталом и исполнительской способностью. Победители в голосовом ИИ, скорее всего, будут те компании, которые уже владеют огромными массивами пользовательских данных и могут использовать это преимущество для создания все более сложных систем. Пока что это остается прерогативой технологического колосса, а не узкоспециализированных новаторов.

Раскрытие информации: Джон Бромелс владеет акциями Amazon и Apple. Motley Fool держит позиции и рекомендует Amazon, Apple и SoundHound AI.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить