Согласно отчету IT House от 19 июня, на крупнейшей в мире конференции по компьютерному зрению CVPR 2023, состоявшейся вчера в Ванкувере, Канада, Исследовательский институт искусственного интеллекта LG, дочерняя компания южнокорейского технологического гиганта LG, раскрыл первый сервис компании по коммерциализации генеративного искусственного интеллекта, Captioning. ИИ. Предоставляет более эффективное решение для клиентов, которым необходимо управлять большим количеством изображений. По словам LG, ИИ с субтитрами основан на технологии обучения с нулевым выстрелом, которая позволяет ИИ использовать свой предыдущий накопленный опыт и знания для объяснения объектов или сцен, которые он видит впервые, как и люди. В среднем сервис может сгенерировать 5 полных описательных предложений и 10 ключевых слов для изображения за 10 секунд. Если количество изображений будет увеличено до 10 000, эти задачи будут выполнены в течение двух дней, так что за короткий период времени можно будет создать индивидуальную систему поиска и управления изображениями. По словам LG, Captioning AI был разработан в тесном сотрудничестве между Исследовательским институтом искусственного интеллекта LG и Shutterstock, одной из крупнейших в мире галерей изображений, которая имеет большой опыт в маркировке изображений. Кроме того, обе стороны также провели проверку этики ИИ, такую как фильтрация и проверка данных обучения, чтобы обеспечить прозрачность авторских прав. Сезал Амин, технический директор Shutterstock, сказал: «В настоящее время мы продолжаем развивать этот сервис с помощью программы раннего доступа для 10 клиентов по всему миру. Сервис призван помочь людям сосредоточиться на более важном контенте и творческих задачах, а не на повторяющихся механических задачах. ”