Вы 15 лет бесплатно помогали Google обучать искусственный интеллект, просто не осознавая этого.

robot
Генерация тезисов в процессе

Вы тренировались с ИИ Google 15 лет. Вы даже не догадывались.

Автор: Шарбель

Источник:

Перевод: Mars Finance

Каждый день около 500 тысяч часов человеческого труда бесплатно используют Google. А те, кто вносит вклад, просто хотят войти в свой онлайн-банк.

reCAPTCHA — одна из самых успешных скрытых систем сбора данных в истории интернета. В пиковые времена ежедневно её проходили 200 миллионов человек. Но почти никто не задумывался, что стоит за каждым кликом.

Компания Google Waymo, занимающаяся беспилотными автомобилями, сейчас оценивается в 45 миллиардов долларов. А большая часть её ключевых тренировочных данных — это бесплатная информация, которую вы предоставляете, посещая разные сайты.

Вот вся история:

Завязка: гениальная идея

В 2000 году спам-боты разрушали интернет. Форумы заполнялись спамом, почтовые ящики переполнялись, сайтам срочно нужно было отличать человека от машины.

Профессор Луис фон Аах из Карнеги-Меллонского университета решил эту проблему. Он изобрёл CAPTCHA — искажённый текст, который могут прочитать только люди, а боты — нет.

Но фон Аах видел не только это. Миллионы людей тратили силы на эти задания. А что если эти усилия можно было использовать для двух целей одновременно?

В 2007 году он запустил reCAPTCHA. Его суть в том, что вместо случайных символов показываются два слова: одно известно системе, другое — реальная книга, которую ещё не распознали компьютеры. Ваш ответ помогал оцифровывать книги.

Эти книги — архив «Нью-Йорк Таймс» и Google Books, всего более 130 миллионов томов.

Вы думали, что просто входите на обычный сайт, а на самом деле помогаете крупнейшей в мире цифровой библиотеке делать OCR (оптическое распознавание символов).

В 2009 году Google официально приобрела reCAPTCHA.

Позже Google изменила подход

Эпоха искажённого текста завершилась примерно в 2012 году.

Google столкнулась с новой задачей: уличные камеры зафиксировали все дороги мира, но фотографии — это только исходные данные. Чтобы AI мог работать с ними, он должен понимать, что изображено: дорожные знаки, пешеходные переходы, светофоры, фасады магазинов.

Поэтому Google переработала reCAPTCHA v2. На изображениях больше не искажённый текст, а сетка фотографий: «Кликните все квадраты с светофорами», «Выделите все пешеходные переходы», «Определите магазины».

Эти картинки взяты прямо из Google Street View. Ваши клики — это метки.

Каждый ваш выбор говорит модели компьютерного зрения Google: этот набор пикселей — светофор, эта форма — пешеходный переход. Вы не проходите тест, вы создаёте датасет.

Масштаб за гранью воображения

В пиковые времена ежедневно решалось 200 миллионов reCAPTCHA. Каждое задание занимало около 10 секунд, итого — 2 миллиарда секунд человеческого труда в день, то есть около 500 тысяч часов.

Стоимость платной разметки данных — примерно 10–50 долларов в час. По минимальным подсчётам, ежедневная ценность этого бесплатного труда достигает 5 миллионов долларов.

И reCAPTCHA — не только в одном приложении. Она есть в каждом банке, на каждом государственном портале, на каждом сайте электронной коммерции. Вам не остаётся выбора: хотите войти — сначала отметьте данные. Google никогда не спрашивала ваше мнение, не платили вам ни копейки, и даже не говорила вам об этом.

Что всё это создало?

Эти данные напрямую питают два продукта:

  • Google Maps: самый популярный навигатор в мире. Его способность распознавать дорожные знаки, магазины и городскую географию частично основана на миллиардах меток, сделанных людьми при входе на сайты.

  • Waymo: проект беспилотных автомобилей Google. Для безопасного движения им нужно почти идеально распознавать тысячи визуальных моделей.

Истинные тренировочные данные для этих задач — это миллионы меток, сделанных миллионами людей без их ведома через reCAPTCHA. В 2024 году Waymo завершила более 4 миллионов платных поездок, её оценка — 45 миллиардов долларов. А основа этого — те самые «бесплатные интернет-граждане», которые просто хотели проверить почту.

Почему никто не может повторить этот подход?

Разметка данных очень дорогая. Компании Scale AI, Appen и Labelbox созданы для решения этой проблемы: они нанимают сотни тысяч работников, иногда за менее чем доллар в час.

Google пошла другим путём: они сделали разметку обязательной. Не платя, не спрашивая согласия, а превращая её в «билет» для доступа к любому уголку интернета. В результате — миллиарды размеченных изображений, глобальное покрытие, работа в любую погоду, в каждом городе. Ни одна компания по разметке не способна на такое. Сам интернет — это фабрика, а каждый пользователь — неофициальный работник.

Вы всё ещё участвуете

В 2018 году вышла reCAPTCHA v3, которая вообще не показывает задания. Она анализирует ваши движения мыши, скорость прокрутки, время задержки. Ваши поведенческие отпечатки позволяют определить, человек вы или бот. Эти данные тоже поступают в систему искусственного интеллекта Google.

Вы никогда не выбирали это сознательно, не было ни галочки, ни согласия. Но сейчас, на большинстве сайтов, вы всё равно делаете это.

Грустная ирония

Изначальная идея Луиса фон Ааха была гениальной: превращать потраченное зря человеческое время в полезный ресурс. Но Google использовала эту идею иначе. Они внедрили механизм безопасности, который вынуждены использовать миллиарды людей, и превратили его в инструмент сбора данных для построения миллиардных бизнесов. Пользователи ничего не получают, даже не знают об этом.

Самая глубокая ирония — в том, что вы тратите годы, чтобы доказать, что вы человек, выполняя задачи, которые AI тогда ещё не мог делать. А когда AI научится этим, человеческая разметка станет ненужной.

Вы доказали, что человек, а в итоге — вас заменят.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить