Ви безкоштовно тренували штучний інтелект Google протягом 15 років, але весь цей час вам приховували це.

robot
Генерація анотацій у процесі

Заголовок: Ви тренували штучний інтелект Google протягом 15 років. Ви навіть не підозрювали.

Автор: Sharbel

Джерело:

Переклад: MarsFinance

Щодня близько 500 000 годин людської праці безкоштовно використовує Google. А ті, хто це робить, просто хочуть увійти до онлайн-банкінгу.

reCAPTCHA — найуспішніша прихована система збору даних в історії Інтернету. У пікові часи щодня понад 200 мільйонів людей проходили верифікацію. Але майже ніхто не усвідомлює, що стоїть за кожним натисканням.

Компанія Google Waymo, яка займається автопілотом, зараз оцінюється у 45 мільярдів доларів. А більша частина її ключових тренувальних даних — це безкоштовна інформація, яку ви надаєте, відвідуючи різні сайти.

Ось повна історія:

Початок: геніальна ідея

У 2000 році спам-боти руйнували Інтернет. Форми заповнювалися спамом, поштові скриньки переповнювалися, сайти потребували способу відрізняти людину від машини.

Професор Луїс фон Аах з Карнегі Меллонського університету вирішив цю проблему. Він винайшов CAPTCHA — код, який може розпізнати лише людина: спотворений текст, який робот не може прочитати.

Але фон Аах бачив не лише це. Мільйони людей витрачали час на ці виклики. А що, якщо цей час можна використовувати для двох справ одночасно?

У 2007 році він запустив reCAPTCHA. Його глибока ідея полягала в тому, що тепер замість випадкового набору символів показували два слова: одне відомо системі, інше — справжня книга, відсканована, але ще не розпізнана комп’ютером. Ваша відповідь допомагала оцифрувати ці книги.

Ці книги походять із архіву The New York Times і Google Books, усього понад 130 мільйонів томів.

Ви думали, що просто входите на звичайний сайт, а насправді допомагаєте глобальній цифровій бібліотеці з розпізнаванням тексту (OCR).

У 2009 році Google офіційно придбав reCAPTCHA.

Згодом Google змінив підхід

Епоха «спотвореного тексту» закінчилася приблизно у 2012 році.

Google знову зіткнувся з новими викликами: у вуличних камерах зняті всі дороги світу, але фотографії — це лише сирі дані. Щоб AI міг ефективно працювати, він має розуміти, що бачить: дорожні знаки, пішохідні переходи, світлофори, фасади магазинів.

Тому Google переробив reCAPTCHA v2. Замість спотвореного тексту — сітка з фотографій. «Клікніть усі квадрати з світлофорами», «Оберіть кожен пішохідний перехід», «Розпізнайте магазини».

Ці зображення беруться безпосередньо з Google Street View. Ваші кліки — це мітки.

Кожен ваш вибір навчає модель комп’ютерного зору Google: цей набір пікселів — світлофор, ця форма — пішохідний перехід. Ви не проходите тест, ви створюєте датасет.

Неймовірний масштаб

У пікові часи щодня розгадувалися 200 мільйонів reCAPTCHA. Кожен виклик займав 10 секунд, тобто щодня витрачалося 2 мільярди секунд людської праці. Або 500 000 годин.

Вартість анотації даних — від 10 до 50 доларів за годину. За мінімальними розрахунками, щоденна вартість безкоштовно зібраної праці становить до 5 мільйонів доларів.

І при цьому reCAPTCHA — це не лише один додаток. Вона використовується у кожному банку, на кожному урядовому порталі, на кожному інтернет-магазині. У вас немає вибору: щоб увійти до облікового запису — потрібно зробити анотацію даних. Google ніколи не питала вашої згоди, не платили вам ні копійки, і навіть не повідомляли про це.

Що все це створює?

Ці дані безпосередньо живлять два продукти:

  • Google Maps: найпопулярніший навігаційний інструмент у світі. Його здатність розпізнавати дорожні знаки, магазини та міську географію частково зобов’язана мільярдам людських міток під час входу на сайти.

  • Waymo: проект безпілотних автомобілів Google. Для безпечної навігації автівки мають майже ідеально розпізнавати тисячі візуальних моделей.

Ці тренувальні дані — це результати роботи сотень тисяч людей, які не підозрювали, що їхні мітки використовуються для навчання AI. У 2024 році Waymo завершила понад 4 мільйони платних поїздок, її оцінка — 45 мільярдів доларів. А фундаментом цього всього є ті, хто просто хотів перевірити пошту — «безкоштовні інтернет-учасники».

Чому ніхто не може повторити цей підхід?

Анотація даних — надзвичайно дорогий процес. Компанії Scale AI, Appen і Labelbox існують саме для його вирішення: вони наймають сотні тисяч працівників, іноді з оплатою менше 1 долара за годину.

Google знайшов інший шлях: зробити анотацію обов’язковою. Не платити, не просити згоди — а зробити це «вхідним квитком» у кожен куточок Інтернету. В результаті: мільярди зображень з мітками, глобальний охоплення, цілодобова робота за будь-якої погоди, у кожному місті світу. Жодна компанія з анотації не здатна на таке. Інтернет — це фабрика, а кожен користувач — неофіційний працівник.

Ви досі берете участь

У 2018 році з’явилася reCAPTCHA v3, яка вже не показує виклики. Вона аналізує ваші рухи мишею, швидкість прокрутки, час затримки. Ваші поведінкові дані визначають, чи ви людина. Ці дані також повертаються у систему штучного інтелекту Google.

Ви ніколи не погоджувалися на це свідомо, не було жодної галочки для згоди. Але зараз, майже на кожному сайті, ви все одно так робите.

Дивна іронія

Початковий задум Луїса фон Ааха був геніальним: перетворити людські зусилля, які вже витрачаються даремно, у корисний ресурс. Але Google використовує цю ідею інакше. Вони застосовують механізми безпеки, які змушені використовувати користувачі, і поширюють їх по всій мережі, щоб збирати дані і створювати багатомільярдні бізнес-продукти. Користувачі нічого не отримують, навіть не підозрюють.

Найглибший іронічний момент — у тому, що ви роками доводили, що ви людина, виконуючи візуальні завдання, які AI ще не міг зробити. А коли AI навчився це робити, людські мітки стали непотрібними.

Ви довели, що ви людина, але водночас зробили себе замінним.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити