Anda telah melatih kecerdasan buatan Google secara gratis selama 15 tahun, tetapi selalu dibiarkan dalam gelap.

robot
Pembuatan abstrak sedang berlangsung

Judul asli: You’ve been training Google’s AI for 15 years. You had no idea.

Penulis asli: Sharbel

Sumber asli:

Reprint: Mars Finance

Setiap hari sekitar 500.000 jam pekerjaan manusia dimanfaatkan secara gratis oleh Google. Dan orang-orang yang berkontribusi ini hanya ingin login ke internet banking.

reCAPTCHA adalah operasi data tersembunyi paling sukses dalam sejarah internet. Pada puncaknya, setiap hari ada 200 juta orang yang menyelesaikan verifikasi. Tapi hampir tidak ada yang menyadari apa arti di balik setiap klik tersebut.

Perusahaan mobil otonom Google, Waymo, kini bernilai 45 miliar dolar AS. Sebagian besar data pelatihan inti mereka berasal dari Anda yang secara gratis mengakses berbagai situs web.

Berikut adalah kisah lengkapnya:

Asal Mula: Sebuah Ide Cerdas

Tahun 2000, robot spam sedang menghancurkan internet. Forum penuh spam, kotak masuk penuh, situs web sangat membutuhkan cara membedakan manusia dan mesin.

Profesor Luis von Ahn dari Carnegie Mellon University memecahkan masalah ini. Dia menciptakan CAPTCHA: sebuah teks yang terdistorsi yang hanya bisa dibaca manusia, tidak oleh robot.

Tapi von Ahn melihat lebih dari itu. Jutaan orang menghabiskan waktu dan tenaga untuk tantangan ini. Bagaimana jika tenaga ini bisa digunakan untuk dua hal sekaligus?

Pada 2007, dia meluncurkan reCAPTCHA. Keunggulannya adalah: tidak lagi menampilkan teks acak, melainkan dua kata. Satu sudah diketahui sistem, yang lain adalah buku yang dipindai secara nyata yang belum bisa dikenali komputer. Jawaban Anda membantu digitalisasi buku-buku tersebut.

Buku-buku ini berasal dari arsip The New York Times dan Google Books, sebanyak 130 juta judul.

Anda pikir Anda hanya login ke situs biasa, padahal Anda sedang membantu perpustakaan digital terbesar di dunia melakukan OCR (Optical Character Recognition).

Pada 2009, Google resmi mengakuisisi reCAPTCHA.

Kemudian, Google mengubah permainan

Era “teks terdistorsi” berakhir sekitar tahun 2012.

Google menghadapi tantangan baru: Street View mengambil gambar setiap jalan di seluruh dunia, tapi foto-foto itu hanyalah data mentah. Untuk membuat AI berfungsi, mereka perlu memahami apa yang dilihat: rambu lalu lintas, zebra cross, lampu lalu lintas, toko.

Jadi Google merancang ulang reCAPTCHA v2. Tidak lagi menampilkan teks terdistorsi, melainkan grid gambar. “Klik semua kotak yang berisi lampu lalu lintas.” “Pilih setiap zebra cross.” “Identifikasi toko.”

Gambar-gambar ini langsung diambil dari Street View Google. Klik Anda adalah label.

Setiap pilihan memberi tahu model visi komputer Google: kelompok piksel ini adalah lampu lalu lintas, bentuk itu adalah zebra cross. Anda bukan hanya menguji, Anda membangun dataset.

Skala yang luar biasa

Pada puncaknya, setiap hari 200 juta reCAPTCHA diselesaikan. Setiap tantangan memakan waktu 10 detik, berarti 2 miliar detik kerja manusia setiap hari. Yaitu: 500.000 jam per hari.

Biaya pelabelan data berbayar sekitar 10 hingga 50 dolar AS per jam. Berdasarkan standar minimum, nilai kerja manusia yang diekstraksi secara gratis ini mencapai 5 juta dolar AS per hari.

Dan reCAPTCHA tidak hanya ada di satu aplikasi. Ia tersebar di setiap bank, portal pemerintah, situs e-commerce. Anda tidak punya pilihan: ingin login ke akun? Harus dulu melabel dataset. Google tidak pernah menanyakan pendapat Anda, tidak membayar satu sen pun, bahkan tidak pernah memberi tahu Anda tentang ini.

Semua ini menghasilkan apa?

Data ini langsung memberi makan dua produk:

  • Google Maps: alat navigasi paling populer di dunia. Kemampuannya mengenali rambu, toko, dan geografi kota sebagian besar berkat miliaran label dari manusia saat login.

  • Waymo: proyek mobil tanpa sopir Google. Untuk navigasi aman, mobil otonom harus mengenali ratusan pola visual secara hampir sempurna.

Data pelatihan yang bernilai ini sebenarnya dilabel oleh jutaan orang tanpa sadar melalui reCAPTCHA. Waymo telah menyelesaikan lebih dari 4 juta perjalanan berbayar pada 2024, dengan valuasi 45 miliar dolar AS. Fondasi utamanya adalah mereka yang hanya ingin cek email, para “warga internet tanpa bayaran” yang tidak tahu apa-apa.

Mengapa tidak ada yang bisa meniru model ini?

Pelabelan data sangat mahal. Perusahaan seperti Scale AI, Appen, dan Labelbox ada untuk mengatasi masalah ini, mereka mempekerjakan ratusan ribu pekerja, kadang dengan upah kurang dari 1 dolar AS per jam.

Google mengambil jalan berbeda: mereka menjadikan pelabelan ini wajib. Tanpa bayar, tanpa izin, sebagai “tiket masuk” ke setiap sudut internet. Hasilnya: miliaran gambar berlabel, cakupan global, cuaca 24/7, di setiap kota di dunia. Tidak ada perusahaan pelabelan lain yang mampu melakukan ini. Internet sendiri adalah pabrik, setiap pengguna adalah pekerja tanpa kontrak.

Anda Masih Berpartisipasi

Pada 2018, reCAPTCHA v3 tidak lagi menampilkan tantangan. Ia memantau perilaku Anda: pergerakan mouse, kecepatan scroll, waktu berhenti. Sidik jari perilaku ini memberi tahu apakah Anda manusia. Data ini juga kembali ke sistem AI Google.

Anda tidak pernah secara aktif memilih untuk bergabung, tidak ada kotak centang untuk dicentang. Tapi saat ini, di sebagian besar situs yang Anda kunjungi, Anda tetap melakukannya.

Ironi yang Mengganggu

Tujuan awal Luis von Ahn sangat brilian: mengubah energi yang sebenarnya terbuang manusia menjadi output yang berguna. Tapi yang dilakukan Google justru berbeda. Mereka memanfaatkan mekanisme keamanan yang harus digunakan pengguna, menyebarkannya ke seluruh web, dan menuai hasilnya untuk membangun produk komersial bernilai miliaran dolar. Pengguna tidak mendapatkan apa-apa, bahkan tidak tahu.

Sarkasme terdalam adalah: Anda menghabiskan bertahun-tahun membuktikan bahwa Anda manusia, dengan menyelesaikan pekerjaan pengenalan visual yang bahkan AI saat itu belum mampu. Tapi begitu AI menguasai kemampuan ini, pelabelan visual manusia tidak lagi dibutuhkan.

Anda membuktikan diri sebagai manusia, tapi hasilnya membuat Anda bisa digantikan.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan