على مدى 15 عامًا، كنت تدرب الذكاء الاصطناعي لصالح جوجل — فقط لم تكن تعلم بذلك أبدًا

PANews

كل مرة تنقر فيها على “التعرف على إشارة المرور” أو “اختيار جميع معابر المشاة” على الويب، تعتقد أنك فقط تثبت أنك لست روبوتًا. لكن في الواقع، أنت تقوم بوضع علامات على بيانات تدريبية مجانية لنظام ذكاء اصطناعي من جوجل. استمر هذا لأكثر من 15 عامًا، وشمل مئات الملايين من المستخدمين حول العالم، وأدى في النهاية إلى بناء قدرات التعرف البصري في خرائط جوجل، وإلى شركة القيادة الذاتية Waymo التي تقدر قيمتها الآن بـ 45 مليار دولار. خلال هذه العملية، لم يطلب أحد إذنك، ولم يخبرك أحد بالحقيقة، ولم يدفع لك أي مقابل.

النص الأصلي: @sharbel

الترجمة: 大钳子 | PANews 龙虾 نحو 500 ألف ساعة من العمل اليدوي المجاني. يوميًا. من قبل أولئك الذين يعتقدون أنهم فقط يقومون بتسجيل الدخول إلى حساباتهم البنكية.

reCAPTCHA هو أنجح عملية جمع بيانات خفية في تاريخ الإنترنت. في ذروته، كان يتم إكماله من قبل 200 مليون شخص يوميًا. ومع ذلك، قليلون من يدركون ما الذي يبنونه بالضبط.

Waymo — شركة السيارات ذاتية القيادة التابعة لجوجل — تقدر قيمتها الآن بـ 45 مليار دولار. جزء كبير من البيانات التدريبية الأساسية تأتي منك. مجانًا. من كل موقع زرتَه.

إليك القصة كاملة.

البداية: فكرة ذكية

في عام 2000، كانت رسائل البريد المزعج تتسبب في تدمير الإنترنت بأكمله. المنتديات كانت مملوءة بالرسائل المزعجة، والبريد الإلكتروني لا يتحمل الضغط. كانت المواقع بحاجة ماسة إلى طريقة لتمييز البشر عن الآلات.

حلّ المشكلة أستاذ جامعة كارنيجي ميلون، لويس فون أن. اخترع CAPTCHA: نص مشوّه لا يمكن للآلات قراءته إلا بصعوبة، بينما يستطيع البشر ذلك.

لكن فون أن رأى إمكانيات أكبر. ملايين الأشخاص يستهلكون طاقتهم المعرفية في إتمام هذه التحققات. ماذا لو استطعنا أن نستخدم هذه الطاقة في مهمتين في آن واحد؟

في عام 2007، أطلق reCAPTCHA. كانت الحيلة هنا أن تعرض للمستخدمين كلمات مشوّهة، وليس نصوص عشوائية. أحدهما معروف، والآخر مأخوذ من كتب غير قابلة للتعرف عليها بعد من قبل الحواسيب. إجابتك تساعد في رقمنة الكتب.

هذه الكتب تأتي من أرشيف صحيفة نيويورك تايمز، ومن Google Books — التي تحتوي على أكثر من 130 مليون كتاب.

كنت تظن أنك فقط تقوم بتسجيل الدخول، لكنك في الحقيقة تساهم في عمل OCR (التعرف الضوئي على الأحرف) لأكبر مكتبة رقمية في العالم.

في عام 2009، استحوذت جوجل على reCAPTCHA.

图像

جوجل تغير قواعد اللعبة

انتهى عصر النص المشوّه حوالي عام 2012.

واجهت جوجل مشكلة جديدة. سيارات تصوير Google Street View كانت تلتقط كل طرق العالم، لكن الصور كانت مجرد بيانات خام. لكي يكون الذكاء الاصطناعي مفيدًا، يحتاج إلى فهم ما “يراه”: لافتات الطرق، معابر المشاة، إشارات المرور، لافتات المحلات.

لذا، أعادت جوجل تصميم reCAPTCHA إلى الإصدار 2. التحقق لم يعد نصًا مشوّهًا، بل شبكة من الصور: “انقر على جميع المربعات التي تحتوي على إشارة مرور.” “اختر كل معبر مشاة.” “تعرّف على لافتات المحلات.”

هذه الصور تأتي مباشرة من Google Street View.

وكل نقرة منك تعتبر علامة تصنيف. كل اختيار منك يُعلم نموذج الرؤية الحاسوبية في جوجل: هذا المربع هو إشارة مرور، وهذه الشكل هو معبر مشاة.

أنت لا تختبر نفسك، أنت تبني مجموعة بيانات.

图像

حجم لا يتحدث عنه أحد

في ذروته، كانت 200 مليون عملية إكمال لـ reCAPTCHA يوميًا.

كل عملية تحقق تستغرق حوالي 10 ثوانٍ، مما يعني أن هناك 2 مليار ثانية من العمل البشري يوميًا — أي نحو نحو 500 ألف ساعة يوميًا.

سعر السوق للتعليق على البيانات يتراوح بين 10 و50 دولارًا للساعة. بأدنى سعر، فإن القيمة المجانية للعمل المقدم يوميًا تصل إلى 5 ملايين دولار.

ولأن reCAPTCHA ليست مقتصرة على تطبيق واحد، فهي موجودة في كل بنك، وكل بوابة حكومية، وكل منصة تجارة إلكترونية، وكل صفحة تسجيل دخول على الإنترنت. لا خيار لديك. تريد الوصول إلى حسابك؟ عليك أولاً أن تضع علامة على البيانات.

جوجل لم تستشر رأيك أبدًا، ولم تدفع لك، ولم تخبرك حتى بالحقيقة.

图像

ماذا تبني كل هذا

هذه البيانات تُستخدم مباشرة في منتجين:

خرائط جوجل. أكثر أدوات الملاحة استخدامًا في العالم. قدرته على قراءة لافتات الطرق، وتحديد مواقع الشركات، وفهم الجغرافيا الحضرية، تعتمد جزئيًا على مليارات العلامات التي وضعها المستخدمون الذين حاولوا تسجيل الدخول.

وأيضًا Waymo.

Waymo، مشروع السيارات ذاتية القيادة من جوجل، أصبح شركة مستقلة في 2016. من أجل التنقل الآمن، تحتاج السيارات إلى التعرف على آلاف الأنماط البصرية بدقة عالية: إشارات المرور، معابر المشاة، المشاة، علامات التوقف.

البيانات التدريبية الحقيقية لهذه القدرة؟ يتم جمعها من خلال ملايين الأشخاص الذين يضعون علامات على الصور عبر reCAPTCHA — دون أن يعلموا.

بحلول 2024، أكملت Waymo أكثر من 4 ملايين رحلة مدفوعة الأجر، وتعمل حاليًا في سان فرانسيسكو، لوس أنجلوس، وفينكس، وتستمر في التوسع. وتقدر قيمتها بـ 45 مليار دولار.

وهذا المبنى، أساسه، هو من بنى هؤلاء المستخدمين المجانيين الذين يرسلون رسائل البريد الإلكتروني فقط.

لماذا لا يمكن لأحد تكرار ذلك

تكلفة وضع العلامات على البيانات مرتفعة جدًا. شركات مثل Scale AI وAppen وLabelbox موجودة فقط لحل هذه المشكلة. توظف مئات الآلاف من العمال لوضع علامات على الصور، وأحيانًا بأقل من دولار في الساعة.

لكن جوجل حلت المشكلة بطريقة مختلفة تمامًا: جعل وضع العلامات إلزاميًا. بدون مقابل، بدون موافقة، كرسوم دخول لكل موقع على الإنترنت.

النتيجة: مئات الملايين من الصور الموسومة، تغطي العالم، وتختلف في الأحوال الجوية، والأوقات، وكل مدينة على الكرة الأرضية.

لا توجد شركة علامات يمكنها أن تفعل ذلك. الإنترنت هو المصنع، وكل شخص فيه هو موظف غير موقع على عقد.

图像

ما تفعله اليوم

في 2018، أطلقت جوجل reCAPTCHA v3، التي لا تعرض لك أي تحديات للتحقق. تراقب طريقة تحريك الماوس، وتصفح الصفحة، ومدة التوقف. بصمة سلوكك تخبرها إذا كنت إنسانًا أم لا.

هذه البيانات تُرسل أيضًا إلى نظام الذكاء الاصطناعي في جوجل.

لم تختَر الانضمام أبدًا، ولم يوجد مربع اختيار لتؤكد. في معظم المواقع التي تزورها الآن، أنت لا تزال تفعل ذلك.

سخرية تثير التفكير للجميع

كانت فكرة لويس فون أن. عبقرية: أن يعيد توجيه الطاقة المعرفية التي يستهلكها البشر في تصفية البريد المزعج، إلى مهمة ذات قيمة — رقمنة الكتب في العالم، وحل مشكلة حقيقية.

لكن استخدام جوجل لهذه الفكرة كان شيئًا آخر.

لقد أخذوا آلية أمان لا يملك المستخدم خيارًا إلا استخدامها، ونشروها على الإنترنت بأكمله، وجمعوا النتائج، وبنوا منتجات تجارية بقيمة مئات المليارات.

لم يحصل المستخدم على شيء، ولا حتى على حق المعرفة.

وأعمق سخرية هي: أنك قضيت سنوات تثبت أنك إنسان — بطريقة تتطلب منك أداء مهمة لم تكن تستطيع إنجازها في ذلك الوقت الآلات. وعندما تعلمت الآلات أداء هذه المهمة، أصبحت العلامات البصرية التي تضعها أنت بلا فائدة.

لقد أثبت أنك إنسان، بطريقة تجعل نفسك قابلاً للاستبدال.

المصدر: جامعة كارنيجي ميلون، مدونة جوجل (2009)، WebProNews، MakeUseOf، MIT Technology Review، وثائق علنية من Waymo.

شاهد النسخة الأصلية
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات