Pemain Pokémon Melatih 300 Miliar Foto untuk Perusahaan Membangun "AI World Model", Mendukung Industri Robot Pengiriman

ChainNewsAbmedia

Game augmented reality yang terkenal di seluruh dunia, Pokémon Go (Pokémon Go), dikembangkan oleh Niantic, perusahaan AI di bawah naungan Niantic, sedang memanfaatkan puluhan miliar gambar kota yang diambil oleh pemain selama bertahun-tahun untuk membangun sebuah “sistem penentuan posisi visual” dan model dunia AI yang mampu memahami dunia nyata. Teknologi ini dapat melakukan penentuan posisi secara akurat di lingkungan kota yang sinyal GPS-nya tidak stabil, dan telah diuji bekerja sama dengan perusahaan robot pengantar, membuka arah baru untuk navigasi robot dan AI di dunia nyata.

Gambar pemain Pokémon Go menjadi data pelatihan AI, foto kota membangun model dunia

Sejak diluncurkan pada tahun 2016, Pokémon Go dengan cepat menjadi permainan populer di seluruh dunia, di mana pemain menggunakan kamera ponsel mereka untuk menangkap Pokémon di dunia nyata. Game AR (augmented reality) terkenal yang dikembangkan oleh Niantic ini, meskipun sudah diluncurkan bertahun-tahun yang lalu, tetap memiliki lebih dari 100 juta pemain aktif setiap tahun hingga saat ini.

Namun, selama bermain, pemain harus terus-menerus mengarahkan kamera ponsel mereka ke bangunan dan landmark kota, secara tidak sengaja mengumpulkan sejumlah besar data gambar.

Perusahaan AI di bawah Niantic, Niantic Spatial, baru-baru ini menyatakan bahwa mereka telah mengumpulkan dan mengatur sekitar 30 miliar foto dari lingkungan kota di seluruh dunia, yang semuanya dilengkapi dengan informasi lokasi geografis dan data pengambilan gambar yang akurat, seperti arah ponsel, kecepatan bergerak, dan sudut pengambilan gambar. Data ini saat ini digunakan untuk melatih AI dalam membangun “model dunia” yang dapat memahami ruang nyata.

(Analisis mendalam: Kelemahan LLM? Mengapa Yang Likun berfokus pada jalur Model Dunia dari AMI)

Sistem penentuan posisi visual vs GPS: AI dapat menentukan posisi secara akurat melalui citra bangunan

Dilaporkan oleh NewsForce, teknologi terbaru yang dikembangkan oleh Niantic Spatial adalah sebuah Sistem Penentuan Posisi Visual (Visual Positioning System, VPS). Model AI ini mampu menganalisis foto bangunan atau landmark untuk menentukan posisi pengguna, bahkan dengan tingkat ketelitian hingga sentimeter.

Perusahaan menyatakan bahwa basis data mereka saat ini mencakup lebih dari satu juta landmark di seluruh dunia. Di setiap lokasi, mungkin terkumpul ribuan gambar yang diambil pada waktu berbeda, dari sudut berbeda, dan dalam kondisi cuaca berbeda. AI dapat membandingkan fitur dari gambar-gambar ini untuk memperkirakan posisi perangkat dan arah pandang, menghasilkan estimasi posisi yang cukup akurat.

Chief Technology Officer Niantic Spatial, Brian McClendon, menyebutkan bahwa ini berbeda dari GPS tradisional yang bergantung pada sinyal satelit, sedangkan VPS menentukan posisi melalui “apa yang dilihat”:

Di lingkungan kota yang padat gedung, sinyal GPS sering mengalami bias, yang dapat menyebabkan kesalahan posisi hingga puluhan meter, bahkan salah arah.

Kesalahan semacam ini tidak terlalu berpengaruh bagi pengguna umum, tetapi bagi robot yang membutuhkan navigasi presisi, hal ini bisa menjadi masalah besar. Oleh karena itu, teknologi penentuan posisi berbasis citra ini menjadi solusi yang menarik bagi perusahaan robot.

Dari menangkap Pokémon hingga pengantaran makanan: robot pengantar mulai mengadopsi teknologi Niantic

Saat ini, Niantic Spatial telah bekerja sama dengan perusahaan robot pengantar, Coco Robotics, untuk melakukan pengujian. Coco telah menempatkan sekitar 1.000 robot pengantar di berbagai kota di Amerika Serikat dan Eropa, yang digunakan untuk pengantaran makanan dan bahan kebutuhan pokok. Robot-robot ini berukuran sekitar koper kecil, mampu membawa hingga 8 pizza besar atau 4 kantong bahan kebutuhan pokok.

Perusahaan menyatakan bahwa meskipun robot-robot ini telah menyelesaikan lebih dari 500.000 pengantaran, terkadang mereka masih mengalami kesulitan karena ketidakakuratan GPS, sehingga sulit untuk berhenti tepat di depan restoran atau pintu pelanggan:

Dengan menggunakan model penentuan posisi visual dari Niantic, robot dapat memanfaatkan empat kamera yang terpasang untuk menganalisis lingkungan sekitar secara lebih akurat, sehingga posisi dan arah perjalanan dapat ditentukan dengan lebih baik, meningkatkan keandalan pengantaran.

Era robot datang: Niantic ingin membangun “peta hidup”

CEO Niantic Spatial, John Hanke, menyatakan bahwa awalnya teknologi penentuan posisi visual dikembangkan untuk mendukung kacamata AR dan aplikasi augmented reality lainnya, tetapi seiring berkembangnya industri robot, perusahaan mulai mengalihkan teknologi ini ke navigasi robot.

Dia menjelaskan bahwa perusahaan sedang membangun sebuah sistem yang disebut “Living Map” (Peta Hidup), sebuah model dunia digital yang sangat rinci dan terus diperbarui, mampu mengikuti perubahan di dunia nyata secara berkelanjutan.

Ke depannya, robot pengantar, perangkat pintar, bahkan perangkat AR bisa menjadi sumber data peta, secara terus-menerus mengirimkan informasi lingkungan, sehingga dunia digital semakin mendekati tampilan dunia nyata yang dinamis.

AI perlu memahami dunia nyata: “Model Dunia” menjadi fokus teknologi baru

Dalam beberapa tahun terakhir, bidang penelitian AI mulai menaruh perhatian pada konsep “Model Dunia” (World Model). Meskipun model bahasa besar (LLM) menunjukkan performa luar biasa dalam pengolahan teks dan pengetahuan, mereka masih memiliki keterbatasan dalam memahami ruang fisik dan lingkungan nyata.

Dengan menggabungkan peta, citra, dan informasi lingkungan, model dunia berusaha membuat AI mampu memahami objek, hubungan ruang, dan perubahan lingkungan. Perusahaan seperti Google DeepMind juga sedang mengembangkan model yang dapat menghasilkan dunia virtual untuk melatih agen AI.

Niantic Spatial mengambil pendekatan berbeda, dengan mengumpulkan data citra dunia nyata secara besar-besaran untuk secara bertahap membangun ulang model digital dunia nyata. Dengan akumulasi data yang terus berlangsung, sistem ini berpotensi menjadi infrastruktur penting bagi robot dan AI dalam memahami dunia nyata di masa depan.

Artikel ini berjudul “Pemain Pokémon melatih perusahaan dengan 30 miliar foto untuk membangun ‘Model Dunia AI’, mendukung industri robot pengantar” pertama kali muncul di ABMedia.

Lihat Asli
Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.
Komentar
0/400
Tidak ada komentar