Menulis: Haotian
Setelah bangun tidur, banyak teman meminta saya untuk melihat #manus, yang diklaim sebagai AI Agent yang benar-benar universal secara global, dapat berpikir secara independen dan merencanakan serta melaksanakan tugas-tugas kompleks, serta memberikan hasil yang lengkap. Terdengar sangat keren, tetapi selain suara kekhawatiran di lingkaran teman yang ingin kehilangan pekerjaan, apa yang akan dibawa ke ledakan besar dalam skenario web3 DeFai? Berikut, saya akan berbagi pemikiran saya:
Sebulan yang lalu, OpenAI meluncurkan produk sejenis bernama Operator, di mana AI dapat menyelesaikan tugas-tugas seperti pemesanan restoran, belanja, memesan tiket, pemesanan makanan untuk dibawa pulang, dan lainnya secara mandiri di browser. Pengguna dapat mengawasi secara visual dan mengambil alih kendali kapan pun diperlukan.
Kehadiran agen ini tidak banyak didiskusikan, karena itu didorong oleh model tunggal dan kerangka kerja panggilan alat, pengguna kehilangan kepercayaan pada gagasan bahwa intervensi masih diperlukan untuk keputusan penting dalam menjalankan tugasnya.
2)manus Meskipun tampaknya tidak jauh berbeda, hanya dengan banyak skenario aplikasi tambahan, termasuk penyaringan resume, riset saham, pembelian properti, dan lainnya, namun sebenarnya perbedaannya terletak pada kerangka dan sistem eksekusi di belakangnya, Manus didorong oleh model besar multimodal, dan secara inovatif menggunakan sistem tanda tangan ganda.
Singkatnya, siklus PDCA di mana AI meniru eksekusi manusia (rencana-lakukan-periksa-bertindak) akan diselesaikan oleh beberapa model besar, masing-masing berfokus pada tautan tertentu, yang tidak hanya dapat mengurangi risiko pengambilan keputusan dari satu model untuk melakukan tugas, tetapi juga meningkatkan efisiensi eksekusi. Apa yang disebut “sistem multi-tanda tangan” sebenarnya adalah mekanisme verifikasi keputusan kolaboratif multi-model, yang memastikan keandalan pengambilan keputusan dan eksekusi dengan memerlukan konfirmasi umum dari beberapa model profesional.
3)Dengan membandingkan seperti itu, keunggulan manus jelas terlihat, ditambah dengan serangkaian pengalaman operasi yang ditunjukkan dalam Demo video, benar-benar memberikan pengalaman yang luar biasa. Namun secara obyektif, inovasi iteratif Manus terhadap Operator hanya merupakan awal, belum mencapai arti revolusi yang mengguncang.
Titik kunci terletak pada kompleksitas pelaksanaan tugasnya, serta definisi tingkat kesalahan dan keberhasilan pengiriman dari model besar setelah pengguna input Prompt yang tidak seragam. Kalau tidak, apakah dengan inovasi ini, skenario DeFai web3 bisa segera menjadi aplikasi matang? Jelas, masih belum bisa:
Misalnya: Dalam skenario DeFai, Agent harus membuat keputusan transaksi, membutuhkan seorang Agent tingkat Oracle untuk mengumpulkan dan memverifikasi data rantai, melakukan analisis integrasi data, serta memantau harga rantai secara real-time untuk menangkap peluang transaksi. Proses ini menantang untuk analisis real-time, dimana peluang transaksi yang mungkin masih berguna satu detik sebelumnya, setelah model besar Oracle ditransfer ke Agent eksekusi transaksi, peluang transaksi tidak lagi tersedia (jendela arbitrase);
Ini sebenarnya mengekspos kelemahan terbesar dari model besar multimodal semacam ini dalam pengambilan keputusan eksekutif, yaitu bagaimana menghubungkan, melibatkan, dan mengakses data tingkat Real-Time, menganalisis peluang perdagangan darinya, lalu mengeksekusi perdagangan. Lingkungan jaringan sebenarnya baik-baik saja, banyak situs web e-commerce tidak mengubah harga pesanan secara real-time, tidak menyebabkan ketidakseimbangan dinamis besar bagi kerjasama multimodal secara keseluruhan, tetapi jika ada di rantai, tantangan semacam ini hampir selalu ada.
Jadi, secara keseluruhan, kehadiran manus memang dapat menimbulkan kecemasan di lingkungan web2, mengingat banyak pekerjaan administratif dan pengolahan informasi yang repetitif mungkin menghadapi risiko digantikan oleh AI. Namun biarlah mereka yang cemas.
Peran dorongan web3 terhadap skenario aplikasi DeFai harus dipahami secara obyektif.
Harus diakui: artinya pasti sangat besar, setelah semua, konsep LLM OS dan Less Structure more intelligence yang diajukan, terutama sistem tanda tangan ganda, akan memberikan inspirasi besar bagi penggabungan DeFi dan AI di web3.
Ini sebenarnya mengoreksi kesalahpahaman besar sebagian besar proyek DeFai, jangan langsung bergantung pada satu model besar untuk mencapai target kompleks seperti pemikiran otonom AI Agent + keputusan, ini sama sekali tidak realistis dalam konteks keuangan.
Pencapaian visi DeFai sejati memerlukan penyelesaian masalah kompleks seperti batas kemampuan model AI tunggal, jaminan kerja sama atomik interaksi multi-modal, pengaturan dan pengendalian sumber daya yang seragam untuk sistem multi-modal, serta mekanisme penanganan kesalahan dan kegagalan sistem.
Misalnya: Oracle Layer Agent, bertanggung jawab untuk mengumpulkan data dari rantai dan menganalisis, serta memantau harga, membentuk sumber data yang efektif;
Pengambil keputusan Agennya menganalisis dan mengevaluasi risiko berdasarkan data yang disajikan oleh Oracle, dan merancang serangkaian keputusan dan rencana tindakan;
Agen lapisan pelaksana, berdasarkan berbagai skenario yang diberikan oleh lapisan pengambil keputusan dan mempertimbangkan situasi aktual untuk pelaksanaan, termasuk optimasi biaya gas, status lintas-rantai, konflik urutan transaksi, dan sebagainya.
Hanya dengan serangkaian Agennya yang kuat dan kerangka sistem yang besar, revolusi DeFai yang sebenarnya akan terjadi.