Viết bởi: Haotian
Khi tôi tỉnh giấc, có rất nhiều bạn bè yêu cầu tôi xem #manus, được mệnh danh là một AI Agent thực sự toàn cầu, có khả năng tự suy nghĩ và lập kế hoạch thực hiện các nhiệm vụ phức tạp một cách độc lập và đưa ra kết quả hoàn chỉnh. Nghe có vẻ rất Cool, nhưng ngoài những tiếng lo lắng về việc mất việc làm mà rất nhiều người bạn đồng nghiệp đang trải qua, nó sẽ mang lại điều gì cho sự bùng nổ của DeFai trong web3? Dưới đây là suy nghĩ của tôi:
Khoảng một tháng trước, OpenAI đã ra mắt sản phẩm cùng loại Operator, AI có thể hoàn thành độc lập các nhiệm vụ như đặt bàn ăn, mua sắm, đặt vé, đặt đồ ăn mang đi trong trình duyệt, người dùng có thể giám sát trực quan và tiếp quản quyền kiểm soát bất cứ lúc nào.
Sự xuất hiện của bộ Agent này không được nhiều người thảo luận, lý do là nó là một mô hình lái đơn lẻ, hoặc là một khung công cụ được gọi, người dùng nghĩ đến quyết định quan trọng vẫn cần can thiệp làm mất ý định dựa vào nó để thực hiện nhiệm vụ.
2)manus Trên bề mặt, có vẻ cũng không khác biệt nhiều, chỉ là nhiều hơn nhiều tình huống ứng dụng, bao gồm sàng lọc hồ sơ, nghiên cứu cổ phiếu, mua bất động sản v.v., nhưng thực tế là sự khác biệt về cấu trúc và hệ thống thực hiện phía sau, Manus được động viên bởi mô hình lớn đa cảm xúc và sáng tạo sử dụng hệ thống chữ ký đa lớp.
Tóm lại, chu trình PDCA trong đó AI bắt chước việc thực hiện của con người (plan-do-check-act) sẽ được hoàn thành bởi nhiều mô hình lớn, mỗi mô hình tập trung vào một liên kết cụ thể, không chỉ có thể giảm rủi ro ra quyết định của một mô hình duy nhất để thực hiện nhiệm vụ mà còn cải thiện hiệu quả thực hiện. Cái gọi là “hệ thống đa chữ ký” thực sự là một cơ chế xác minh quyết định hợp tác đa mô hình, đảm bảo độ tin cậy của việc ra quyết định và thực hiện bằng cách yêu cầu xác nhận chung của nhiều mô hình chuyên nghiệp.
3)Với sự so sánh như vậy, rõ ràng điểm mạnh của manus đã được làm nổi bật, cùng với loạt trải nghiệm hoạt động được thể hiện trong Video Demo, thực sự tạo ra một trải nghiệm đặc biệt. Nhưng một cách khách quan, việc Manus tiến hành sáng tạo theo từng phiên bản chỉ là bước khởi đầu, chưa đạt được ý nghĩa cách mạng đảo lộn.
Điểm quan trọng nằm ở mức độ phức tạp của nhiệm vụ thực thi của nó, cũng như việc xác định tỷ lệ chấp nhận lỗi và tỷ lệ thành công của kết quả khi người dùng input Prompt không thống nhất vào mô hình lớn. Nếu không, theo lối suy luận sáng tạo này, liệu cảnh DeFai của web3 có thể ngay lập tức trở thành ứng dụng trưởng thành không? Rõ ràng, vẫn chưa thể:
Ví dụ: Trong kịch bản DeFai, Agent cần thực hiện quyết định giao dịch, cần có một Oracle Layer của Agent chịu trách nhiệm thu thập và xác minh dữ liệu trên chuỗi, thực hiện phân tích dữ liệu tích hợp, đồng thời theo dõi giá trên chuỗi để nắm bắt cơ hội giao dịch. Quá trình này đối với phân tích thời gian thực có nhiều thách thức lớn, có thể cơ hội giao dịch có ích một giây trước, sau khi mô hình lớn của Oracle được truyền cho Agent thực hiện giao dịch, cơ hội giao dịch sẽ không còn tồn tại (cửa sổ lợi nhuận).
Điều này thực ra đã tiết lộ một trong những điểm yếu lớn nhất của các mô hình lớn đa phương thể thực hiện quyết định, là làm thế nào để kết nối, gọi dữ liệu cấp độ Real-Time và phân tích ra cơ hội giao dịch từ đó, sau đó thực hiện việc giao dịch. Môi trường kết nối thực sự không tệ, giá đơn hàng trên nhiều trang web thương mại điện tử không thay đổi theo thời gian thực, không gây ra rắc rối cân bằng động lớn cho toàn bộ hệ thống đa phương thể, nhưng nếu nằm trên chuỗi, thách thức như vậy gần như luôn tồn tại.
Vì vậy, nói chung, sự xuất hiện của manus thực sự sẽ gây ra lo lắng trong cộng đồng web2, bởi vì nhiều công việc văn phòng và xử lý thông tin có mức độ lặp lại cao có thể đối mặt với nguy cơ bị máy tính thông minh thay thế. Nhưng điều làm họ lo lắng là họ.
Vấn đề này cần được nhận thức một cách khách quan về tác động của web3 đối với các trường hợp ứng dụng DeFai.
Phải thừa nhận: Ý nghĩa chắc chắn rất lớn, cuối cùng nó đã đề xuất LLM OS và ý tưởng Less Structure more intelligence, đặc biệt là hệ thống chữ ký đa bên sẽ mở ra hướng đi lớn cho sự kết hợp DeFi và AI trên web3.
Điều này thực sự sửa chữa một số lỗi lớn của hầu hết các dự án DeFai, không nên chỉ đặt niềm tin vào một mô hình lớn để thực hiện các mục tiêu phức tạp như suy nghĩ tự trọng AI Agent + quyết định, điều này hoàn toàn không phù hợp trong bối cảnh tài chính.
Việc thực hiện tầm nhìn DeFai thực sự yêu cầu giải quyết các vấn đề phức tạp như giới hạn khả năng của mô hình AI đơn, đảm bảo tính nguyên tử của tương tác đa phương tiện, điều phối và kiểm soát tài nguyên thống nhất của hệ thống đa phương tiện, cũng như cơ chế xử lý lỗi và sự cố hệ thống.
Ví dụ: Oracle Layer Agent, chịu trách nhiệm thu thập dữ liệu trên chuỗi và phân tích, theo dõi giá cả, tạo thành nguồn dữ liệu hiệu quả;
Agent cấp quản lý, dựa vào dữ liệu được cung cấp bởi Oracle để phân tích và đánh giá rủi ro, và thiết lập một bộ quyết định và kế hoạch hành động;
Đại diện tầng thực thi, dựa vào nhiều giải pháp được đưa ra bởi tầng quyết định và xem xét tình hình thực tế để thực hiện, bao gồm tối ưu chi phí gas, trạng thái liên chuỗi, xung đột sắp xếp giao dịch và nhiều hơn nữa.
Chỉ khi chuỗi Agent này hoàn toàn mạnh mẽ và có một hệ thống khung lớn được thiết lập, cuộc cách mạng DeFai thực sự mới có thể bùng nổ.