Escrito por: Haotian
Después de despertar, muchos amigos me piden que mire #manus, que se dice que es un agente de IA verdaderamente universal a nivel mundial, capaz de pensar de forma independiente, planificar y ejecutar tareas complejas, y entregar resultados completos. Suena muy genial, pero además de las voces de ansiedad en muchas redes de amigos sobre perder sus trabajos, ¿qué traerá consigo el gran avance en el escenario web3 DeFai? A continuación, compartiré mis reflexiones:
Hace aproximadamente un mes, OpenAI lanzó Operator, un producto similar, donde la IA puede realizar tareas como reservar restaurantes, comprar, reservar boletos, pedir comida para llevar, etc. de forma independiente en el navegador. Los usuarios pueden supervisar de forma visual y tomar el control en cualquier momento.
La aparición de este agente no ha sido discutida por muchas personas, debido a que se trata de un modelo de un solo conductor, o el marco de herramientas llamado, cuando los usuarios piensan en intervenciones clave para tomar decisiones, pierden la idea de depender de él para realizar tareas.
2)manus en apariencia no difiere mucho, simplemente tiene muchos más escenarios de aplicación, incluida la selección de currículums, la investigación de acciones, la compra de propiedades, etc., pero en realidad son las diferencias en el marco y el sistema de ejecución subyacentes, Manus está impulsado por un gran modelo multimodal e innovador que utiliza un sistema de firmas múltiples.
En resumen, la IA debe imitar el ciclo de acción PDCA (Plan - Do - Check - Act) ejecutado por los humanos, que será realizado por múltiples grandes modelos trabajando juntos, cada uno enfocado en una etapa específica, lo que no solo reduce el riesgo de toma de decisiones de un solo modelo al realizar tareas, sino que también mejora la eficiencia de la ejecución. El llamado “sistema de firma múltiple” en realidad es un mecanismo de verificación de decisiones colaborativas de múltiples modelos, que garantiza la fiabilidad de las decisiones y la ejecución al requerir la confirmación conjunta de varios modelos especializados.
3)En comparación, las ventajas de manus son claramente evidentes, además de una serie de experiencias operativas demostradas en el video, que realmente brindan una experiencia extraordinaria. Sin embargo, objetivamente hablando, la innovación iterativa de Manus en Operator es solo el comienzo y no alcanza un significado revolucionario disruptivo.
El punto clave radica en la complejidad de sus tareas ejecutivas, así como en la definición de la tolerancia a fallos y la tasa de éxito de la entrega del gran modelo después de que el usuario input Prompt entre en un estándar no unificado. De lo contrario, ¿se puede aplicar inmediatamente en escenarios DeFai de web3 esta innovación? Claramente, todavía no se puede lograr:
Por ejemplo: en el escenario DeFai, el Agente debe tomar decisiones comerciales y necesita tener un Agente de capa de Oracle responsable de recopilar y verificar datos en la cadena, realizar análisis e integración de datos, y monitorear en tiempo real las oportunidades comerciales de captura de precios en la cadena. Este proceso representa un gran desafío para el análisis en tiempo real, ya que es posible que una oportunidad comercial útil hace un segundo ya no exista después de que el modelo grande de Oracle se transmita al Agente de ejecución comercial (ventana de arbitraje).
Esto en realidad pone al descubierto la mayor debilidad de este tipo de grandes modelos multimodales para la toma de decisiones, cómo conectarse a la red, activar y acceder a datos de nivel de análisis en tiempo real, identificar oportunidades comerciales y luego capturar transacciones. El entorno de red en realidad no es tan malo, muchos sitios web de comercio electrónico no tienen precios de pedidos que cambien en tiempo real, lo que no causa grandes problemas dinámicos al equilibrio general de la colaboración multimodal. Sin embargo, si se trata de una cadena, este tipo de desafíos casi no existen en ningún momento.
Por lo tanto, en general, la aparición de manus realmente causará ansiedad en el círculo de amigos en el campo de la web2, después de todo, muchos trabajos administrativos y de procesamiento de información con alta repetitividad podrían enfrentar el riesgo de ser reemplazados por la IA. Pero que se preocupen por ellos mismos.
Debemos tener una comprensión objetiva del papel impulsor de web3 en los escenarios de aplicaciones DeFai.
Debe admitirse: definitivamente tiene un gran significado, después de todo, el concepto LLM OS propuesto y la idea de Less Structure more intelligence, especialmente el sistema de firma múltiple, brindarán una gran inspiración para la combinación de DeFi y AI en web3.
Esto en realidad corrige un gran error en la mayoría de los proyectos DeFai, no se debe intentar depender de un gran modelo para lograr objetivos complejos como el pensamiento autónomo y la toma de decisiones del Agente de IA, lo cual no es realista en el contexto financiero.
La realización de la verdadera visión de DeFai requiere abordar problemas complejos como el límite de capacidad de los modelos de IA monolíticos, la garantía de la atomicidad en la interacción colaborativa multimodal, la coordinación y el control unificados de recursos en sistemas multimodales, y mecanismos de tolerancia a fallos y manejo de fallos, entre otros.
Por ejemplo, el Agente de Capa Oracle, que es responsable de recopilar y analizar datos en cadena, monitorear precios y formar una fuente de datos efectiva;
La capa de toma de decisiones Agent, analiza y evalúa el riesgo según los datos proporcionados por Oracle y elabora un conjunto de decisiones y planes de acción;
El agente de nivel de ejecución, según las múltiples soluciones proporcionadas por la capa de toma de decisiones y considerando la situación real para la ejecución, incluida la optimización de los costos de gas, el estado entre cadenas, conflictos en la ordenación de transacciones, etc.
Solo cuando esta serie de Agentes esté sincronizada y tenga un marco de sistema sólido, se podrá desatar una verdadera revolución DeFai.