¿El marco del Agente de Inteligencia Artificial es la última pieza del rompecabezas? ¿Cómo se interpreta la 'dualidad onda-partícula' del marco?

2025-01-03 07:35:35

Escrito por: Kevin, el investigador de BlockBooster

El marco de AI Agent, como una pieza clave para el desarrollo de la industria, puede tener un doble potencial para impulsar la implementación de la tecnología y la madurez del ecosistema. Algunos marcos ampliamente discutidos en el mercado incluyen: Eliza, Rig, Swarms, ZerePy, etc. Estos marcos atraen a los desarrolladores a través de los repositorios de Github y establecen su reputación. Emitiendo monedas a través de ‘bibliotecas’, estos marcos tienen características similares a las de las ondas y partículas, y el marco de Agente combina tanto la externalidad seria como las características de la ‘memecoin’. Este artículo se centrará en la ‘dualidad onda-partícula’ del marco y por qué el marco de Agente puede convertirse en el último jugador.

El rendimiento externo traído por el marco del agente puede dejar brotes verdes después de que la espuma se disipe

Desde el nacimiento de GOAT, la fuerza del impacto narrativo del Agente en el mercado ha seguido aumentando, como un maestro de kung fu con su puño izquierdo ‘Memecoin’ y su palma derecha ‘esperanza de la industria’, siempre terminarás siendo derrotado por uno de ellos. De hecho, los escenarios de aplicación del Agente de IA no están estrictamente diferenciados, los límites entre plataformas, marcos y aplicaciones específicas son borrosos, pero aún se pueden clasificar aproximadamente según las preferencias de los tokens o protocolos. Sin embargo, las preferencias de desarrollo de tokens o protocolos se pueden dividir en las siguientes categorías:

Launchpad: plataforma de emisión de activos. Protocolo virtuals de Base Chain y clanker, Dasha de Solana Chain.

Aplicaciones de AI Agent: se encuentran entre Agent y Memecoin, destacando en la configuración de la memoria, como GOAT, aixbt, etc. Estas aplicaciones suelen tener salidas unidireccionales y condiciones de entrada muy limitadas.

Motor de AI Agent: griffain de la cadena Solana y Spectre AI de la cadena base. griffain puede evolucionar desde el modo de lectura/escritura al modo de lectura, escritura y acción; Spectre AI es un motor RAG para búsqueda en la cadena.

Marco del Agente de IA: Para una plataforma de marco, el Agente en sí mismo es un activo, por lo que el Marco del Agente es una plataforma de emisión de activos del Agente, es el punto de partida del Agente. Los proyectos representativos actuales incluyen ai16, Zerebro, ARC y Swarms, que han sido ampliamente discutidos en estos días.

Otras direcciones pequeñas: Agente integral Simmi; Modo de protocolo AgentFi; Agente de falsificación Seraph; Creador de API en tiempo real Creator.Bid.

Al discutir aún más el marco del Agente, se puede ver que tiene una externalidad suficiente. A diferencia de los desarrolladores de las principales cadenas y protocolos públicos, que solo pueden elegir entre diferentes entornos de desarrollo de lenguajes, el tamaño total de los desarrolladores en la industria no ha mostrado un crecimiento correspondiente en la capitalización de mercado. El repositorio de Github es donde los desarrolladores de Web2 y Web3 llegan a un consenso, construyendo una comunidad de desarrolladores aquí, con un mayor atractivo e influencia entre los desarrolladores de Web2 que cualquier paquete desarrollado individualmente por un protocolo.

Los 4 marcos mencionados en este artículo son todos de código abierto: el marco Eliza de ai16z tiene 6200 estrellas; el marco ZerePy de Zerebro tiene 191 estrellas; el marco RIG de ARC tiene 1700 estrellas; el marco Swarms de Swarms tiene 2100 estrellas. Actualmente, el marco Eliza se utiliza ampliamente en diversas aplicaciones de Agent y es el marco con mayor cobertura. El nivel de desarrollo de ZerePy no es muy alto y su dirección de desarrollo se centra principalmente en X, sin soporte para LLM local y memoria integrada. RIG tiene la dificultad de desarrollo relativa más alta, pero puede brindar a los desarrolladores la máxima libertad para optimizar el rendimiento. Además del lanzamiento de mcs por parte del equipo, Swarms aún no tiene otros casos de uso, pero Swarms puede integrar diferentes marcos y tiene un gran espacio para la imaginación.

Además, en la clasificación anterior, separar el motor y el marco del Agente puede causar confusión. Pero creo que hay una diferencia entre los dos. En primer lugar, ¿por qué un motor? Compararlo con los motores de búsqueda en la vida real es bastante adecuado. A diferencia de las aplicaciones de Agente homogéneas, el rendimiento del motor del Agente está por encima de ellas, pero al mismo tiempo está completamente encapsulado, es una caja negra ajustada a través de la interfaz de API. Los usuarios pueden experimentar el rendimiento del motor del Agente a través de un fork, pero no pueden tener una comprensión completa ni libertad de personalización como lo harían con el marco básico. El motor de cada usuario es como un espejo generado en un Agente bien entrenado, interactuando con el espejo. Por otro lado, el marco se crea fundamentalmente para adaptarse a la cadena, ya que tanto el Agente como el marco del Agente tienen como objetivo final integrarse con la cadena correspondiente. Cómo definir el método de intercambio de datos, cómo definir el método de validación de datos, cómo definir el tamaño del bloque, cómo equilibrar el consenso y el rendimiento, son cosas que el marco necesita considerar. ¿Y el motor? Solo necesita ajustar el modelo y establecer la relación entre el intercambio de datos y la memoria en una dirección determinada, el rendimiento es el único criterio de evaluación, pero no es así para el marco.

Evaluar el marco de Agente desde la perspectiva de la dualidad onda-partícula puede ser una premisa para asegurarse de que se está en el camino correcto.

En el ciclo de vida de la entrada y salida del agente, se necesitan tres partes. Primero, el modelo subyacente determina la profundidad y el enfoque del pensamiento, luego la memoria es el lugar personalizado donde se realiza la modificación según el modelo base, y finalmente se completa la operación de salida en diferentes clientes.

Fuente: @SuhailKakar

Para demostrar que el marco del Agente tiene una ‘dualidad onda-partícula’, ‘onda’ tiene las características de ‘Memecoin’, que representa la cultura de la comunidad y la actividad de los desarrolladores, enfatizando la atracción y capacidad de difusión del Agente; ‘partícula’ representa las características de ‘expectativas de la industria’, que representa el rendimiento subyacente, casos de uso reales y profundidad técnica. Voy a explicar esto con ejemplos de tutoriales de desarrollo de tres marcos desde dos perspectivas diferentes.

El marco de Eliza de montaje rápido

Configurar el entorno

Fuente: @SuhailKakar

Instalar Eliza

Fuente: @SuhailKakar

Configuración del archivo

Fuente: @SuhailKakar

Configurar el carácter del agente

Fuente: @SuhailKakar

El marco de Eliza es relativamente fácil de usar. Está basado en TypeScript, que es un lenguaje familiar para la mayoría de los desarrolladores web y web3. El marco es conciso, sin abstracciones excesivas, lo que permite a los desarrolladores agregar fácilmente las funciones que desean. En el paso 3, se puede ver que Eliza puede integrarse en múltiples clientes, lo que se puede entender como un ensamblador para la integración en múltiples clientes. Eliza es compatible con plataformas como DC, TG y X, y también admite varios modelos de lenguaje natural, que pueden tomar entradas a través de las redes sociales mencionadas anteriormente y producir salidas a través del modelo LLM. Además, cuenta con un sistema de gestión de memoria integrado que permite a los desarrolladores implementar rápidamente un agente de inteligencia artificial personalizado.

Debido a la simplicidad del marco y la riqueza de la interfaz, Eliza ha reducido significativamente la barrera de entrada y ha logrado un estándar de interfaz relativamente unificado.

Un marco ZerePy de uso único

Fork the ZerePy repository

Fuente:

Configurar X y GPT

Fuente:

Configurar el carácter del agente

Fuente:

Marco de Rig optimizado para el rendimiento

Tomando como ejemplo la construcción de un agente RAG (Recuperación y Generación Mejorada)

Configurar el entorno y la clave de OpenAI

Fuente:

Configurar el cliente de OpenAI y utilizar el chunking para procesar archivos PDF

Fuente:

Establecer la estructura del documento y la incrustación

Fuente:

Crear almacenamiento vectorial y agente RAG

Fuente:

Rig（ARC）es un marco de construcción de sistemas de inteligencia artificial basado en el motor de flujo de trabajo LLM y el lenguaje Rust, que busca resolver problemas de optimización de rendimiento más fundamentales. En otras palabras, ARC es una “caja de herramientas” de motor de inteligencia artificial que proporciona servicios de soporte en segundo plano como llamadas de inteligencia artificial, optimización de rendimiento, almacenamiento de datos, manejo de excepciones, entre otros.

Rig se ocupa del problema de ‘llamada’ para ayudar a los desarrolladores a elegir mejor LLM, optimizar las sugerencias de palabras clave, administrar tokens de manera más efectiva y cómo manejar el procesamiento concurrente, administrar recursos, reducir la latencia, etc. Su enfoque principal es cómo ‘aprovecharlo’ en el proceso de colaboración entre el modelo de LLM de IA y el sistema de agente de IA.

Rig es una biblioteca de código abierto en Rust que tiene como objetivo simplificar el desarrollo de aplicaciones impulsadas por LLM (incluido el agente RAG). Debido a que Rig es más abierto, requiere un mayor nivel de conocimiento por parte de los desarrolladores en Rust y Agent. Este tutorial es el proceso de configuración más básico del agente RAG, que mejora LLM mediante la combinación de LLM con la recuperación de conocimiento externo. En otros DEMO en el sitio web oficial, se pueden ver las siguientes características de Rig:

LLM Interfaz unificada: admite una API coherente para proveedores LLM diferentes, simplificando la integración.

Flujo de trabajo abstracto: los componentes preconstruidos modularmente permiten que Rig asuma el diseño de sistemas de IA complejos.

Almacenamiento vectorial integrado: ofrece soporte para el almacenamiento de recortes de cuerpo integrado, brindando un rendimiento eficiente en Agentes de búsqueda similares a RAG.

Incorporación flexible: proporciona una API fácil de usar para manejar la incorporación, lo que reduce la dificultad de comprensión semántica al desarrollar agentes de búsqueda similares como RAG Agent.

Se puede ver que en comparación con Eliza, Rig ofrece un espacio adicional de optimización de rendimiento para los desarrolladores, ayudando a depurar mejor las llamadas y la optimización de la colaboración entre LLM y Agent. Rig utiliza el rendimiento impulsado por Rust, aprovecha la abstracción sin costo y la seguridad de memoria de Rust, y tiene operaciones de LLM de alto rendimiento y baja latencia. Puede proporcionar una mayor libertad a nivel de bajo nivel.

El marco de enjambres de descomposición y composición de Swarms

Swarms tiene como objetivo proporcionar un marco de programación de múltiples agentes a nivel empresarial y de producción. El sitio web ofrece docenas de flujos de trabajo y arquitecturas de agentes paralelos y en serie. Aquí se presentan algunas de ellas.

Flujo de trabajo secuencial

Fuente:

La arquitectura Swarm secuencial procesa las tareas en orden lineal. Cada agente completa su tarea antes de pasar los resultados al siguiente agente en la cadena. Esta arquitectura garantiza un procesamiento ordenado y es muy útil cuando las tareas tienen dependencias.

Casos de uso:

Cada paso en el flujo de trabajo depende del paso anterior, como una línea de ensamblaje o procesamiento de datos secuencial.

Escenario que requiere seguir estrictamente el orden de las operaciones.

Arquitectura jerárquica:

Fuente:

Implementar un control descendente, en el que el Agente superior coordina las tareas entre los Agentes inferiores. Los Agentes ejecutan las tareas al mismo tiempo y luego retroalimentan sus resultados al ciclo para una agregación final. Esto es muy útil para tareas altamente paralelizables.

Estructura de formato de hoja electrónica:

Fuente:

Una arquitectura de grupo a gran escala para gestionar múltiples agentes que trabajan al mismo tiempo. Puede gestionar simultáneamente miles de agentes, cada uno de los cuales se ejecuta en su propio hilo. Es una opción ideal para supervisar la salida de agentes a gran escala.

Swarms no solo es un marco de Agent, sino que también es compatible con los marcos Eliza, ZerePy y Rig mencionados anteriormente, con la idea de modularidad, maximizando el rendimiento del Agente en diferentes flujos de trabajo y arquitecturas para resolver problemas correspondientes. La concepción y el progreso de la comunidad de desarrolladores de Swarms no tienen problemas.

Eliza: La usabilidad es la más fuerte y es adecuada para principiantes y desarrollo rápido de prototipos, especialmente para la interacción de IA en plataformas de redes sociales. El marco es conciso y fácil de integrar y modificar rápidamente, adecuado para escenarios que no requieren una optimización excesiva de rendimiento.

ZerePy: una aplicación de agente de IA para el desarrollo rápido de aplicaciones Web3 y plataformas sociales con implementación con un solo clic. Es adecuado para aplicaciones de IA de bajo peso, con un marco simple y una configuración flexible, lo que permite la construcción y la iteración rápida.

Rig: Se centra en la optimización del rendimiento, especialmente en tareas de alta concurrencia y alto rendimiento, adecuado para desarrolladores que requieren un control y optimización detallados. El marco es bastante complejo y requiere cierto conocimiento de Rust, por lo que es adecuado para desarrolladores más experimentados.

Swarms: adecuado para aplicaciones empresariales, admite la colaboración de múltiples agentes y la gestión de tareas complejas. El marco es flexible, admite procesamiento en paralelo a gran escala y ofrece varias configuraciones de arquitectura, pero debido a su complejidad, puede requerir un mayor conocimiento técnico para su aplicación efectiva.

En general, Eliza y ZerePy tienen ventajas en usabilidad y desarrollo rápido, mientras que Rig y Swarms son más adecuados para desarrolladores profesionales o aplicaciones empresariales que requieren alto rendimiento y procesamiento a gran escala.

Esta es la razón por la que el marco de Agent tiene características de ‘esperanza de la industria’. El marco mencionado anteriormente aún está en una etapa temprana y la tarea más urgente es aprovechar la ventaja de ser pionero y establecer una comunidad de desarrolladores activa. El rendimiento del marco en sí y si está rezagado en comparación con las aplicaciones populares de Web2 no son las principales contradicciones. Solo un flujo constante de desarrolladores hacia el marco puede ganar en última instancia, porque la industria de Web3 siempre necesita atraer la atención del mercado. No importa cuán fuerte sea el rendimiento del marco o cuán sólidos sean los fundamentos, si es difícil de usar y nadie lo utiliza, entonces las prioridades están invertidas. En el caso de que el marco pueda atraer a los desarrolladores por sí mismo, un marco con un modelo económico de tokens más maduro y completo destacará.

La característica “Memecoin” del marco de Agent es fácil de entender. Las fichas del marco anterior no tienen un diseño económico de fichas razonable, no tienen casos de uso o los casos de uso son muy limitados, no tienen modelos comerciales verificados y no tienen una rueda de inercia de fichas efectiva. El marco sólo es un marco y no está orgánicamente integrado con las fichas. El aumento del precio de las fichas es difícil de obtener sin la ayuda de los fundamentos, además de FOMO, y no hay suficientes fosos para garantizar un crecimiento de valor estable y duradero. Al mismo tiempo, el marco anterior también parece bastante rudimentario, y su valor real no coincide con su valor de mercado actual, por lo que tiene una fuerte característica de “Memecoin”.

Es importante tener en cuenta que la ‘dualidad onda-partícula’ del marco de Agent no es una desventaja, no se puede entender de manera brusca como simplemente no es un Memecoin puro, ni una semilata de agua sin caso de uso de token. Como mencioné en mi artículo anterior: el marco liviano de Agent cubre el velo ambiguo de Memecoin, la cultura comunitaria y los fundamentos ya no serán contradictorios, un nuevo camino de desarrollo de activos está emergiendo gradualmente; a pesar de la burbuja y la incertidumbre iniciales del marco de Agent, su potencial para atraer desarrolladores y promover la implementación de aplicaciones no debe ser pasado por alto. En el futuro, un marco con un modelo económico de token completo y un sólido ecosistema de desarrolladores podría convertirse en un pilar clave en esta carrera.

ELIZA-8,13%

SWARMS-1,95%

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

2 me gusta