El modelo de IA más reciente de Alibaba QwQ-32B-Preview supera a OpenAI's O1 en algunos benchmarks

2024-11-29 23:33:44

A medida que la competencia se intensifica en el campo de la IA, el gigante minorista chino Alibaba presentó su QwQ-32B-Preview, que según informes supera a la serie o1 de OpenAI.

El último modelo al parecer supera a los modelos o1-preview y o1-mini de OpenAI en algunas pruebas específicas, como las pruebas AIME y MATH, que evalúan el rendimiento de los modelos de IA en rompecabezas lógicos y problemas matemáticos.

Alibaba ha hecho QwQ-32B-Preview para descargar.

Según el gigante minorista, el nuevo modelo de Alibaba es capaz de abordar problemas complejos e intrincados en comparación con los modelos de lenguaje grandes (LLMs) normales como ChatGPT-4 y Claude 3.5.

Un artículo de Benzinga indica que el QwQ-32B-Preview es uno de los pocos disponibles bajo una licencia permisiva, lo que permite a los usuarios descargarlo y usarlo. El modelo ahora está disponible en la plataforma de desarrollo de IA Hugging Face.

Sin embargo, Alibaba lanzó ciertos componentes del modelo para limitar la replicación completa del modelo o las ideas sobre su funcionamiento.

El último modelo de Alibaba cuenta con 32.5 mil millones de parámetros, lo que le permite manejar conjuntos de hasta 32,000 palabras. Con las capacidades significativas del modelo y su accesibilidad semiabierta, el nuevo participante de Alibaba sienta las bases para un salto transformador en las tecnologías de razonamiento de IA.

El anuncio transparente de Alibaba, que subraya la sofisticación de su modelo, OpenAI ha mantenido en secreto el recuento de sus parámetros.

La llegada de este modelo se produce en un momento en que OpenAI está dando pasos significativos en el sector de la IA. En octubre, la valoración de OpenAI aumentó a $157 mil millones después de una exitosa ronda de financiación.

A principios de esta semana, se informó que SoftBank Group SFTBF aumentó su participación en el fabricante de ChatGPT a través de una recompra de acciones de empleados por $1.5 mil millones.

También se dice que OpenAI está explorando el desarrollo de su propio navegador web para desafiar al navegador Google Chrome de la subsidiaria de Alphabet, después de la presión del Departamento de Justicia de EE. UU. para deshacerse de él.

Alibaba admite que el modelo también tiene defectos

Aunque posee algunas fortalezas únicas, el nuevo modelo también tiene limitaciones. Según el grupo, QwQ-32B-Preview tiene problemas como cambios de idioma inesperados, lo que podría confundir a los usuarios. El modelo también rinde por debajo en tareas que requieren razonamiento de sentido común, lo cual es común en muchos sistemas de inteligencia artificial.

Según AutoGPT, el modelo puede quedar atrapado en bucles lógicos, retrasando las respuestas.

A pesar de sus deficiencias, sus capacidades de razonamiento le permiten verificar los hechos por sí mismo, por lo tanto, reduciendo los errores pero aumentando el tiempo de resolución.

Razonando a través de tareas y planificando pasos, el modelo de Alibaba evita algunos obstáculos que afectan a la inteligencia artificial tradicional. Pero este enfoque requiere tiempo adicional que podría limitar la aplicación en tiempo real.

Según Benzinga, las respuestas de ‘QwQ-32B-Preview’ se ajustan a los estándares regulatorios chinos, evitando temas políticamente sensibles.

Por ejemplo, temas políticamente sensibles como Taiwán darán respuestas que estén alineadas con la postura del gobierno chino.

Además, s sobre eventos como la Plaza Tiananmen no obtienen respuestas, lo que muestra el diseño cauteloso del modelo.

Si bien esto puede ser ideal para el mercado chino, también puede limitar su atractivo en el mercado mundial. Sin embargo, el modelo es un paso significativo hacia el mundo de la IA de razonamiento. Si bien sus limitaciones pueden reducir su atractivo global, sus otros componentes como la lógica y su naturaleza semiabierta lo convierten en un gran competidor para OpenAI.

Según AutoGPT, QwQ-32B-Preview destaca el potencial y los desafíos de esta emocionante frontera donde los laboratorios de IA de todo el mundo están trabajando para perfeccionar la tecnología de razonamiento.

De cero a Web3 Pro: Tu plan de lanzamiento profesional de 90 días

MATH-2,26%

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.