Alors que la concurrence s’intensifie dans le domaine de l’IA, le géant de la vente au détail chinois Alibaba a dévoilé son QwQ-32B-Preview qui surpasserait apparemment la série o1 d’OpenAI.
Le dernier modèle aurait apparemment surpassé les modèles o1-preview et o1-mini d’OpenAI sur certains benchmarks spécifiques, tels que les tests AIME et MATH, qui évaluent les performances des modèles d’IA dans les énigmes logiques et les problèmes mathématiques.
Alibaba a créé QwQ-32B-Preview à télécharger.
Selon le géant de la vente au détail, le nouveau modèle d’Alibaba est capable de résoudre des problèmes complexes et complexes par rapport aux modèles linguistiques classiques (LLM) tels que ChatGPT-4 et Claude 3.5.
Un article de Benzinga indique que le QwQ-32B-Preview est l’un des rares disponibles sous licence permissive, permettant aux utilisateurs de le télécharger et de l’utiliser. Le modèle est maintenant disponible sur la plateforme de développement d’IA Hugging Face.
Cependant, Alibaba a publié certains composants du modèle pour limiter la réplication complète du modèle ou les informations sur son fonctionnement.
Le dernier modèle d’Alibaba compte 32,5 milliards de paramètres, ce qui lui permet de gérer des textes allant jusqu’à 32 000 mots. Avec les capacités significatives du modèle et son accessibilité semi-ouverte, le nouveau venu d’Alibaba ouvre la voie à un bond transformateur dans les technologies de raisonnement de l’IA.
Annonce transparente d’Alibaba, qui souligne la sophistication de son modèle, OpenAI a gardé ses comptes de paramètres secrets.
L’arrivée de ce modèle intervient à un moment où OpenAI fait des progrès significatifs dans le secteur de l’IA. En octobre, la valorisation d’OpenAI a atteint 157 milliards de dollars à la suite d’une levée de fonds réussie.
Plus tôt cette semaine, SoftBank Group SFTBF aurait augmenté sa participation dans le fabricant de ChatGPT grâce à un rachat d’actions d’une valeur de 1,5 milliard de dollars pour les employés.
On dit également qu’OpenAI explore le développement de son propre navigateur Web pour défier le navigateur Google Chrome d’Alphabet, filiale de Google, après une pression exercée par le ministère américain de la Justice pour le céder.
Alibaba reconnaît que le modèle a aussi des défauts
Bien qu’il possède certaines forces uniques, le nouveau modèle a également des limites. Selon le groupe, QwQ-32B-Prévisualisation présente des problèmes tels que des changements de langue inattendus, ce qui pourrait potentiellement perturber les utilisateurs. Le modèle a également des performances inférieures dans les tâches nécessitant un raisonnement de bon sens, ce qui est courant avec de nombreuses IA.
Selon AutoGPT, le modèle peut se retrouver pris dans des boucles logiques, retardant les réponses.
Malgré ses défauts, ses capacités de raisonnement lui permettent de vérifier les faits par lui-même, réduisant ainsi les erreurs mais augmentant le temps de résolution.
En raisonnant à travers les tâches et en planifiant les étapes, le modèle d’Alibaba évite certains pièges qui affectent l’IA traditionnelle. Mais cette approche demande un temps supplémentaire qui pourrait limiter l’application en temps réel.
Selon Benzinga, les réponses de QwQ-32B-Preview sont conformes aux normes réglementaires chinoises, évitant les sujets politiquement sensibles.
Par exemple, des sujets politiquement sensibles comme Taiwan donneront des réponses qui sont alignées sur la position du gouvernement chinois.
De plus, les informations sur des événements tels que la place Tiananmen ne donnent aucun résultat, ce qui montre le caractère prudent du modèle.
Bien que cela puisse être idéal pour le marché chinois, cela peut également limiter son attrait sur le marché mondial. Cependant, le modèle est une étape importante dans le monde de l’IA raisonnée. Bien que ses limites puissent restreindre son attrait mondial, ses autres composantes telles que la logique et sa nature semi-ouverte en font un grand concurrent pour OpenAI.
Selon AutoGPT, QwQ-32B-Preview met en évidence le potentiel et les défis de cette frontière passionnante où les laboratoires d’IA du monde entier travaillent à affiner la technologie de raisonnement.
De zéro à Web3 Pro: Votre plan de lancement de carrière de 90 jours