Xiaomi et MiniMax lancent simultanément leur offensive, la guerre des prix des agents commence officiellement

robot
Création du résumé en cours

Titre original : Xiaomi et MiniMax lancent simultanément de grandes initiatives, la guerre des prix des Agents est officiellement lancée

Auteur original :律动BlockBeats

Source originale :

Reproduction : Mars Finance

Les 18 et 19 mars, deux entreprises chinoises ont successivement lancé leurs grands modèles d’Agents. La startup nationale d’IA MiniMax a présenté M2.7, tandis que l’équipe de grands modèles de Xiaomi, MiMo, a dévoilé V2-Pro. Les deux modèles figurent tous deux dans le premier rang mondial en benchmark Agent, mais leurs prix de sortie API sont respectivement 1/21 et 1/8 de Claude Opus 4.6.

Les deux entreprises ont lancé leurs produits la même semaine, mais leurs stratégies sont totalement différentes. Elles représentent deux trajectoires technologiques distinctes, jouant chacune leur avenir dans l’ère des Agents.

Même examen, 1/17 du coût

Commençons par la comparaison la plus évidente.

Selon les données d’OpenRouter et des pages de tarification officielles, en termes de prix de sortie API (par million de tokens), MiniMax M2.7 coûte 1,2 dollar, et MiMo V2-Pro coûte 3 dollars. En comparaison, Claude Opus 4.6 est à 25 dollars, GPT-5.2 à 14 dollars, et Claude Sonnet 4.6 à 15 dollars.

L’écart de prix est de plusieurs ordres de grandeur, mais la différence de capacités ne l’est pas. Sur SWE-bench Verified (le benchmark le plus courant pour mesurer les compétences en ingénierie logicielle), MiMo V2-Pro obtient 78 %, Sonnet 4.6 79,6 %, une différence inférieure à deux points de pourcentage. M2.7 affiche un score de 56,22 % sur SWE-Pro, équivalent à GPT-5.3-Codex. Sur VIBE-Pro (évaluation de la capacité de livraison de projets de bout en bout), M2.7 atteint 55,6 %, proche du niveau d’Opus 4.6.

L’intérêt de cette image ne réside pas dans qui est le plus haut ou le plus bas — les systèmes de benchmark de chaque entreprise ne sont pas entièrement alignés, la comparaison directe doit être prudente. L’essentiel réside dans ce « décalage prix-performance » : les modèles Agents nationaux ont déjà atteint un même niveau de capacité, mais dans des plages de prix totalement différentes.

Paramètres d’un billion vs auto-évolution

Le prix n’est qu’une apparence. Les deux entreprises ont dévoilé deux stratégies radicalement différentes.

MiMo V2-Pro suit la voie du « gros effort, miracle ». Selon l’annonce officielle de Xiaomi, V2-Pro possède plus d’un billion de paramètres au total, avec 42 milliards de paramètres activés, et supporte un contexte ultra-long de 1 million de tokens. Son innovation principale est le mécanisme d’attention hybride (Hybrid Attention), combinant l’attention par fenêtre glissante (SWA) et l’attention globale (GA) dans un ratio de 7:1 — la version précédente V2-Flash utilisait un ratio de 5:1. Cette architecture permet au modèle d’être plus stable lors du traitement de longs documents et dans des scénarios d’Agents avec plusieurs outils parallèles. Sur PinchBench (évaluation de la capacité d’appel d’outils d’Agents), MiMo V2-Pro obtient 84 %.

M2.7 suit une voie totalement différente. Selon le blog technique officiel publié par MiniMax le 18 mars, la quantité de paramètres de M2.7 n’a pas été divulguée, mais il présente un mécanisme d’« évolution auto-iterative » : le modèle fonctionne de manière autonome pendant plus de 100 cycles d’optimisation, comprenant l’analyse des trajectoires d’échec, la planification de modifications, la modification de sa propre architecture, l’évaluation, puis la boucle recommence, aboutissant à une amélioration de 30 % des performances sur un ensemble d’évaluation interne. Sur le MLE Bench Lite (évaluation de difficulté pour les compétitions d’apprentissage automatique), M2.7 a obtenu 9 médailles d’or, 5 d’argent et 1 de bronze, avec un taux de médailles moyen de 66,6 %.

Du point de vue de cinq dimensions, ces deux trajectoires sont totalement opposées : MiMo V2-Pro domine clairement en longueur de contexte et en dimension de développement logiciel, tandis que M2.7 se distingue par ses capacités d’automatisation et d’auto-optimisation. Selon le même blog technique de MiniMax, M2.7 a obtenu un score ELO de 1495 sur GDPval-AA (évaluation de traitement de documents professionnels), en tête des modèles open source, et a maintenu un taux de conformité de 97 % dans le test MM-Claw, couvrant plus de 40 compétences complexes.

Cinq mois, quatre versions

Les deux entreprises ne diffèrent pas seulement par leur trajectoire technologique, mais aussi par leur rythme d’itération.

Selon les archives publiques, MiniMax a lancé M2 en octobre 2025, puis M2.7 en mars 2026, en seulement cinq mois, avec quatre versions majeures, chaque 49 jours en moyenne. La différence entre M2.5 et M2.7 n’est que d’environ 30 jours.

Xiaomi, quant à elle, a un rythme différent : en avril 2025, elle a lancé MiMo-7B (modèle de raisonnement open source de 7 milliards de paramètres), puis en décembre de la même année V2-Flash (total de 309 milliards de paramètres), et en mars 2026 V2-Pro (1 trillion de paramètres). Chaque génération voit une augmentation significative de la taille, mais l’intervalle entre les versions est plus long.

MiniMax opte pour une approche de petites étapes rapides, avec des itérations fréquentes mais de faible ampleur, la mécanique d’auto-optimisation de M2.7 étant conçue pour une « évolution continue ». Xiaomi préfère une approche de frappe puissante, chaque version étant une avancée majeure en termes de paramètres et d’architecture.

Anonyme en 8 jours, en tête d’OpenRouter

Au-delà de la stratégie technologique, la stratégie de lancement de Xiaomi brise également les conventions du secteur.

Selon Reuters, le 11 mars, un modèle anonyme nommé Hunter Alpha est apparu sur la plus grande plateforme d’agrégation d’API, OpenRouter. Sans marque, sans conférence de lancement, sans blog technique. Son prix API est très bas, mais ses performances sont étonnamment fortes.

La communauté a commencé à spéculer sur son origine. Selon Republic World et plusieurs médias technologiques, la supposition la plus répandue est qu’il s’agit de DeepSeek V4, car le responsable de l’équipe MiMo, Luo Fuli, a précédemment travaillé chez DeepSeek. Le volume d’appels a rapidement augmenté, atteignant plus de 1 billion de tokens durant la période anonyme, et il a dominé le classement hebdomadaire d’OpenRouter.

Le 19 mars au petit matin, Xiaomi a révélé : Hunter Alpha est en réalité MiMo V2-Pro. Selon le même rapport de Reuters, après cette révélation, l’action de Xiaomi à Hong Kong a brièvement augmenté de 5,8 %.

C’est la première fois qu’un grand modèle national prouve sa capacité sur une plateforme mondiale en mode totalement aveugle. Sans marque, sans publicité, en seulement 8 jours, permettant aux développeurs de voter avec leurs pieds.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler