ゲートニュースによると、3月19日、小米は今朝、MiMo-V2シリーズのAIモデルを正式に発表しました。これには、フラッグシップ推論モデルのPro、全モーダル基盤のOmni、音声合成TTSの3つの製品が含まれます。
MiMo-V2-Proは総パラメータ数が1兆超(42Bの活性化パラメータ)、100万トークン超の長大なコンテキストに対応し、エージェントの作業シナリオ向けに設計されています。Artificial Analysisランキングで世界第8位、国内第2位に入り、PinchBenchとClawEvalの評価でも世界第3位を獲得。全体的な性能はClaude Sonnet 4.6を超え、Opus 4.6に迫るものの、価格は後者の1/5です。256K以内の入力は$1、出力は$3/百万トークン、1M以内の入力は$2、出力は$6/百万トークンです。MiMo Clawモジュールは金山WebOfficeエコシステムと連携済みで、WPSのLingxiとも同期接続されています。
MiMo-V2-Omniは全モーダル基盤で、テキスト、画像、音声、動画の4つの入力に対応し、256Kのコンテキストを持ちます。価格は入力$0.4、出力$2/百万トークンです。音声面では10時間超の長時間音声理解をサポートし、総合評価でGemini 3 Proを超えています。画像理解もClaude Opus 4.6を超え、Gemini 3 Proに迫ります。
MiMo-V2-TTSは自社開発のAudio Tokenizerを基に、数億時間の音声データで事前学習されており、全体のスタイルから局所的な感情まで多粒度のコントロールが可能です。高品質な歌声の合成や、東北弁、四川弁、河南弁、粤語、台湾訛りの方言にも対応しています。
これら3つのモデルは現在、Xiaomi miclaw、MiMo Studio、金山办公、小米ブラウザに接続されており、OpenClaw、OpenCode、KiloCode、Blackbox、Clineの5つのエージェント開発フレームワークを通じて呼び出すことができ、期間限定で1週間無料提供中です。