Щойно побачив, що команда MiMo від Xiaomi відкрила вихідний код нової моделі, серії V2.5.


Мене дивує, що вони використовують ліцензію MIT, це дуже відкрито, ти можеш використовувати її для комерційних продуктів, продовжувати тренувати самостійно, змінювати на свій розсуд — їм все одно.
Також коротко про дві моделі.
Професійна версія — це чистий текстовий MoE, з загальним числом параметрів 1.02 трильйона, але не панікуй, у реальності при запуску активується лише 420 мільярдів, навантаження на апаратне забезпечення не таке велике. Вона головним чином призначена для агентських задач і написання коду.
Результати на ClawEval приблизно на рівні GPT-5.4, але є один цікавий показник: кожна задача обходиться приблизно у 70 тисяч токенів, що вдвічі менше, ніж у інших. Це означає, що за ту саму роботу ти платиш значно менше за токени.
Інша — мультимодальна версія, з 3100 мільярдами параметрів, активується 150 мільярдами, може бачити, чути та читати зображення. Вона оснащена спеціальними візуальними та аудіо кодерами. Обидві можуть одночасно обробляти контекст до 1 мільйона токенів, достатньо для довгих кодів або цілого книжкового тому.
Крім того, вони запустили акцію: протягом 30 днів безкоштовно надається квота у 1 мільярд трильйонів токенів.
Особисті користувачі, команди та компанії можуть подати заявку, і після цього використовувати її для таких інструментів, як Claude Code, Cursor та інших.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити