Xiaomi анонсировала три новые модели искусственного интеллекта: MiMo-V2-Pro, MiMo-V2-Omni и MiMo-V2-TTS. Они уже интегрированы в собственную экосистему Xiaomi, включая MiMo Studio, Xiaomi Browser и Kingsoft Office, а также доступны через инструменты для разработчиков, такие как OpenClaw, OpenCode и Cline. Для разработчиков также доступна бесплатная пробная версия на одну неделю.
Главная модель здесь — MiMo-V2-Pro, которую Xiaomi позиционирует как свой флагман для так называемой «эры агентов». Она создана для ресурсоемких задач в реальных условиях, имеет более 1 ТБ общего объема параметров и контекстное окно размером 1 МБ.
Xiaomi утверждает, что MiMo-V2-Pro способен справляться со сложными задачами, такими как организация рабочих процессов и долгосрочное планирование, без участия человека, особенно в рамках агентских систем. Компания также заявляет, что его производительность близка к моделям типа Claude Opus 4.6, при этом стоимость использования через API значительно ниже. Цена начинается от 1 доллара за миллион токенов для ввода данных в небольших контекстах и увеличивается для более крупных.
Данная модель интегрирована в инструменты WPS Office от Kingsoft, где она может работать с документами Word, Excel, PowerPoint и PDF.
MiMo-V2-Omni использует иной подход, ориентированный на мультимодальные задачи. Она предназначена для одновременной обработки аудио, изображений и видео, и Xiaomi заявляет о высокой производительности в таких областях, как распознавание звука и визуальное мышление.
Эта модель способна обрабатывать длинные аудиовходы, сценарии с несколькими говорящими и комбинированный аудио-видеоанализ, что указывает на более широкий спектр применения, выходящий за рамки обработки текста. Xiaomi утверждает, что в некоторых случаях её способность распознавать звук превосходит даже такие модели, как Gemini 3 Pro.
Между тем, MiMo-V2-TTS — это модель синтеза речи от Xiaomi. Здесь можно детально настроить тон, эмоцию и стиль речи. Xiaomi утверждает, что она может обрабатывать всё — от естественной речи до пения, с поддержкой нескольких китайских диалектов.
В прошлом году Xiaomi анонсировала MiMo, свою первую крупную языковую модель с открытым исходным кодом, ориентированную на выполнение задач, требующих логического и математического анализа.
Ранее Илон Маск заявил, что уже к выходным компания xAI будет одновременно обучать сразу три разные версии модели Grok.