MiMo‑V2‑Pro da Xiaomi alcança desempenho próximo a GPT‑5.2 e Opus 4.6 por fração do custo

A Xiaomi apresentou o MiMo‑V2‑Pro, um modelo foundation projetado para tarefas de raciocínio com 1 trilhão de parâmetros e desempenho comparável, em benchmarks, a modelos como GPT‑5.2 e Opus 4.6, enquanto roda via API proprietária por cerca de um sétimo do custo observado em concorrentes.

O modelo usa uma arquitetura esparsa: apesar dos 1T de parâmetros totais, apenas 42B ficam ativos a cada forward pass. A infraestrutura também traz uma proporção de atenção híbrida de 7:1 (acima dos 5:1 da versão Flash) e uma janela de contexto de 1M tokens, combinação que permite manter memória de tarefas longas sem aumentar drasticamente latência ou custo.

Equipe e estratégia operacional tentam mudar o foco do texto conversacional para agentes autônomos: o projeto, liderado por Fuli Luo, prioriza operação em espaços de ação complexos, potencialmente controlando “garras” digitais e integrando raciocínio a sistemas físicos. Luo afirmou em um post no X que a empresa pretende abrir uma variante do modelo “quando os modelos estiverem estáveis o suficiente para merecer”.

Além do uso em software, a Xiaomi aposta que a integração entre hardware e IA — construída sobre sua experiência em smartphones e veículos elétricos como o SU7 e o YU7 — ajudará a colocar o MiMo‑V2‑Pro como cérebro de sistemas complexos, de cadeias de suprimentos a agentes autônomos que exigem raciocínio prolongado e eficiente.

Fontes: Twitter, Twitter