Huawei lança acelerador de IA Atlas 350 com 1,56 PFLOPS em FP4 e até 112 GB de HBM

Huawei apresentou no Huawei China Partner Conference 2026, em Shenzhen, o acelerador de IA Atlas 350, baseado no silício Ascend 950PR. O Atlas 350 entrega 1,56 PFLOPS de desempenho em FP4 e traz até 112 GB de memória HBM proprietária chamada HiBL 1.0, e a empresa afirma que isso representa 2,87 vezes a performance da H20 da Nvidia.

O Atlas 350 foi projetado para a etapa de prefill (inferência) e é otimizado para a precisão FP4, formato que permite implantar modelos maiores com menos memória. A vantagem anunciada sobre a H20 não é diretamente verificável porque GPUs da geração Hopper não suportavam FP4 nativamente; a adoção do FP4 pela Nvidia só ocorreu mais recentemente com os GPUs Blackwell.

O Ascend 950PR, base do Atlas 350, traz especificações de memória e interconexão elevadas: embora o silício seja especificado com 128 GB e 1,6 TB/s de largura de banda, relatos atuais indicam que o Atlas 350 chega a cerca de 112 GB e ~1,4 TB/s. O módulo reduz a granularidade de acesso à memória para 128 bytes e oferece até 2 TB/s de largura de interconexão com o protocolo LingQu — aproximadamente 2,5 vezes o anterior —; o consumo anunciado é de 600W, cerca de 200 W a mais que a H20.

A Huawei posiciona o Atlas 350 como um workhorse de alta eficiência para deploys de inferência, em um movimento alinhado à estratégia chinesa de construir maior autonomia na pilha de computação de IA diante de sanções que limitam acesso a tecnologias estrangeiras.