Alibaba testa Qwen 3.7 Max e Ultra no LM Arena antes de lançamento oficial
Novos modelos de 72 bilhões de parâmetros da Alibaba surgem em rankings de benchmark, indicando iteração simultânea de versões topo de linha.

Enquanto todo mundo olhava para os grandes players do Ocidente, a Alibaba estava trabalhando em silêncio nos bastidores.
A gigante chinesa acaba de colocar dois novos pesos-pesados para testar no maior campo de batalha da IA atual.
E os primeiros sinais mostram que o impacto pode ser global.
O portal Pandaily revelou que as versões de teste do Qwen 3.7 Max e do Qwen 3 Ultra surgiram simultaneamente no ranking do LM Arena.
A estratégia de testar dois modelos topo de linha ao mesmo tempo chamou a atenção de especialistas.
Isso indica que a Alibaba está acelerando o passo para dominar o mercado de modelos de código aberto e proprietários.
O que é o LM Arena e por que ele importa
> "O LM Arena é considerado o padrão ouro para testar a inteligência real dos modelos através de avaliações cegas de usuários."
Para quem não conhece, o LMSYS Chatbot Arena funciona como um torneio de inteligência artificial.
Os usuários fazem perguntas e dois modelos anônimos respondem lado a lado.
Sem saber quem é quem, o humano escolhe a melhor resposta.
Isso evita o viés de marca e foca apenas na qualidade do texto e do raciocínio.
A aparição do Qwen 3.7 Max e do Ultra nesse ranking sugere que o lançamento oficial está muito próximo.
A estratégia dupla da Alibaba
O que mais surpreendeu o mercado foi a iteração simultânea de duas versões de alto desempenho.
Normalmente, as empresas lançam uma versão e depois trabalham na próxima.
Segundo dados do Google News, ambos os modelos compartilham uma característica técnica importante.
Confira os detalhes conhecidos:
- Parâmetros: 72 bilhões em ambas as versões
- Status: Fase de preview público no LM Arena
- Desenvolvedor: Alibaba Cloud (Qwen)
- Foco: Alta performance em raciocínio e codificação
Essa abordagem sugere que a empresa quer oferecer opções diferentes para necessidades específicas.
O mistério do Qwen 3.7 Max
O sufixo "Max" geralmente indica uma versão otimizada para tarefas pesadas.
Ele pode ser o sucessor direto das versões que já lideravam rankings de codificação.
A potência do Qwen 3 Ultra
Já a nomenclatura "Ultra" costuma ser reservada para o modelo mais capaz da família.
Ter ambos com 72 bilhões de parâmetros mostra um refinamento técnico impressionante da Alibaba.
Por que 72 bilhões é o número mágico?
No mundo das IAs, o tamanho nem sempre é o único fator de sucesso.
Modelos com 72B parâmetros são considerados o "ponto ideal" da indústria.
Eles são grandes o suficiente para ter um raciocínio profundo e complexo.
Ao mesmo tempo, são pequenos o bastante para rodar em infraestruturas mais acessíveis que os modelos de trilhões de parâmetros.
> "A Alibaba parece ter encontrado uma fórmula para extrair desempenho de elite sem precisar de hardware proibitivo."
Isso permite que desenvolvedores e empresas usem a tecnologia de forma mais eficiente.
Contexto histórico da linha Qwen
A série Qwen tem uma trajetória de crescimento acelerado desde o seu lançamento inicial.
O Qwen 2.5 já havia surpreendido ao superar modelos da Meta e da Google em benchmarks específicos.
A Alibaba tem investido pesado para garantir que seus modelos falem múltiplas línguas com fluidez.
Além disso, a integração com o ecossistema de nuvem da empresa dá uma vantagem competitiva enorme.
O surgimento dessas novas versões no LM Arena é apenas o próximo passo lógico dessa evolução.
O que esperar nos próximos meses
Ainda não há uma data oficial para o lançamento completo das versões finais.
No entanto, a presença no LM Arena costuma ser o último estágio antes do anúncio global.
Isso coloca pressão em concorrentes como OpenAI e Anthropic.
Afinal, a China está provando que pode competir de igual para igual no topo dos rankings.
O veredito
A movimentação da Alibaba mostra que a corrida pela soberania da IA não tem um líder fixo.
Ter o Qwen 3.7 Max e o Ultra sendo testados agora é um sinal claro de confiança.
Se esses modelos mantiverem o desempenho dos previews, o mercado de LLMs vai ficar ainda mais disputado.
Qual dessas versões você está mais ansioso para testar no seu dia a dia?
Ver no Ranking SWEN.AI →
Compare Qwen por ELO, preço e velocidade
Fonte: Google News
Benchmark de IA
Compare GPT, Claude, Gemini e mais: preços, velocidade e benchmarks em português.
