Grok 4.20

Grok 4.20

xAILLM

Grok 4.20 is xAI's newest flagship model with industry-leading speed and agentic tool calling capabilities. It combines the lowest hallucination rate on the market with strict prompt adherance, delivering consistently...

MultimodalAPI DisponívelVisãoTool CallingRaciocínio

Especificações

Context Window

2.0M tokens

Preço Input/1M

$2.00

Preço Output/1M

$6.00

Parâmetros

Velocidade

168 tok/s

Latência (TTFT)

538ms

Benchmarks

Resultados do Grok 4.20 nos principais benchmarks de avaliação de modelos de IA. Scores mais altos indicam melhor performance.

Agentic

BenchmarkScoreMáximoMetodologia
Terminal-Bench Hard38.0100.0

Coding

BenchmarkScoreMáximoMetodologia
SciCode46.0100.0
AA Coding Index40.5100.0Artificial Analysis official API

Long Context

BenchmarkScoreMáximoMetodologia
AA-LCR58.0100.0

overall

BenchmarkScoreMáximoMetodologia
AA Intelligence Index49.3100.0Artificial Analysis official API

Reasoning

BenchmarkScoreMáximoMetodologia
GPQA Diamond91.0100.0Artificial Analysis official API
IFBench81.0100.0
HLE32.0100.0

Tool Use

BenchmarkScoreMáximoMetodologia
Tau²-Bench93.0100.0

Informações

Lançamento
07 de abril de 2026
Tool Calling
✅ Suportado
Visão
✅ Suportado
Áudio
❌ Não suportado

Análise Completa: Grok 4.20

O que é o Grok 4.20?

O Grok 4.20 é um modelo de inteligência artificial desenvolvido pela xAI, classificado como modelo de linguagem (LLM). É um modelo multimodal, capaz de processar texto, imagens e potencialmente outros tipos de mídia. Como modelo proprietário, está disponível via API cloud da xAI. Com uma janela de contexto de 2.0M tokens, é adequado para processamento de documentos longos como contratos, livros e bases de código completas.

Preços e Custos em 2026

O Grok 4.20 é cobrado por uso, com preço de US$ 2/1M tokens de input e US$ 6/1M tokens de output. Para contextualizar: 1 milhão de tokens equivale a aproximadamente 750 mil palavras, ou cerca de 10 livros de tamanho médio. O posicionamento de preço é intermediário, equilibrando qualidade e custo para a maioria das aplicações profissionais.

Para o mercado brasileiro, é importante considerar o IOF de 6,38% sobre transações internacionais e a variação cambial do dólar. Com o câmbio atual, o custo do Grok 4.20 em reais fica em torno de R$ 12.34/1M tokens de input (estimativa com IOF incluso).

Benchmarks e Performance

O Grok 4.20 foi avaliado em 9 benchmarks diferentes, cobrindo categorias como Agentic, Coding, Long Context, overall, Reasoning, Tool Use. Os resultados mostram performance excepcional nas avaliações disponíveis.

É importante notar que benchmarks medem aspectos específicos e não capturam toda a experiência de uso. Fatores como qualidade da resposta em português, aderência a instruções complexas e comportamento em conversas longas variam significativamente entre modelos e nem sempre são refletidos nos scores padrão.

Casos de Uso Recomendados

O Grok 4.20 é adequado para diversas aplicações de inteligência artificial: análise de documentos longos (contratos, processos jurídicos, bases de código), automação com tool calling (integração com APIs, banco de dados, sistemas externos), análise de imagens e documentos visuais (OCR, diagramas, screenshots), processamento multimodal combinando texto e imagens, raciocínio complexo, resolução de problemas matemáticos e análise lógica, geração de texto, resumo, tradução e assistência geral.

Comparação com Alternativas

No ecossistema de modelos de IA em 2026, o Grok 4.20 compete diretamente com modelos de nível similar. A xAI compete neste segmento contra OpenAI, Anthropic, Google e Meta. A escolha entre modelos depende do caso de uso específico, orçamento, requisitos de latência e necessidade de funcionalidades como multimodalidade e tool calling.

Para uma comparação detalhada lado a lado, utilize nossa ferramenta de comparação ou consulte o ranking geral de modelos.

Uso no Brasil e em Português

Para usuários brasileiros, a performance em português é um critério fundamental na escolha de um modelo de IA. A maioria dos benchmarks internacionais testa apenas em inglês, o que pode mascarar diferenças significativas na qualidade de resposta em outros idiomas. O Grok 4.20 oferece suporte multimodal que funciona em múltiplos idiomas, mas a qualidade em português brasileiro pode variar dependendo da tarefa específica.

Recomendamos testar o modelo com prompts representativos do seu caso de uso em português antes de tomar uma decisão. O SWEN.AI está desenvolvendo um benchmark proprietário em PT-BR com tarefas aderentes ao mercado brasileiro para fornecer comparações mais precisas.

Perguntas Frequentes

O que é o Grok 4.20?

Grok 4.20 is xAI's newest flagship model with industry-leading speed and agentic tool calling capabilities. It combines the lowest hallucination rate on the market with strict prompt adherance, delivering consistently...

Quanto custa o Grok 4.20?

O Grok 4.20 custa US$ 2/1M tokens de input e US$ 6/1M tokens de output. Para uso intensivo (ex.: chatbot de WhatsApp com 100k mensagens/mês), o custo pode variar de R$ 50 a R$ 5.000 dependendo do volume.

O Grok 4.20 funciona em português?

A maioria dos modelos de IA modernos, incluindo o Grok 4.20, suporta português brasileiro. No entanto, a qualidade pode variar — modelos como Claude e Gemini tendem a ter melhor performance em PT-BR. Recomendamos testar com prompts específicos do seu caso de uso.

Como o Grok 4.20 se compara com outros modelos?

Nos benchmarks disponíveis, o Grok 4.20 obteve scores como: Terminal-Bench Hard: 38/100, SciCode: 46/100, AA Coding Index: 40.5/100. Consulte a tabela completa acima para comparação detalhada.

O Grok 4.20 é open source?

Não, o Grok 4.20 é um modelo proprietário da xAI. Ele está disponível via API cloud. Para alternativas open source, confira nosso ranking de modelos open source.

Última atualização: 29 de maio de 2026 Ver metodologia →