Meta • LLM
Llama 4 Scout 17B Instruct (16E) is a mixture-of-experts (MoE) language model developed by Meta, activating 17 billion parameters out of a total of 109B. It supports native multimodal input...
Context Window
10.0M tokens
Preço Input/1M
$0.17
Preço Output/1M
$0.66
Parâmetros
—
Velocidade
107 tok/s
Latência (TTFT)
579ms
Max Output
16K tokens
Resultados do Llama 4 Scout nos principais benchmarks de avaliação de modelos de IA. Scores mais altos indicam melhor performance.
| Benchmark | Score | Máximo | Metodologia |
|---|---|---|---|
| Terminal-Bench Hard | 2.0 | 100.0 | — |
| Benchmark | Score | Máximo | Metodologia |
|---|---|---|---|
| LiveCodeBench | 30.0 | 100.0 | Artificial Analysis official API |
| SciCode | 17.0 | 100.0 | — |
| AA Coding Index | 6.7 | 100.0 | Artificial Analysis official API |
| Benchmark | Score | Máximo | Metodologia |
|---|---|---|---|
| MMLU-Pro | 75.0 | 100.0 | — |
| Benchmark | Score | Máximo | Metodologia |
|---|---|---|---|
| AA-LCR | 26.0 | 100.0 | — |
| Benchmark | Score | Máximo | Metodologia |
|---|---|---|---|
| MATH-500 | 84.4 | 100.0 | Artificial Analysis official API |
| AIME 2025 | 14.0 | 100.0 | Artificial Analysis official API |
| AA Math Index | 14.0 | 100.0 | Artificial Analysis official API |
| Benchmark | Score | Máximo | Metodologia |
|---|---|---|---|
| AA Intelligence Index | 13.5 | 100.0 | Artificial Analysis official API |
| Benchmark | Score | Máximo | Metodologia |
|---|---|---|---|
| MMLU Pro | 75.2 | 100.0 | Artificial Analysis official API |
| GPQA Diamond | 59.0 | 100.0 | Artificial Analysis official API |
| IFBench | 40.0 | 100.0 | — |
| HLE | 4.0 | 100.0 | — |
| Benchmark | Score | Máximo | Metodologia |
|---|---|---|---|
| Tau²-Bench | 15.0 | 100.0 | — |
O Llama 4 Scout é um modelo de inteligência artificial desenvolvido pela Meta, classificado como modelo de linguagem (LLM). É um modelo multimodal, capaz de processar texto, imagens e potencialmente outros tipos de mídia. Como modelo de código aberto, está disponível para download, personalização e deploy on-premises. Com uma janela de contexto de 10.0M tokens, é adequado para processamento de documentos longos como contratos, livros e bases de código completas.
O Llama 4 Scout é cobrado por uso, com preço de US$ 0.17/1M tokens de input e US$ 0.66/1M tokens de output. Para contextualizar: 1 milhão de tokens equivale a aproximadamente 750 mil palavras, ou cerca de 10 livros de tamanho médio. Com esse preço agressivo, é uma das opções mais econômicas do mercado, ideal para aplicações de alto volume como chatbots, análise de documentos em massa e automações.
Para o mercado brasileiro, é importante considerar o IOF de 6,38% sobre transações internacionais e a variação cambial do dólar. Com o câmbio atual, o custo do Llama 4 Scout em reais fica em torno de R$ 1.05/1M tokens de input (estimativa com IOF incluso).
O Llama 4 Scout foi avaliado em 15 benchmarks diferentes, cobrindo categorias como Agentic, Coding, Knowledge, Long Context, Math, overall, Reasoning, Tool Use. Os resultados mostram performance sólida nas avaliações disponíveis.
É importante notar que benchmarks medem aspectos específicos e não capturam toda a experiência de uso. Fatores como qualidade da resposta em português, aderência a instruções complexas e comportamento em conversas longas variam significativamente entre modelos e nem sempre são refletidos nos scores padrão.
O Llama 4 Scout é adequado para diversas aplicações de inteligência artificial: análise de documentos longos (contratos, processos jurídicos, bases de código), automação com tool calling (integração com APIs, banco de dados, sistemas externos), análise de imagens e documentos visuais (OCR, diagramas, screenshots), processamento multimodal combinando texto e imagens, chatbots de alto volume e atendimento automatizado, geração de texto, resumo, tradução e assistência geral.
No ecossistema de modelos de IA em 2026, o Llama 4 Scout compete diretamente com modelos de nível similar. Como modelo open source, compete com Qwen (Alibaba), Mistral e DeepSeek, além dos modelos proprietários como GPT, Claude e Gemini. A escolha entre modelos depende do caso de uso específico, orçamento, requisitos de latência e necessidade de funcionalidades como multimodalidade e tool calling.
Para uma comparação detalhada lado a lado, utilize nossa ferramenta de comparação ou consulte o ranking geral de modelos.
Para usuários brasileiros, a performance em português é um critério fundamental na escolha de um modelo de IA. A maioria dos benchmarks internacionais testa apenas em inglês, o que pode mascarar diferenças significativas na qualidade de resposta em outros idiomas. O Llama 4 Scout oferece suporte multimodal que funciona em múltiplos idiomas, mas a qualidade em português brasileiro pode variar dependendo da tarefa específica.
Recomendamos testar o modelo com prompts representativos do seu caso de uso em português antes de tomar uma decisão. O SWEN.AI está desenvolvendo um benchmark proprietário em PT-BR com tarefas aderentes ao mercado brasileiro para fornecer comparações mais precisas.
Llama 4 Scout 17B Instruct (16E) is a mixture-of-experts (MoE) language model developed by Meta, activating 17 billion parameters out of a total of 109B. It supports native multimodal input...
O Llama 4 Scout custa US$ 0.17/1M tokens de input e US$ 0.66/1M tokens de output. Para uso intensivo (ex.: chatbot de WhatsApp com 100k mensagens/mês), o custo pode variar de R$ 50 a R$ 5.000 dependendo do volume.
A maioria dos modelos de IA modernos, incluindo o Llama 4 Scout, suporta português brasileiro. No entanto, a qualidade pode variar — modelos como Claude e Gemini tendem a ter melhor performance em PT-BR. Recomendamos testar com prompts específicos do seu caso de uso.
Nos benchmarks disponíveis, o Llama 4 Scout obteve scores como: Terminal-Bench Hard: 2/100, LiveCodeBench: 30/100, SciCode: 17/100. Consulte a tabela completa acima para comparação detalhada.
Sim, o Llama 4 Scout é um modelo de código aberto. Isso significa que você pode fazer deploy on-premises, personalizar via fine-tuning e ter controle total sobre os dados. Verifique a licença específica no repositório oficial.
Última atualização: 29 de maio de 2026 • Ver metodologia →