💎 Custo-Benefício

Melhor Custo-Benefício em IARanking Score AA ÷ Preço 2026

Qual modelo de IA entrega mais inteligência por dólar gasto? Ranking calculado por AA Intelligence Index ÷ preço/1M tokens — modelos com alta qualidade e baixo custo de API ficam no topo. 30 modelos ranqueados.

Fórmula: (AA Intelligence Index × 10) ÷ preço_input/1M tokens. Fonte: Artificial Analysis, atualizado a cada 6h.

Top 5 — Melhor Custo-Benefício

Ranking Completo

30 modelos com AA Intelligence Index e preço disponíveis.

#ModeloEmpresaScore AA$/1M in$/1M outtok/sScore C/B
1Qwen3.5 0.8B (Reasoning)Alibaba10.5$$0.01$$0.05
10,500
2Qwen3.5 0.8B (Non-reasoning)Alibaba9.9$$0.01$$0.0557
9,900
3Qwen3.5 4B (Non-reasoning)Alibaba27.1$$0.03$$0.15194
9,033
4Qwen3.5 2B (Reasoning)Alibaba16.3$$0.02$$0.10328
8,150
5Qwen3.5 4B (Reasoning)Alibaba22.6$$0.03$$0.15160
7,533
6GPT-5 NanoOpenAI26.8$$0.05$$0.40185
5,360
7gpt-oss-20bOpenAI24.5$$0.05$$0.20271
4,900
8NVIDIA Nemotron 3 Nano 30B A3B (Reasoning)NVIDIA24.3$$0.06$$0.22123
4,418
9NVIDIA Nemotron Nano 9B V2 (Reasoning)NVIDIA14.8$$0.04$$0.16123
3,700
10LFM2-24B-A2BLiquidAI10.5$$0.03$$0.12129
3,500
11DeepSeek V4 FlashDeepSeek46.5$$0.14$$0.28106
3,321
12Gemma 3n E4B InstructGoogle6.4$$0.02$$0.0455
3,200
13Amazon: Nova Micro 1.0Amazon10.3$$0.04$$0.14
2,943
14Nova MicroAmazon10.3$$0.04$$0.14327
2,943
15Nemotron 3 Nano Omni 30B A3B ReasoningNVIDIA21.4$$0.07$$0.30286
2,853
16Gemma 4 31BGoogle39.2$$0.14$$0.4018
2,800
17GPT-5 nano (minimal)OpenAI13.8$$0.05$$0.40182
2,760
18NVIDIA Nemotron 3 Nano 30B A3B (Non-reasoning)NVIDIA13.2$$0.05$$0.2062
2,640
19NVIDIA Nemotron Nano 9B V2 (Non-reasoning)NVIDIA13.2$$0.05$$0.20149
2,640
20Ling 2.6 FlashInclusion AI26.2$$0.10$$0.30
2,620
21Qwen3.5 Omni FlashAlibaba25.9$$0.10$$0.80254
2,590
22Granite 4.1 8BIBM12.4$$0.05$$0.10114
2,480
23Gemma 4 26B A4B Google31.2$$0.13$$0.4074
2,400
24Granite 3.3 8B (Non-reasoning)IBM7.0$$0.03$$0.25405
2,333
25gpt-oss-120bOpenAI33.3$$0.15$$0.60356
2,220
26GPT-5.4 NanoOpenAI44.0$$0.20$$1.25164
2,200
27Gemini 2.5 Flash-Lite Preview (Sep '25) (Reasoning)Google21.6$$0.10$$0.40
2,160
28Amazon: Nova Lite 1.0Amazon12.7$$0.06$$0.24204
2,117
29Nova LiteAmazon12.7$$0.06$$0.24201
2,117
30Mistral: Mistral Small 3.2 24BMistral AI15.1$$0.07$$0.20
2,013

Score C/B = (AA Intelligence Index × 10) ÷ preço_input/1M. Maior = melhor custo-benefício.Ver metodologia →

Como Interpretar o Ranking de Custo-Benefício

O ranking de custo-benefício não é um substituto para o ranking de qualidade absoluta. Um modelo no topo desta lista não é necessariamente “melhor” — é o que entrega mais qualidade relativa ao seu custo. Para projetos onde a qualidade máxima é crítica (diagnóstico médico, análise jurídica, código de produção), use oranking por inteligência absoluta.

Quando Custo-Benefício É o Critério Principal

Custo-benefício deve ser o critério dominante quando: (1) volume de tokens é alto (chatbots de WhatsApp com centenas de mensagens/dia); (2) a tarefa tem critérios de qualidade definidos e mensuráveis (respostas corretas em FAQs, extração de dados estruturados); (3) você tem múltiplos modelos passando no critério de qualidade mínimo. Nesses casos, o modelo mais barato que passa é a escolha correta — pagar a mais não adiciona valor.

O Custo Real: Além do Preço por Token

O preço por token é só parte do custo total. Inclua também: (1) custo de latência — modelos mais baratos tendem a ser mais lentos, impactando a experiência em tempo real; (2) custo de prompt engineering — modelos com menos capacidade requerem prompts mais elaborados; (3) custo de erros — um modelo barato que erra 10% mais pode custar mais em revisão humana; (4) custo de integração — APIs com menor documentação aumentam o custo de desenvolvimento.

Perguntas Frequentes

Como é calculado o custo-benefício?

(AA Intelligence Index × 10) ÷ preço_input/1M tokens. O Intelligence Index mede raciocínio + código + contexto de 0 a 100 (Artificial Analysis, atualizado a cada 6h); multiplicar por 10 escala a métrica; dividir pelo preço normaliza por custo. Maior score = mais inteligência por dólar.

Qual o modelo mais barato com boa qualidade?

Qwen3.5 0.8B (Reasoning) lidera em 2026 com Score AA 10.5 por $0.01/1M tokens. Modelos com alto AA Intelligence Index e baixo preço ficam no topo desta lista.

Vale pagar mais por um modelo mais caro?

Depende da tarefa. Para volume alto e tarefas simples, modelos baratos entregam 80% da qualidade por 10% do custo. Para análise complexa, o ganho de qualidade pode justificar o preço maior.