Custo de API de IAPreços em Reais 2026

Quanto custa usar a API do ChatGPT, Claude, Gemini e outros LLMs para empresas e desenvolvedores brasileiros? Compare o preço por milhão de tokens convertido para BRL — sem surpresas na fatura.

Câmbio de referência: US$ 1 = R$ 5.70 • IOF zerado para PF desde jan/2024 • Última atualização: 29 de maio de 2026626 APIs listadas

626

APIs listadas

139

Com plano grátis

Grátis

Mais barata (input/1M)

$150.00

Mais cara (input/1M)

Como ler a tabela: preços são por milhão de tokens (input = o que você envia; output = a resposta do modelo). Em português, 1.000 tokens ≈ 750 palavras ≈ 1 página A4. O valor em BRL usa câmbio R$ 5.70/USD — substitua pelo câmbio do seu banco para estimativas precisas. Preços verificados nas páginas oficiais de precificação de cada empresa.

Preços por Milhão de Tokens — APIs com Custo

#ModeloInput USD/1MInput R$/1M
1Jamba 1.7 MiniGrátis
2Jamba Reasoning 3BGrátis
3Qwen Chat 14BGrátis
4Qwen Chat 72BGrátis
5Qwen1.5 Chat 110BGrátis
6Qwen2 Instruct 72BGrátis
7Qwen2.5 Coder 32B InstructGrátis
8Qwen2.5 Coder Instruct 7B Grátis
9Qwen2.5 Instruct 32BGrátis
10Qwen3 4B 2507 (Reasoning)Grátis
11Qwen3 4B 2507 InstructGrátis
12Qwen3 VL 4B (Reasoning)Grátis
13Qwen3 VL 4B InstructGrátis
14Qwen3.5 9B (Reasoning)Grátis
15QwQ 32B-PreviewGrátis
16Llama 3.1 Tulu3 405BGrátis
17Molmo 7B-DGrátis
18Molmo2-8BGrátis
19OLMo 2 32BGrátis
20OLMo 2 7BGrátis
21Olmo 3 7B ThinkGrátis
22Olmo 3.1 32B ThinkGrátis
23Olmo 3 32B ThinkGrátis
24Olmo 3.1 32B InstructGrátis
25Claude 2.0Grátis
26Claude 2.1Grátis
27Claude 3.7 Sonnet (thinking)Grátis
28Claude InstantGrátis
29ERNIE 5.0 Thinking PreviewGrátis
30Doubao Seed CodeGrátis
31Doubao Seed CodeGrátis
32JT-35B-FlashGrátis
33JT-35B-FlashGrátis
34JT-MINIGrátis
35Command A+Grátis
36Tiny Aya GlobalGrátis
37DBRX InstructGrátis
38DeepSeek Coder V2 Lite InstructGrátis
39DeepSeek LLM 67B Chat (V1)Grátis
40DeepSeek R1 0528 Qwen3 8BGrátis
41DeepSeek R1 Distill Llama 8BGrátis
42DeepSeek R1 Distill Qwen 1.5BGrátis
43DeepSeek R1 Distill Qwen 14BGrátis
44DeepSeek V3.2 SpecialeGrátis
45DeepSeek-Coder-V2Grátis
46DeepSeek-V2-ChatGrátis
47DeepSeek-V2.5Grátis
48DeepSeek-V2.5 (Dec '24)Grátis
49DeepSeek: R1 Distill Qwen 32BGrátis
50Gemini 1.0 ProGrátis
51Gemini 1.0 UltraGrátis
52Gemini 1.5 Flash (May '24)Grátis
53Gemini 1.5 Flash (Sep '24)Grátis
54Gemini 1.5 Flash-8BGrátis
55Gemini 1.5 Pro (May '24)Grátis
56Gemini 1.5 Pro (Sep '24)Grátis
57Gemini 2.0 Flash (experimental)Grátis
58Gemini 2.0 Flash Thinking Experimental (Dec '24)Grátis
59Gemini 2.0 Flash Thinking Experimental (Jan '25)Grátis
60Gemini 2.0 Flash-Lite (Feb '25)Grátis
61Gemini 2.0 Flash-Lite (Preview)Grátis
62Gemini 2.0 Pro Experimental (Feb '25)Grátis
63Gemini 2.5 Flash Preview (Non-reasoning)Grátis
64Gemini 2.5 Flash Preview (Sep '25) (Reasoning)Grátis
65Gemini 2.5 Pro Preview (Mar' 25)Grátis
66Gemini 3 Deep ThinkGrátis
67Gemma 3 1B InstructGrátis
68Gemma 3 270MGrátis
69Gemma 3n E2B InstructGrátis
70Gemma 3n E4B Instruct Preview (May '25)Grátis
71Gemma 4 E2B (Non-reasoning)Grátis
72Gemma 4 E2B (Reasoning)Grátis
73Gemma 4 E4B (Non-reasoning)Grátis
74Gemma 4 E4B (Reasoning)Grátis
75PALM-2Grátis
76Granite 4.0 1BGrátis
77Granite 4.0 350MGrátis
78Granite 4.0 H 1BGrátis
79Granite 4.0 H 350MGrátis
80Granite 4.0 MicroGrátis
81Granite 4.1 30BGrátis
82Granite 4.1 3BGrátis
83Ling-1TGrátis
84Ling-mini-2.0Grátis
85Ring-1TGrátis
86Kimi Linear 48B A3B InstructGrátis
87Mi:dm K 2.5 ProGrátis
88Mi:dm K 2.5 Pro PreviewGrátis
89EXAONE 4.5 33BGrátis
90K-EXAONE (Reasoning)Grátis
91Exaone 4.0 1.2B (Non-reasoning)Grátis
92EXAONE 4.0 32B (Non-reasoning)Grátis
93EXAONE 4.0 32B (Reasoning)Grátis
94LFM 40BGrátis
95LFM2 1.2BGrátis
96LFM2 2.6BGrátis
97LFM2 8B A1BGrátis
98LFM2.5-1.2B-InstructGrátis
99LFM2.5-1.2B-ThinkingGrátis
100LFM2.5-VL-1.6BGrátis
101LongCat Flash LiteGrátis
102K2 Think V2Grátis
103K2-V2 (high)Grátis
104K2-V2 (medium)Grátis
105Llama 2 Chat 13BGrátis
106Llama 2 Chat 70BGrátis
107Llama 65BGrátis
108Muse SparkGrátis
109Phi-3 Mini Instruct 3.8BGrátis
110Phi-4 Mini InstructGrátis
111Phi-4 Multimodal InstructGrátis
112MiniMax M1 40kGrátis
113Devstral 2Grátis
114Devstral Small (May '25)Grátis
115Magistral Medium 1Grátis
116Magistral Small 1Grátis
117Magistral Small 1.2Grátis
118Mixtral 8x22B InstructGrátis
119Magistral Medium 1.2Grátis
120Mistral: SabaGrátis
121Motif-2-12.7B-ReasoningGrátis
122Nanbeige4.1-3BGrátis
123HyperCLOVA X SEED Think (32B)Grátis
124DeepHermes 3 - Llama-3.1 8B Preview (Non-reasoning)Grátis
125DeepHermes 3 - Mistral 24B Preview (Non-reasoning)Grátis
126Llama 3.1 Nemotron Nano 4B v1.1 (Reasoning)Grátis
127Llama 3.3 Nemotron Super 49B v1 (Non-reasoning)Grátis
128Llama 3.3 Nemotron Super 49B v1 (Reasoning)Grátis
129Nemotron Cascade 2 30B A3BGrátis
130NVIDIA Nemotron 3 Nano 4BGrátis
131GPT-3.5 Turbo (0613)Grátis
132GPT-4.5 (Preview)Grátis
133GPT-4o (ChatGPT)Grátis
134GPT-4o (March 2025, chatgpt-4o-latest)Grátis
135GPT-4o mini Realtime (Dec '24)Grátis
136GPT-4o Realtime (Dec '24)Grátis
137GPT-5.5 ProGrátis
138o1-miniGrátis
139MiniCPM-V 4.6 1.3BGrátis
140Qwen3.5 0.8B (Non-reasoning)$0.010R$ 0.057
141Qwen3.5 0.8B (Reasoning)$0.010R$ 0.057
142Qwen3.5 2B (Reasoning)$0.020R$ 0.114
143Gemma 3n E4B Instruct$0.020R$ 0.114
144Mistral: Mistral Nemo$0.020R$ 0.114
145Qwen3.5 4B (Non-reasoning)$0.030R$ 0.171
146Qwen3.5 4B (Reasoning)$0.030R$ 0.171
147Granite 3.3 8B (Non-reasoning)$0.030R$ 0.171
148LFM2-24B-A2B$0.030R$ 0.171
149Amazon: Nova Micro 1.0$0.035R$ 0.200
150Nova Micro$0.035R$ 0.200
151Cohere: Command R7B (12-2024)$0.037R$ 0.214
152Qwen: Qwen2.5 7B Instruct$0.040R$ 0.228
153Gemma 3 4B$0.040R$ 0.228
154NVIDIA Nemotron Nano 9B V2 (Reasoning)$0.040R$ 0.228
155Arcee AI: Trinity Mini$0.045R$ 0.257
156Llama 3 8B Instruct$0.045R$ 0.257
157Granite 4.1 8B$0.050R$ 0.285
158Llama 2 Chat 7B$0.050R$ 0.285
159Llama 3.2 1B Instruct$0.050R$ 0.285
160NVIDIA Nemotron 3 Nano 30B A3B (Non-reasoning)$0.050R$ 0.285
161NVIDIA Nemotron Nano 9B V2 (Non-reasoning)$0.050R$ 0.285
162GPT-5 Nano$0.050R$ 0.285
163GPT-5 nano (minimal)$0.050R$ 0.285
164gpt-oss-20b$0.050R$ 0.285
165NVIDIA Nemotron 3 Nano 30B A3B (Reasoning)$0.055R$ 0.314
166Amazon: Nova Lite 1.0$0.060R$ 0.342
167Nova Lite$0.060R$ 0.342
168Gemma 3n 4B$0.060R$ 0.342
169Granite 4.0 H Small$0.060R$ 0.342
170MythoMax 13B$0.060R$ 0.342
171Baidu: ERNIE 4.5 21B A3B Thinking$0.070R$ 0.399
172ByteDance Seed: Seed 1.6 Flash$0.075R$ 0.427
173Gemini 2.0 Flash Lite$0.075R$ 0.427
174Mistral Small 3$0.075R$ 0.427
175Mistral: Mistral Small 3.2 24B$0.075R$ 0.427
176Nemotron 3 Nano Omni 30B A3B Reasoning$0.075R$ 0.427
177gpt-oss-safeguard-20b$0.075R$ 0.427
178Qwen: Qwen3 30B A3B Instruct 2507$0.080R$ 0.456
179Qwen: Qwen3 30B A3B Thinking 2507$0.080R$ 0.456
180Mistral Small 3.2$0.087R$ 0.496
181Qwen3 30B A3B (Reasoning)$0.090R$ 0.513
182Gemma 3 12B$0.090R$ 0.513
183Qwen3.5 Omni Flash$0.100R$ 0.570
184Olmo 3 7B Instruct$0.100R$ 0.570
185ByteDance: UI-TARS 7B $0.100R$ 0.570
186Gemini 2.5 Flash Lite$0.100R$ 0.570
187Gemini 2.5 Flash-Lite Preview (Sep '25) (Non-reasoning)$0.100R$ 0.570
188Gemini 2.5 Flash-Lite Preview (Sep '25) (Reasoning)$0.100R$ 0.570
189Ling 2.6 Flash$0.100R$ 0.570
190Llama 3.1 8B Instruct$0.100R$ 0.570
191Devstral Small (Jul '25)$0.100R$ 0.570
192Devstral Small 2$0.100R$ 0.570
193Ministral 3 3B$0.100R$ 0.570
194Mistral: Devstral Small 1.1$0.100R$ 0.570
195Mistral: Ministral 3 3B 2512$0.100R$ 0.570
196Mistral: Mistral Small Creative$0.100R$ 0.570
197Mistral: Voxtral Small 24B 2507$0.100R$ 0.570
198Llama Nemotron Super 49B v1.5 (Non-reasoning)$0.100R$ 0.570
199Llama Nemotron Super 49B v1.5 (Reasoning)$0.100R$ 0.570
200GPT-4.1 Nano$0.100R$ 0.570
201Mistral Small 3.1$0.105R$ 0.599
202Qwen3 0.6B (Non-reasoning)$0.110R$ 0.627
203Qwen3 0.6B (Reasoning)$0.110R$ 0.627
204Qwen3 1.7B (Non-reasoning)$0.110R$ 0.627
205Qwen3 1.7B (Reasoning)$0.110R$ 0.627
206Qwen3 4B (Non-reasoning)$0.110R$ 0.627
207Qwen3 4B (Reasoning)$0.110R$ 0.627
208Qwen3 8B (Reasoning)$0.110R$ 0.627
209Gemma 3 27B$0.110R$ 0.627
210Mistral: Mistral 7B Instruct v0.1$0.110R$ 0.627
211Microsoft: Phi 4$0.125R$ 0.713
212Gemma 4 26B A4B $0.130R$ 0.741
213Nous: Hermes 4 70B$0.130R$ 0.741
214Hermes 4 - Llama-3.1 70B (Non-reasoning)$0.130R$ 0.741
215Hermes 4 - Llama-3.1 70B (Reasoning)$0.130R$ 0.741
216Nex AGI: DeepSeek V3.1 Nex N1$0.135R$ 0.770
217Baidu: ERNIE 4.5 VL 28B A3B$0.140R$ 0.798
218DeepSeek V4 Flash$0.140R$ 0.798
219Gemma 4 31B$0.140R$ 0.798
220Ling-flash-2.0$0.140R$ 0.798
221Ring-flash-2.0$0.140R$ 0.798
222NousResearch: Hermes 2 Pro - Llama-3 8B$0.140R$ 0.798
223Qwen: Qwen3 235B A22B Thinking 2507$0.149R$ 0.852
224Qwen3 30B A3B 2507 Instruct$0.150R$ 0.855
225Qwen3 32B (Non-reasoning)$0.150R$ 0.855
226Qwen3 32B (Reasoning)$0.150R$ 0.855
227EssentialAI: Rnj 1 Instruct$0.150R$ 0.855
228Gemini 2.0 Flash$0.150R$ 0.855
229Llama 3.2 3B Instruct$0.150R$ 0.855
230Ministral 3 8B$0.150R$ 0.855
231Mistral: Ministral 3 8B 2512$0.150R$ 0.855
232GPT-4o-mini (2024-07-18)$0.150R$ 0.855
233GPT-4o-mini Search Preview$0.150R$ 0.855
234gpt-oss-120b$0.150R$ 0.855
235OpenAI: GPT-4o-mini$0.150R$ 0.855
236Llama 4 Scout$0.170R$ 0.969
237Qwen: Qwen3 VL 8B Instruct$0.180R$ 1.03
238Qwen3 8B (Non-reasoning)$0.180R$ 1.03
239Qwen3 VL 8B (Reasoning)$0.180R$ 1.03
240Arcee AI: Spotlight$0.180R$ 1.03
241Llama Guard 4 12B$0.180R$ 1.03
242Qwen: Qwen3 Coder 30B A3B Instruct$0.190R$ 1.08
243Jamba 1.5 Mini$0.200R$ 1.14
244Jamba 1.6 Mini$0.200R$ 1.14
245Qwen: Qwen3 VL 30B A3B Instruct$0.200R$ 1.14
246Qwen3 VL 30B A3B (Reasoning)$0.200R$ 1.14
247MiniMax: MiniMax-01$0.200R$ 1.14
248Ministral 3 14B$0.200R$ 1.14
249Mistral 7B Instruct$0.200R$ 1.14
250Mistral Small (Sep '24)$0.200R$ 1.14
251Mistral: Ministral 3 14B 2512$0.200R$ 1.14
252Mistral: Mistral Small 4$0.200R$ 1.14
253NVIDIA Nemotron Nano 12B v2 VL (Non-reasoning)$0.200R$ 1.14
254NVIDIA Nemotron Nano 12B v2 VL (Reasoning)$0.200R$ 1.14
255GPT-5.4 Nano$0.200R$ 1.14
256Seed-OSS-36B-Instruct$0.210R$ 1.20
257Arcee AI: Trinity Large Thinking$0.220R$ 1.25
258DeepSeek V3$0.229R$ 1.30
259Qwen3 14B (Non-reasoning)$0.235R$ 1.34
260Qwen3 14B (Reasoning)$0.235R$ 1.34
261Trinity Large Thinking$0.235R$ 1.34
262Llama 3.2 11B Vision Instruct$0.245R$ 1.40
263Qwen: Qwen2.5 VL 72B Instruct$0.250R$ 1.43
264Qwen3 Omni 30B A3B (Reasoning)$0.250R$ 1.43
265Qwen3 Omni 30B A3B Instruct$0.250R$ 1.43
266Anthropic: Claude 3 Haiku$0.250R$ 1.43
267ByteDance Seed: Seed-2.0-Lite$0.250R$ 1.43
268Gemini 3.1 Flash Lite$0.250R$ 1.43
269Gemini 3.1 Flash Lite Preview$0.250R$ 1.43
270Inception: Mercury 2$0.250R$ 1.43
271GPT-5 Mini$0.250R$ 1.43
272GPT-5 mini (minimal)$0.250R$ 1.43
273GPT-5.1-Codex-Mini$0.250R$ 1.43
274DeepSeek V3.2 Exp$0.270R$ 1.54
275DeepSeek V3.2 Exp (Non-reasoning)$0.275R$ 1.57
276DeepSeek V3.2 Exp (Reasoning)$0.275R$ 1.57
277Qwen3 30B A3B 2507 (Reasoning)$0.280R$ 1.60
278Baidu: ERNIE 4.5 300B A47B $0.280R$ 1.60
279Qwen: Qwen3 VL 235B A22B Instruct$0.300R$ 1.71
280Qwen3 Coder 480B A35B Instruct$0.300R$ 1.71
281Amazon: Nova 2 Lite$0.300R$ 1.71
282Nova 2.0 Lite (high)$0.300R$ 1.71
283Nova 2.0 Omni (low)$0.300R$ 1.71
284Nova 2.0 Omni (medium)$0.300R$ 1.71
285Nova 2.0 Omni (Non-reasoning)$0.300R$ 1.71
286Gemini 2.5 Flash$0.300R$ 1.71
287Gemini 2.5 Flash Preview (Reasoning)$0.300R$ 1.71
288Nano Banana (Gemini 2.5 Flash Image)$0.300R$ 1.71
289Ling-2.6-1T$0.300R$ 1.71
290Ring-2.6-1T$0.300R$ 1.71
291KAT-Coder-Pro V1$0.300R$ 1.71
292Kwaipilot: KAT-Coder-Pro V2$0.300R$ 1.71
293MiniMax-M2$0.300R$ 1.71
294MiniMax: MiniMax M2-her$0.300R$ 1.71
295MiniMax: MiniMax M2.1$0.300R$ 1.71
296MiniMax: MiniMax M2.5$0.300R$ 1.71
297MiniMax: MiniMax M2.7$0.300R$ 1.71
298Mistral: Codestral 2508$0.300R$ 1.71
299Nous: Hermes 3 70B Instruct$0.300R$ 1.71
300Hermes 3 - Llama-3.1 70B$0.300R$ 1.71
301NVIDIA Nemotron 3 Super 120B A12B (Reasoning)$0.300R$ 1.71
302Llama 4 Maverick$0.350R$ 1.99
303Mistral: Mistral Small 3.1 24B$0.350R$ 1.99
304Qwen2.5 72B Instruct$0.360R$ 2.05
305Qwen3.5 Omni Plus$0.400R$ 2.28
306DeepSeek V3.1$0.400R$ 2.28
307MiniMax: MiniMax M1$0.400R$ 2.28
308Mistral: Devstral 2 2512$0.400R$ 2.28
309Mistral: Devstral Medium$0.400R$ 2.28
310Mistral: Mistral Medium 3$0.400R$ 2.28
311Mistral: Mistral Medium 3.1$0.400R$ 2.28
312GPT-4.1 Mini$0.400R$ 2.28
313Baidu: ERNIE 4.5 VL 424B A47B $0.420R$ 2.39
314DeepSeek V4 Pro$0.435R$ 2.48
315Qwen: Qwen3 235B A22B Instruct 2507$0.450R$ 2.56
316Mistral: Mixtral 8x7B Instruct$0.450R$ 2.56
317Llama Guard 3 8B$0.480R$ 2.74
318Qwen: Qwen3 Next 80B A3B Instruct$0.500R$ 2.85
319Qwen3 Next 80B A3B (Reasoning)$0.500R$ 2.85
320Arcee AI: Coder Large$0.500R$ 2.85
321Command-R (Mar '24)$0.500R$ 2.85
322DeepSeek V3.2$0.500R$ 2.85
323Gemini 3 Flash Preview$0.500R$ 2.85
324Gemini 3 Flash Preview (Non-reasoning)$0.500R$ 2.85
325Gemini 3 Flash Preview (Reasoning)$0.500R$ 2.85
326Nano Banana 2 (Gemini 3.1 Flash Image Preview)$0.500R$ 2.85
327GPT-3.5 Turbo$0.500R$ 2.85
328GPT-3.5 Turbo$0.500R$ 2.85
329MiniMax M1 80k$0.550R$ 3.14
330Llama 3.1 70B Instruct$0.560R$ 3.19
331MoonshotAI: Kimi K2 0711$0.570R$ 3.25
332Llama 3.3 70B Instruct$0.585R$ 3.33
333Kimi K2$0.585R$ 3.33
334Kimi K2 Thinking$0.600R$ 3.42
335MoonshotAI: Kimi K2 0905$0.600R$ 3.42
336MoonshotAI: Kimi K2.5$0.600R$ 3.42
337Llama 3.1 Nemotron Ultra 253B v1 (Reasoning)$0.600R$ 3.42
338GPT Audio Mini$0.600R$ 3.42
339WizardLM-2 8x22B$0.620R$ 3.53
340Gemma 2 27B$0.650R$ 3.71
341Llama 3 70B Instruct$0.650R$ 3.71
342QwQ 32B$0.660R$ 3.76
343Qwen: Qwen3 VL 32B Instruct$0.700R$ 3.99
344Qwen3 235B A22B (Reasoning)$0.700R$ 3.99
345Qwen3 VL 32B (Reasoning)$0.700R$ 3.99
346DeepSeek: R1$0.700R$ 3.99
347R1 Distill Llama 70B$0.700R$ 3.99
348Arcee AI: Virtuoso Large$0.750R$ 4.28
349Mancer: Weaver (alpha)$0.750R$ 4.28
350GPT-5.4 Mini$0.750R$ 4.28
351AionLabs: Aion-2.0$0.800R$ 4.56
352AionLabs: Aion-RP 1.0 (8B)$0.800R$ 4.56
353AlfredPros: CodeLLaMa 7B Instruct Solidity$0.800R$ 4.56
354Amazon: Nova Pro 1.0$0.800R$ 4.56
355Nova Pro$0.800R$ 4.56
356Morph: Morph V3 Fast$0.800R$ 4.56
357Qwen3 VL 235B A22B (Reasoning)$0.840R$ 4.79
358Arcee AI: Maestro Reasoning$0.900R$ 5.13
359Morph: Morph V3 Large$0.900R$ 5.13
360MoonshotAI: Kimi K2.6$0.950R$ 5.42
361Claude 3.5 Haiku$1.00R$ 5.70
362Mistral Small (Feb '24)$1.00R$ 5.70
363Nous: Hermes 3 405B Instruct$1.00R$ 5.70
364Nous: Hermes 4 405B$1.00R$ 5.70
365Hermes 4 - Llama-3.1 405B (Non-reasoning)$1.00R$ 5.70
366Hermes 4 - Llama-3.1 405B (Reasoning)$1.00R$ 5.70
367o3 Mini$1.10R$ 6.27
368o3 Mini High$1.10R$ 6.27
369o4 Mini$1.10R$ 6.27
370o4 Mini High$1.10R$ 6.27
371DeepSeek V3 0324$1.20R$ 6.81
372Qwen3 Max (Preview)$1.20R$ 6.84
373Qwen3 Max Thinking (Preview)$1.20R$ 6.84
374Llama 3.1 Nemotron 70B Instruct$1.20R$ 6.84
375Nova 2.0 Pro Preview (medium)$1.25R$ 7.13
376Claude 4.5 Haiku (Reasoning)$1.25R$ 7.13
377Claude Haiku 4.5$1.25R$ 7.13
378Cogito v2.1 (Reasoning)$1.25R$ 7.13
379Deep Cogito: Cogito v2.1 671B$1.25R$ 7.13
380Gemini 2.5 Pro$1.25R$ 7.13
381Gemini 2.5 Pro Preview (May' 25)$1.25R$ 7.13
382Gemini 2.5 Pro Preview 05-06$1.25R$ 7.13
383Gemini 2.5 Pro Preview 06-05$1.25R$ 7.13
384GPT-5$1.25R$ 7.13
385GPT-5 (ChatGPT)$1.25R$ 7.13
386GPT-5 (minimal)$1.25R$ 7.13
387GPT-5 Chat$1.25R$ 7.13
388GPT-5 Codex$1.25R$ 7.13
389GPT-5.1$1.25R$ 7.13
390GPT-5.1 Chat$1.25R$ 7.13
391GPT-5.1-Codex$1.25R$ 7.13
392GPT-5.1-Codex-Max$1.25R$ 7.13
393Qwen3.6 Max Preview$1.30R$ 7.41
394Llama 3.2 Instruct 90B (Vision)$1.38R$ 7.87
395Gemini 3.5 Flash (minimal)$1.50R$ 8.55
396Google: Gemini 3.5 Flash$1.50R$ 8.55
397Mistral: Mistral Medium 3.5$1.50R$ 8.55
398Qwen2.5 Max$1.60R$ 9.12
399DeepSeek V3.1 Terminus$1.64R$ 9.32
400DeepSeek R1 (Jan '25)$1.68R$ 9.55
401GPT-5.2$1.75R$ 9.97
402GPT-5.2 Chat$1.75R$ 9.97
403GPT-5.2-Codex$1.75R$ 9.97
404GPT-5.3 Chat$1.75R$ 9.97
405GPT-5.3-Codex$1.75R$ 9.97
406AI21: Jamba Large 1.7$2.00R$ 11.40
407Jamba 1.5 Large$2.00R$ 11.40
408Jamba 1.6 Large$2.00R$ 11.40
409Gemini 3 Pro Preview (high)$2.00R$ 11.40
410Gemini 3 Pro Preview (low)$2.00R$ 11.40
411Gemini 3.1 Pro Preview$2.00R$ 11.40
412Gemini 3.1 Pro Preview Custom Tools$2.00R$ 11.40
413Nano Banana Pro (Gemini 3 Pro Image Preview)$2.00R$ 11.40
414Mistral Large 2 (Jul '24)$2.00R$ 11.40
415Mistral Large 2 (Nov '24)$2.00R$ 11.40
416Mistral Large$2.00R$ 11.40
417Mistral: Mixtral 8x22B Instruct$2.00R$ 11.40
418Mistral: Pixtral Large 2411$2.00R$ 11.40
419GPT-4.1$2.00R$ 11.40
420o3$2.00R$ 11.40
421o4 Mini Deep Research$2.00R$ 11.40
422Qwen3.7 Max$2.50R$ 14.25
423Amazon: Nova Premier 1.0$2.50R$ 14.25
424Cohere: Command R+ (08-2024)$2.50R$ 14.25
425Inflection: Inflection 3 Pi$2.50R$ 14.25
426Inflection: Inflection 3 Productivity$2.50R$ 14.25
427GPT Audio$2.50R$ 14.25
428GPT-4o (2024-08-06)$2.50R$ 14.25
429GPT-4o (2024-11-20)$2.50R$ 14.25
430GPT-4o Audio$2.50R$ 14.25
431GPT-4o Search Preview$2.50R$ 14.25
432GPT-5 Image Mini$2.50R$ 14.25
433GPT-5.4$2.50R$ 14.25
434OpenAI: GPT-4o$2.50R$ 14.25
435Llama 3.1 Instruct 405B$2.75R$ 15.68
436Mistral Medium$2.75R$ 15.68
437Claude 3 Sonnet$3.00R$ 17.10
438Claude Sonnet 4.5$3.00R$ 17.10
439Command-R+ (Apr '24)$3.00R$ 17.10
440Magnum v4 72B$3.00R$ 17.10
441OpenAI: GPT-3.5 Turbo 16k$3.00R$ 17.10
442Claude 3.5 Sonnet (June '24)$3.75R$ 21.38
443Claude 3.5 Sonnet (Oct '24)$3.75R$ 21.38
444Claude 3.7 Sonnet$3.75R$ 21.38
445Claude 4 Sonnet (Reasoning)$3.75R$ 21.38
446Claude 4.5 Sonnet (Non-reasoning)$3.75R$ 21.38
447Claude 4.5 Sonnet (Reasoning)$3.75R$ 21.38
448Claude Sonnet 4$3.75R$ 21.38
449Claude Sonnet 4.6$3.75R$ 21.38
450Claude Sonnet 4.6 (Adaptive Reasoning, Max Effort)$3.75R$ 21.38
451Claude Sonnet 4.6 (Non-reasoning, Low Effort)$3.75R$ 21.38
452Goliath 120B$3.75R$ 21.38
453AionLabs: Aion-1.0$4.00R$ 22.80
454Mistral Large 3$4.00R$ 22.80
455GPT Chat Latest$5.00R$ 28.50
456GPT-5.5$5.00R$ 28.50
457GPT-5.5 Instant (May 2026)$5.00R$ 28.50
458OpenAI: GPT-4o (2024-05-13)$5.00R$ 28.50
459Claude Opus 4.5$6.25R$ 35.63
460Claude Opus 4.5 (Reasoning)$6.25R$ 35.63
461Claude Opus 4.6$6.25R$ 35.63
462Claude Opus 4.6 (Adaptive Reasoning, Max Effort)$6.25R$ 35.63
463Claude Opus 4.7$6.25R$ 35.63
464Claude Opus 4.8 (Adaptive Reasoning, Max Effort)$6.25R$ 35.63
465GPT-5.4 Image 2$8.00R$ 45.60
466Anthropic: Claude Opus 4.8 (Fast)$10.00R$ 57.00
467GPT-4 Turbo$10.00R$ 57.00
468GPT-4 Turbo Preview$10.00R$ 57.00
469GPT-5 Image$10.00R$ 57.00
470o3 Deep Research$10.00R$ 57.00
471OpenAI: GPT-4 Turbo (older v1106)$10.00R$ 57.00
472Claude Opus 4.1$15.00R$ 85.50
473GPT-5 Pro$15.00R$ 85.50
474o1$15.00R$ 85.50
475o1-preview$16.50R$ 94.05
476Claude 3 Opus$18.75R$ 106.88
477Claude 4 Opus (Reasoning)$18.75R$ 106.88
478Claude 4.1 Opus (Non-reasoning)$18.75R$ 106.88
479Claude 4.1 Opus (Reasoning)$18.75R$ 106.88
480Claude Opus 4$18.75R$ 106.88
481o3 Pro$20.00R$ 114.00
482GPT-5.2 Pro$21.00R$ 119.70
483Claude Opus 4.6 (Fast)$30.00R$ 171.00
484Claude Opus 4.7 (Fast)$30.00R$ 171.00
485GPT-5.4 Pro$30.00R$ 171.00
486OpenAI: GPT-4$30.00R$ 171.00
487o1-pro$150.00R$ 855.00

APIs com Plano Gratuito

Estes modelos oferecem acesso via API sem custo (com limites de rate). Ideais para protótipos e projetos de baixo volume.

Claude 2.0

Anthropic

Grátis

Claude 2.1

Anthropic

Grátis

Claude 3.7 Sonnet (thinking)

Anthropic

Grátis

Claude Instant

Anthropic

Grátis

Command A+

Cohere

Grátis

DBRX Instruct

Databricks

Grátis

DeepHermes 3 - Llama-3.1 8B Preview (Non-reasoning)

Nous Research

Grátis

DeepHermes 3 - Mistral 24B Preview (Non-reasoning)

Nous Research

Grátis

DeepSeek Coder V2 Lite Instruct

DeepSeek

Grátis

DeepSeek LLM 67B Chat (V1)

DeepSeek

Grátis

DeepSeek R1 0528 Qwen3 8B

DeepSeek

Grátis

DeepSeek R1 Distill Llama 8B

DeepSeek

Grátis

DeepSeek R1 Distill Qwen 1.5B

DeepSeek

Grátis

DeepSeek R1 Distill Qwen 14B

DeepSeek

Grátis

DeepSeek V3.2 Speciale

DeepSeek

Grátis

DeepSeek-Coder-V2

DeepSeek

Grátis

DeepSeek-V2-Chat

DeepSeek

Grátis

DeepSeek-V2.5

DeepSeek

Grátis

DeepSeek-V2.5 (Dec '24)

DeepSeek

Grátis

DeepSeek: R1 Distill Qwen 32B

DeepSeek

Grátis

Devstral 2

Mistral

Grátis

Devstral Small (May '25)

Mistral

Grátis

Doubao Seed Code

ByteDance

Grátis

Doubao Seed Code

ByteDance Seed

Grátis

ERNIE 5.0 Thinking Preview

Baidu

Grátis

Exaone 4.0 1.2B (Non-reasoning)

LG AI Research

Grátis

EXAONE 4.0 32B (Non-reasoning)

LG AI Research

Grátis

EXAONE 4.0 32B (Reasoning)

LG AI Research

Grátis

EXAONE 4.5 33B

LG AI

Grátis

Gemini 1.0 Pro

Google

Grátis

Gemini 1.0 Ultra

Google

Grátis

Gemini 1.5 Flash (May '24)

Google

Grátis

Gemini 1.5 Flash (Sep '24)

Google

Grátis

Gemini 1.5 Flash-8B

Google

Grátis

Gemini 1.5 Pro (May '24)

Google

Grátis

Gemini 1.5 Pro (Sep '24)

Google

Grátis

Gemini 2.0 Flash (experimental)

Google

Grátis

Gemini 2.0 Flash Thinking Experimental (Dec '24)

Google

Grátis

Gemini 2.0 Flash Thinking Experimental (Jan '25)

Google

Grátis

Gemini 2.0 Flash-Lite (Feb '25)

Google

Grátis

Gemini 2.0 Flash-Lite (Preview)

Google

Grátis

Gemini 2.0 Pro Experimental (Feb '25)

Google

Grátis

Gemini 2.5 Flash Preview (Non-reasoning)

Google

Grátis

Gemini 2.5 Flash Preview (Sep '25) (Reasoning)

Google

Grátis

Gemini 2.5 Pro Preview (Mar' 25)

Google

Grátis

Gemini 3 Deep Think

Google

Grátis

Gemma 3 1B Instruct

Google

Grátis

Gemma 3 270M

Google

Grátis

Gemma 3n E2B Instruct

Google

Grátis

Gemma 3n E4B Instruct Preview (May '25)

Google

Grátis

Gemma 4 E2B (Non-reasoning)

Google

Grátis

Gemma 4 E2B (Reasoning)

Google

Grátis

Gemma 4 E4B (Non-reasoning)

Google

Grátis

Gemma 4 E4B (Reasoning)

Google

Grátis

GPT-3.5 Turbo (0613)

OpenAI

Grátis

GPT-4.5 (Preview)

OpenAI

Grátis

GPT-4o (ChatGPT)

OpenAI

Grátis

GPT-4o (March 2025, chatgpt-4o-latest)

OpenAI

Grátis

GPT-4o mini Realtime (Dec '24)

OpenAI

Grátis

GPT-4o Realtime (Dec '24)

OpenAI

Grátis

GPT-5.5 Pro

OpenAI

Grátis

Granite 4.0 1B

IBM

Grátis

Granite 4.0 350M

IBM

Grátis

Granite 4.0 H 1B

IBM

Grátis

Granite 4.0 H 350M

IBM

Grátis

Granite 4.0 Micro

IBM

Grátis

Granite 4.1 30B

IBM

Grátis

Granite 4.1 3B

IBM

Grátis

HyperCLOVA X SEED Think (32B)

Naver

Grátis

Jamba 1.7 Mini

AI21 Labs

Grátis

Jamba Reasoning 3B

AI21 Labs

Grátis

JT-35B-Flash

China Mobile

Grátis

JT-35B-Flash

China Mobile

Grátis

JT-MINI

China Mobile

Grátis

K-EXAONE (Reasoning)

LG AI

Grátis

K2 Think V2

MBZUAI Institute of Foundation Models

Grátis

K2-V2 (high)

MBZUAI Institute of Foundation Models

Grátis

K2-V2 (medium)

MBZUAI Institute of Foundation Models

Grátis

Kimi Linear 48B A3B Instruct

Kimi

Grátis

LFM 40B

Liquid AI

Grátis

LFM2 1.2B

Liquid AI

Grátis

LFM2 2.6B

Liquid AI

Grátis

LFM2 8B A1B

Liquid AI

Grátis

LFM2.5-1.2B-Instruct

Liquid AI

Grátis

LFM2.5-1.2B-Thinking

Liquid AI

Grátis

LFM2.5-VL-1.6B

Liquid AI

Grátis

Ling-1T

InclusionAI

Grátis

Ling-mini-2.0

InclusionAI

Grátis

Llama 2 Chat 13B

Meta

Grátis

Llama 2 Chat 70B

Meta

Grátis

Llama 3.1 Nemotron Nano 4B v1.1 (Reasoning)

NVIDIA

Grátis

Llama 3.1 Tulu3 405B

Allen Institute for AI

Grátis

Llama 3.3 Nemotron Super 49B v1 (Non-reasoning)

NVIDIA

Grátis

Llama 3.3 Nemotron Super 49B v1 (Reasoning)

NVIDIA

Grátis

Llama 65B

Meta

Grátis

LongCat Flash Lite

LongCat

Grátis

Magistral Medium 1

Mistral

Grátis

Magistral Medium 1.2

Mistral AI

Grátis

Magistral Small 1

Mistral

Grátis

Magistral Small 1.2

Mistral

Grátis

Mi:dm K 2.5 Pro

Korea Telecom

Grátis

Mi:dm K 2.5 Pro Preview

Korea Telecom

Grátis

MiniCPM-V 4.6 1.3B

OpenBMB

Grátis

MiniMax M1 40k

MiniMax

Grátis

Mistral: Saba

Mistral AI

Grátis

Mixtral 8x22B Instruct

Mistral

Grátis

Molmo 7B-D

Allen Institute for AI

Grátis

Molmo2-8B

Allen Institute for AI

Grátis

Motif-2-12.7B-Reasoning

Motif Technologies

Grátis

Muse Spark

Meta

Grátis

Nanbeige4.1-3B

Nanbeige

Grátis

Nemotron Cascade 2 30B A3B

NVIDIA

Grátis

NVIDIA Nemotron 3 Nano 4B

NVIDIA

Grátis

o1-mini

OpenAI

Grátis

OLMo 2 32B

Allen Institute for AI

Grátis

OLMo 2 7B

Allen Institute for AI

Grátis

Olmo 3 32B Think

AllenAI

Grátis

Olmo 3 7B Think

Allen Institute for AI

Grátis

Olmo 3.1 32B Instruct

AllenAI

Grátis

Olmo 3.1 32B Think

Allen Institute for AI

Grátis

PALM-2

Google

Grátis

Phi-3 Mini Instruct 3.8B

Microsoft

Grátis

Phi-4 Mini Instruct

Microsoft

Grátis

Phi-4 Multimodal Instruct

Microsoft

Grátis

Qwen Chat 14B

Alibaba

Grátis

Qwen Chat 72B

Alibaba

Grátis

Qwen1.5 Chat 110B

Alibaba

Grátis

Qwen2 Instruct 72B

Alibaba

Grátis

Qwen2.5 Coder 32B Instruct

Alibaba

Grátis

Qwen2.5 Coder Instruct 7B

Alibaba

Grátis

Qwen2.5 Instruct 32B

Alibaba

Grátis

Qwen3 4B 2507 (Reasoning)

Alibaba

Grátis

Qwen3 4B 2507 Instruct

Alibaba

Grátis

Qwen3 VL 4B (Reasoning)

Alibaba

Grátis

Qwen3 VL 4B Instruct

Alibaba

Grátis

Qwen3.5 9B (Reasoning)

Alibaba

Grátis

QwQ 32B-Preview

Alibaba

Grátis

Ring-1T

InclusionAI

Grátis

Tiny Aya Global

Cohere

Grátis

Guia de Custo de APIs de IA para o Brasil

Como Funciona a Precificação por Token

A grande maioria das APIs de LLMs cobra por tokens processados, divididos em duas categorias: tokens de input(o texto que você envia ao modelo — seu prompt, contexto e histórico) e tokens de output (a resposta gerada pelo modelo). Em geral, o custo de output é 2–4× maior que o de input, pois requer mais computação para gerar.

Para o português brasileiro, 1.000 tokens equivalem a aproximadamente 750 palavras — ligeiramente menos eficiente que o inglês por causa de palavras mais longas e acentuação. Na prática, uma página A4 de texto corrido tem entre 600 e 900 tokens.

Exemplo Real de Custo Mensal

Imagine uma empresa que usa a API do GPT-4o para processar 100 e-mails por dia, com um prompt médio de 800 tokens e resposta de 300 tokens. Isso representa 110.000 tokens/dia × 30 dias = 3,3 milhões de tokens/mês. Com o preço de $2,50/M tokens de input e $10/M de output:

  • Input: 2,4M tokens × $2,50/M = $6,00/mêsR$ 34.20/mês
  • Output: 0,9M tokens × $10/M = $9,00/mêsR$ 51.30/mês
  • Total: $15,00/mêsR$ 85.50/mês

O mesmo volume com Claude Haiku (a ~$0,25/M input) custaria apenas R$ 9.83/mês — uma economia significativa para casos onde a qualidade máxima não é crítica.

Estratégias para Reduzir Custos de API no Brasil

1. Escolha o modelo certo para cada tarefa: classificação simples de texto pode usar Gemini Flash ou Claude Haiku; reserve GPT-4o ou Claude Opus para tarefas que realmente exigem raciocínio avançado.

2. Comprima os prompts: evite repetir contexto desnecessário. Sistemas de RAG bem implementados enviam apenas os trechos relevantes, não o documento inteiro.

3. Cache de respostas: se o mesmo prompt é enviado repetidamente (ex: categorização de produtos), armazene as respostas e reutilize. Providers como Anthropic oferecem prompt caching com desconto.

4. Use modelos open source via APIs de terceiros: Groq, Together AI e Fireworks oferecem modelos como Llama e Qwen por $0,01–$0,20/M tokens — 10–100× mais barato que os proprietários frontier.

IOF e Câmbio para Empresas Brasileiras

O pagamento das APIs de IA (OpenAI, Anthropic, Google) é feito em dólares americanos por cartão de crédito ou débito internacional. Para pessoas físicas, o IOF sobre compras internacionais foi zerado pelo governo Lula em janeiro de 2024 — você paga apenas o câmbio do cartão. Para pessoas jurídicas (CNPJ), as remessas internacionais ainda incidem IOF de 0,38%. Além do IOF, considere o spread do cartão (tipicamente 3–5% sobre o câmbio PTAX). Plataformas de pagamento como Wise podem oferecer câmbio mais próximo ao comercial.

Perguntas Frequentes sobre Custo de API

Quanto custa usar a API do ChatGPT (GPT-4o) em reais?

A API do GPT-4o custa $2,50 por milhão de tokens de input e $10,00 por milhão de tokens de output (preços de 2026). Com o câmbio em torno de R$ 5.70, isso equivale a aproximadamente R$ 14.25/M tokens de input. Para uma empresa brasileira que envia 1 milhão de tokens por dia, o custo mensal seria de aproximadamente R$ 428.

Qual é a API de IA mais barata disponível para empresas brasileiras?

Modelos open source como Qwen, Llama e Gemma podem ser rodados via APIs de terceiros (Groq, Together AI, Fireworks) por frações de centavo por milhão de tokens — chegando a $0,01–$0,10/M tokens. Entre as APIs proprietárias, Gemini Flash e Claude Haiku são as mais acessíveis, com preços a partir de $0,08–$0,25/M tokens de input.

Preciso pagar IOF ao usar APIs de IA no Brasil?

O IOF sobre compras internacionais no cartão de crédito foi zerado desde janeiro de 2024 para pessoas físicas. Empresas (CNPJ) ainda pagam IOF sobre remessas internacionais — consulte sua contabilidade. Os preços nesta tabela mostram o valor base em USD sem IOF adicional; inclua seu câmbio bancário real na estimativa final.

O que são tokens e como calcular o custo real do meu projeto?

Tokens são unidades de texto que os LLMs processam — em inglês, 1 token ≈ 4 caracteres; em português, pode ser um pouco menos por causa de acentuação. Uma página A4 tem ~600–800 tokens. Para estimar o custo: (tokens de input + tokens de output) × preço/1M tokens. Exemplo: prompt de 500 tokens + resposta de 300 tokens = 800 tokens × preço do modelo.

Vale mais a pena usar API ou assinar o plano premium do ChatGPT/Claude?

Para uso pessoal moderado, a assinatura (US$ 20/mês ≈ R$ 114/mês) costuma ser mais econômica. Para uso intensivo ou integração em produtos, a API é mais flexível e escalável. O ponto de virada geralmente acontece quando o consumo de tokens via API supera o custo da assinatura mensal.

Como os preços de API de IA variam ao longo do tempo?

Os preços caíram drasticamente: GPT-4 custava $30/M tokens em 2023; hoje modelos equivalentes custam $2–5/M. A tendência é de queda contínua conforme a competição aumenta. Atualizamos esta tabela semanalmente — verifique sempre os preços oficiais antes de comprometer seu budget.

Explorar no Benchmark