Melhor IA para Código em 2026Claude vs GPT vs Gemini — Ranking

Qual IA programa melhor em 2026? Ranking de 273 modelos por SWE-bench, HumanEval e LiveCodeBench. Compare Claude, GPT-4o, Gemini e DeepSeek para código, debug e geração de funções.

Sincronizado: 29 de maio de 2026 •273 modelos com benchmarks de código

Casos de Uso

Autocompletar Código

Sugestões inline enquanto você digita. Ideal para IDEs como Cursor e VS Code.

Top modelos: Gemini 3 Pro Preview (high), Gemini 3 Flash Preview (Reasoning), Gemini 3 Flash Preview

Geração de Código

Criar funções, classes e projetos completos a partir de descrições em linguagem natural.

Top modelos: Gemini 3 Pro Preview (high), Gemini 3 Flash Preview (Reasoning), Gemini 3 Flash Preview

Debug e Code Review

Identificar bugs, sugerir correções e revisar pull requests automaticamente.

Top modelos: Gemini 3 Pro Preview (high), Gemini 3 Flash Preview (Reasoning), Gemini 3 Flash Preview

Ranking de Coding — Top Modelos

#	Modelo	Empresa	Coding Score	Benchmark	Context	Preço Input	Lançamento	Open Source
🥇	Gemini 3 Pro Preview (high)	Google	92.0	LiveCodeBench	—	$2.00	nov. de 2025	—
🥈	Gemini 3 Flash Preview (Reasoning)	Google	91.0	LiveCodeBench	—	$0.50	dez. de 2025	—
🥉	Gemini 3 Flash Preview	Google	90.8	LiveCodeBench	1.0M tokens	$0.50	dez. de 2025	—
4	DeepSeek V3.2 Speciale	DeepSeek	90.0	LiveCodeBench	164K tokens	—	dez. de 2025	✅
5	GPT-5.2	OpenAI	89.0	LiveCodeBench	400K tokens	$1.75	dez. de 2025	—
6	GPT-5.2 Chat	OpenAI	88.9	LiveCodeBench	128K tokens	$1.75	dez. de 2025	—
7	GPT-5.2 Pro	OpenAI	88.9	LiveCodeBench	400K tokens	$21.00	dez. de 2025	—
8	gpt-oss-120b	OpenAI	88.0	LiveCodeBench	131K tokens	$0.15	ago. de 2025	—
9	Claude Opus 4.5 (Reasoning)	Anthropic	87.0	LiveCodeBench	—	$6.25	nov. de 2025	—
10	GPT-5.1	OpenAI	87.0	LiveCodeBench	400K tokens	$1.25	nov. de 2025	—
11	DeepSeek V3.2 Exp (Reasoning)	DeepSeek	86.0	LiveCodeBench	—	$0.28	set. de 2025	—
12	Gemini 3 Pro Preview (low)	Google	86.0	LiveCodeBench	—	$2.00	nov. de 2025	—
13	o4 Mini	OpenAI	86.0	LiveCodeBench	200K tokens	$1.10	abr. de 2025	—
14	o4 Mini High	OpenAI	85.9	LiveCodeBench	200K tokens	$1.10	abr. de 2025	—
15	Kimi K2 Thinking	Kimi	85.0	LiveCodeBench	262K tokens	$0.60	nov. de 2025	—
16	GPT-5	OpenAI	85.0	LiveCodeBench	400K tokens	$1.25	ago. de 2025	—
17	GPT-5.1-Codex	OpenAI	85.0	LiveCodeBench	400K tokens	$1.25	nov. de 2025	—
18	GPT-5.1-Codex-Max	OpenAI	84.9	LiveCodeBench	400K tokens	$1.25	dez. de 2025	—
19	GPT-5 Codex	OpenAI	84.0	LiveCodeBench	400K tokens	$1.25	set. de 2025	—
20	GPT-5 Mini	OpenAI	84.0	LiveCodeBench	400K tokens	$0.25	ago. de 2025	—
21	GPT-5.1-Codex-Mini	OpenAI	84.0	LiveCodeBench	400K tokens	$0.25	nov. de 2025	—
22	MiniMax: MiniMax M2.7	MiniMax	83.0	LiveCodeBench	197K tokens	$0.30	out. de 2025	✅
23	ERNIE 5.0 Thinking Preview	Baidu	81.0	LiveCodeBench	—	—	nov. de 2025	—
24	MiniMax-M2	MiniMax	81.0	LiveCodeBench	205K tokens	$0.30	out. de 2025	—
25	MiniMax: MiniMax M2.1	MiniMax	81.0	LiveCodeBench	197K tokens	$0.30	dez. de 2025	✅
26	o3	OpenAI	81.0	LiveCodeBench	200K tokens	$2.00	abr. de 2025	—
27	o3 Pro	OpenAI	80.8	LiveCodeBench	200K tokens	$20.00	jun. de 2025	—
28	Gemini 2.5 Pro	Google	80.1	LiveCodeBench	1.0M tokens	$1.25	jun. de 2025	—
29	DeepSeek V3.1 Terminus	DeepSeek	80.0	LiveCodeBench	164K tokens	$1.64	set. de 2025	✅
30	Gemini 2.5 Pro Preview (Mar' 25)	Google	80.0	LiveCodeBench	—	—	mar. de 2025	—
31	Gemini 3 Flash Preview (Non-reasoning)	Google	80.0	LiveCodeBench	—	$0.50	dez. de 2025	—
32	Qwen: Qwen3 235B A22B Instruct 2507	Alibaba	79.0	LiveCodeBench	262K tokens	$0.45	abr. de 2025	✅
33	GPT-5 Nano	OpenAI	79.0	LiveCodeBench	400K tokens	$0.05	ago. de 2025	—
34	DeepSeek V3.2 Exp	DeepSeek	78.9	LiveCodeBench	164K tokens	$0.27	set. de 2025	✅
35	DeepSeek V3.2 Exp (Non-reasoning)	DeepSeek	78.9	LiveCodeBench	—	$0.28	set. de 2025	—
36	Qwen: Qwen3 235B A22B Thinking 2507	Alibaba	78.8	LiveCodeBench	131K tokens	$0.15	—	✅
37	GPT-5.3 Chat	OpenAI	78.2	LiveBench Coding	128K tokens	$1.75	mar. de 2026	—
38	Qwen3 Next 80B A3B (Reasoning)	Alibaba	78.0	LiveCodeBench	—	$0.50	set. de 2025	—
39	DeepSeek V3.1	DeepSeek	78.0	LiveCodeBench	164K tokens	$0.40	dez. de 2024	✅
40	gpt-oss-20b	OpenAI	78.0	LiveCodeBench	131K tokens	$0.05	ago. de 2025	—
41	Gemini 2.5 Pro Preview 06-05	Google	77.8	LiveCodeBench	1.0M tokens	$1.25	jun. de 2025	—
42	GPT-5.1 Chat	OpenAI	77.5	LiveBench Coding	128K tokens	$1.25	nov. de 2025	—
43	Doubao Seed Code	ByteDance Seed	77.0	LiveCodeBench	—	—	nov. de 2025	—
44	Seed-OSS-36B-Instruct	ByteDance Seed	77.0	LiveCodeBench	—	$0.21	ago. de 2025	—
45	DeepSeek R1 (Jan '25)	DeepSeek	77.0	LiveCodeBench	—	$1.68	jan. de 2025	—
46	Gemini 2.5 Pro Preview (May' 25)	Google	77.0	LiveCodeBench	—	$1.25	mai. de 2025	—
47	K-EXAONE (Reasoning)	LG AI	77.0	LiveCodeBench	—	—	dez. de 2025	—
48	Doubao Seed Code	ByteDance	76.6	LiveCodeBench	—	—	—	—
49	Claude Sonnet 4.5	Anthropic	76.1	LiveBench Coding	1.0M tokens	$3.00	set. de 2025	—
50	KAT-Coder-Pro V1	KwaiKAT	75.0	LiveCodeBench	—	$0.30	nov. de 2025	—
51	EXAONE 4.0 32B (Reasoning)	LG AI Research	75.0	LiveCodeBench	—	—	jul. de 2025	—
52	Magistral Medium 1.2	Mistral AI	75.0	LiveCodeBench	—	—	jun. de 2025	—
53	Qwen3 VL 32B (Reasoning)	Alibaba	74.0	LiveCodeBench	—	$0.70	out. de 2025	—
54	Claude Opus 4.5	Anthropic	74.0	LiveCodeBench	200K tokens	$6.25	nov. de 2025	—
55	Llama Nemotron Super 49B v1.5 (Reasoning)	NVIDIA	74.0	LiveCodeBench	—	$0.10	jul. de 2025	—
56	NVIDIA Nemotron 3 Nano 30B A3B (Reasoning)	NVIDIA	74.0	LiveCodeBench	—	$0.06	dez. de 2025	—
57	Nova 2.0 Pro Preview (medium)	Amazon	73.0	LiveCodeBench	—	$1.25	nov. de 2025	—
58	o3 Mini High	OpenAI	73.0	LiveCodeBench	200K tokens	$1.10	jan. de 2025	—
59	GPT-5 Pro	OpenAI	72.1	LiveBench Coding	400K tokens	$15.00	out. de 2025	—
60	Magistral Small 1.2	Mistral	72.0	LiveCodeBench	—	—	jun. de 2025	—
61	NVIDIA Nemotron Nano 9B V2 (Reasoning)	NVIDIA	72.0	LiveCodeBench	—	$0.04	ago. de 2025	—
62	o3 Mini	OpenAI	72.0	LiveCodeBench	200K tokens	$1.10	jan. de 2025	—
63	Qwen3 30B A3B 2507 (Reasoning)	Alibaba	71.0	LiveCodeBench	—	$0.28	jul. de 2025	—
64	Nova 2.0 Lite (high)	Amazon	71.0	LiveCodeBench	—	$0.30	out. de 2025	—
65	Claude 4.5 Sonnet (Reasoning)	Anthropic	71.0	LiveCodeBench	—	$3.75	set. de 2025	—
66	Gemini 2.5 Flash Preview (Sep '25) (Reasoning)	Google	71.0	LiveCodeBench	—	—	set. de 2025	—
67	MiniMax M1 80k	MiniMax	71.0	LiveCodeBench	—	$0.55	jun. de 2025	—
68	Qwen3 VL 30B A3B (Reasoning)	Alibaba	70.0	LiveCodeBench	—	$0.20	out. de 2025	—
69	Olmo 3.1 32B Think	Allen Institute for AI	70.0	LiveCodeBench	—	—	dez. de 2025	—
70	Gemini 2.5 Flash Preview (Reasoning)	Google	70.0	LiveCodeBench	—	$0.30	mai. de 2025	—
71	NVIDIA Nemotron Nano 9B V2 (Non-reasoning)	NVIDIA	70.0	LiveCodeBench	131K tokens	$0.05	ago. de 2025	—
72	Cogito v2.1 (Reasoning)	Deep Cogito	69.0	LiveCodeBench	—	$1.25	nov. de 2025	—
73	Gemini 2.5 Flash-Lite Preview (Sep '25) (Reasoning)	Google	69.0	LiveCodeBench	—	$0.10	set. de 2025	—
74	K2-V2 (medium)	MBZUAI Institute of Foundation Models	69.0	LiveCodeBench	—	—	dez. de 2025	—
75	Hermes 4 - Llama-3.1 405B (Reasoning)	Nous Research	69.0	LiveCodeBench	—	$1.00	ago. de 2025	—
76	NVIDIA Nemotron Nano 12B v2 VL (Reasoning)	NVIDIA	69.0	LiveCodeBench	—	$0.20	out. de 2025	—
77	Deep Cogito: Cogito v2.1 671B	Deep Cogito	68.8	LiveCodeBench	128K tokens	$1.25	—	—
78	Gemini 3.1 Flash Lite	Google	68.5	LiveBench Coding	1.0M tokens	$0.25	mai. de 2026	—
79	Qwen: Qwen3 Next 80B A3B Instruct	Alibaba	68.0	LiveCodeBench	262K tokens	$0.50	set. de 2025	✅
80	Qwen3 Omni 30B A3B (Reasoning)	Alibaba	68.0	LiveCodeBench	—	$0.25	set. de 2025	—
81	Ling-1T	InclusionAI	68.0	LiveCodeBench	—	—	out. de 2025	—
82	o1	OpenAI	68.0	LiveCodeBench	200K tokens	$15.00	dez. de 2024	—
83	o1-preview	OpenAI	67.9	LiveCodeBench	—	$16.50	set. de 2024	—
84	o1-pro	OpenAI	67.9	LiveCodeBench	200K tokens	$150.00	mar. de 2025	—
85	Olmo 3 32B Think	AllenAI	67.0	LiveCodeBench	66K tokens	—	nov. de 2025	✅
86	Mistral: Devstral 2 2512	Mistral AI	66.8	LiveBench Coding	262K tokens	$0.40	—	✅
87	Nova 2.0 Omni (medium)	Amazon	66.0	LiveCodeBench	—	$0.30	nov. de 2025	—
88	Claude 4 Sonnet (Reasoning)	Anthropic	66.0	LiveCodeBench	—	$3.75	mai. de 2025	—
89	Mi:dm K 2.5 Pro	Korea Telecom	66.0	LiveCodeBench	—	—	dez. de 2025	—
90	MiniMax M1 40k	MiniMax	66.0	LiveCodeBench	—	—	jun. de 2025	—
91	Arcee AI: Trinity Large Thinking	Arcee AI	65.7	LiveBench Coding	262K tokens	$0.22	—	✅
92	Claude 4.1 Opus (Non-reasoning)	Anthropic	65.4	LiveCodeBench	—	$18.75	ago. de 2025	—
93	Qwen3 Max (Preview)	Alibaba	65.0	LiveCodeBench	—	$1.20	set. de 2025	—
94	Qwen3 VL 235B A22B (Reasoning)	Alibaba	65.0	LiveCodeBench	—	$0.84	set. de 2025	—
95	Claude 4.1 Opus (Reasoning)	Anthropic	65.0	LiveCodeBench	—	$18.75	ago. de 2025	—
96	Motif-2-12.7B-Reasoning	Motif Technologies	65.0	LiveCodeBench	—	—	dez. de 2025	—
97	Hermes 4 - Llama-3.1 70B (Reasoning)	Nous Research	65.0	LiveCodeBench	—	$0.13	ago. de 2025	—
98	Qwen3 4B 2507 (Reasoning)	Alibaba	64.0	LiveCodeBench	—	—	ago. de 2025	—
99	Claude 4 Opus (Reasoning)	Anthropic	64.0	LiveCodeBench	—	$18.75	mai. de 2025	—
100	Gemini 2.5 Flash-Lite Preview (Sep '25) (Non-reasoning)	Google	64.0	LiveCodeBench	—	$0.10	set. de 2025	—
101	Ring-1T	InclusionAI	64.0	LiveCodeBench	—	—	out. de 2025	—
102	Llama 3.1 Nemotron Ultra 253B v1 (Reasoning)	NVIDIA	64.0	LiveCodeBench	—	$0.60	abr. de 2025	—
103	Ring-flash-2.0	InclusionAI	63.0	LiveCodeBench	—	$0.14	set. de 2025	—
104	HyperCLOVA X SEED Think (32B)	Naver	63.0	LiveCodeBench	—	—	dez. de 2025	—
105	Qwen3 235B A22B (Reasoning)	Alibaba	62.0	LiveCodeBench	—	$0.70	abr. de 2025	—
106	Olmo 3 7B Think	Allen Institute for AI	62.0	LiveCodeBench	—	—	nov. de 2025	—
107	Claude 4.5 Haiku (Reasoning)	Anthropic	62.0	LiveCodeBench	—	$1.25	out. de 2025	—
108	DeepSeek: R1	DeepSeek	61.7	LiveCodeBench	164K tokens	$0.70	mai. de 2025	✅
109	MoonshotAI: Kimi K2 0905	MoonshotAI	61.0	LiveCodeBench	262K tokens	$0.60	set. de 2025	✅
110	GPT-5.5	OpenAI	59.1	AA Coding Index	1.1M tokens	$5.00	abr. de 2026	—
111	Qwen: Qwen3 VL 235B A22B Instruct	Alibaba	59.0	LiveCodeBench	262K tokens	$0.30	set. de 2025	✅
112	Qwen3 Coder 480B A35B Instruct	Alibaba	59.0	LiveCodeBench	—	$0.30	jul. de 2025	—
113	Nova 2.0 Omni (low)	Amazon	59.0	LiveCodeBench	—	$0.30	nov. de 2025	—
114	Claude 4.5 Sonnet (Non-reasoning)	Anthropic	59.0	LiveCodeBench	—	$3.75	set. de 2025	—
115	DeepSeek V3.2	DeepSeek	59.0	LiveCodeBench	131K tokens	$0.50	dez. de 2025	✅
116	Gemini 2.5 Flash Lite	Google	59.0	LiveCodeBench	1.0M tokens	$0.10	jun. de 2025	—
117	Gemini 3.1 Pro Preview	Google	59.0	SciCode	1.0M tokens	$2.00	fev. de 2026	—
118	Ling-flash-2.0	InclusionAI	59.0	LiveCodeBench	—	$0.14	set. de 2025	—
119	Mi:dm K 2.5 Pro Preview	Korea Telecom	58.0	LiveCodeBench	—	—	dez. de 2025	—
120	o1-mini	OpenAI	58.0	LiveCodeBench	—	—	set. de 2024	—
121	GPT-5.4	OpenAI	57.2	AA Coding Index	1.1M tokens	$2.50	mar. de 2026	—
122	Anthropic: Claude Opus 4.8 (Fast)	Anthropic	56.7	AA Coding Index	1.0M tokens	$10.00	mai. de 2026	—
123	Claude Opus 4.8 (Adaptive Reasoning, Max Effort)	Anthropic	56.7	AA Coding Index	1.0M tokens	$6.25	mai. de 2026	—
124	Kimi K2	Moonshot AI	56.0	LiveCodeBench	131K tokens	$0.58	jul. de 2025	—
125	GPT-5 (minimal)	OpenAI	56.0	LiveCodeBench	—	$1.25	ago. de 2025	—
126	Qwen3 32B (Reasoning)	Alibaba	55.0	LiveCodeBench	—	$0.15	abr. de 2025	—
127	Claude Opus 4.7	Anthropic	55.0	SciCode	1.0M tokens	$6.25	abr. de 2026	—
128	Hermes 4 - Llama-3.1 405B (Non-reasoning)	Nous Research	55.0	LiveCodeBench	—	$1.00	ago. de 2025	—
129	GPT-5 mini (minimal)	OpenAI	55.0	LiveCodeBench	—	$0.25	ago. de 2025	—
130	GPT-5.2-Codex	OpenAI	55.0	SciCode	400K tokens	$1.75	dez. de 2025	—
131	GPT-5 Chat	OpenAI	54.3	LiveCodeBench	128K tokens	$1.25	ago. de 2025	—
132	Qwen3 Max Thinking (Preview)	Alibaba	54.0	LiveCodeBench	—	$1.20	nov. de 2025	—
133	Claude Opus 4	Anthropic	54.0	LiveCodeBench	200K tokens	$18.75	mai. de 2025	—
134	MoonshotAI: Kimi K2.6	MoonshotAI	54.0	SciCode	262K tokens	$0.95	abr. de 2026	✅
135	GPT-5 (ChatGPT)	OpenAI	54.0	LiveCodeBench	—	$1.25	ago. de 2025	—
136	Claude Opus 4.7 (Fast)	Anthropic	53.1	AA Coding Index	1.0M tokens	$30.00	mai. de 2026	—
137	GPT-5.3-Codex	OpenAI	53.1	AA Coding Index	400K tokens	$1.75	fev. de 2026	—
138	Google: Gemini 3.5 Flash	Google	53.0	SciCode	1.0M tokens	$1.50	mai. de 2026	—
139	Magistral Medium 1	Mistral	52.7	LiveCodeBench	—	—	jun. de 2025	—
140	Qwen3 14B (Reasoning)	Alibaba	52.0	LiveCodeBench	—	$0.23	abr. de 2025	—
141	Qwen3 30B A3B 2507 Instruct	Alibaba	52.0	LiveCodeBench	—	$0.15	jul. de 2025	—
142	Claude Opus 4.6 (Adaptive Reasoning, Max Effort)	Anthropic	52.0	SciCode	—	$6.25	fev. de 2026	—
143	Exaone 4.0 1.2B (Non-reasoning)	LG AI Research	52.0	LiveCodeBench	—	—	jul. de 2025	—
144	Muse Spark	Meta	52.0	SciCode	—	—	abr. de 2026	—
145	GPT-5.4 Mini	OpenAI	51.5	AA Coding Index	400K tokens	$0.75	mar. de 2026	—
146	Magistral Small 1	Mistral	51.4	LiveCodeBench	—	—	jun. de 2025	—
147	Qwen: Qwen3 VL 32B Instruct	Alibaba	51.0	LiveCodeBench	131K tokens	$0.70	out. de 2025	✅
148	Qwen3 30B A3B (Reasoning)	Alibaba	51.0	LiveCodeBench	—	$0.09	abr. de 2025	—
149	Claude Haiku 4.5	Anthropic	51.0	LiveCodeBench	200K tokens	$1.25	out. de 2025	—
150	DeepSeek R1 0528 Qwen3 8B	DeepSeek	51.0	LiveCodeBench	—	—	mai. de 2025	—
151	Claude Sonnet 4.6 (Adaptive Reasoning, Max Effort)	Anthropic	50.9	AA Coding Index	—	$3.75	fev. de 2026	—
152	Qwen3.7 Max	Alibaba	50.1	AA Coding Index	—	$2.50	mai. de 2026	—
153	DeepSeek V4 Pro	DeepSeek	50.0	SciCode	1.0M tokens	$0.43	abr. de 2026	✅
154	Gemini 2.5 Flash	Google	50.0	LiveCodeBench	1.0M tokens	$0.30	mai. de 2025	—
155	GPT-5.5 Instant (May 2026)	OpenAI	50.0	SciCode	—	$5.00	mai. de 2026	—
156	Gemini 3.5 Flash (minimal)	Google	49.0	SciCode	—	$1.50	mai. de 2026	—
157	MoonshotAI: Kimi K2.5	MoonshotAI	49.0	SciCode	262K tokens	$0.60	jan. de 2026	✅
158	Llama 3.1 Nemotron Nano 4B v1.1 (Reasoning)	NVIDIA	49.0	LiveCodeBench	—	—	mai. de 2025	—
159	Qwen: Qwen3 30B A3B Thinking 2507	Alibaba	48.9	LiveBench Coding	131K tokens	$0.08	—	✅
160	Qwen: Qwen3 VL 30B A3B Instruct	Alibaba	48.0	LiveCodeBench	131K tokens	$0.20	out. de 2025	✅
161	GPT-4.1 Mini	OpenAI	48.0	LiveCodeBench	1.0M tokens	$0.40	abr. de 2025	—
162	Claude Opus 4.6	Anthropic	47.6	AA Coding Index	1.0M tokens	$6.25	fev. de 2026	—
163	Claude Opus 4.6 (Fast)	Anthropic	47.6	AA Coding Index	1.0M tokens	$30.00	abr. de 2026	—
164	Qwen3 4B (Reasoning)	Alibaba	47.0	LiveCodeBench	—	$0.11	abr. de 2025	—
165	Qwen3.6 Max Preview	Alibaba	47.0	SciCode	—	$1.30	abr. de 2026	—
166	Claude 3.7 Sonnet (thinking)	Anthropic	47.0	LiveCodeBench	200K tokens	—	fev. de 2025	—
167	Claude Sonnet 4.6	Anthropic	47.0	SciCode	1.0M tokens	$3.75	fev. de 2026	—
168	Baidu: ERNIE 4.5 300B A47B	Baidu	47.0	LiveCodeBench	123K tokens	$0.28	jun. de 2025	✅
169	EXAONE 4.0 32B (Non-reasoning)	LG AI Research	47.0	LiveCodeBench	—	—	jul. de 2025	—
170	Mistral Large 3	Mistral	47.0	LiveCodeBench	—	$4.00	fev. de 2024	—
171	GPT-5 nano (minimal)	OpenAI	47.0	LiveCodeBench	—	$0.05	ago. de 2025	—
172	GPT-5.4 Nano	OpenAI	47.0	SciCode	400K tokens	$0.20	mar. de 2026	—
173	GPT-4.1	OpenAI	46.0	LiveCodeBench	1.0M tokens	$2.00	abr. de 2025	—
174	Kwaipilot: KAT-Coder-Pro V2	Kwaipilot	45.6	AA Coding Index	256K tokens	$0.30	mar. de 2026	—
175	Claude Sonnet 4	Anthropic	45.0	LiveCodeBench	1.0M tokens	$3.75	mai. de 2025	—
176	DeepSeek V4 Flash	DeepSeek	45.0	SciCode	1.0M tokens	$0.14	abr. de 2026	✅
177	Devstral 2	Mistral	45.0	LiveCodeBench	—	—	dez. de 2025	—
178	Claude Sonnet 4.6 (Non-reasoning, Low Effort)	Anthropic	44.0	SciCode	—	$3.75	fev. de 2026	—
179	Gemma 4 31B	Google	43.0	SciCode	262K tokens	$0.14	abr. de 2026	—
180	Ling-mini-2.0	InclusionAI	43.0	LiveCodeBench	—	—	set. de 2025	—
181	MiniMax: MiniMax M2.5	MiniMax	43.0	SciCode	197K tokens	$0.30	fev. de 2026	✅
182	GPT-4o (March 2025, chatgpt-4o-latest)	OpenAI	43.0	LiveCodeBench	—	—	mar. de 2025	—
183	Qwen3 Omni 30B A3B Instruct	Alibaba	42.0	LiveCodeBench	—	$0.25	set. de 2025	—
184	Gemini 3.1 Flash Lite Preview	Google	42.0	SciCode	1.0M tokens	$0.25	mar. de 2026	—
185	Ring-2.6-1T	InclusionAI	42.0	SciCode	—	$0.30	mai. de 2026	—
186	Qwen3 8B (Reasoning)	Alibaba	41.0	LiveCodeBench	—	$0.11	abr. de 2025	—
187	Qwen3.5 Omni Plus	Alibaba	41.0	SciCode	—	$0.40	mar. de 2026	—
188	DeepSeek V3 0324	DeepSeek	41.0	LiveCodeBench	—	$1.20	mar. de 2025	—
189	Gemini 2.5 Flash Preview (Non-reasoning)	Google	41.0	LiveCodeBench	—	—	abr. de 2025	—
190	Mistral: Mistral Medium 3.1	Mistral AI	41.0	LiveCodeBench	131K tokens	$0.40	ago. de 2025	✅
191	GPT-5.4 Pro	OpenAI	41.0	AA Coding Index	1.1M tokens	$30.00	mar. de 2026	—
192	Qwen: Qwen3 Coder 30B A3B Instruct	Alibaba	40.0	LiveCodeBench	160K tokens	$0.19	jul. de 2025	✅
193	Gemma 4 26B A4B	Google	40.0	SciCode	262K tokens	$0.13	abr. de 2026	—
194	Llama 4 Maverick	Meta	40.0	LiveCodeBench	1.0M tokens	$0.35	abr. de 2025	✅
195	Mistral: Mistral Medium 3	Mistral AI	40.0	LiveCodeBench	131K tokens	$0.40	mai. de 2025	✅
196	Mistral: Mistral Medium 3.5	Mistral AI	40.0	SciCode	262K tokens	$1.50	abr. de 2026	✅
197	K2-V2 (high)	MBZUAI Institute of Foundation Models	39.3	LiveCodeBench	—	—	dez. de 2025	—
198	Claude 3.7 Sonnet	Anthropic	39.0	LiveCodeBench	200K tokens	$3.75	fev. de 2025	—
199	Inception: Mercury 2	Inception	39.0	SciCode	128K tokens	$0.25	fev. de 2026	—
200	Claude 3.5 Sonnet (June '24)	Anthropic	38.1	LiveCodeBench	—	$3.75	jun. de 2024	—
201	Claude 3.5 Sonnet (Oct '24)	Anthropic	38.0	LiveCodeBench	—	$3.75	out. de 2024	—
202	Command A+	Cohere	38.0	SciCode	—	—	mai. de 2026	—
203	DeepSeek R1 Distill Qwen 14B	DeepSeek	38.0	LiveCodeBench	—	—	jan. de 2025	—
204	DeepSeek: R1 Distill Qwen 32B	DeepSeek	38.0	SciCode	128K tokens	—	jan. de 2025	✅
205	Kimi Linear 48B A3B Instruct	Kimi	38.0	LiveCodeBench	—	—	out. de 2025	—
206	Mistral: Mistral Small 4	Mistral AI	38.0	SciCode	262K tokens	$0.20	set. de 2024	✅
207	Qwen3 4B 2507 Instruct	Alibaba	37.7	LiveCodeBench	—	—	ago. de 2025	—
208	Ling-2.6-1T	Inclusion AI	37.0	SciCode	—	$0.30	abr. de 2026	—
209	Qwen2.5 Max	Alibaba	36.0	LiveCodeBench	—	$1.60	jan. de 2025	—
210	QwQ 32B	Alibaba	36.0	SciCode	—	$0.66	mar. de 2025	—
211	Trinity Large Thinking	Arcee AI	36.0	SciCode	—	$0.23	abr. de 2026	—
212	NVIDIA Nemotron 3 Nano 30B A3B (Non-reasoning)	NVIDIA	36.0	LiveCodeBench	262K tokens	$0.05	dez. de 2025	—
213	NVIDIA Nemotron 3 Super 120B A12B (Reasoning)	NVIDIA	36.0	SciCode	1.0M tokens	$0.30	mar. de 2026	—
214	DeepSeek V3	DeepSeek	35.9	LiveCodeBench	131K tokens	$0.23	dez. de 2024	✅
215	Mistral: Ministral 3 14B 2512	Mistral AI	35.1	LiveCodeBench	262K tokens	$0.20	—	✅
216	Qwen3 VL 8B (Reasoning)	Alibaba	35.0	LiveCodeBench	—	$0.18	out. de 2025	—
217	Gemini 2.0 Pro Experimental (Feb '25)	Google	35.0	LiveCodeBench	—	—	fev. de 2025	—
218	Devstral Small 2	Mistral	35.0	LiveCodeBench	—	$0.10	jul. de 2025	—
219	Ministral 3 14B	Mistral	35.0	LiveCodeBench	—	$0.20	dez. de 2025	—
220	Nemotron Cascade 2 30B A3B	NVIDIA	35.0	SciCode	—	—	mar. de 2026	—
221	NVIDIA Nemotron Nano 12B v2 VL (Non-reasoning)	NVIDIA	35.0	LiveCodeBench	—	$0.20	out. de 2025	—
222	QwQ 32B-Preview	Alibaba	34.0	LiveCodeBench	—	—	nov. de 2024	—
223	Gemini 2.0 Flash (experimental)	Google	34.0	SciCode	—	—	dez. de 2024	—
224	Mistral: Devstral Medium	Mistral AI	34.0	LiveCodeBench	131K tokens	$0.40	jul. de 2025	✅
225	Qwen: Qwen3 VL 8B Instruct	Alibaba	33.0	LiveCodeBench	131K tokens	$0.18	out. de 2025	✅
226	Gemini 2.0 Flash	Google	33.0	SciCode	1.0M tokens	$0.15	fev. de 2025	—
227	Gemini 2.0 Flash Thinking Experimental (Jan '25)	Google	33.0	SciCode	—	—	jan. de 2025	—
228	K2 Think V2	MBZUAI Institute of Foundation Models	33.0	SciCode	—	—	dez. de 2025	—
229	GPT-4.1 Nano	OpenAI	33.0	LiveCodeBench	1.0M tokens	$0.10	abr. de 2025	—
230	GPT-4o (2024-08-06)	OpenAI	33.0	SciCode	128K tokens	$2.50	ago. de 2024	—
231	GPT-4o (ChatGPT)	OpenAI	33.0	SciCode	—	—	fev. de 2025	—
232	OpenAI: GPT-4o	OpenAI	33.0	SciCode	128K tokens	$2.50	nov. de 2024	—
233	OpenAI: GPT-4o (2024-05-13)	OpenAI	33.0	LiveCodeBench	128K tokens	$5.00	mai. de 2024	—
234	Gemini 2.0 Flash Thinking Experimental (Dec '24)	Google	32.1	LiveCodeBench	—	—	dez. de 2024	—
235	Qwen: Qwen3 30B A3B Instruct 2507	Alibaba	32.0	LiveCodeBench	262K tokens	$0.08	abr. de 2025	✅
236	Qwen3 VL 4B (Reasoning)	Alibaba	32.0	LiveCodeBench	—	—	out. de 2025	—
237	Amazon: Nova Premier 1.0	Amazon	32.0	LiveCodeBench	1.0M tokens	$2.50	abr. de 2025	—
238	Gemini 1.5 Pro (Sep '24)	Google	32.0	LiveCodeBench	—	—	set. de 2024	—
239	GPT-4 Turbo	OpenAI	32.0	SciCode	128K tokens	$10.00	nov. de 2023	—
240	Qwen3 1.7B (Reasoning)	Alibaba	31.0	LiveCodeBench	—	$0.11	abr. de 2025	—
241	Nova 2.0 Omni (Non-reasoning)	Amazon	31.0	LiveCodeBench	—	$0.30	nov. de 2025	—
242	Claude 3.5 Haiku	Anthropic	31.0	LiveCodeBench	200K tokens	$1.00	out. de 2024	—
243	R1 Distill Llama 70B	DeepSeek	31.0	SciCode	131K tokens	$0.70	jan. de 2025	✅
244	Llama 3.1 Instruct 405B	Meta	31.0	LiveCodeBench	—	$2.75	jul. de 2024	—
245	GPT-4o (2024-11-20)	OpenAI	31.0	LiveCodeBench	128K tokens	$2.50	nov. de 2024	—
246	Qwen3 1.7B (Non-reasoning)	Alibaba	30.8	LiveCodeBench	—	$0.11	abr. de 2025	—
247	Mistral: Ministral 3 8B 2512	Mistral AI	30.3	LiveCodeBench	262K tokens	$0.15	—	✅
248	Qwen2.5 Coder 32B Instruct	Alibaba	30.0	LiveCodeBench	33K tokens	—	nov. de 2024	✅
249	Llama 3.1 Tulu3 405B	Allen Institute for AI	30.0	SciCode	—	—	jan. de 2025	—
250	Llama 4 Scout	Meta	30.0	LiveCodeBench	10.0M tokens	$0.17	abr. de 2025	✅
251	Ministral 3 8B	Mistral	30.0	LiveCodeBench	—	$0.15	dez. de 2025	—
252	GPT-4 Turbo Preview	OpenAI	29.1	LiveCodeBench	128K tokens	$10.00	jan. de 2024	—
253	OpenAI: GPT-4 Turbo (older v1106)	OpenAI	29.1	LiveCodeBench	128K tokens	$10.00	nov. de 2023	—
254	Qwen3 VL 4B Instruct	Alibaba	29.0	LiveCodeBench	—	—	out. de 2025	—
255	JT-35B-Flash	China Mobile	29.0	SciCode	—	—	mai. de 2026	—
256	Llama 3.3 70B Instruct	Meta	29.0	LiveCodeBench	131K tokens	$0.58	dez. de 2024	✅
257	Mistral Large 2 (Nov '24)	Mistral	29.0	LiveCodeBench	—	$2.00	nov. de 2024	—
258	Mistral: Pixtral Large 2411	Mistral AI	29.0	SciCode	131K tokens	$2.00	nov. de 2024	—
259	Llama Nemotron Super 49B v1.5 (Non-reasoning)	NVIDIA	29.0	LiveCodeBench	—	$0.10	jul. de 2025	—
260	Qwen3 32B (Non-reasoning)	Alibaba	28.8	LiveCodeBench	—	$0.15	abr. de 2025	—
261	Qwen2.5 72B Instruct	Alibaba	28.0	LiveCodeBench	33K tokens	$0.36	set. de 2024	✅
262	Qwen3 14B (Non-reasoning)	Alibaba	28.0	LiveCodeBench	—	$0.23	abr. de 2025	—
263	Claude 3 Opus	Anthropic	28.0	LiveCodeBench	—	$18.75	mar. de 2024	—
264	EXAONE 4.5 33B	LG AI	28.0	SciCode	—	—	abr. de 2026	—
265	LongCat Flash Lite	LongCat	28.0	SciCode	—	—	jan. de 2026	—
266	Mistral Small 3.2	Mistral	28.0	LiveCodeBench	—	$0.09	jun. de 2025	—
267	Hermes 4 - Llama-3.1 70B (Non-reasoning)	Nous Research	28.0	SciCode	—	$0.13	ago. de 2025	—
268	Llama 3.3 Nemotron Super 49B v1 (Non-reasoning)	NVIDIA	28.0	LiveCodeBench	—	—	mar. de 2025	—
269	Llama 3.3 Nemotron Super 49B v1 (Reasoning)	NVIDIA	28.0	SciCode	—	—	mar. de 2025	—
270	Nemotron 3 Nano Omni 30B A3B Reasoning	NVIDIA	28.0	SciCode	—	$0.07	abr. de 2026	—
271	Mistral: Mistral Small 3.2 24B	Mistral AI	27.5	LiveCodeBench	128K tokens	$0.07	—	✅
272	Gemini 1.5 Flash (Sep '24)	Google	27.0	LiveCodeBench	—	—	set. de 2024	—
273	Llama 3.1 70B Instruct	Meta	27.0	SciCode	131K tokens	$0.56	jul. de 2024	✅

+ 227 modelos sem benchmark de coding disponível.Ver todos os modelos

Guia Completo: IA para Programação em 2026

O Estado da IA para Código em 2026

A inteligência artificial transformou radicalmente o desenvolvimento de software nos últimos anos. Em 2026, modelos de linguagem (LLMs) são capazes de gerar código funcional em dezenas de linguagens, resolver bugs em projetos reais e até criar aplicações completas a partir de descrições em linguagem natural. O SWE-bench — o benchmark mais rigoroso para coding — avalia modelos em tarefas reais de engenharia de software extraídas de issues do GitHub.

SWE-bench: O Benchmark de Referência

O SWE-bench (Software Engineering Benchmark) é considerado o padrão ouro para avaliar capacidade de coding de LLMs. Diferente de benchmarks acadêmicos como HumanEval (que testa funções isoladas), o SWE-bench apresenta issues reais de repositórios populares como Django, Flask, scikit-learn e requests. O modelo precisa entender o contexto do projeto, localizar os arquivos relevantes e gerar um patch que resolva o bug — simulando o trabalho real de um desenvolvedor.

A versão "Verified" do SWE-bench (SWE-bench Verified) é curada por engenheiros humanos para garantir que cada tarefa tem uma solução clara e verificável. Os scores neste benchmark são particularmente informativos porque correlacionam fortemente com a experiência real de uso para coding.

HumanEval e LiveCodeBench

HumanEval, criado pela OpenAI, testa a capacidade de gerar funções Python a partir de docstrings. É um benchmark mais simples que o SWE-bench, mas útil para avaliar fluência básica em código. LiveCodeBench adiciona uma camada de complexidade ao testar com problemas que são atualizados regularmente, reduzindo o risco de contaminação (quando o modelo já viu as respostas durante o treinamento).

Como Escolher o Melhor Modelo para Código

A escolha do modelo ideal depende do caso de uso específico. Para autocompletar código em tempo real (Cursor, Copilot), velocidade e latência são mais importantes que score máximo — modelos menores como GPT-4o-mini e Claude Haiku oferecem excelente relação velocidade/qualidade. Para geração de projetos completos ou debug complexo, modelos frontier como Claude Opus, GPT-4o e Gemini Ultra são mais adequados, apesar do custo maior.

Para equipes que precisam de controle sobre os dados (compliance, segurança), modelos open source como DeepSeek Coder, Code Llama e StarCoder permitem deploy on-premises com performance competitiva. A decisão entre proprietário e open source envolve tradeoffs de custo, latência, privacidade e qualidade.

Ferramentas de Coding com IA

As principais ferramentas de desenvolvimento assistido por IA em 2026 incluem Cursor (IDE completa com suporte a Claude e GPT), GitHub Copilot (extensão VS Code com modelos OpenAI), Windsurf (ex-Codeium, focado em acessibilidade), e Amazon CodeWhisperer (integrado ao ecossistema AWS). Cada ferramenta usa diferentes modelos por baixo, e a qualidade do código gerado depende diretamente da capacidade do LLM utilizado.

Para desenvolvedores brasileiros, um fator importante é a capacidade do modelo de entender comentários, nomes de variáveis e documentação em português — algo que varia significativamente entre modelos e que não é capturado pelos benchmarks tradicionais em inglês.

Tendências para 2026 e Além

As tendências mais relevantes em IA para código incluem: agentes autônomos de engenharia (que resolvem tarefas complexas sem supervisão), geração de testes automatizados, refatoração inteligente, e integração nativa com pipelines de CI/CD. A fronteira está se movendo de “assistente de código” para “engenheiro autônomo”, com modelos cada vez mais capazes de navegar codebases grandes e tomar decisões arquiteturais.

Perguntas Frequentes

Qual é a melhor IA para programar?

Em 2026, os modelos que lideram em benchmarks de código são Gemini 3 Pro Preview (high), Gemini 3 Flash Preview (Reasoning), Gemini 3 Flash Preview. No entanto, a melhor escolha depende do caso de uso: autocompletar código, geração de projetos completos, debug ou code review.

ChatGPT ou Claude para código?

Ambos são excelentes para programação. Claude tende a ser melhor em contextos longos (bases de código grandes) e seguir instruções complexas. GPT tem forte performance em geração rápida e edição inline. Teste ambos no seu caso de uso específico.

O que é o SWE-bench?

SWE-bench (Software Engineering Benchmark) avalia a capacidade de modelos de resolver issues reais de repositórios open source no GitHub. É considerado o benchmark mais realista para coding, pois testa resolução de bugs em projetos reais, não exercícios acadêmicos.

Quais LLMs gratuitas são boas para código?

Modelos open source como DeepSeek Coder, Qwen Coder e Code Llama oferecem excelente performance em coding sem custo de API. Podem ser rodados localmente via Ollama ou acessados gratuitamente em plataformas como Together AI e Groq.

Cursor ou GitHub Copilot?

Cursor e Copilot são IDEs/extensões que usam LLMs por baixo. Cursor permite escolher o modelo (Claude, GPT, etc.), enquanto Copilot usa modelos da OpenAI. A qualidade do código gerado depende mais do modelo escolhido do que da ferramenta em si.

Código & Programação

Melhores LLMs para Código

Compare modelos otimizados para programação, debug e geração de código. Avaliados em HumanEval, SWE-Bench e WebDev Arena.

Autocompletar Código

Sugestões inteligentes enquanto você digita

Em breve

Geração de Código

Crie funções completas a partir de descrições

Em breve

Debug e Refatoração

Encontre bugs e melhore a qualidade do código

Em breve

Ranking para Código

0 modelos

Compare Modelos Lado a Lado

Use nossa ferramenta de comparação para ver benchmarks detalhados entre modelos específicos.

Comparar Modelos

Melhor IA para Código em 2026Claude vs GPT vs Gemini — Ranking

Casos de Uso

Autocompletar Código

Geração de Código

Debug e Code Review

Ranking de Coding — Top Modelos

Guia Completo: IA para Programação em 2026

O Estado da IA para Código em 2026

SWE-bench: O Benchmark de Referência

HumanEval e LiveCodeBench

Como Escolher o Melhor Modelo para Código

Ferramentas de Coding com IA

Tendências para 2026 e Além

Perguntas Frequentes

Qual é a melhor IA para programar?

ChatGPT ou Claude para código?

O que é o SWE-bench?

Quais LLMs gratuitas são boas para código?

Cursor ou GitHub Copilot?

Explorar Outras Categorias

Melhores LLMs para Código

Autocompletar Código

Geração de Código

Debug e Refatoração

Ranking para Código

Compare Modelos Lado a Lado

Melhores LLMs para Código

Autocompletar Código

Geração de Código

Debug e Refatoração

Ranking para Código

Compare Modelos Lado a Lado