Ranking 2026

Melhores LLMs Gratuitos

236 modelos de IA sem custo — open-source e planos gratuitos de API. Ordenados por AA Intelligence Index (Artificial Analysis, atualizado a cada 6h).

236
modelos gratuitos
92
open-source
144
API gratuita

Top 5 LLMs Gratuitos

Lista Completa de LLMs Gratuitos

#ModeloScore AA
1MoonshotAI: Kimi K2.653.9
2Muse Spark52.2
3DeepSeek V4 Pro51.5
4MiniMax: MiniMax M2.749.6
5MoonshotAI: Kimi K2.546.8
6DeepSeek V4 Flash46.5
7MiniMax: MiniMax M2.541.9
8MiniMax: MiniMax M2.139.4
9Mistral: Mistral Medium 3.539.2
10Command A+37.2
11JT-35B-Flash36.1
12Claude 3.7 Sonnet (thinking)34.7
13Gemini 2.5 Pro Preview (Mar' 25)34.6
14DeepSeek V3.1 Terminus33.9
15Doubao Seed Code33.5
16Doubao Seed Code33.5
17DeepSeek V3.2 Exp32.9
18DeepSeek V3.232.1
19K-EXAONE (Reasoning)32.1
20Arcee AI: Trinity Large Thinking31.9
21Gemini 2.5 Flash Preview (Sep '25) (Reasoning)31.1
22MoonshotAI: Kimi K2 090530.9
23EXAONE 4.5 33B30.2
24Qwen: Qwen3 235B A22B Instruct 250729.5
25Qwen: Qwen3 235B A22B Thinking 250729.5
26DeepSeek V3.2 Speciale29.4
27ERNIE 5.0 Thinking Preview29.1
28Nemotron Cascade 2 30B A3B28.4
29DeepSeek V3.128.1
30Mistral: Mistral Small 427.8
31Qwen3.5 9B (Reasoning)27.3
32Magistral Medium 1.227.1
33JT-35B-Flash25.4
34JT-MINI25.4
35K2 Think V224.1
36LongCat Flash Lite23.9
37HyperCLOVA X SEED Think (32B)23.7
38Mi:dm K 2.5 Pro23.1
39Mi:dm K 2.5 Pro Preview23.1
40Ring-1T22.8
41Devstral 222.0
42Mistral: Devstral 2 251222.0
43Mistral: Mistral Medium 3.121.3
44MiniMax M1 40k20.9
45Qwen: Qwen3 VL 235B A22B Instruct20.8
46K2-V2 (medium)20.6
47o1-mini20.4
48Qwen: Qwen3 Next 80B A3B Instruct20.1
49Qwen: Qwen3 Coder 30B A3B Instruct20.0
50GPT-4.5 (Preview)20.0
51Gemini 2.0 Flash Thinking Experimental (Jan '25)19.6
52Motif-2-12.7B-Reasoning19.1
53Ling-1T19.0
54DeepSeek: R118.8
55Gemma 4 E4B (Reasoning)18.8
56Magistral Medium 118.8
57Mistral: Mistral Medium 318.8
58Mistral: Devstral Medium18.7
59GPT-4o (March 2025, chatgpt-4o-latest)18.6
60Llama 3.3 Nemotron Super 49B v1 (Reasoning)18.5
61Llama 4 Maverick18.4
62Qwen3 4B 2507 (Reasoning)18.2
63Magistral Small 1.218.2
64Gemini 2.0 Pro Experimental (Feb '25)18.1
65Devstral Small (May '25)18.0
66Mistral: Devstral Small 1.118.0
67Gemini 2.5 Flash Preview (Non-reasoning)17.8
68Qwen: Qwen3 VL 32B Instruct17.2
69DeepSeek: R1 Distill Qwen 32B17.2
70Gemini 2.0 Flash (experimental)16.8
71Magistral Small 116.8
72EXAONE 4.0 32B (Reasoning)16.7
73DeepSeek V316.5
74DeepSeek R1 0528 Qwen3 8B16.4
75Nanbeige4.1-3B16.1
76Qwen: Qwen3 VL 30B A3B Instruct16.0
77R1 Distill Llama 70B16.0
78Gemini 1.5 Pro (Sep '24)16.0
79Mistral: Ministral 3 14B 251216.0
80DeepSeek R1 Distill Qwen 14B15.8
81Qwen2.5 72B Instruct15.6
82QwQ 32B-Preview15.2
83Gemma 4 E2B (Reasoning)15.2
84Mistral: Mistral Small 3.2 24B15.1
85Baidu: ERNIE 4.5 300B A47B 15.0
86Gemma 4 E4B (Non-reasoning)14.8
87Mistral: Ministral 3 8B 251214.8
88Gemini 2.0 Flash-Lite (Feb '25)14.7
89Granite 4.1 30B14.7
90NVIDIA Nemotron 3 Nano 4B14.7
91Gemini 2.0 Flash-Lite (Preview)14.5
92Llama 3.3 70B Instruct14.5
93Mistral: Mistral Small 3.1 24B14.5
94Kimi Linear 48B A3B Instruct14.4
95K2-V2 (high)14.4
96Llama 3.1 Nemotron Nano 4B v1.1 (Reasoning)14.4
97Qwen: Qwen3 VL 8B Instruct14.3
98Llama 3.3 Nemotron Super 49B v1 (Non-reasoning)14.3
99Llama 3.1 Tulu3 405B14.1
100GPT-4o (ChatGPT)14.1
101Olmo 3.1 32B Think13.9
102Gemini 1.5 Flash (Sep '24)13.8
103Qwen3 VL 4B (Reasoning)13.7
104Llama 4 Scout13.5
105Llama 3.1 Nemotron 70B Instruct13.4
106Qwen2.5 Instruct 32B13.2
107Qwen2.5 Coder 32B Instruct12.9
108Qwen3 4B 2507 Instruct12.9
109MiniCPM-V 4.6 1.3B12.7
110Qwen: Qwen3 30B A3B Instruct 250712.5
111Qwen: Qwen3 30B A3B Thinking 250712.5
112DeepSeek-V2.5 (Dec '24)12.5
113Llama 3.1 70B Instruct12.5
114DeepSeek-V2.512.3
115Gemini 2.0 Flash Thinking Experimental (Dec '24)12.3
116Olmo 3.1 32B Instruct12.2
117Olmo 3 32B Think12.1
118DeepSeek R1 Distill Llama 8B12.1
119Gemma 4 E2B (Non-reasoning)12.1
120Mistral: Saba12.1
121Gemini 1.5 Pro (May '24)12.0
122Llama 3.1 8B Instruct11.8
123Qwen2 Instruct 72B11.7
124EXAONE 4.0 32B (Non-reasoning)11.7
125Mistral: Ministral 3 3B 251211.2
126Gemini 1.5 Flash-8B11.1
127AI21: Jamba Large 1.710.9
128DeepHermes 3 - Mistral 24B Preview (Non-reasoning)10.9
129OLMo 2 32B10.6
130DeepSeek-Coder-V210.6
131Gemini 1.5 Flash (May '24)10.5
132LFM2-24B-A2B10.5
133Microsoft: Phi 410.4
134Gemini 1.0 Ultra10.1
135Gemma 3n E4B Instruct Preview (May '25)10.1
136Phi-3 Mini Instruct 3.8B10.1
137Qwen2.5 Coder Instruct 7B 10.0
138Phi-4 Multimodal Instruct10.0
139Mistral Large9.9
140Mixtral 8x22B Instruct9.8
141Mistral: Mixtral 8x22B Instruct9.8
142Llama 3.2 3B Instruct9.7
143Jamba Reasoning 3B9.6
144Qwen3 VL 4B Instruct9.6
145Qwen1.5 Chat 110B9.5
146Olmo 3 7B Think9.4
147OLMo 2 7B9.3
148Claude 2.19.3
149Molmo 7B-D9.2
150Ling-mini-2.09.2
151Claude 2.09.1
152DeepSeek R1 Distill Qwen 1.5B9.1
153DeepSeek-V2-Chat9.1
154Mistral: Mistral Small Creative9.0
155Llama 3 70B Instruct8.9
156Qwen Chat 72B8.8
157LFM 40B8.8
158Llama 3.2 11B Vision Instruct8.7
159PALM-28.6
160DeepSeek Coder V2 Lite Instruct8.5
161Gemini 1.0 Pro8.5
162Granite 4.1 3B8.5
163DeepSeek LLM 67B Chat (V1)8.4
164Llama 2 Chat 13B8.4
165Llama 2 Chat 70B8.4
166Phi-4 Mini Instruct8.4
167DBRX Instruct8.3
168Exaone 4.0 1.2B (Non-reasoning)8.3
169Jamba 1.7 Mini8.1
170LFM2.5-1.2B-Thinking8.1
171Granite 4.0 H 1B8.0
172LFM2 2.6B8.0
173LFM2.5-1.2B-Instruct8.0
174Gemma 3 270M7.7
175Granite 4.0 Micro7.7
176Mistral: Mixtral 8x7B Instruct7.7
177DeepHermes 3 - Llama-3.1 8B Preview (Non-reasoning)7.6
178Qwen Chat 14B7.4
179Claude Instant7.4
180Llama 65B7.4
181Mistral: Mistral 7B Instruct v0.17.4
182Molmo2-8B7.3
183Granite 4.0 1B7.3
184LFM2 8B A1B7.0
185Llama 3 8B Instruct6.4
186LFM2 1.2B6.3
187Llama 3.2 1B Instruct6.3
188LFM2.5-VL-1.6B6.2
189Granite 4.0 350M6.1
190Gemma 3 1B Instruct5.6
191Granite 4.0 H 350M5.4
192Gemma 3n E2B Instruct4.8
193Tiny Aya Global4.7
194AlfredPros: CodeLLaMa 7B Instruct Solidity
195Qwen: Qwen2.5 7B Instruct
196Qwen: Qwen2.5 VL 72B Instruct
197Wan 2.1
198Claude 3.5
199Claude Opus 4.8
200Opus 4.7
201Opus 4.8
202Arcee AI: Trinity Mini
203Baidu: ERNIE 4.5 21B A3B Thinking
204Baidu: ERNIE 4.5 VL 28B A3B
205Baidu: ERNIE 4.5 VL 424B A47B
206ByteDance: UI-TARS 7B
207EssentialAI: Rnj 1 Instruct
208Goliath 120B
209Gemini 3.5
210Gemini 3 Deep Think
211Lyria 3 Clip Preview
212Lyria 3 Pro Preview
213Kling AI 2.0
214Luma Dream Machine 1.6
215Magnum v4 72B
216Llama Guard 3 8B
217Llama Guard 4 12B
218WizardLM-2 8x22B
219Hailuo MiniMax Video-01
220MiniMax: MiniMax-01
221Mistral
222Mistral: Mistral Nemo
223Mistral: Voxtral Small 24B 2507
224MoonshotAI: Kimi K2 0711
225MythoMax 13B
226Nex AGI: DeepSeek V3.1 Nex N1
227Nous: Hermes 3 405B Instruct
228Nous: Hermes 3 70B Instruct
229Nous: Hermes 4 405B
230Nous: Hermes 4 70B
231NousResearch: Hermes 2 Pro - Llama-3 8B
232GPT-3.5 Turbo (0613)
233GPT-4o mini Realtime (Dec '24)
234GPT-4o Realtime (Dec '24)
235GPT-5.5 Pro
236Sora

Como Acessar LLMs Gratuitos

Via Interface Web (sem código)

  • ChatGPT — GPT-4o mini grátis em chat.openai.com
  • Claude.ai — Claude 3.5 Haiku grátis (limite diário)
  • Gemini — Gemini 1.5 Flash grátis em gemini.google.com
  • Mistral Le Chat — Mistral Large grátis
  • Groq — Llama 3, Mistral via API rápida grátis

Rodar Localmente (open-source)

  • Ollama — instale e execute ollama run llama3
  • LM Studio — interface gráfica para modelos locais
  • Jan.ai — app desktop com interface amigável
  • Together.ai — inferência cloud com cota gratuita generosa
  • Replicate — pay-per-use, mas com créditos iniciais

Open-Source vs. API Gratuita: Qual Escolher?

CritérioOpen-SourceAPI Gratuita
Privacidade dos dadosTotal (roda local)Compartilhados com provedor
Custo de infraestruturaGPU própria ou cloudZero (dentro do limite)
Limite de usoIlimitadoRate limit diário/mensal
Facilidade de setupMédio (requer técnica)Imediato
Customização/fine-tuningTotalLimitada ou indisponível
Qualidade máxima disponívelLlama 3.1 405BGPT-4o, Gemini Ultra

Perguntas Frequentes

Qual o melhor LLM gratuito disponível hoje?
Com base no AA Intelligence Index, o melhor modelo gratuito atualmente é o MoonshotAI: Kimi K2.6 (score 53.9), que pode ser acessado gratuitamente. Em seguida aparecem Muse Spark e DeepSeek V4 Pro.
Qual a diferença entre LLM gratuito e open-source?
LLM gratuito significa que você pode usá-lo sem pagar — via interface web (ChatGPT free, Claude.ai, Gemini) ou via API com tier gratuito. Open-source vai além: o código e os pesos são públicos, permitindo rodar localmente, modificar e usar sem limites ou privacidade comprometida. Exemplos open-source: Llama 3, Mistral, Qwen. Exemplos gratuitos mas não open-source: GPT-4o-mini (API grátis com limite), Gemini Flash.
Como rodar um LLM open-source localmente?
A forma mais fácil é usar o Ollama (ollama.ai): instale, execute "ollama run llama3" e o modelo roda no seu computador. Para modelos maiores (70B+), é necessário GPU com pelo menos 40GB VRAM ou usar serviços como Groq, Together.ai e Replicate — que oferecem inferência gratuita com cota mensal.
LLMs gratuitos têm qualidade suficiente para uso profissional?
Sim, para muitos casos de uso. Modelos como Llama 3.1 70B, Mistral Large e Qwen 2.5 72B atingem performance comparável ou superior a GPT-3.5 e competem com GPT-4 em tarefas específicas. Para uso profissional de alto volume (produção, integração via API, SLA), a API paga geralmente oferece melhor confiabilidade e suporte.

Conteúdo relacionado: