Gemini 2.5 Flash Lite — Benchmarks, Preços e Especificações 2026

Name: Gemini 2.5 Flash Lite
Brand: Google
Price: 0.1 USD

Especificações

Context Window

1.0M tokens

Preço Input/1M

$0.10

Preço Output/1M

$0.40

Parâmetros

—

Velocidade

236 tok/s

Latência (TTFT)

17.7s

Max Output

66K tokens

Benchmarks

Resultados do Gemini 2.5 Flash Lite nos principais benchmarks de avaliação de modelos de IA. Scores mais altos indicam melhor performance.

Agentic

Benchmark	Score	Máximo	Metodologia
Terminal-Bench Hard	5.0	100.0	—

Coding

Benchmark	Score	Máximo	Metodologia
LiveCodeBench	59.0	100.0	Artificial Analysis official API
SciCode	19.0	100.0	—
AA Coding Index	9.5	100.0	Artificial Analysis official API

Knowledge

Benchmark	Score	Máximo	Metodologia
MMLU-Pro	76.0	100.0	—

Long Context

Benchmark	Score	Máximo	Metodologia
AA-LCR	51.0	100.0	—

Math

Benchmark	Score	Máximo	Metodologia
MATH-500	96.9	100.0	Artificial Analysis official API
AA Math Index	53.3	100.0	Artificial Analysis official API
AIME 2025	53.0	100.0	Artificial Analysis official API

overall

Benchmark	Score	Máximo	Metodologia
AA Intelligence Index	17.6	100.0	Artificial Analysis official API

Reasoning

Benchmark	Score	Máximo	Metodologia
MMLU Pro	75.9	100.0	Artificial Analysis official API
GPQA Diamond	63.0	100.0	Artificial Analysis official API
IFBench	50.0	100.0	—
HLE	6.0	100.0	—

Tool Use

Benchmark	Score	Máximo	Metodologia
Tau²-Bench	19.0	100.0	—

Informações

Lançamento: 17 de junho de 2025
Tool Calling: ❌ Não suportado
Visão: ❌ Não suportado
Áudio: ❌ Não suportado

Análise Completa: Gemini 2.5 Flash Lite

O que é o Gemini 2.5 Flash Lite?

O Gemini 2.5 Flash Lite é um modelo de inteligência artificial desenvolvido pela Google, classificado como modelo de linguagem (LLM). É um modelo multimodal, capaz de processar texto, imagens e potencialmente outros tipos de mídia. Como modelo proprietário, está disponível via API cloud da Google. Com uma janela de contexto de 1.0M tokens, é adequado para processamento de documentos longos como contratos, livros e bases de código completas.

Preços e Custos em 2026

O Gemini 2.5 Flash Lite é cobrado por uso, com preço de US$ 0.1/1M tokens de input e US$ 0.4/1M tokens de output. Para contextualizar: 1 milhão de tokens equivale a aproximadamente 750 mil palavras, ou cerca de 10 livros de tamanho médio. Com esse preço agressivo, é uma das opções mais econômicas do mercado, ideal para aplicações de alto volume como chatbots, análise de documentos em massa e automações.

Para o mercado brasileiro, é importante considerar o IOF de 6,38% sobre transações internacionais e a variação cambial do dólar. Com o câmbio atual, o custo do Gemini 2.5 Flash Lite em reais fica em torno de R$ 0.62/1M tokens de input (estimativa com IOF incluso).

Benchmarks e Performance

O Gemini 2.5 Flash Lite foi avaliado em 15 benchmarks diferentes, cobrindo categorias como Agentic, Coding, Knowledge, Long Context, Math, overall, Reasoning, Tool Use. Os resultados mostram performance excepcional nas avaliações disponíveis.

É importante notar que benchmarks medem aspectos específicos e não capturam toda a experiência de uso. Fatores como qualidade da resposta em português, aderência a instruções complexas e comportamento em conversas longas variam significativamente entre modelos e nem sempre são refletidos nos scores padrão.

Casos de Uso Recomendados

O Gemini 2.5 Flash Lite é adequado para diversas aplicações de inteligência artificial: análise de documentos longos (contratos, processos jurídicos, bases de código), processamento multimodal combinando texto e imagens, chatbots de alto volume e atendimento automatizado, geração de texto, resumo, tradução e assistência geral.

Comparação com Alternativas

No ecossistema de modelos de IA em 2026, o Gemini 2.5 Flash Lite compete diretamente com modelos de nível similar. Os principais concorrentes incluem GPT (OpenAI), Claude (Anthropic) e modelos open source como Llama (Meta) e Qwen (Alibaba). A escolha entre modelos depende do caso de uso específico, orçamento, requisitos de latência e necessidade de funcionalidades como multimodalidade e tool calling.

Para uma comparação detalhada lado a lado, utilize nossa ferramenta de comparação ou consulte o ranking geral de modelos.

Uso no Brasil e em Português

Para usuários brasileiros, a performance em português é um critério fundamental na escolha de um modelo de IA. A maioria dos benchmarks internacionais testa apenas em inglês, o que pode mascarar diferenças significativas na qualidade de resposta em outros idiomas. O Gemini 2.5 Flash Lite oferece suporte multimodal que funciona em múltiplos idiomas, mas a qualidade em português brasileiro pode variar dependendo da tarefa específica.

Recomendamos testar o modelo com prompts representativos do seu caso de uso em português antes de tomar uma decisão. O SWEN.AI está desenvolvendo um benchmark proprietário em PT-BR com tarefas aderentes ao mercado brasileiro para fornecer comparações mais precisas.

Perguntas Frequentes

O que é o Gemini 2.5 Flash Lite?

O Gemini 2.5 Flash Lite é um modelo de inteligência artificial desenvolvido pela Google. É um modelo do tipo texto, com suporte multimodal (texto, imagem e mais).

Quanto custa o Gemini 2.5 Flash Lite?

O Gemini 2.5 Flash Lite custa US$ 0.1/1M tokens de input e US$ 0.4/1M tokens de output. Para uso intensivo (ex.: chatbot de WhatsApp com 100k mensagens/mês), o custo pode variar de R$ 50 a R$ 5.000 dependendo do volume.

O Gemini 2.5 Flash Lite funciona em português?

A maioria dos modelos de IA modernos, incluindo o Gemini 2.5 Flash Lite, suporta português brasileiro. No entanto, a qualidade pode variar — modelos como Claude e Gemini tendem a ter melhor performance em PT-BR. Recomendamos testar com prompts específicos do seu caso de uso.

Como o Gemini 2.5 Flash Lite se compara com outros modelos?

Nos benchmarks disponíveis, o Gemini 2.5 Flash Lite obteve scores como: Terminal-Bench Hard: 5/100, LiveCodeBench: 59/100, SciCode: 19/100. Consulte a tabela completa acima para comparação detalhada.

O Gemini 2.5 Flash Lite é open source?

Não, o Gemini 2.5 Flash Lite é um modelo proprietário da Google. Ele está disponível via API cloud. Para alternativas open source, confira nosso ranking de modelos open source.