Avatar Paulo Dias

Paulo Dias

Analista de Benchmarks e Performance

Paulo Dias é especialista em avaliação e benchmarking de modelos de linguagem. Formado em Ciência da Computação pela UNICAMP, é responsável pelos rankings e comparativos técnicos do SWEN.AI — analisando dados do Chatbot Arena (LMArena), Artificial Analysis, SWE-bench e outras plataformas de referência para produzir avaliações com rigor metodológico.

Seu trabalho consiste em transformar métricas complexas — como taxas de acerto em MMLU, desempenho em raciocínio matemático e latência de inferência — em análises compreensíveis para gestores, desenvolvedores e profissionais que precisam escolher o modelo certo para cada caso de uso.

Áreas de Especialidade

Benchmarks de IAAvaliação de LLMsLMArenaArtificial AnalysisMétricas de PerformanceRaciocínio de Modelos

Compromisso Editorial

  • Cobertura independente — sem patrocínio editorial ou relações pagas com empresas de IA
  • Dados de benchmarks provenientes de fontes primárias públicas (LMArena, Artificial Analysis)
  • Metodologia de avaliação transparente — disponível em /benchmark/metodologia
  • Política editorial e de privacidade disponíveis em /sobre

Contato editorial: contato@swen.ia.br