A Cortex, plataforma de Inteligência Artificial Corporativa da SinapseTech, disponibiliza atualmente 75 modelos de diversos provedores para impulsionar produtividade, inovação e transformação digital.
Cada modelo é otimizado para cenários específicos — desde raciocínio profundo e geração de código até resposta rápida em alto volume, análise multimodal, pesquisa web e geração de imagens.
🔄 Catálogo vivo — novos modelos são adicionados continuamente conforme são liberados pelos provedores. A Cortex sempre oferece acesso aos modelos mais recentes e relevantes para o ambiente corporativo, com governança e segurança da informação.
Cada modelo possui tags que indicam seus pontos fortes:
🌟 Premium · ⚡ Rapido · 🧠 Raciocinio · 💰 Economico · 🤖 Agentes · 💻 Codigo · 🖼️ Multimodal · 🏢 Corporativo · ✍️ Redacao · 🎯 Estrategia · 💡 Criativo · 📊 Analise de Dados · 📄 Documentos · 🔍 Pesquisa Web · 🔧 Infraestrutura
Capacidades (ícones ao lado de cada modelo): 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Geração de imagem · 💻 Code Interpreter · 🔧 Ferramentas
Preço de tokens 💲: valores em USD por 1 milhão de tokens (entrada · saída). Fonte: provedores oficiais. Preços podem variar — consulte sempre a tabela de preços do provedor.
1 modelo disponível.
![]() |
O Cortex Model Orchestrator é a inteligência central da plataforma Cortex. Em vez de exigir que o usuário conheça e escolha entre dezenas de modelos, ele faz esse trabalho automaticamente — analisando cada solicitação, identificando a natureza e a complexidade da tarefa e selecionando o modelo mais adequado entre todos os disponíveis na plataforma. Como funciona na prática:
Por que é a melhor escolha para uso cotidiano: Suporta texto, imagens, arquivos, pesquisa web, geração de imagens, execução de código e uso de ferramentas externas. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
5 modelos disponíveis.
![]() |
Projetado para assistentes inteligentes e agentes em tempo real. Oferece respostas ageis, contextuais e precisas para suporte e automacoes. Baixa latencia com boa qualidade. Usar para tarefas rapidas que exigem precisao. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
![]() |
Modelo altamente avançado e autônomo, ideal para tarefas complexas de longo prazo, como análise, desenvolvimento de código, automação de processos e tomada de decisão baseada em dados. Destaca-se pela capacidade de raciocínio profundo, uso inteligente de memória e excelente interpretação de imagens e documentos, entregando resultados mais completos e precisos. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
![]() |
O modelo mais avançado da Anthropic para tarefas complexas, combinando raciocínio profundo, alta precisão e excelente capacidade de colaboração. Destaca-se em programação, automação de agentes, análise de grandes volumes de informação e tomada de decisão, entregando respostas mais confiáveis, transparentes e com menor propensão a conclusões incorretas. Ideal para desafios que exigem qualidade, profundidade e resultados consistentes. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
![]() |
O modelo mais avançado da Anthropic disponível para uso geral — e o melhor modelo de linguagem da atualidade. Oferece desempenho excepcional em programação, análise de dados, pesquisa, visão computacional e resolução de problemas complexos. Destaca-se pela capacidade de trabalhar de forma autônoma por longos períodos, mantendo contexto e qualidade mesmo em tarefas extensas e multidisciplinares. Seu raciocínio avançado permite compreender documentos, gráficos, imagens e grandes volumes de informação com elevada precisão. Para garantir segurança, algumas solicitações sensíveis são tratadas por modelos especializados da Anthropic, mantendo o equilíbrio entre alta capacidade e uso responsável da IA. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
![]() |
Versao mais avancada da linha Sonnet da Anthropic. Evolucao significativa em codificacao, raciocinio em longo contexto e planejamento de agentes. Janela de ate 1 milhao de tokens. Desempenho proximo ao nivel Opus com custo menor. Excelente para programacao, analise tecnica e construcao de agentes. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
6 modelos disponíveis.
![]() |
Modelo Cohere especializado em re-ranking para reorganizar resultados de busca e RAG. NAO usar para geracao de texto - usar apenas em pipelines de busca/RAG. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
![]() |
Modelo da Cohere focado em re-ranking de alta precisao para cenarios empresariais complexos como financas, saude e diagnostico industrial. NAO usar para geracao de texto - usar apenas em pipelines de busca/RAG. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
![]() |
Modelo avancado de embeddings com maior precisao e profundidade contextual. NAO usar para geracao de texto - usar apenas em pipelines de busca/RAG/classificacao de alta exigencia. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
![]() |
Modelo de geracao de embeddings que converte textos em vetores numericos semanticos. NAO usar para geracao de texto - usar apenas em pipelines de busca/RAG/classificacao. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
![]() |
Modelo de Text-to-Speech (TTS) para transformar texto em audio com voz natural. NAO usar para geracao de texto - usar apenas para sintese de fala. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
![]() |
Modelo de Speech-to-Text (STT) para transformar audio em texto. NAO usar para geracao de texto - usar apenas para transcricao de audio. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
20 modelos disponíveis.
![]() |
Modelo versatil e confiavel para redacao, estudos, analise de dados e desenvolvimento de software. Bom equilibrio entre capacidade e custo. Indicado para tarefas de media complexidade que exigem consistencia e qualidade textual. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
![]() |
Versao economica para tarefas simples, rascunhos rapidos e pequenos resumos. Baixa latencia e custo reduzido. Usar para triagem, respostas curtas e automacoes basicas. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
![]() |
Modelo ultraleve e altamente responsivo para validacoes simples, automacoes basicas e respostas objetivas. Latencia minima. Usar apenas para tarefas triviais. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
![]() |
Especialista em redacao longa em portugues do Brasil com acentuacao completa, copywriting persuasivo, otimizacao editorial, SEO e traducao. Modelo multimodal nativo com forte capacidade de interacao em tempo real. Melhor relacao qualidade/custo para tarefas textuais, relatorios executivos, propostas comerciais e comunicacao corporativa. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
![]() |
Modelo multimodal economico e rapido para classificacao, analise de midias curtas, triagem de informacoes e respostas objetivas. Boa relacao custo-beneficio para tarefas simples e processamento em volume. Suporta texto e imagem. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
![]() |
Modelo multimodal de altissima capacidade da OpenAI. Indicado para agentes orquestradores, automacoes complexas, software critico e tarefas que exigem raciocinio profundo em multiplas etapas. Custo elevado - usar quando a complexidade justifica. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
![]() |
Excelente equilibrio entre qualidade e latencia. Ideal para copilotos de produtividade, fluxos rapidos, analises moderadas e respostas de qualidade com custo controlado. Bom para uso corporativo cotidiano. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
![]() |
Motor ultraleve com latencia minima para respostas objetivas e uso em edge. Custo muito baixo. Usar para automacoes em escala, validacoes simples e tarefas de alto volume. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
![]() |
Especializado em transformar tarefas complexas em fluxos claros, eficientes e orientados a decisao corporativa. Bom para planejamento, workflows e automacao de processos. Capacidade intermediaria-alta. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
![]() |
Modelo rapido e contextual para respostas claras, uteis e diretas. Ideal para uso geral corporativo com boa qualidade e latencia moderada. Bom equilibrio para tarefas do dia a dia. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
![]() |
Modelo de codificacao agnetica mais avancado da OpenAI. Unifica engenharia de software de ponta com raciocinio profundo. Especialista em geracao de codigo de producao, debugging avancado, refatoracao, testes automatizados e arquitetura de software. Usar para qualquer tarefa que envolva programacao complexa. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
![]() |
Modelo mais recente e completo da OpenAI. Unifica GPT e Codex em um unico sistema com janela de contexto superior a 1 milhao de tokens. Capaz de executar tarefas avancadas de raciocinio, analise e desenvolvimento de software. Suporta texto e imagens. Excelente para orquestracao, planejamento e tarefas de maxima complexidade. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
![]() |
Alta performance com eficiencia da OpenAI. Ideal para aplicacoes avancadas de IA, automacoes e agentes inteligentes. Equilibra capacidade, velocidade e custo para uso corporativo. Bom para tarefas de media-alta complexidade com custo controlado. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
![]() |
Modelo ultraleve, rapido e economico da OpenAI. Perfeito para demandas em escala e tarefas do dia a dia. Agilidade e baixo custo sem abrir mao da qualidade basica. Usar para alto volume e tarefas simples. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
![]() |
O modelo de ponta da OpenAI para demandas profissionais de alta exigência. Evolução do GPT-5.4 com raciocínio mais apurado, maior confiabilidade e melhor aproveitamento de tokens em tarefas complexas. Janela de contexto de mais de 1 milhão de tokens, suporte a texto e imagens, ideal para projetos de grande escala que envolvem raciocínio encadeado, desenvolvimento de software avançado e workflows multimodais. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
![]() |
Modelo avancado para criacao e edicao de imagens com alta fidelidade a marcas, rostos e identidade visual. Usar exclusivamente para tarefas de geracao e edicao de imagens. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
![]() |
Modelo de última geração para criação e edição de imagens com alto nível de realismo e precisão, garantindo fidelidade consistente a marcas, rostos e identidade visual. Indicado exclusivamente para demandas avançadas de geração e manipulação de imagens com qualidade profissional. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
![]() |
Modelo de raciocinio avancado para problemas complexos em multiplas etapas. Excelente para programacao, matematica, ciencia e interpretacao de imagens com analise profunda. Usar para decomposicao de problemas, arquitetura de sistemas e decisoes com trade-offs. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
![]() |
Versao enxuta otimizada para baixa latencia em texto. Ideal para automacoes leves, rascunhos rapidos, respostas repetitivas e validacoes simples. Custo muito baixo com boa estabilidade. Usar para tarefas que nao exigem raciocinio profundo. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
![]() |
Focado em raciocinio estruturado com otimo custo-beneficio. Recomendado para analise tecnica, QA, troubleshooting, checagem de respostas e validacao logica. Bom para revisao de qualidade e verificacao de consistencia. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
7 modelos disponíveis.
![]() |
Modelo ultrarrapido para analise de dados estruturados, classificacao em lote, sumarizacao, extracao de informacoes e processamento em massa. Custo extremamente baixo. Ideal como primeiro filtro, triagem de informacoes e geracao de rascunhos rapidos. Evolucao do Flash com melhor qualidade mantendo alta velocidade. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
![]() |
Modelo de raciocinio de ponta do Google com desempenho aprimorado em engenharia de software, confiabilidade de agentes e uso eficiente de tokens. Multimodal com raciocinio avancado. Excelente para tarefas complexas de programacao e planejamento. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
![]() |
Modelo do Google projetado para ser rápido e econômico, ideal para uso em grande volume. Entende texto, imagens, vídeos, áudios e PDFs, sendo capaz de resumir documentos, extrair informações específicas, apoiar atendimentos simples e automações leves do dia a dia. Permite ajustar o nível de raciocínio conforme a necessidade — de respostas ágeis a análises mais elaboradas — sempre com foco em eficiência. A escolha certa quando velocidade de resposta é mais importante do que profundidade máxima. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
![]() |
Modelo multimodal avancado do Google com forte capacidade de raciocinio, planejamento e programacao. Janela de contexto grande. Excelente para analise de documentos longos, codigo complexo e tarefas que exigem compreensao profunda de multiplas fontes. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
![]() |
Modelo da familia Gemini 3 otimizado para alta velocidade, baixa latencia e eficiencia de custo com suporte multimodal. Ideal para assistentes, automacoes e fluxos de alta frequencia. Custo muito baixo. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
![]() |
Modelo multimodal de alta performance do Google, otimizado para velocidade, raciocínio avançado e programação. Capaz de processar textos, imagens, vídeos, áudios e PDFs com excelente eficiência. Ideal para automações, agentes de IA, análise de arquivos complexos e tarefas técnicas que exigem respostas rápidas e inteligentes. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
![]() |
Modelo multimodal da Google DeepMind com suporte a texto e imagem, contexto de 256K tokens e forte capacidade em código, raciocínio e compreensão documental. Inclui function calling nativo e suporte a mais de 140 idiomas. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
7 modelos disponíveis.
![]() |
Versao leve da xAI para respostas curtas, rotinas simples e automacoes rapidas. Baixa latencia e custo reduzido. Usar para tarefas simples e triagem. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
![]() |
Modelo topo de linha da xAI para planejamento estrategico, temas complexos, raciocinio profundo e analise multi-dimensional. Excelente capacidade de argumentacao e visao critica. Usar para tarefas de alta complexidade. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
![]() |
Otimizado para raciocinio rapido da xAI. Respostas diretas e analise objetiva com baixa latencia. Usar quando raciocinio e necessario mas velocidade e prioridade. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
![]() |
Modelo Grok 4.20 otimizado para respostas rapidas e baixa latencia. Gera respostas diretas e eficientes sem processamento extensivo de raciocinio. Usar para interacoes conversacionais, automacoes e tarefas onde velocidade e prioridade. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
![]() |
Modelo Grok 4.20 otimizado para raciocinio avancado e resolucao de problemas complexos. Utiliza reasoning step-by-step para analise logica, matematica, programacao e tomada de decisao multi-etapas. Usar para tarefas que exigem pensamento profundo. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
![]() |
Especializado em programacao rapida, revisao de codigo, debugging e suporte a desenvolvedores. Baixa latencia para tarefas de codificacao. Usar quando a tarefa envolve codigo e velocidade e prioridade. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
![]() |
O Grok 4.3 é o modelo mais avançado da xAI para uso corporativo real. Combina raciocínio profundo com contexto ultra longo (até ~2 milhões de tokens) e suporte multimodal nativo — incluindo texto, imagem e vídeo. Na prática, é capaz de analisar grandes volumes de dados, gerar automaticamente relatórios, planilhas e apresentações, e executar tarefas complexas em múltiplas etapas sem depender de ferramentas externas. Apresenta custo por token significativamente reduzido em relação a versões anteriores. Ideal para projetos que exigem raciocínio avançado, saídas estruturadas e automação sofisticada de processos. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
4 modelos disponíveis.
![]() |
Generalista forte para escrita e apoio a agentes utilitarios via Groq (latencia ultra-baixa). Bom para produzir textos consistentes, organizar informacoes e apoiar pesquisa assistida. Modelo open-source de 70B parametros com boa versatilidade. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
![]() |
Focado em organizacao e clareza via infraestrutura Groq (latencia ultra-baixa). Otimo para transformar informacao em topicos, resumos estruturados e pesquisas guiadas. Modelo open-source economico para tarefas de organizacao textual. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
![]() |
Modelo de 120B parametros via Groq (latencia ultra-baixa). Indicado para textos longos e sinteses profundas, relatorios extensos, analises detalhadas e coerencia em conteudos grandes. Boa capacidade com custo open-source. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
![]() |
Modelo robusto e multilingue via Groq (latencia ultra-baixa). Bom para conversacao ampla, explicacoes didaticas e uso geral com times diversos. Suporte global multilingue com custo reduzido. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
6 modelos disponíveis.
![]() |
Modelo de raciocinio principal da serie Qwen3. Projetado para tarefas cognitivas complexas que exigem raciocinio profundo e em multiplas etapas. Excelente capacidade analitica e resolucao de problemas avancados. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
![]() |
Serie Qwen3.5 com arquitetura hibrida que integra linear attention com sparse mixture-of-experts. Maior eficiencia em inferencia. Suporte nativo a visao e linguagem. Bom desempenho em tarefas multimodais diversas. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
![]() |
Modelo de alta performance voltado para desenvolvimento e resolução de problemas complexos, com forte capacidade em geração de código, front-end, jogos e cenários avançados, oferecendo respostas rápidas, intuitivas e eficazes para construir e evoluir aplicações completas. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
![]() |
Modelo ágil e econômico da série Qwen3.6, ideal para quem precisa de velocidade e escala sem abrir mão da qualidade. Com suporte a texto, imagem e vídeo e contexto de até 1 milhão de tokens, é a escolha certa para automações corporativas, classificação de informações, atendimento automatizado, análise de grandes volumes de dados e assistentes em tempo real — entregando respostas rápidas e consistentes com excelente custo-benefício. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
![]() |
Modelo de última geração da Qwen para raciocínio avançado e agentes inteligentes. Com arquitetura mixture-of-experts, thinking mode, function calling e saídas estruturadas, é especialmente poderoso em análise profunda, desenvolvimento de código, automação sofisticada e tomada de decisão estratégica. Para o usuário, significa resolver problemas complexos, orquestrar múltiplos sistemas e manter contexto ao longo de interações longas - ideal para projetos críticos e de alto valor. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
![]() |
O modelo mais avançado da linha Qwen3.7 da Alibaba, desenvolvido para executar tarefas complexas com alta eficiência e autonomia. Destaca-se em programação, automação de processos, produtividade corporativa e uso em agentes de IA, com melhorias significativas em raciocínio, geração de código e execução de tarefas em relação às versões anteriores. Oferece maior eficiência no reaproveitamento de contexto em interações contínuas — ideal para fluxos corporativos exigentes e projetos de alto valor. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
2 modelos disponíveis.
![]() |
Modelo com acesso a busca web em tempo real. Ideal para checagem de fatos, noticias recentes e consultas que exigem dados atualizados. Versao mais leve do Sonar Pro, com menor profundidade mas boa velocidade. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
![]() |
Unico modelo com acesso real a internet em tempo real. Retorna citacoes com URLs verificaveis. Essencial para pesquisa de mercado, analise competitiva, verificacao de fatos, dados atualizados, noticias recentes e qualquer tarefa que exija informacoes que nao estejam no treinamento dos demais modelos. Insubstituivel para fact-check e pesquisa ao vivo. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
1 modelo disponível.
![]() |
Modelo flagship open-weight da Mistral com arquitetura Mixture-of-Experts multimodal. Projetado para workloads empresariais complexos combinando raciocinio avancado, suporte a texto e imagem, contexto longo (ate 256k tokens), function calling e eficiencia de custo. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
3 modelos disponíveis.
![]() |
Modelo avançado da DeepSeek com arquitetura Mixture-of-Experts, projetado para alta eficiência e forte desempenho em raciocínio, coding e tarefas complexas. Oferece excelente custo-benefício, sendo ideal para aplicações agentic, automação e análise de grandes volumes de dados. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
![]() |
Versão otimizada da DeepSeek para quem precisa de velocidade sem abrir mão da qualidade. Com 284 bilhões de parâmetros totais e arquitetura Mixture-of-Experts, o modelo ativa apenas 13 bilhões de parâmetros por vez, tornando as respostas rápidas e eficientes. Suporta contextos de até 1 milhão de tokens, processa textos longos com facilidade e oferece ótimo desempenho em programação, chat e fluxos de agentes. Ideal para aplicações onde velocidade e custo-benefício são prioridade. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
![]() |
Modelo de alto desempenho da DeepSeek com arquitetura Mixture-of-Experts, projetado para tarefas que exigem raciocínio avançado, grande volume de contexto e execução em múltiplas etapas. Com suporte a até 1 milhão de tokens, destaca-se na análise de grandes bases de informação, revisão e geração de código em larga escala, automação de processos complexos e síntese de dados estruturados. Ideal para cenários que demandam profundidade analítica, precisão técnica e capacidade de transformar grandes volumes de dados em insights acionáveis de forma consistente e escalável. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
3 modelos disponíveis.
![]() |
Bom para explicacoes detalhadas e resolucao guiada com encadeamento logico. Util quando o usuario precisa de clareza, passo-a-passo didatico e respostas bem estruturadas. Modelo com raciocinio transparente. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
![]() |
Parceiro de conversa versatil que transforma ideias complexas em solucoes simples - escrevendo, calculando, programando ou organizando pensamentos. Bom para uso geral com abordagem pratica. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
![]() |
Modelo avançado para desenvolvimento completo de soluções, capaz de transformar ideias ou imagens em sistemas, interfaces e aplicações prontas para uso. Ideal para tarefas complexas de programação, criação de sites, documentos e automações, atuando de forma autônoma e coordenando múltiplos "agentes" para entregar resultados completos com alta eficiência. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
3 modelos disponíveis.
![]() |
Modelo open-source flagship da Z.ai para engenharia de sistemas complexos e workflows agentivos de longo prazo. Foco em desenvolvedores experientes e ambientes de producao em larga escala. Planejamento agentivo avancado e raciocinio backend profundo. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
![]() |
Modelo especializado em execução profunda de tarefas complexas, capaz de trabalhar de forma contínua por horas planejando, executando e refinando soluções de maneira autônoma, ideal para projetos que exigem alto nível técnico, análise detalhada e entrega completa sem necessidade de múltiplas interações. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
![]() |
Modelo multimodal focado em agentes, capaz de interpretar texto, imagem e vídeo. Especializado em tarefas de coding, planejamento de longo prazo e execução completa de fluxos “perceber → planejar → executar”. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
1 modelo disponível.
![]() |
Modelo open-source de alta performance com arquitetura híbrida MoE (Mamba + Transformer), ativando apenas 12B parâmetros para máxima eficiência. Possui contexto de até 1M tokens, ideal para agentes complexos, planejamento multi-etapas e raciocínio avançado. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
2 modelos disponíveis.
![]() |
Modelo de larga escala da Xiaomi com mais de 1 trilhão de parâmetros e contexto de até 1M tokens. Projetado para cenários agentic, orquestração de workflows complexos e execução confiável de tarefas em produção. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
![]() |
Modelo flagship da Xiaomi com desempenho de ponta em tarefas agentivas, engenharia de software complexa e execução autônoma de longo prazo. Capaz de concluir de forma independente projetos que demandariam dias ou semanas de especialistas humanos, realizando mais de mil chamadas de ferramentas em sequência. Contexto de até 1M tokens e alto desempenho nos benchmarks ClawEval, GDPVal e SWE-bench Pro, com ampla compatibilidade com frameworks de agentes. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
1 modelo disponível.
![]() |
Modelo de linguagem avancado da Inception com arquitetura baseada em difusao para geracao paralela de texto. Mais rapido e eficiente que modelos autoregressivos tradicionais. Alta qualidade de resposta com controle preciso de geracao. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
3 modelos disponíveis.
![]() |
Modelo de ultima geracao orientado a produtividade real com forte capacidade em coding, workflows agneticos e uso de ferramentas. Raciocinio eficiente, decomposicao de tarefas complexas e suporte a multiplas linguagens de programacao. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
![]() |
Versao evolutiva da linha MiniMax com raciocinio profundo, autonomia agnetica e processamento de contexto extenso. Foco em tarefas complexas multi-etapas, robustez em decisoes e desempenho em cenarios empresariais e automacao inteligente. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
![]() |
Modelo multimodal de nova geração da MiniMax com contexto de até 1 milhão de tokens e suporte nativo a texto, imagem e vídeo. Construído sobre a arquitetura MiniMax Sparse Attention (MSA), que reduz drasticamente o custo por token em contextos longos — cerca de 1/20 do custo da geração anterior a 1M tokens — com prefill e decode significativamente mais rápidos. Treinado nativamente em dados multimodais intercalados e ajustado para colaboração em múltiplos turnos, é orientado para tarefas contínuas e complexas: uso de ferramentas, programação, automação de agentes e workflows de longa duração. 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
| Modelo | Família | Tags | Capacidades |
|---|---|---|---|
claude-haiku-4-5 |
🎭 Claude (Anthropic) | ⚡ Rapido 🤖 Agentes 💰 Economico |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
claude-opus-4-7 |
🎭 Claude (Anthropic) | 🧠 Raciocinio 💻 Codigo 🎯 Estrategia 🌟 Premium |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
anthropic/claude-opus-4.8 |
🎭 Claude (Anthropic) | 🧠 Raciocinio 💻 Codigo 🎯 Estrategia 🌟 Premium |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
claude-fable-5 |
🎭 Claude (Anthropic) | 🧠 Raciocinio 💻 Codigo 🤖 Agentes 🌟 Premium |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
claude-sonnet-4-6 |
🎭 Claude (Anthropic) | 💻 Codigo 🧠 Raciocinio 🤖 Agentes 🌟 Premium |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
cortex_model_orchestrator |
🧠 Cortex (SinapseTech) | 🌟 Premium 🤖 Agentes 🏢 Corporativo |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
deepseek/deepseek-v3.2 |
🌊 DeepSeek | 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools | |
deepseek/deepseek-v4-flash |
🌊 DeepSeek | ⚡ Rapido 💻 Codigo 🤖 Agentes 💰 Economico |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
deepseek/deepseek-v4-pro |
🌊 DeepSeek | 🧠 Raciocinio 💻 Codigo 📊 Analise de Dados 🌟 Premium |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
gemini-2.5-flash |
🔮 Gemini / Gemma (Google) | 📊 Analise de Dados ⚡ Rapido 💰 Economico |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
gemini-3.1-pro-preview |
🔮 Gemini / Gemma (Google) | 🧠 Raciocinio 💻 Codigo 🖼️ Multimodal 🌟 Premium |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
google/gemini-3.1-flash-lite |
🔮 Gemini / Gemma (Google) | ⚡ Rapido 🖼️ Multimodal 💰 Economico |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
gemini/gemini-2.5-pro |
🔮 Gemini / Gemma (Google) | 🧠 Raciocinio 💻 Codigo 🖼️ Multimodal 🌟 Premium |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
gemini/gemini-3-flash-preview |
🔮 Gemini / Gemma (Google) | ⚡ Rapido 🖼️ Multimodal 💰 Economico |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
google/gemini-3.5-flash |
🔮 Gemini / Gemma (Google) | ⚡ Rapido 🖼️ Multimodal 💰 Economico |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
google/gemma-4-31b |
🔮 Gemini / Gemma (Google) | 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools | |
gpt-4.1 |
🤖 GPT (OpenAI) | ✍️ Redacao 💻 Codigo 📊 Analise de Dados |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
gpt-4.1-mini |
🤖 GPT (OpenAI) | ✍️ Redacao ⚡ Rapido 💰 Economico |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
gpt-4.1-nano |
🤖 GPT (OpenAI) | ⚡ Rapido 💰 Economico |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
gpt-4o |
🤖 GPT (OpenAI) | ✍️ Redacao 🖼️ Multimodal 🏢 Corporativo |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
gpt-4o-mini |
🤖 GPT (OpenAI) | 🖼️ Multimodal ⚡ Rapido 💰 Economico |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
gpt-5 |
🤖 GPT (OpenAI) | 🧠 Raciocinio 💻 Codigo 🤖 Agentes 🌟 Premium |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
gpt-5-mini |
🤖 GPT (OpenAI) | 🏢 Corporativo ⚡ Rapido 🤖 Agentes |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
gpt-5-nano |
🤖 GPT (OpenAI) | ⚡ Rapido 💰 Economico |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
gpt-5.1 |
🤖 GPT (OpenAI) | 🏢 Corporativo 🎯 Estrategia 🤖 Agentes |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
gpt-5.2 |
🤖 GPT (OpenAI) | 🏢 Corporativo ⚡ Rapido |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
gpt-5.3-codex |
🤖 GPT (OpenAI) | 💻 Codigo 🌟 Premium |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
gpt-5.4 |
🤖 GPT (OpenAI) | 🧠 Raciocinio 💻 Codigo 🤖 Agentes 🌟 Premium |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
gpt-5.4-mini |
🤖 GPT (OpenAI) | 🏢 Corporativo 🤖 Agentes ⚡ Rapido |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
gpt-5.4-nano |
🤖 GPT (OpenAI) | ⚡ Rapido 💰 Economico |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
openai/gpt-5.5 |
🤖 GPT (OpenAI) | 🧠 Raciocinio 💻 Codigo 🤖 Agentes 🌟 Premium |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
gpt-image-1.5 |
🤖 GPT (OpenAI) | 🖼️ Multimodal |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
gpt-image-2 |
🤖 GPT (OpenAI) | 🖼️ Multimodal 🌟 Premium |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
groq/llama-3.3-70b-versatile |
🚀 Acelerados pela Groq | ✍️ Redacao 🤖 Agentes 💰 Economico |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
groq/meta-llama/llama-4-scout-17b-16e-instruct |
🚀 Acelerados pela Groq | ✍️ Redacao ⚡ Rapido 💰 Economico |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
groq/openai/gpt-oss-120b |
🚀 Acelerados pela Groq | 📄 Documentos ✍️ Redacao 💰 Economico |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
groq/qwen/qwen3-32b |
🚀 Acelerados pela Groq | ✍️ Redacao 🏢 Corporativo 💰 Economico |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
inception/mercury-2 |
☄️ Inception (Mercury) | ⚡ Rapido 💡 Criativo |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
MiniMax-M2.5 |
🎯 MiniMax | 💻 Codigo 🤖 Agentes |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
MiniMax-M2.7 |
🎯 MiniMax | 🧠 Raciocinio 🤖 Agentes |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
MiniMax-M3 |
🎯 MiniMax | 🖼️ Multimodal 🤖 Agentes 💻 Codigo |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
mistral/mistral-large-3 |
🌬️ Mistral | 🧠 Raciocinio 🖼️ Multimodal 🏢 Corporativo |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
moonshotai/kimi-k2-thinking |
🌙 Moonshot (Kimi) | 🧠 Raciocinio ✍️ Redacao |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
moonshotai/kimi-k2.5 |
🌙 Moonshot (Kimi) | ✍️ Redacao 💡 Criativo |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
moonshotai/kimi-k2.6 |
🌙 Moonshot (Kimi) | 💻 Codigo 🤖 Agentes 🌟 Premium |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
nvidia/nemotron-3-super |
🟢 NVIDIA | 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools | |
o3 |
🤖 GPT (OpenAI) | 🧠 Raciocinio 💻 Codigo 🌟 Premium |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
o3-mini |
🤖 GPT (OpenAI) | ⚡ Rapido 💰 Economico 🤖 Agentes |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
o4-mini |
🤖 GPT (OpenAI) | 🧠 Raciocinio ⚡ Rapido 💰 Economico |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
perplexity/sonar |
🔍 Perplexity | 🔍 Pesquisa Web ⚡ Rapido |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
perplexity/sonar-pro |
🔍 Perplexity | 🔍 Pesquisa Web 🏢 Corporativo 🌟 Premium |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
qwen/qwen3-max-thinking |
🐉 Qwen (Alibaba) | 🧠 Raciocinio 🌟 Premium |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
qwen/qwen3.5-plus |
🐉 Qwen (Alibaba) | 🖼️ Multimodal 🧠 Raciocinio |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
qwen/qwen3.6-plus |
🐉 Qwen (Alibaba) | 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools | |
qwen/qwen3.6-flash |
🐉 Qwen (Alibaba) | ⚡ Rapido 🖼️ Multimodal 💰 Economico |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
qwen/qwen3.6-max-preview |
🐉 Qwen (Alibaba) | 🧠 Raciocinio 🤖 Agentes 💻 Codigo 🌟 Premium |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
qwen/qwen3.7-max |
🐉 Qwen (Alibaba) | 🧠 Raciocinio 🤖 Agentes 💻 Codigo 🌟 Premium |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
rerank-v3.5 |
🛠️ Ferramentas & Infraestrutura | 🔧 Infraestrutura |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
rerank-v4.0-pro |
🛠️ Ferramentas & Infraestrutura | 🔧 Infraestrutura |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
text-embedding-3-large |
🛠️ Ferramentas & Infraestrutura | 🔧 Infraestrutura |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
text-embedding-3-small |
🛠️ Ferramentas & Infraestrutura | 🔧 Infraestrutura |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
tts-1 |
🛠️ Ferramentas & Infraestrutura | 🔧 Infraestrutura |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
whisper-1 |
🛠️ Ferramentas & Infraestrutura | 🔧 Infraestrutura |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
xai/grok-3-mini |
⚡ Grok (xAI) | ⚡ Rapido 💰 Economico |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
xai/grok-4 |
⚡ Grok (xAI) | 🧠 Raciocinio 🎯 Estrategia 🌟 Premium |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
xai/grok-4-1-fast-reasoning |
⚡ Grok (xAI) | 🧠 Raciocinio ⚡ Rapido |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
xai/grok-4.20 |
⚡ Grok (xAI) | ⚡ Rapido 🏢 Corporativo |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
xai/grok-4.20-reasoning |
⚡ Grok (xAI) | 🧠 Raciocinio 🌟 Premium |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
xai/grok-code-fast |
⚡ Grok (xAI) | 💻 Codigo ⚡ Rapido |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code |
xai/grok-4.3 |
⚡ Grok (xAI) | 🧠 Raciocinio 🤖 Agentes 📄 Documentos 🌟 Premium |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
xiaomi/mimo-v2-pro |
📱 Xiaomi | 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools | |
xiaomi/mimo-v2.5-pro |
📱 Xiaomi | 🤖 Agentes 💻 Codigo 🌟 Premium |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
z-ai/glm-5 |
💎 Z.ai (GLM) | 💻 Codigo 🤖 Agentes 🌟 Premium |
👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
z-ai/glm-5.1 |
💎 Z.ai (GLM) | 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools | |
z-ai/glm-5v-turbo |
💎 Z.ai (GLM) | 👁️ Visão · 📎 Arquivos · 🌐 Web · 🎨 Imagem · 💻 Code · 🔧 Tools |
Preços em USD por 1 milhão de tokens (entrada · saída). Modelos de infraestrutura usam unidades diferentes — veja nota ao final. Valores aproximados; consulte os provedores para tarifas atualizadas.
| Modelo | Família | Entrada ($/1M) | Saída ($/1M) |
|---|---|---|---|
claude-haiku-4-5 |
🎭 Claude (Anthropic) | $1,00 | $5,00 |
claude-opus-4-7 |
🎭 Claude (Anthropic) | $5,00 | $25,00 |
anthropic/claude-opus-4.8 |
🎭 Claude (Anthropic) | $5,00 | $25,00 |
claude-fable-5 |
🎭 Claude (Anthropic) | $10,00 | $50,00 |
claude-sonnet-4-6 |
🎭 Claude (Anthropic) | $3,00 | $15,00 |
deepseek/deepseek-v3.2 |
🌊 DeepSeek | $0,28 | $0,40 |
deepseek/deepseek-v4-flash |
🌊 DeepSeek | $0,14 | $0,28 |
deepseek/deepseek-v4-pro |
🌊 DeepSeek | $1,74 | $3,48 |
gemini-2.5-flash |
🔮 Gemini / Gemma (Google) | $0,30 | $2,50 |
gemini-3.1-pro-preview |
🔮 Gemini / Gemma (Google) | $2,00 | $12,00 |
google/gemini-3.1-flash-lite |
🔮 Gemini / Gemma (Google) | $0,25 | $1,50 |
gemini/gemini-2.5-pro |
🔮 Gemini / Gemma (Google) | $1,25 | $10,00 |
gemini/gemini-3-flash-preview |
🔮 Gemini / Gemma (Google) | $0,50 | $3,00 |
google/gemini-3.5-flash |
🔮 Gemini / Gemma (Google) | $1,50 | $9,00 |
google/gemma-4-31b |
🔮 Gemini / Gemma (Google) | $0,14 | $0,40 |
gpt-4.1 |
🤖 GPT (OpenAI) | $2,00 | $8,00 |
gpt-4.1-mini |
🤖 GPT (OpenAI) | $0,40 | $1,60 |
gpt-4.1-nano |
🤖 GPT (OpenAI) | $0,10 | $0,40 |
gpt-4o |
🤖 GPT (OpenAI) | $2,50 | $10,00 |
gpt-4o-mini |
🤖 GPT (OpenAI) | $0,15 | $0,60 |
gpt-5 |
🤖 GPT (OpenAI) | $1,25 | $10,00 |
gpt-5-mini |
🤖 GPT (OpenAI) | $0,25 | $2,00 |
gpt-5-nano |
🤖 GPT (OpenAI) | $0,05 | $0,40 |
gpt-5.1 |
🤖 GPT (OpenAI) | $1,25 | $10,00 |
gpt-5.2 |
🤖 GPT (OpenAI) | $1,75 | $14,00 |
gpt-5.3-codex |
🤖 GPT (OpenAI) | $1,75 | $14,00 |
gpt-5.4 |
🤖 GPT (OpenAI) | $2,50 | $15,00 |
gpt-5.4-mini |
🤖 GPT (OpenAI) | $0,75 | $4,50 |
gpt-5.4-nano |
🤖 GPT (OpenAI) | $0,20 | $1,25 |
openai/gpt-5.5 |
🤖 GPT (OpenAI) | $5,00 | $30,00 |
gpt-image-1.5 |
🤖 GPT (OpenAI) | $5,00 | $10,00 |
gpt-image-2 |
🤖 GPT (OpenAI) | $5,00 | $10,00 |
o3 |
🤖 GPT (OpenAI) | $2,00 | $8,00 |
o3-mini |
🤖 GPT (OpenAI) | $1,10 | $4,40 |
o4-mini |
🤖 GPT (OpenAI) | $1,10 | $4,40 |
xai/grok-3-mini |
⚡ Grok (xAI) | $0,30 | $0,50 |
xai/grok-4 |
⚡ Grok (xAI) | $3,00 | $15,00 |
xai/grok-4-1-fast-reasoning |
⚡ Grok (xAI) | $0,20 | $0,50 |
xai/grok-4.20 |
⚡ Grok (xAI) | $2,00 | $6,00 |
xai/grok-4.20-reasoning |
⚡ Grok (xAI) | $2,00 | $6,00 |
xai/grok-code-fast |
⚡ Grok (xAI) | $0,20 | $1,50 |
xai/grok-4.3 |
⚡ Grok (xAI) | $1,25 | $2,50 |
groq/llama-3.3-70b-versatile |
🚀 Acelerados pela Groq | $0,59 | $0,79 |
groq/meta-llama/llama-4-scout-17b-16e-instruct |
🚀 Acelerados pela Groq | $0,11 | $0,34 |
groq/openai/gpt-oss-120b |
🚀 Acelerados pela Groq | $0,15 | $0,60 |
groq/qwen/qwen3-32b |
🚀 Acelerados pela Groq | $0,29 | $0,59 |
qwen/qwen3-max-thinking |
🐉 Qwen (Alibaba) | $1,20 | $6,00 |
qwen/qwen3.5-plus |
🐉 Qwen (Alibaba) | $0,26 | $1,56 |
qwen/qwen3.6-plus |
🐉 Qwen (Alibaba) | $0,33 | $1,95 |
qwen/qwen3.6-flash |
🐉 Qwen (Alibaba) | $0,25 | $1,50 |
qwen/qwen3.6-max-preview |
🐉 Qwen (Alibaba) | $1,04 | $6,24 |
qwen/qwen3.7-max |
🐉 Qwen (Alibaba) | $2,50 | $7,50 |
perplexity/sonar |
🔍 Perplexity | $1,00 | $1,00 |
perplexity/sonar-pro |
🔍 Perplexity | $3,00 | $15,00 |
mistral/mistral-large-3 |
🌬️ Mistral | $0,50 | $1,50 |
moonshotai/kimi-k2-thinking |
🌙 Moonshot (Kimi) | $0,60 | $2,50 |
moonshotai/kimi-k2.5 |
🌙 Moonshot (Kimi) | $0,60 | $3,00 |
moonshotai/kimi-k2.6 |
🌙 Moonshot (Kimi) | $0,95 | $4,00 |
z-ai/glm-5 |
💎 Z.ai (GLM) | $0,72 | $2,30 |
z-ai/glm-5.1 |
💎 Z.ai (GLM) | $0,95 | $3,15 |
z-ai/glm-5v-turbo |
💎 Z.ai (GLM) | $1,20 | $4,00 |
nvidia/nemotron-3-super |
🟢 NVIDIA | $0,15 | $0,65 |
xiaomi/mimo-v2-pro |
📱 Xiaomi | $1,00 | $3,00 |
xiaomi/mimo-v2.5-pro |
📱 Xiaomi | $1,00 | $3,00 |
inception/mercury-2 |
☄️ Inception (Mercury) | $0,25 | $0,75 |
MiniMax-M2.5 |
🎯 MiniMax | $0,30 | $1,20 |
MiniMax-M2.7 |
🎯 MiniMax | $0,30 | $1,20 |
MiniMax-M3 |
🎯 MiniMax | $0,60 | $2,40 |
Modelos de infraestrutura (unidades diferentes):
| Modelo | Preço |
|---|---|
rerank-v3.5 |
$2,00 / 1.000 buscas |
rerank-v4.0-pro |
$2,00 / 1.000 buscas |
text-embedding-3-large |
$0,13 / 1M tokens |
text-embedding-3-small |
$0,02 / 1M tokens |
tts-1 |
$0,015 / 1K caracteres |
whisper-1 |
$0,006 / minuto de áudio |
💡 Dica: o
cortex_model_orchestratornão tem preço fixo — ele seleciona automaticamente o modelo mais adequado para cada tarefa, otimizando a relação qualidade/custo.
cortex_model_orchestrator escolhe automaticamente o melhor modelo para cada solicitação quando você não deseja especificar manualmente.whisper-1 (transcrição), tts-1 (texto-para-voz), gpt-image-1.5 / gpt-image-2 (geração de imagens).text-embedding-3-small, text-embedding-3-large, rerank-v3.5, rerank-v4.0-pro — usados pela camada de RAG para busca semântica.💰 Economico para tarefas de alto volume e 🌟 Premium para casos que exigem máxima qualidade. Veja FinOps e Gestão de Custos.