
Fonte: Google para desenvolvedores
O Google lançou o modelo Gemma 3, um novo modelo de inteligência artificial (AI), atingindo 98% da precisão do DeepSeek R1, enquanto usava apenas uma GPU da NVIDIA H100 – em comparação com 32 GPUs estimados em R1.
Esse salto em eficiência pode tornar a IA de alto desempenho muito mais acessível.
Na Chatbot Arena Elo Ratings, o Gemma 3 marcou 1338 em comparação com o 1363 do DeepSeek R1. Enquanto o R1 mantém uma pequena vantagem, a conquista do Google se concentra em fornecer resultados semelhantes com muito menos poder de computação.


Fonte: Google
“Gemma 3 oferece desempenho de última geração para seu tamanho, superando o LLAMA-405B, o Deepseek-V3 e o O3-mini em avaliações preliminares de preferência humana”. O Google afirmou em seu blog de desenvolvedores. “Isso ajuda você a criar experiências de usuário envolventes que podem se encaixar em um único host GPU ou TPU”.
O modelo possui quatro tamanhos (parâmetros 1b, 4b, 12b e 27b) construídos para executar em dispositivos de telefones às estações de trabalho. Até sua maior versão é dramaticamente menor que os 671 bilhões de parâmetros de Deepseek R1.
A Gemma 3 fornece suporte “pronta para uso” para 35 idiomas com recursos pré-treinados para mais 105. Isso representa uma expansão dramática de Gemma 2, que apoiava principalmente o inglês.


Fonte: Google
Além do suporte da linguagem, a Gemma 3 traz recursos multimodais. Isso significa que a IA pode entender e trabalhar com palavras, imagens e vídeos de uma só vez, em vez de apenas processar o texto. Seus 128 mil token contexto Janela processa aproximadamente 300 páginas de texto ou 30 imagens de alta resolução ao mesmo tempo.
Essas melhorias de eficiência vêm da destilação do modelo e técnicas de treinamento, como o aprendizado de reforço com o feedback humano (RLHF) e o aprendizado de reforço com o feedback da máquina (RLMF). Detalhes técnicos completos estão disponíveis em Relatório técnico de 26 páginas do Google no site da Gemma.
O Google combinou o lançamento com o Shieldgemma 2, um modelo de parâmetros 4B especializado para segurança de conteúdo. O relatório técnico da empresa observa: “Descobrimos que os modelos Gemma 3 memorizam texto de formato longo a uma taxa muito mais baixa do que os modelos anteriores”, sugerindo uma melhor privacidade de dados do que as versões anteriores.
O impulso pela eficiência da IA ficou mais forte com o PHI-4 da Microsoft e o Mistral Small 3, juntando-se à competição. Esses modelos menores têm como alvo empresas que precisam de recursos de IA sem os enormes recursos de computação dos data centers. A execução da IA avançada em uma única GPU reduz drasticamente as barreiras de entrada para organizações menores.
Os desenvolvedores podem acessar o Gemma 3 através do Google AI Studio, abraçar o rosto e Kaggle. Os pesquisadores acadêmicos podem se inscrever no programa do Google, que oferece US $ 10.000 em créditos em nuvem para pesquisas da Gemma 3.
Enquanto o Google chama Gemma de “Open”, existe algum debate em torno de seus termos de licenciamento restringindo certos usos. Ainda assim, o modelo representa o progresso na formação de IA avançada com recursos de computação razoáveis.