Início Tecnologia Claude-3.7 supera outras IA em Super Mario Bros, mas ainda não é...

Tecnologia

Claude-3.7 supera outras IA em Super Mario Bros, mas ainda não é jogador

Por

8 Março 2025

Semana passada, Bgr relatou a jornada de Claude tocando Pokemon Red. Enquanto milhares de jogadores jogando ao mesmo tempo foram mais eficientes – já que a IA ainda está presa no Monte – os pesquisadores acham que o próximo avanço da IA pode estar relacionado a jogos ao vivo.

Liderado por Hao Zhang, professor assistente de UC San Diegoa equipe de pesquisa está desenvolvendo estruturas personalizadas para Teste os recursos dos principais modelos de IA em jogos.

Embora Claude tenha sido meio desastroso interpretando Pokemon Red (parece que não tem o que é preciso para se tornar um mestre de Pokemon), ele é um pouco menos que Gemini-1.5 Pro e GPT-4o. Comparando Claude-3.7 e Claude-3.5, a IA mais recente é mais receptiva e parece saber um pouco mais sobre o que precisa ser feito no Super Mario Bros. Além deste jogo clássico da Nintendo, os pesquisadores também estão testando 2048 e Tetris, com mais jogos em breve.

Claude-3.7 foi testado no Pokémon Red, mas e mais jogos em tempo real como Super Mario?

Jogamos os agentes de jogos de IA nos Jogos do Super Mario ao vivo e encontramos Claude-3.7 superando outros modelos com heurísticas simples. 🤯

Claude-3.5 também é forte, mas menos capaz de… pic.twitter.com/bqzvblwqx3

– Hao Ai Lab (@haoailab) 28 de fevereiro de 2025

Outro teste é com o Roblox. UM Postagem do blog Explica: “Desenvolvemos um jogo Live Roblox, AI Space Escape, alimentado por Modelos de Linguagem (LLMS) de última geração, oferecendo uma experiência única para raciocinar com a IA. Além do entretenimento, nosso jogo gera dados de jogos para avaliar as habilidades de raciocínio de IA em cenários do mundo real, estendendo-se além dos benchmarks de matemática e codificação. Todos os dados de jogos, scripts de avaliação e código estão disponíveis publicamente para mais pesquisas. ”

Ainda temos que esperar por Claude e outras melhorias de IA para ver como esses modelos podem continuar a evoluir jogando jogos. Para o experimento Pokemon Red, o desenvolvedor explicou que o que diferencia Claude é que ele pode ver o que está acontecendo, entender o estado do jogo e tomar decisões “semelhantes a como um jogador humano faria” – embora eu possa discordar, pois a IA ainda está sofrendo de passar por uma das primeiras “masmorras” do jogo.

fonte

Claude-3.7 supera outras IA em Super Mario Bros, mas ainda não é jogador

última postagem

Assista como Furious Mafs Australia Bride descobre que o marido saiu...

A mídia social está acontecendo depois que o DDG compartilhou esta...

Quem é Joshua Riibe, ‘pessoa de interesse’, de 24 anos, ligada...

Rooney: Amad tem sido fantástico para Man United

SZA faz uma mulher de gato purrrfect no novo anúncio da...

Motorola não recebeu memorando de que estamos passando por displays de...

O ex -secretário do Tesouro Steven Mnuchin diz que ‘as pessoas...

A família de Alec Baldwin exige o aumento do salário da...

O que sabemos sobre o mandado de prisão da ICC de...

Minha equipe é melhor do que Rangers: José Mourinho Goads Ibrox...

Tecnologia. Entretenimento. Ciência. Sua caixa de entrada.

última postagem