Uma dúvida que está presente no imaginário colectivo nesta era da Inteligência Artificial generativa é: qual é a melhor IA? Seria o pioneiro ChatGPT? O Claude, da Anthropic? O Gemini, do gigante da tecnologia Google? Ou quem sabe o meteórico modelo chinês da DeepSeek?
Definir a melhor inteligência artificial é uma questão complexa, que depende de diversos critérios e perspectivas. Contudo, em uma brincadeira nas redes sociais, a disputa entre Claude e Gemini acabou atraindo atenção, e curiosamente, o Gemini sagrou-se vencedor.
Desvendando a Disputa
Para chegar a esse resultado, as duas IAs participaram de um desafio pouco convencional: jogaram os jogos clássicos Pokémon Red e Pokémon Blue. Esses jogos, lançados pela Nintendo em 1996, marcam o início de uma das franquias mais icônicas da história dos videogames.
Leia Também
Recentemente, o CEO do Google, Sundar Pichai, anunciou no brTongue-X que o Gemini finalmente “zerou” o jogo. De acordo com seu anúncio, o único erro cometido foi escolher Squirtle em vez de Charmander como Pokémon inicial.
Como Funcionou Essa Disputa?
É interessante destacar que nunca houve uma competição formal entre as duas inteligências artificiais. No passado, a Anthropic utilizou o Claude para jogar Pokémon Red em testes padronizados. Nesse experimento, o Claude recebeu entradas de pixels e comandos para simular as ações de um jogador,活动 que se estendeu por vários meses antes do Gemini fazer sua aparição.
A decisão de fazer o Gemini jogar Pokémon Blue partiu de um engenheiro externo, não afiliado ao Google, mas a empresa respaldou essa iniciativa. O registro desse feito recebeu a aprovação de Sundar Pichai, que reconheceu o empenho da equipe envolvida.
Para superar os desafios do jogo e vencer o rival final, o Gemini executou cerca de 60 mil ações. Já o Claude, ficou aquém dessa marca, com mais de 200 mil ações e ainda sem conseguir conquistar todas as insígnias necessárias.
Se você é novo nos jogos de Pokémon, precisa saber que um jogador deve obter 8 insígnias antes de desafiar o final. Isso estabelece um pré-requisito fundamental para acessar as etapas seguintes do jogo.
O Gemini É Realmente Superior?
Ao avaliarmos os resultados objetivamente, a resposta seria afirmativa. No entanto, essa conclusão não se sustenta quando outros fatores são considerados. O responsável pela iniciativa, Joel Z, enfatizou sua posição em sua página na Twitch: “Por favor, não considerem isso um parâmetro para avaliar como um LLM consegue jogar Pokémon. Não é possível fazer comparações diretas – Gemini e Claude possuem ferramentas e inputs diferentes.”
Essa questão da troca de informações é vital para entender por que o Claude teve desempenho inferior. Joel Z enfatizou que seu modelo teve acesso a dados mais extensos, o que conferiu a ele uma desvantagem em relação ao Gemini. Independentemente do resultado, o fato é que esta experiência oferece um vislumbre fascinante sobre como funcionam esses modelos de linguagem avançados.
Para quem já jogou Pokémon, é claro que não estamos diante de um RPG necessariamente complicado. Pelo contrário, sua proposta é de simplicidade e intuitividade. Quem já experimentou qualquer uma das versões sabe que a essência do jogo permanece, mesmo com variantes de design.
Contudo, para uma máquina, jogar Pokémon se revela um desafio substancial. Para os leigos, acompanhar essa competitividade entre IAs enriquece nossa compreensão sobre a evolução da tecnologia.
Termino mencionando que você pode assistir ao Claude jogando a versão Red em Twitch e ao Gemini jogando Pokémon Blue no seu próprio canal, que pode ser acessado aqui.
As informações têm como base a matéria publicada por Tech Crunch, ressaltando a crescente relevância das IAs generativas na cultura contemporânea. Certamente, o futuro revelará novas nuances nesta emocionante saga.