Tecnologia será capaz de interpretar comandos em diferentes formatos. Crédito de imagem: divulgação/Google

No dia 6 de novembro, o Google anunciou o lançamento de seu novo modelo de inteligência artificial (IA), o Gemini. Segundo a empresa, a tecnologia de IA é a mais poderosa já criada pelo Google, sendo capaz de interpretar diferentes tipos de dados enviados nos formatos de texto, imagem, áudio, códigos e vídeos. Descrito como uma grande inovação, o Gemini se torna o principal concorrente do ChatGPT, IA da empresa OpenAI. 

O Gemini atua como uma atualização, uma espécie de “motor” mais potente do Bard, plataforma de IA do Google. Por enquanto, a tecnologia está disponível apenas em inglês, podendo já ser testada no Bard. O Google declarou que a ferramenta superou a capacidade humana em testes de conhecimento e solução de problemas, que incluíam questões de física, matemática e história.

Para exemplo de comparação, o Gemini compete mais diretamente com o GPT-4, versão atualizada e mais moderna do ChatGPT, disponível apenas para assinantes. Assim como o GPT-4 é uma otimização do ChatGPT, o Gemini é um avanço com capacidades mais completas dentro do Bard. 

Diferenças entre o Gemini e o GPT-4

Dentre os principais diferenciais entre o Gemini e o GPT estão as percepções sensoriais. A intenção é que o lançamento do Google “imite” a maneira como cérebro humano opera, podendo interpretar informações por meio de voz, imagem etc.; o GPT-4 realiza a mesma função; e o GPT-3, não. No entanto, enquanto o GPT-4 precisa de diferentes extensões fora da própria programação para reconhecer conteúdos de imagem e áudio, o Gemini opera naturalmente com o reconhecimento multimodal (que lê, além de texto, conteúdos audiovisuais), sem precisar de nenhuma extensão (plugin) a mais. 

Versões do Gemini

O Gemini irá operar com três modelos diferentes: Nano, Pro e Ultra. A versão Nano promete funcionar offline em celulares que utilizam o sistema operacional Android. Já a versão Pro será compartilhada com desenvolvedores (profissionais que trabalham com códigos de programação) no dia 13 de dezembro, dentro da plataforma Google Cloud, espaço de armazenamento na nuvem que também oferece diferentes aplicativos para os usuários. Para os outros internautas, o Gemini Pro já está disponível no Bard.

Por fim, o Gemini Ultra, apenas para especialistas e programadores, possui uma versão mais complexa ainda em desenvolvimento, voltada para chatbots e diálogos. O modelo Ultra será lançado em 2024. O Google também declarou que, nos próximos meses, o Gemini poderá ser integrado a outras extensões, como o Google Chrome. 




Assim, a nova tecnologia do Google promete ser mais abrangente e completa, podendo ser utilizada em diferentes tipos de estruturas e por perfis variados de usuário, desde programadores a internautas que desejam, por exemplo, resolver problemas matemáticos por meio de uma foto.

O Google alerta que, assim como as outras IAs, o Gemini está passível a erros de interpretação e fornecimento de respostas incorretas. Do mesmo modo que o ChatGPT, a ferramenta utiliza um banco de informações para encontrar as respostas.

Fontes: G1, CNN, TechTudo, The Guardian e Tecnoblog

Ixi! Você bateu no paywall!

Ainda não é assinante? Assine agora e tenha acesso ilimitado ao conteúdo do Joca.

Assinante? Faça Login

Voltar para a home

Ou faça sua assinatura e tenha acesso a todo o conteúdo do Joca

Assine

Enquete

Sobre qual assunto você gosta mais de ler no portal do Joca?

Comentários (0)

Compartilhar por email

error: Contéudo Protegido