Gemini: o modelo de IA apresentado pelo Google

Foto: Divulgação/Google

Por: OCP News Criciúma

06/12/2023 - 20:12 - Atualizada em: 06/12/2023 - 20:30

O Google lançou nesta quarta-feira (6) o seu mais recente modelo de inteligência artificial (IA), chamado Gemini, destacando-o como o mais poderoso já criado pela empresa. Ele atua como o motor do Bard, concorrente do ChatGPT, e, por enquanto, está disponível apenas em inglês.

Assim como o ChatGPT, o Bard é um chatbot que funciona como uma página de bate-papo. Utilizando aprendizado de máquina, ele é capaz de “imitar” humanos ao fornecer respostas a perguntas feitas pelos usuários com base em uma vasta quantidade de textos disponíveis na internet.

O modelo Gemini é projetado para ser utilizado por outros aplicativos e competirá com ferramentas como o GPT-4, o modelo de IA da OpenAI usado no ChatGPT. Segundo o Google, o Gemini superou a capacidade humana em um teste de conhecimento e solução de problemas que combina 57 temas, incluindo matemática, física e história. A empresa também afirma que ele teve um desempenho melhor nesse teste do que o GPT-4.

O Google destacou que a abordagem para desenvolver o Gemini diferiu um pouco de outros modelos de IA multimodais, que conseguem entender ao mesmo tempo diferentes formatos de mensagens, como textos, imagens, áudios e códigos.

Fred Gomes, Diretor da Defesa Civil, ressaltou que o sistema de drenagem poderia lidar com 30 a 35 mm por hora a partir das 17h, mas a chuva ultrapassou esse limite em menos de 10 minutos. Embora tenha havido pontos de alagamento devido à chuva intensa, o que se destacou foi a rápida redução do nível da água em algumas ruas, graças ao eficiente sistema de drenagem. Não foram relatados ferimentos humanos ou incidentes graves.

Como o Gemini funciona?

O Gemini é o modelo de IA mais flexível já desenvolvido pelo Google, projetado para ser executado em infraestruturas grandes de data centers e em dispositivos mais limitados, como telefones celulares.

Ele terá três versões:

– Gemini Ultra: O maior e mais poderoso, voltado para tarefas altamente complexas – será lançado apenas em 2024.
– Gemini Pro: Voltado para executar uma ampla gama de tarefas e atender a usuários, disponível a partir desta quarta-feira no Bard, e a desenvolvedores a partir de 13 de dezembro.
– Gemini Nano: Rodará diretamente nos dispositivos móveis para os quais foi criado, permitindo que funcione mesmo quando não há internet – disponível no Pixel 8 Pro, o celular do Google.

A versão Pro do Gemini será a primeira a ser introduzida, aprimorando as capacidades de raciocínio, planejamento e compreensão do Bard. O Chatbot do Google começará a usar a nova IA para respostas em inglês a partir desta quarta-feira (outros idiomas receberão a atualização em breve).

No início de 2024, o Google lançará o Bard Advanced, que contará com o Gemini Ultra. A empresa também mencionou que, nos próximos meses, o Gemini se integrará a produtos como Search e Chrome.

A partir de 13 de dezembro, desenvolvedores e empresas poderão usar o Gemini Pro por meio das plataformas de inteligência artificial Google AI Studio e Google Cloud Vertex AI. O Gemini Ultra passará por verificações de segurança adicionais antes de ser lançado para todos os usuários em 2024.

O que torna o Gemini mais poderoso?

Segundo o Google, a criação de modelos de IA costuma envolver “treinamentos” separados, com foco em cada formato. Em uma segunda etapa, o aprendizado de texto é reunido com o de imagem, por exemplo, e tudo é “empacotado” em apenas um produto.

Na avaliação do Google, esse método permite realizar algumas tarefas, como descrever imagens, mas tem limitações nos casos que exigem mais raciocínio.

“Projetamos o Gemini para ser nativamente multimodal, pré-treinado desde o início em diferentes modalidades. Em seguida, aperfeiçoamos com dados multimodais adicionais para refinar ainda mais sua eficácia”, disse Demis Hassabis, diretor-executivo da DeepMind, subsidiária de IA do Google.

O Gemini é confiável?

O Google admite que, assim como toda IA, o Gemini está sujeito ao problema de alucinação, um erro que faz a resposta de um robô incluir informações incorretas, tendenciosas ou sem sentido.

A empresa, no entanto, diz que o Gemini é capaz de fazer as melhores avaliações de segurança de uma IA já criada por sua equipe. O objetivo é que ela seja capaz de evitar conteúdo violento ou estereotipado, por exemplo.

A criação do Gemini envolveu ainda o treinamento sobre o que não deve ser exibido aos usuários a partir de um conjunto de 100 mil frases consideradas tóxicas retiradas da internet. Um grupo de especialistas independentes também iniciou os trabalhos para testar os limites da nova IA.

“Estamos abordando esse trabalho com ousadia e responsabilidade”, disse Sundar Pichai, diretor-executivo da Alphabet