A OpenAI, desenvolvedora do ChatGPT, anunciou nesta segunda-feira (13) o lançamento do GPT-4o, a mais recente versão do modelo de inteligência artificial (IA) usado pelo ChatGPT.
A interface em que é possivel “conversar” com o robô será liberada gradualmente para todos os usuários, inclusive quem está na versão gratuita.
As informações são do portal G1.
O GPT-4o é o primeiro modelo da OpenAI a combinar textos, imagens e áudios por conta própria – gerações anteriores precisavam de outros modelos de IA para analisar comandos de voz e fotos. Com a mudança, o tempo de resposta do ChatGPT deve ficar mais rápido – segundo o Think Tank, o GPT-4o leva em média 320 milissegundos para responder comandos de áudio; em média, o GPT-3.5 leva 2,8 segundos e o GPT-4, 5,4 segundos.
O presidente-executivo da OpenAI, Sam Altman, afirmou que este é o melhor modelo já criado pela empresa. “É inteligente, é rápido, é nativamente multimodal”, disse.
Até então, o ChatGPT seguia várias etapas para analisar e responder comandos de voz. Primeiro, era preciso usar um modelo para converter o áudio para texto.
Depois, o GPT-3.5 ou o GPT-4 interpretava o conteúdo e criava uma resposta. Por fim, outro modelo transformava o material de volta para áudio.
Segundo a empresa, o GPT-4o é mais rápido e tem mais capacidade para entender textos, imagens e áudios do que seu antecessor, o GPT-4, lançado em março de 2023.
A empresa também anunciou um aplicativo do ChatGPT para computador, que se junta à versão para navegadores e um aplicativo para Android e iOS.