Tecnologia

O mais novo modelo da OpenAI é GPT-4o

A OpenAI está lançando um novo modelo de IA generativa chamado GPT-4o, definido para ser implementado “iterativamente” nos produtos da empresa para desenvolvedores e consumidores nas próximas semanas. (O “o” em GPT-4 significa “omni”.)

O CTO da OpenAI, Muri Murati, disse que o GPT-4o fornece inteligência de “nível GPT-4”, mas melhora os recursos do GPT-4 em texto e visão, bem como em áudio.

“O GPT-4o raciocina através de voz, texto e visão”, disse Murati durante uma apresentação nos escritórios da OpenAI. “E isso é extremamente importante, porque estamos olhando para o futuro da interação entre nós e as máquinas.”

GPT-4 Turbo — o modelo líder anterior da OpenAI, uma versão aprimorada do GPT-4 — foi treinado em uma combinação de imagens e texto e podia analisar imagens e texto para realizar tarefas como extrair texto de imagens ou até mesmo descrever o conteúdo dessas imagens. . Mas o GPT-4o acrescenta fala à mistura.

O que isso permite, concretamente? Uma variedade de coisas.

GPT-4o melhora muito a experiência do ChatGPT – ChatGPT é o chatbot viral da OpenAI com tecnologia de IA. O ChatGPT oferece há muito tempo um modo de voz que transcreve texto do ChatGPT usando um modelo de conversão de texto em fala. Mas o GPT-4o potencializa isso, permitindo que os usuários interajam com o ChatGPT mais como um assistente.

Por exemplo, os usuários podem fazer uma pergunta ao ChatGPT – desenvolvido com GPT-4o – e interromper o ChatGPT enquanto ele responde. O modelo oferece capacidade de resposta em “tempo real”, diz OpenAI, e pode até captar a emoção na voz do usuário e gerar voz em “uma variedade de estilos emotivos diferentes”.

O GPT-4o também melhora as capacidades de visão do ChatGPT. Dada uma foto – ou uma tela de desktop – o ChatGPT agora pode responder rapidamente a perguntas relacionadas, desde coisas como “O que está acontecendo neste código de software” até “Que marca de camisa essa pessoa está vestindo?”

“Sabemos que esses modelos [are getting] cada vez mais complexo, mas queremos que a experiência de interação se torne realmente mais natural, fácil, e que você não se concentre na interface do usuário, mas apenas na colaboração com [GPTs]Murti disse.

O GPT-4o também é mais multilíngue, afirma a OpenAI, com desempenho aprimorado em 50 idiomas diferentes. Na API da OpenAI, o GPT-4o é duas vezes mais rápido que o GPT-4 (especificamente o GPT-4 Turbo), metade do preço e tem limites de taxa mais altos.

Em outras notícias, a OpenAI está lançando uma versão desktop do ChatGPT e uma interface de usuário atualizada.

Leia mais sobre o evento de primavera da OpenAI no TechCrunch

Source

Related Articles

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button