O espaço da inteligência artificial generativa (IA) continua a esquentar à medida que a OpenAI revela o GPT-4V, um modelo com capacidade de visão, e modos de conversação multimodais para seu sistema ChatGPT.
Com as novas atualizações, os usuários do ChatGPT poderão envolver o chatbot nas conversas. Os modelos que alimentam ChatGPT, GPT-3.5 e GPT-4 agora podem compreender consultas faladas em linguagem simples e responder em uma das cinco vozes diferentes.
ChatGPT can now see, hear, and speak. Rolling out over next two weeks, Plus users will be able to have voice conversations with ChatGPT (iOS & Android) and to include images in conversations (all platforms). https://t.co/uNZjgbR5Bm pic.twitter.com/paG0hMshXb
— OpenAI (@OpenAI) September 25, 2023
De acordo com uma postagem no blog da OpenAI, esta nova interface multimodal permitirá que os usuários interajam com o ChatGPT de maneiras inovadoras:
“Tire uma foto de um ponto de referência enquanto viaja e converse ao vivo sobre o que há de interessante nele. Quando estiver em casa, tire fotos da sua geladeira e da despensa para descobrir o que há para o jantar (e faça perguntas de acompanhamento para obter uma receita passo a passo). Depois do jantar, ajude seu filho com um problema de matemática tirando uma foto, circulando o conjunto de problemas e fazendo com que ele compartilhe dicas com vocês dois.”
A versão atualizada do ChatGPT será lançada para usuários Plus e Enterprise em plataformas móveis nas próximas duas semanas, com acesso subsequente para desenvolvedores e outros usuários logo depois. A atualização multimodal do ChatGPT vem logo após o lançamento do DALL-E 3, o sistema de geração de imagens mais avançado da OpenAI.
De acordo com a OpenAI, o DALL-E 3 também integra processamento de linguagem natural. Isso permite que os usuários conversem com o modelo para ajustar os resultados e integrar o ChatGPT para obter ajuda na criação de prompts de imagem.
Em outras notícias sobre IA, a Anthropic, concorrente da OpenAI, anunciou uma parceria com a Amazon. A Amazon investirá até US$4 bilhões para incluir serviços em nuvem e acesso a hardware. Em troca, a Anthropic disse que fornecerá suporte aprimorado para o modelo fundamental de IA da Amazon, Bedrock, juntamente com personalização de modelo seguro e ajuste fino para empresas.