O modelo de inteligência artificial (IA) do Google, Gemini, está sendo integrado em grande parte da tecnologia da gigante da tecnologia. A IA aparecerá em breve no Gmail, no YouTube e nos smartphones da empresa.
Em um discurso de abertura na conferência de desenvolvedores da empresa, o CEO do Google, Sundar Pichai, revelou alguns dos próximos lugares em que seu modelo de IA aparecerá.
Pichai mencionou a IA 121 vezes em sua palestra de 110 minutos enquanto o tópico ganhava destaque, e Gemini, lançado em dezembro de 2023, ganhava o centro das atenções.
O Google está incorporando o modelo de linguagem grande (LLM) em suas ofertas, incluindo Android, Pesquisa e Gmail. Aqui está o que os usuários podem esperar daqui para frente:

Gemini está ganhando mais contexto, pois poderá interagir com aplicativos. Em uma atualização futura, os usuários poderão ligar para o Gemini para interagir com os aplicativos, como arrastar e soltar uma imagem gerada por IA em uma mensagem.
Os usuários do YouTube também poderão tocar em “Perguntar a este vídeo” para obter informações específicas da IA dentro do vídeo.
A plataforma de e-mail do Google, Gmail, também está recebendo integração de IA. Os usuários poderão pesquisar, resumir e redigir seus e-mails usando o Gemini.
O assistente de IA poderá atuar em e-mails para tarefas mais complexas, como auxiliar no processamento de devoluções de comércio eletrônico pesquisando na caixa de entrada, encontrando o recibo e preenchendo formulários online.
O Google também revelou uma nova experiência chamada Gemini Live, onde os usuários podem ter bate-papos de voz profundos com a IA em seus smartphones.
O chatbot pode ser interrompido no meio da resposta para esclarecimentos e se adaptará aos padrões de fala dos usuários em tempo real. Além disso, o Gemini também pode ver e responder ao ambiente físico por meio de fotos ou vídeos capturados no dispositivo.

O Google está trabalhando no desenvolvimento de agentes inteligentes de IA que possam raciocinar, planejar e concluir tarefas complexas de várias etapas sob supervisão em nome do usuário. Multimodal significa que a IA pode ir além do texto e lidar com entradas de imagem, áudio e vídeo.
Exemplos e casos de uso iniciais incluem automatizar devoluções de compras e explorar uma nova cidade.
Outras atualizações em andamento para o modelo de IA da empresa incluem a substituição do Google Assistant no Android pelo Gemini, que será totalmente integrado ao seu sistema operacional móvel.
Um novo recurso “Ask Photos” permite pesquisar na biblioteca de fotos usando consultas em linguagem natural desenvolvidas pelo Gemini. Ele pode compreender o contexto, reconhecer objetos e pessoas e resumir memórias fotográficas em resposta a perguntas.
O Google Maps mostrará resumos de lugares e áreas gerados por IA, utilizando insights dos dados de mapeamento da plataforma.