O Google propôs usar sua tecnologia de inteligência artificial, incluindo o modelo Gemini, no “Projeto Ellmann“, que tem como objetivo criar um panorama da vida dos usuários a partir dos dados de seus celulares. O projeto visa absorver resultados de pesquisas e identificar padrões em fotos para desenvolver um chatbot capaz de responder a perguntas complexas sobre a vida do usuário, oferecendo uma visão abrangente de sua história pessoal.
O Projeto Ellman faz parte do esforço do Google para usar a IA para aprimorar produtos. O chatbot proposto poderia inferir momentos significativos na vida do usuário e fornecer insights sobre preferências pessoais, baseando-se em uma variedade de informações contextuais.
Ainda não está claro se o Google planeja integrar essas capacidades no Google Fotos ou outros produtos.
O Google Fotos, por exemplo, já possui um vasto acervo de mais de um bilhão de usuários e quatro trilhões de fotos e vídeos. Apesar de ser um projeto exploratório inicial, qualquer lançamento de novos recursos relacionados ao Projeto Ellmann será cuidadosamente planejado pelo Google para garantir a utilidade, privacidade e segurança dos usuários, conforme informou um porta-voz da empresa.
Essa ideia, denominada “Projeto Ellmann”, visa absorver resultados de pesquisas e identificar padrões em fotos, culminando na criação de um chatbot capaz de responder a perguntas complexas sobre a vida do usuário.
A ideia do Projeto Ellmann foi apresentada em uma cúpula interna do Google por um gerente de produto do Google Fotos e equipes do Gemini. A abordagem proposta visa oferecer uma visão abrangente da história de vida de um usuário, agregando contexto às suas fotos além dos pixels e metadados.
Ainda não está claro se o Google planeja integrar essas capacidades no Google Fotos ou em outros produtos. O Google Fotos, por exemplo, já possui mais de um bilhão de usuários e quatro trilhões de fotos e vídeos armazenados, conforme divulgado pela empresa.
Sua vida diante dos seus olhos, by Google
O Projeto Ellman é parte dos esforços do Google para utilizar tecnologia de IA para melhorar e/ou criar outros produtos. O recente lançamento do Gemini – sua IA mais avançada (e multimodal) até o momento – é um exemplo disso. A empresa pretende licenciar o Gemini para clientes por meio do Google Cloud.
O projeto sugere que grandes modelos de linguagem (LLMs, na sigla em inglês) podem inferir momentos significativos na vida de um usuário, como o nascimento de um filho, baseando-se em informações contextuais variadas. A tecnologia poderia utilizar diferentes níveis de contexto para melhor compreender e narrar a história da vida do usuário.
A equipe do Google também demonstrou o “Chat Ellmann”, uma funcionalidade que permitiria aos usuários fazer perguntas sobre suas vidas, com respostas personalizadas baseadas no conhecimento adquirido pelo LLM sobre as suas vidas.
Além de responder a perguntas, o Ellmann poderia fornecer insights sobre preferências do usuário, como gostos alimentares, produtos considerados para compra, interesses, trabalho e planos de viagem, baseando-se em capturas de tela e outras informações coletadas.
Um porta-voz do Google informou à CNBC que, embora este seja um projeto exploratório inicial, qualquer lançamento futuro de novos recursos seria cuidadosamente planejado para garantir utilidade, privacidade e segurança dos usuários.