Desde sua introdução no final do ano passado, o ChatGPT da OpenAI e a família de modelos de linguagem GPT que o alimenta têm sido imbatíveis. O GPT-4, o mais recente modelo de linguagem da OpenAI, é considerado amplamente o modelo de IA generativa mais capaz disponível.
O Google, da Alphabet, também oferece seus próprios modelos de IA, incluindo a família de modelos de linguagem PaLM. O PaLM 2 foi anunciado em maio e é usado internamente pelo Google em várias aplicações, além de estar disponível para clientes do Google Cloud.
O PaLM 2 é menos poderoso que o GPT-4, mas o próximo modelo de IA da Google pode igualar ou até mesmo superar o modelo principal da OpenAI. O Gemini, anunciado na quarta-feira, é o modelo de IA mais poderoso da empresa até o momento. Construído do zero para entender texto, imagens, áudio e código, o Google afirma que o Gemini supera o GPT-4 em uma ampla gama de benchmarks de IA.
Uma grande oportunidade
Embora as estimativas variem, a Bloomberg Intelligence prevê que o mercado de IA generativa atingirá US$ 1,3 trilhão na próxima década, um aumento significativo em relação aos apenas US$ 40 bilhões em 2022. Embora hardware e infraestrutura representem a maior parte desse total, espera-se que os softwares de IA generativa gerem quase US$ 280 bilhões em receita até 2032.
Um modelo de IA líder na indústria beneficia o Google de algumas maneiras. Primeiro, o Gemini pode impulsionar o crescimento dos negócios de computação em nuvem do Google. O Gemini Pro, o segundo modelo mais capaz do Gemini, estará disponível no Google Cloud a partir de 13 de dezembro. O Gemini Ultra, ainda mais poderoso, estará disponível após o Google concluir verificações adicionais de segurança e ajustes finos.
Em segundo lugar, o Gemini impulsionará e melhorará os próprios aplicativos e serviços do Google. A ferramenta de IA baseada em chat do Google, o Bard, agora está usando uma versão ajustada do Gemini Pro, e o Google planeja trazer o Gemini para Search, Ads, Chrome e outros produtos ao longo do tempo. A IA representa uma ameaça existencial para o principal negócio de buscas do Google, por isso a empresa precisa garantir que esteja liderando a integração da IA na experiência de busca.
Em terceiro lugar, os negócios de smartphones Android e Pixel do Google se beneficiarão do Gemini Nano, o menor dos três modelos do Gemini. O Gemini Nano funcionará diretamente em smartphones com Android 14, permitindo que os desenvolvedores do Android integrem IA em seus aplicativos. Os dispositivos Pixel 8 Pro do Google já foram atualizados para usar o Gemini Nano para recursos de IA generativa no dispositivo.
O Google treinou os modelos Gemini em suas próprias Unidades de Processamento Tensor, em vez das GPUs da Nvidia amplamente usadas na indústria. Diante da escassez e do alto custo das GPUs de centro de dados mais potentes da Nvidia à medida que a febre da IA aumenta, o uso de chips de IA personalizados pelo Google pode proporcionar uma vantagem de custo importante à medida que treina modelos de IA gerativos cada vez mais capazes.
A batalha pela supremacia da IA
Com um único golpe, o Google praticamente pôs fim a qualquer preocupação de que estaria irremediavelmente atrasado na corrida pela IA generativa. A OpenAI, apoiada pela Microsoft, é uma líder pioneira, mas o Gemini tem o potencial de impulsionar o negócio de IA da empresa, especialmente quando o Gemini Ultra estiver disponível no início do próximo ano.
Ainda existem algumas questões difíceis para o Google em relação a como a IA muda a economia dos principais negócios de publicidade e busca. Executar grandes modelos de IA não é barato, e a empresa não tem escolha senão abraçar a IA em seu negócio de busca. Os chips de IA personalizados ajudarão a equação de custos, mas apenas até certo ponto.
As ações da Alphabet subiram na quinta-feira após o anúncio do Gemini, e com razão. A empresa está pronta para uma intensa batalha com a OpenAI e outros concorrentes de IA, mas agora está em uma posição forte à medida que a demanda por IA generativa explode nos próximos anos.]