O Google anunciou seu modelo de inteligência artificial multimodal Gemini nesta quarta-feira, 6, ressaltando sua capacidade de processar e raciocinar nativamente em diferentes opções, como texto, imagens, vídeo e código.
Com o novo modelo de IA, o gigante das buscas pretende avançar na competição de IA contra OpenAI, Microsoft, Amazon, e o novo consórcio liderado por IBM e Meta, principais rivais da indústria.
O Google descreveu o Gemini como seu maior e mais capaz modelo até o momento, e o primeiro modelo de IA a superar os especialistas humanos no benchmark Massive Multitask Language Understanding (MMLU) .
Sundar Pichai, CEO do Google e da Alphabet, disse que Gemini representa "um dos maiores esforços científicos e de engenharia que empreendemos como empresa", sob a égide das iniciativas DeepMind AI da empresa.
O Google disse que o Gemini passou por extensos testes de segurança de IA, usando ferramentas que incluem um conjunto de "Real Toxicity Prompts" desenvolvido pelo Allen Institute for AI , com sede em Seattle , para avaliar sua capacidade de identificar, rotular e filtrar conteúdo tóxico.
Gemini será lançado em fases em diferentes produtos:
Muitos usuários do Google experimentarão o Gemini primeiro no chatbot Bard AI da empresa. Uma versão chamada Gemini Pro irá equipar Bard a partir desta quarta-feira, disseram executivos do Google. Um modelo mais poderoso chamado Gemini Ultra estará disponível no início do próximo ano em uma nova versão chamada Bard Advanced.
O Google Cloud disponibilizará o Gemini Ultra em um programa de acesso antecipado para desenvolvedores, com lançamento mais amplo no início de 2024. O Gemini Pro estará disponível a partir de 13 de dezembro no Vertex AI e AI Studio do Google Cloud.
Uma versão chamada Gemini Nano para aplicativos no dispositivo estará disponível nos telefones Google Pixel, começando com o Pixel 8 Pro. O Google afirma que irá potencializar um novo recurso Resumir no aplicativo Gravador e Resposta Inteligente no Gboard.
"Agora, estamos dando o próximo passo em nossa jornada com o Gemini, nosso modelo mais capaz e geral até agora, com desempenho de última geração em muitos benchmarks líderes. Nossa primeira versão, Gemini 1.0, é otimizada para diferentes tamanhos: Ultra, Pro e Nano. Estes são os primeiros modelos da era Gemini e a primeira concretização da visão que tínhamos quando formamos o Google DeepMind no início deste ano. Esta nova era de modelos representa um dos maiores esforços científicos e de engenharia que empreendemos como empresa. Estou genuinamente animado com o que está por vir e com as oportunidades que Gêmeos abrirá para as pessoas em todos os lugares" disse o CEO do Google.