Há alguns dias, a Anthropic, startup apoiada pela Amazon e fundada por ex-pesquisadores da OpenAI, anunciou um passo importante em direção a sua visão de inteligência artificial: agentes de IA que podem usar um computador para realizar tarefas complexas como um humano faria. Essa nova funcionalidade dos modelos Claude, chatbot da empresa e um dos mais populares do mercado, permite que eles naveguem em softwares, cliquem em botões, insiram dados e realizem etapas complexas automaticamente. Com essa tecnologia em versão beta, empresas como Amazon, Asana, Canva e Notion já testam o recurso, que abre novas possibilidades em diferentes setores.
A Anthropic adota um posicionamento distinto em relação à OpenAI e está focada em criar agentes realmente autônomos. Esse movimento segue uma tendência crescente no mercado. A Meta, por exemplo, tem investido no ecossistema LLaMA, sua tecnologia open-source, para criar agentes multimodais que podem, inclusive, utilizar visão e ajudar criadores de conteúdo. Com o AI Studio, a Meta busca fortalecer seu papel em um mercado de agentes de IA criativos e personalizados, sinalizando uma visão de longo prazo para IA que vai além de responder perguntas simples e avançando para agentes que auxiliam em tarefas de criação e que serão uma extensão dos criadores de conteúdo.
Google e Microsoft também estão investindo em agentes de IA, mas com abordagens muito diferentes. O Gemini, do Google, busca um conceito de "agentes universais" com atuação proativa e personalizada, capazes de lidar com tarefas complexas e interagir de forma contextual em ambientes diversos, desde smartphones até dispositivos IoT. Em contrapartida, a Microsoft aposta em uma visão limitada com o Microsoft Copilot, restrito a ambientes já conhecidos como Office e Azure, atuando como um copiloto "embutido" em seus produtos. É quase um retorno do assistente virtual Clippy, o clip de papel dos anos 90, mas agora com um "upgrade". Essa integração restringe seu uso a fluxos de trabalho exclusivamente no ecossistema Microsoft, o que o torna menos adaptável a interações fora do seu domínio. Esse posicionamento reflete a abordagem clássica da Microsoft de se prender excessivamente aos seus ecossistemas legados, tratando a IA mais como uma ferramenta de produtividade incremental do que como uma ruptura tecnológica verdadeiramente transformadora.
Em contraste, a abordagem da Apple com a IA, especialmente no iOS, representa uma visão voltada para o futuro e para o consumidor final. A empresa vem integrando de forma silenciosa a inteligência em seu ecossistema, priorizando a experiência do usuário e a autonomia sem interrupções. O futuro do iOS pode ver agentes de IA profundamente integrados ao sistema operacional, realizando tarefas como assistência preditiva, gerenciamento automatizado de comunicação e organização inteligente de informações, integrando nativamente todos os aplicativos do seu ecossistema, terceiros e proprietários.
Embora a OpenAI pareça menos focada em agentes autônomos, suas atualizações com o GPT-4o e o1 demonstram uma estratégia que pode transformar o ChatGPT em um agente mais completo e sofisticado no futuro. Com melhorias na capacidade de raciocínio e execução de tarefas complexas, o ChatGPT apresenta uma base sólida para evoluir em direção a agentes de IA que possam operar de forma mais independente. Se a OpenAI conseguir alavancar essas habilidades, poderá competir diretamente com a visão de autonomia de empresas como Anthropic, Meta, Google e Apple.
Os avanços da Anthropic destacam o potencial da IA de se afastar dos frameworks tradicionais de produtividade e operar como agentes independentes, capazes de resolver problemas no mundo real. O contraste com a trajetória das demais empresas, por exemplo, também ressalta como sistemas inteligentes podem ser integrados de maneira mais fluida às experiências dos usuários.
Por fim, a própria forma como interagimos com dispositivos e o ambiente ao nosso redor tende a ser drasticamente transformada. Com agentes de IA que podem atuar como "extensões" de nós mesmos, é possível imaginar uma sociedade onde nossas ações cotidianas são antecipadas e facilitadas por sistemas que conhecem nossos padrões, hábitos e até mesmo nossas emoções. Estamos falando de um novo modelo de interação "sem fricções", fluem sem barreiras e a tecnologia se dissolve no nosso ambiente, quase invisível, mas sempre presente e atuante. Essa perspectiva de integração, no entanto, levanta questões sobre privacidade, dependência tecnológica e o equilíbrio entre eficiência e liberdade. As escolhas feitas por cada empresa definem como a IA pode evoluir—não como um recurso aditivo, mas como uma presença que reimagina o futuro da interação digital e da sociedade.
Samir Ramos, co-founder e co-CEO do smarters.