O Red Hat Enterprise Linux AI acaba de ser disponibilizado a clientes em todo os cantos do mundo. O RHEL AI é a plataforma de modelos de base da Red Hat, que permite aos usuários desenvolver, testar e executar modelos de IA generativa (gen AI) de forma mais integrada para potencializar aplicações empresariais dentro da nuvem híbrida.
A solução reúne a família de large language models (LLM) Granite com licença de código aberto e as ferramentas de alinhamento de modelos InstructLab, com base na metodologia Large-scale Alignment for chatBots (LAB), empacotada como uma imagem RHEL otimizada e inicializável para implantações de servidores individuais na nuvem híbrida.
Embora o potencial da gen AI seja imenso, os custos associados à aquisição, treinamento e ajuste fino de LLMs podem ser astronômicos, com o valor de treinamento de alguns modelos de ponta chegando a quase US$ 200 milhões antes do lançamento.
O investimento não inclui os gastos de alinhamento para necessidades ou dados específicos de uma determinada organização, o que normalmente requer cientistas de dados ou desenvolvedores altamente especializados para realizar a tarefa. Independentemente do modelo selecionado para uma aplicação, o alinhamento ainda será necessário para operar com dados e processos específicos da empresa, tornando a eficiência e a agilidade essenciais para a IA em vários ambientes de aplicação.
A Red Hat acredita que, na próxima década, modelos de IA menores, mais eficientes e desenvolvidos sob medida serão um componente substancial no desenvolvimento do TI empresarial, juntamente com aplicações nativas em nuvem.
Mas, para conseguir isso, a gen AI precisa ser mais acessível, flexível e disponível, desde a democratização de custos até seus contribuidores e onde ela poderá operar na nuvem híbrida. Por décadas, comunidades de código aberto têm ajudado a resolver desafios semelhantes para problemas complexos de software por meio de contribuições de diversos grupos de usuários; uma abordagem parecida pode reduzir as barreiras para adotar efetivamente a gen AI.
O RHEL AI já está disponível pelo Red Hat Customer Portal para operar on-premises ou para upload no AWS e IBM Cloud no formato "bring your own subscription" (BYOS). A oferta BYOS no Azure e Google Cloud deve ser lançada no 4T 2024 e o RHEL AI também deve estar disponível no IBM Cloud como serviço no fim deste ano.