A Nutanix anuncia a extensão de sua plataforma de infraestrutura de IA com uma nova oferta nativa de nuvem, a Nutanix Enterprise AI (NAI), que pode ser implementada em qualquer plataforma Kubernetes, edge, em data centers core e em serviços de nuvem pública como AWS EKS, Azure AKS e Google GKE.
A oferta NAI oferece um modelo operacional multicloud híbrido consistente para cargas de trabalho de IA aceleradas, permitindo que as organizações aproveitem seus modelos e dados em um local seguro de sua escolha, ao mesmo tempo em que melhoram o retorno sobre o investimento (ROI).
Aproveitando o NVIDIA NIM para desempenho otimizado de modelos de base, a Nutanix Enterprise AI ajuda as organizações a implementar, a executar e a dimensionar com segurança endpoints de inferência para modelos de linguagem grandes (LLMs) para dar suporte à implementação de aplicações de IA generativa (GenAI) em minutos, não dias ou semanas.
A IA generativa é uma carga de trabalho inerentemente híbrida, com novas aplicações frequentemente criadas na nuvem pública, ajuste fino de modelos usando dados privados ocorrendo on-premises e inferência implantada mais próxima da lógica de negócios, que pode estar em edge, on-premises ou na nuvem pública. Esse fluxo de trabalho GenAI híbrido distribuído pode apresentar desafios para organizações preocupadas com complexidade, privacidade de dados, segurança e custo.
O Nutanix Enterprise AI fornece um modelo operacional multicloud consistente e uma maneira simples de implantar, dimensionar e executar LLMs com segurança com microsserviços de inferência otimizados para NVIDIA NIM, bem como modelos de base aberta da Hugging Face. Isso permite que os clientes criem uma infraestrutura GenAI empresarial com resiliência, operações de dia 2 e segurança de que precisam para aplicações essenciais aos negócios, on-premises ou no AWS Elastic Kubernetes Service (EKS), Azure Managed Kubernetes Service (AKS) e Google Kubernetes Engine (GKE).
Além disso, o Nutanix Enterprise AI oferece um modelo de preços transparente e previsível com base em recursos de infraestrutura, o que é importante para clientes que buscam maximizar o ROI de seus investimentos em GenAI. Isso contrasta com o uso difícil de prever ou com os preços baseados em tokens.
O Nutanix Enterprise AI é um componente do Nutanix GPT-in-a-Box 2.0 que inclui o Nutanix Cloud Infrastructure, Nutanix Kubernetes Platform e Nutanix Unified Storage, juntamente com serviços para dar suporte às necessidades de configuração e dimensionamento do cliente para treinamento e inferência on-premises. Para clientes que buscam implementar em nuvem pública, o Nutanix Enterprise AI pode ser executado em qualquer ambiente Kubernetes, mas é operacionalmente consistente com implementações on-premises.
"Com o Nutanix Enterprise AI, estamos ajudando nossos clientes a executar de forma simples e segura aplicações GenAI on-premises ou em nuvens públicas. O Nutanix Enterprise AI pode ser executado em qualquer plataforma Kubernetes e permite que suas aplicações de IA sejam executadas em seu local seguro, com um modelo de custo previsível", diz Thomas Cornely, vice-presidente sênior e gerente de Produto da Nutanix.
O Nutanix Enterprise AI pode ser adotado com a plataforma NVIDIA full-stack AI e é validado com a plataforma de software NVIDIA AI Enterprise, incluindo NVIDIA NIM, um conjunto de microsserviços fáceis de usar, projetados para implantação segura e confiável de inferência de modelo de IA de alto desempenho. O Nutanix-GPT-in-a-Box também é um Sistema Certificado pela NVIDIA, garantindo também a confiabilidade do desempenho.
"Cargas de trabalho de IA generativa são inerentemente híbridas, com treinamento, personalização e inferência ocorrendo em nuvens públicas, sistemas on-premises e locais de edge", diz Justin Boitano, vice-presidente de Enterprise AI da NVIDIA. "Integrar o NVIDIA NIM ao Nutanix Enterprise AI fornece um modelo multicloud consistente com APIs seguras, permitindo que os clientes implementem IA em diversos ambientes com o alto desempenho e a segurança necessários para aplicações essenciais aos negócios."
O Nutanix Enterprise AI pode ajudar os clientes a:
- Lidar com a escassez de skills em IA. Simplicidade, escolha e recursos integrados significam que os administradores de TI podem ser administradores de IA, acelerando o desenvolvimento com por cientistas de dados e desenvolvedores que se adaptam rapidamente usando os modelos mais recentes e computação acelerada pela NVIDIA.
- Remover barreiras para construir uma plataforma pronta para IA. Muitas organizações que buscam adotar o GenAI lutam para construir a plataforma certa para dar suporte a cargas de trabalho de IA, incluindo manter a consistência em sua infraestrutura local e em várias nuvens públicas. O Nutanix Enterprise AI aborda isso com um fluxo de trabalho simples orientado por UI que pode ajudar os clientes a implantar e testar endpoints de inferência LLM em minutos, oferecendo escolha ao cliente com suporte para microsserviços NVIDIA NIM que rodam em qualquer lugar, garantindo desempenho otimizado do modelo em ambientes de nuvem e on-premises. Hugging Face e outros padrões de modelo também são suportados. Além disso, a integração nativa com a Nutanix Kubernetes Platform mantém o alinhamento com a capacidade de aproveitar toda a Nutanix Cloud Platform ou fornecer aos clientes a opção de executar em qualquer tempo de execução do Kubernetes, incluindo AWS EKS, Azure AKS ou Google Cloud GKE com computação acelerada pela NVIDIA.
- Mitigar preocupações com privacidade e segurança de dados. Ajudar a mitigar riscos de privacidade e segurança está incorporado ao Nutanix Enterprise AI, permitindo que os clientes executem modelos e dados em recursos de computação que eles controlam. Além disso, o Nutanix Enterprise AI oferece um painel intuitivo para solução de problemas, observabilidade e utilização de recursos usados para LLMs, bem como controles de acesso baseados em função (RBAC) rápidos e seguros para garantir que a acessibilidade do LLM seja controlável e compreendida. As organizações que exigem segurança reforçada também poderão implantar em ambientes air-gapped ou dark-site.
- Trazer infraestrutura empresarial para cargas de trabalho GenAI. Os clientes que executam o Nutanix Cloud Platform para aplicações essenciais aos negócios agora podem trazer a mesma resiliência, operações Dia 2 e segurança para cargas de trabalho GenAI para uma experiência de infraestrutura empresarial.
Os principais casos de uso para clientes que utilizam o Nutanix Enterprise AI incluem: aprimorar a experiência do cliente com o GenAI por meio da análise de feedback e documentos do cliente; acelerar a criação de código e conteúdo aproveitando copilots e processamento inteligente de documentos; aproveitar modelos de ajuste fino em dados específicos de domínio para acelerar a geração de código e conteúdo; fortalecer a segurança, incluindo o aproveitamento de modelos de IA para detecção de fraudes, detecção de ameaças, enriquecimento de alertas e criação automática de políticas; e melhorar a análise aproveitando modelos ajustados em dados privados.