NVIDIA lança microsserviços de IA generativa para desenvolvedores

Por

19 de março de 2024

A NVIDIA anuncia dezenas de microsserviços de IA generativa de nível corporativo que as empresas podem usar para criarem e implantarem aplicações personalizadas em suas próprias plataformas enquanto detêm propriedade e controle plenos de suas propriedades intelectuais.

Criado com base na plataforma NVIDIA CUDA, o catálogo de microsserviços nativos da nuvem inclui microsserviços NVIDIA NIM para inferência otimizada em mais de duas dúzias de modelos de IA populares da NVIDIA e de seu ecossistema de parceiros. Além disso, ferramentas, bibliotecas e kits de desenvolvimento de software acelerados da NVIDIA agora podem ser acessados como microsserviços NVIDIA CUDA-X para geração aumentada por recuperação (RAG), proteções, processamento de dados, HPC e muito mais. A NVIDIA também anuncia separadamente mais de duas dúzias de microsserviços para assistência médica NIM e CUDA-X.

A seleção de microsserviços com curadoria acrescenta uma nova camada à plataforma de computação full-stack da NVIDIA. Essa camada conecta o ecossistema de IA de desenvolvedores de modelos, provedores de plataformas e empresas a um caminho padronizado para execução de modelos de IA personalizados otimizados para a base instalada CUDA da NVIDIA de centenas de milhões de GPUs em nuvens, data centers, estações de trabalho e PCs.

Entre os primeiros a acessarem os novos microsserviços de IA generativas da NVIDIA disponíveis no NVIDIA AI Enterprise 5.0, estão os principais provedores de aplicações, dados e plataformas de segurança cibernética, incluindo Adobe, Cadence, CrowdStrike, Getty Images, SAP, ServiceNow e Shutterstock.

“As plataformas empresariais estabelecidas estão sentadas em uma mina de ouro de dados que podem ser transformados em copilotos da IA generativa”, ressalta Jensen Huang, fundador e CEO da NVIDIA. “Criados com o ecossistema de nossos parceiros, esses microsserviços de IA em contêineres são os componentes para que empresas de todos os setores se tornem empresas de IA.”

Microsserviços de inferência de NIM aceleram as implantações de semanas para minutos
Os microsserviços de NIM fornecem contêineres pré-construídos equipados com o software de inferência da NVIDIA – incluindo Triton Inference Server™ e TensorRT™-LLM – que permitem que os desenvolvedores reduzam os tempos de implantação de semanas para minutos.

Eles fornecem APIs padrão do setor para domínios como linguagem, fala e descoberta de medicamentos para permitir que os desenvolvedores criem aplicações de IA rapidamente usando seus dados proprietários hospedados com segurança em suas próprias infraestruturas. Essas aplicações podem se expandir sob demanda, fornecendo flexibilidade e desempenho para a execução de IA generativa na produção em plataformas de computação aceleradas pela NVIDIA.

Os microsserviços NIM fornecem o contêiner de IA de produção mais rápido e de melhor desempenho para a implantação de modelos da NVIDIA, A121, Adept, Cohere, Getty Images, e Shutterstock, bem como modelos abertos da Google, Hugging Face, Meta, Microsoft, Mistral AI e Stability AI.

ServiceNow anuncia que está usando NIM para desenvolver e implantar novos copilotos específicos de domínio e outras aplicações generativas de IA de forma mais rápida e econômica.

Os clientes poderão acessar os microsserviços NIM do Amazon SageMaker, Google Kubernetes Engine e Microsoft Azure AI e integrá-los a estruturas de IA populares como Deepset, LangChain e LlamaIndex.

“Os microsserviços de IA generativa surgem como uma inovação ágil e personalizada. Por meio dessa tecnologia, os desenvolvedores têm o poder de moldar o futuro das aplicações empresariais e poderão auxiliar as companhias na revolução da IA”, afirma Marcio Aguiar, diretor da divisão Enterprise da NVIDIA para América Latina.

Microsserviços CUDA-X para RAG, processamento de dados, proteções e HPC
Os microsserviços CUDA-X fornecem componentes de ponta a ponta para preparação, personalização e treinamento de dados para acelerar o desenvolvimento de IA de produção em todos os setores.

Para acelerar a adoção da IA, as empresas podem usar microsserviços CUDA-X, incluindo NVIDIA Riva, para IA personalizável de fala e tradução, NVIDIA cuOpt™, para otimização de roteamento, além de NVIDIA Earth-2, para simulações climáticas e meteorológicas de alta resolução.

Os microsserviços NeMo Retriever permitem que os desenvolvedores vinculem suas aplicações de IA a seus dados de negócios – incluindo texto, imagens e visualizações como gráficos de barras, de linhas e de pizza – para a geração de respostas contextualmente relevantes e altamente precisas. Com esses recursos de RAG, as empresas podem oferecer mais dados a copilotos, chatbots e ferramentas de produtividade de IA generativa para elevar a precisão e os insights.

Outros microsserviços NVIDIA NeMo serão disponibilizados em breve para desenvolvimento de modelos personalizados. Eles incluem NVIDIA NeMo Curator, para a criação de conjuntos de dados limpos para treinamento e recuperação, NVIDIA NeMo Customizer, para ajuste de LLMs com dados específicos de domínio, NVIDIA NeMo Evaluator, para análise de desempenho de modelos de IA, bem como NVIDIA NeMo Guardrails para LLMs.

O ecossistema potencializa plataformas empresariais com microsserviços de IA generativa
Além de liderarem fornecedores de aplicações, os provedores de plataformas de computação, infraestrutura e dados de todo o ecossistema da NVIDIA estão trabalhando com microsserviços da NVIDIA para levar a IA generativa para as empresas.

Os principais provedores de plataformas de dados, incluindo Box, Cloudera, Cohesity, Datastax, Dropbox e NetApp, estão trabalhando com microsserviços NVIDIA para ajudarem os clientes a otimizarem seus pipelines RAG e a integrarem seus dados proprietários a aplicações de IA generativa. Snowflake usa o NeMo Retriever para dominar dados empresariais e usá-los na criação de aplicações de IA.

As empresas podem implantar microsserviços da NVIDIA incluídos no NVIDIA AI Enterprise 5.0 na infraestrutura que preferirem, como as principais nuvens Amazon Web Services (AWS), Google Cloud, Azure e Oracle Cloud Infrastructure.

Os microsserviços da NVIDIA também são compatíveis com mais de 400 NVIDIA-Certified Systems, incluindo servidores e estações de trabalho da Cisco, Dell Technologies, Hewlett Packard Enterprise (HPE), HP, Lenovo e Supermicro. Em um anúncio a parte, a HPE informa a disponibilidade da solução de computação empresarial da HPE para IA generativa, com integração planejada do NIM e de modelos-base de IA NVIDIA ao software de IA da HPE.

Os microsserviços NVIDIA AI Enterprise estão chegando a plataformas de software de infraestrutura, incluindo VMware Private AI Foundation com NVIDIA. Red Hat OpenShift oferece suporte aos microsserviços NVIDIA NIM para ajudar as empresas a integrarem mais facilmente recursos de IA generativa em suas aplicações com recursos otimizados para segurança, conformidade e controles. A Canonical está adicionando suporte ao Charmed Kubernetes para microsserviços da NVIDIA por meio do NVIDIA AI Enterprise.

O ecossistema da NVIDIA de centenas de parceiros de IA e MLOps, incluindo Abridge, Anyscale, Dataiku, DataRobot, Glean, H2O.ai, Securiti AI, Scale.ai, OctoAI e Weights & Biases, está acrescentando suporte para microsserviços da NVIDIA por meio do NVIDIA AI Enterprise.

Apache Lucene, Datastax, Faiss, Kinetica, Milvus, Redis e Weaviate estão entre os provedores de pesquisas de vetor trabalhando com microsserviços NVIDIA NeMo Retriever para capacitar recursos de RAG responsivos para empresas.

{{post_title}}

SEM COMENTÁRIOS

DEIXE UMA RESPOSTA

Loading…

Here are the results for the search: "{{td_search_query}}"

No results!

{{post_title}}

ARTIGOS RELACIONADOS

PMEs registram crescimento de 11,5% no primeiro trimestre

Estudo aponta que indústrias perdem, em média, 323 horas de produção...

Gartner estima que 63% das empresas implementaram estratégia de ‘Zero Trust’

SEM COMENTÁRIOS

DEIXE UMA RESPOSTA Cancelar resposta

DEIXE UMA RESPOSTA