O termo "CPU", abreviação para Unidade de Processamento Central, existe desde a década de 1950. No coração de cada computador ou dispositivo inteligente está a CPU, executando incansavelmente os aplicativos tradicionais.
Desde a década de 1990, também temos a GPU, ou Unidade de Processamento Gráfico – originalmente criada para a tarefa especial de acelerar a computação gráfica na tela para estações de trabalho de engenharia, processamento de vídeo e jogos para acompanhar as expectativas extremamente exigentes do sistema visual humano. Devemos nossa sobrevivência à nossa capacidade de estar imediatamente alerta ao menor movimento ou anomalia visual – e isso sempre representou um grande desafio para o design da tela do cinema, da televisão ou do computador. Enquanto a CPU foi projetada para processar um fluxo linear de dados, a GPU foi projetada para processar uma experiência multidimensional, incluindo três dimensões de espaço mais as dimensões de cor e tempo. Na teoria, a CPU poderia lidar com isso, mas na prática seria muito lenta e imprecisa.
O fascinante sobre a GPU é que esta habilidade de processamento multidimensional acaba se tornando muito mais próxima das exigências da aprendizagem da máquina e do processamento de "big data". Algo originalmente criado para tornar os jogos de computador mais vívidos tornou-se uma parte vital dos atuais centros de dados que impulsionam a transformação digital.
E agora estamos ouvindo muito mais sobre as DPUs – Unidades de Processamento de Dados. Mas as CPUs e GPUs já não processam dados? A diferença é uma questão de "não é o que você faz, é a maneira como você o faz". A DPU desempenha um papel fundamental no gerenciamento da forma como os dados se movimentam através do centro de dados. E sim, ela contém sua própria CPU.
Aceleração através de redes inteligentes
Considere uma conferência diplomática internacional de alto nível. No interesse de total responsabilidade e precisão, pode-se insistir que as palavras de cada palestrante sejam transcritas em seu idioma nativo e passadas para todos os outros participantes, que então têm o trabalho de traduzir essas palavras exatas em seu próprio idioma. Mas isso não funciona assim – em vez disso, usamos intérpretes para dizer aos ouvintes o que foi dito, na sua própria língua. Os tradutores têm tempo para estudar dicionários, os intérpretes fazem seu trabalho rapidamente.
O papel do intérprete experiente e inteligente não é simplesmente fornecer uma tradução precisa, o trabalho requer outras habilidades. Primeiro, deve haver uma compreensão dos protocolos nacionais. O palestrante australiano pode usar a palavra "mate" (companheiro) como um gesto amigável, quando o intérprete sabe que haverá menos atrito diplomático se "mate" for substituído por "Vossa Estimada Alteza". Depois, há o entendimento de que frases familiares em uma cultura – digamos em inglês "it is not cricket" (isto não é honesto) – podem precisar de explicação para outras. Depois, é necessário acelerar a comunicação editando expressões como "ums and ers", pausas dramáticas e anedotas pessoais divagantes. Pode até mesmo haver alguma criptografia sutil: "nossos concorrentes europeus" podem ser codificados como "nossos aliados europeus". Por fim, no interesse da paz e da segurança global, algumas afirmações poderiam ser simplesmente esquecidas.
Em vez de sobrecarregar cada delegado com a tarefa de analisar páginas de transcrição, uma equipe de intérpretes habilidosos pode garantir que as mensagens essenciais sejam transmitidas da forma mais econômica para aqueles que precisam saber – ao mesmo tempo em que mantém um controle sobre as mensagens maliciosas. Os delegados, poupados de muitas dores de cabeça com traduções e protocolos, podem se concentrar melhor na diplomacia de alto nível.
Em um centro de dados tradicional, a rede nada mais é do que uma teia de cabos interligados por "switches" para fornecer dados de e para as CPUs, onde todo o processamento ocorre. Em um centro de dados moderno, a rede é conectada por DPUs que processam os dados em tempo real para reduzir a carga nas CPUs e liberá-las para o processamento de aplicativos pretendido. Elas desempenham um papel não muito diferente de uma equipe de intérpretes muito profissionais. Então, o que se encontra em uma DPU?
A DPU
A DPU é uma nova classe de processador programável, um sistema em um chip (SOC) que combina três elementos:
- Uma CPU multi-core, padrão da indústria, de alto desempenho, programável por software.
- Uma interface de rede de alto desempenho capaz de analisar, processar e transferir dados com eficiência na velocidade da rede.
- Um rico conjunto de mecanismos de aceleração flexíveis e programáveis projetados para descarregar tarefas de rede e otimizar o desempenho do aplicativo para IA e aprendizado de máquina, segurança, telecomunicações e armazenamento, etc.
Esse terceiro componente é especialmente significativo, porque pode ser comparado com as habilidades do intérprete perfeito descrito acima: um conjunto de funções que juntas servem para otimizar a eficiência, garantem que os dados certos vão no formato certo para o lugar certo ao longo da rota mais rápida e mais confiável. Ele também pode oferecer suporte à criptografia, bem como identificar tráfego anômalo ou malware e até mesmo iniciar uma resposta apropriada. Alguns fornecedores de "DPU" podem contar com processadores proprietários e outros esperam que a CPU faça todo o trabalho, mas a menos que todos esses três elementos estejam presentes, o dispositivo não deve ser chamado de DPU.
A DPU é normalmente integrada em um controlador de interface de rede (NIC) para criar o que é chamado de "SmartNIC". Os SmartNICs são componentes-chave dos centros de dados da próxima geração, o tipo necessário para impulsionar a revolução de dados que foi chamada de "A Quarta Revolução".
A Quarta Revolução
Alguns historiadores identificaram três revoluções principais na evolução da humanidade:
- A Revolução Cognitiva, por volta de 70.000 a.C., definiu o nascimento da linguagem e a capacidade de comunicação.
- A Revolução Agrícola, em torno de 10.000 a.C., definiu nossa capacidade de domesticar os animais de criação e cultivar colheitas para apoiar a ascensão das cidades.
- A Revolução Científica, durante o início do período moderno, foi quando os desenvolvimentos em matemática, física, astronomia e ciências lançaram as bases para nosso modo de vida moderno.
A quarta revolução é a inteligência artificial (IA), que pode realizar tarefas com níveis de desempenho sobre-humanos. O aprendizado de máquina avançado pode agora organizar, processar e extrair informações sutis, mas valiosas, de montanhas de dados coletados de milhões de usuários na Internet e na crescente "Internet das Coisas". Isso marca um passo fundamental para o desenvolvimento da verdadeira inteligência artificial e das possibilidades extraordinárias que isso possibilita.
Mesmo com o benefício das GPUs para processar os dados, o progresso tem sido retardado pela extrema carga que isso impõe às CPUs para acessar e compartilhar informações entre os computadores e manter as GPUs alimentadas com dados. Um desenvolvimento importante tem sido tornar a rede ainda mais rápida – mas isso tem sobrecarregado a CPU com tarefas de gerenciamento de dados. Mas agora com as DPUs tornamos a rede mais inteligente, como aquela equipe altamente profissional de intérpretes, de modo que a rede se torna um agente ativo no processamento geral de dados. As DPUs aproximam o processamento dos próprios dados e fazem com que a rede aja como um coprocessador, descarregando mão de obra do mecanismo de computação central.
A Transformação Digital é a aplicação comercial da Quarta Revolução. É por isso que em breve ouviremos muito mais sobre as DPUs.
Kevin Deierling, vice-presidente de Marketing, Unidade de Negócio de Redes da NVIDIA.