Nvidia amplia recursos de computação visual e reforça aposta no conceito de deep learning

0
0

A Nvidia colocou o conceito de deep learning definitivamente no centro de sua estratégia de mercado. O anúncio foi feito na terça-feira, 17, pelo cofundador e CEO da companhia, Jen-Hsun Huang, durante a abertura da GPU Technology Conference (GTC 2015), seu encontro anual de desenvolvedores, que acontece esta semana em San Jose, na Califórnia, quando apresentou o novo portfólio de plataformas para aplicações de deep learning e redes neurais.

O conceito, derivado de um conjunto de tecnologias computacionais para o reconhecimento de voz e imagens e o processamento de linguagem natural, tomando como base a forma como o cérebro humano aprende e reconhece padrões, já vem sendo aplicado em campos tão diversos como identificação de novas moléculas para a concepção de drogas e até pela Apple, em seu assistente virtual de voz Siri, e o Google, em seu projeto de mapeamento de ruas Street View, que usa o reconhecimento de imagem para identificar endereços específicos.

A estratégia de deep learning da fabricante de placas gráficas de alto desempenho está apoiada em quatro soluções: a unidade de processamento gráfico (GPU) Titan X, a Digits DevBox, máquina fabricada especialmente para a pesquisa e desenvolvimento de deep learning, a GPU de última geração Pascal, e o Nvidia Drive PX, plataforma para carros autônomos baseada no processador Tegra X1.

Mais conhecida por placas de processamento gráfico para videogames e PCs, a Nvidia tem como alvo com os novos sistemas, além de segmentos que fazem uso intensivo de processamento gráfico, como mídia e entretenimento e vídeo e imagem, nichos de mercado que necessitam de processadores matemáticos para gerar algum dado, tais como de energia, petróleo e gás, bem como big data e computação em nuvem, entre outros.

O carro-chefe dessa estratégia é a Digits DevBox, máquina equipada com quatro GPUs Titan X, desenvolvida para tarefas de treinamento de classificação de imagens por computador. Ela vem com o software Digits (sigla para Deep Learning GPU Training System), que permite projetar, treinar e validar redes neurais. "Ela pode processar dados, configurar uma rede neural profunda, monitorar o progresso ao longo do caminho e visualizar camadas", explica Huang. "É o máximo de desempenho de uma GPU a partir de uma tomada de parede", afirma, ressaltando as dimensões do equipamento. Segundo ele, os primeiros resultados têm sido fantásticos. "Há depoimentos elogiosos de executivos do Flickr e do Facebook."

O CEO da Nvidia ressalta que a Digits DevBox não é uma máquina destinada ao chamado mercado de massa e que não será vendida aleatoriamente, mas a pesquisadores que tiverem projetos ligados a inteligência artificial, reconhecimento de imagens e redes neurais de computadores. O preço do equipamento em sua configuração básica é de US$ 15 mil e estará disponível a partir de maio. "É um preço a um nível que todos os pesquisadores podem pagar", acredita Huang.

Carros autônomos

Outra plataforma de deep learning apresentada pelo CEO da Nvidia é a Drive PX, destinada a carros autônomos, segmento do mercado no qual a empresa também tem apostado fortemente, com o lançamento da placa Tegra X1, desenvolvida para levar a capacidade de "aprendizado" a carros autônomos. Também prevista para estar disponível no mercado em maio, a plataforma tem preço na faixa de US$ 10 mil e conta com duas GPUs Tegra X1, com desempenho de 2,3 teraflops de dados.

De acordo com Huang, a Drive PX está sendo desenvolvida para o crescente número de montadoras que estão colocando — ou pretendem colocar em breve ­— carros autônomos no mercado. O denominador comum, segundo ele, é que todos esses projetos contam com a tecnologia de GPU da Nvidia para processar e analisar, em tempo real, os dados em streaming a partir de sensores e câmeras instaladas nos carros.

Outro componente importante na estratégia de deep learning da Nvidia é a GeForce Titan X, também anunciada durante evento. A GPU opera com 8 bilhões de transistores e foi desenvolvida com base na arquitetura de GPU Maxwell. Ela já está disponível e custa US$ 999. Segundo Huang, a Titan X é a GPU mais avançada criada pela Nvidia e oferece o dobro do desempenho e de eficiência de energia que sua antecessora, a GeForce GTX 980, combinando 3.072 núcleos de processamento, com pico de desempenho de 7 teraflops de dados.

Para comprovar a capacidade da nova GPU, Huang apresentou uma animação feita com o Unreal Engine 4, software da Epic Games. Nele, um garoto persegue uma pipa em um cenário com 15 milhões de folhas de plantas por uma área de 258 quilômetros quadrados, com qualidade visual perfeita. Segundo Huang, isso ajuda a entender para onde a computação gráfica está indo.

O CEO da Nvidia também mostrou o trabalho que vem sendo feito por pesquisadores da Universidade de Stanford, chamado "Automated Image Captioning with ConvNets and Recurrent Nets" (captura automatizada de imagem com redes neurais recorrentes e redes convolucionais, topologias de redes neurais).

Quem explica é Andrej Karpathy, pesquisador da Universidade de Stanford que está por trás desse trabalho. "A ciência por trás disso é complicada, mas o resultado final é fácil de entender." Ele exibe fotos em uma tela e mostra como a rede as identifica com base em 500 mil imagens. Uma delas, por exemplo, mostra a imagem de um peixe voando sobre o mar, que é identificado como "um pequeno pássaro branco voando sobre a água".

Karpathy diz que ainda se "perde algo na escrita", mas observa que essas distorções são comuns num projeto inicial e, mesmo assim, se diz perplexo com o trabalho. Ele explica que as redes neurais são treinadas para captar milhares e até milhões de imagens e vão ficando "mais inteligentes" até que sejam capazes de identificar imagens corretamente. De fato, estudos mostram que, nos últimos cinco anos, a taxa de erro caiu de 25% para apenas 4%.

*O jornalista viajou a San Jose a convite da empresa.

Deixe seu comentário