A IBM anunciou nesta semana novas tecnologias baseadas no Hadoop como parte de sua estratégia para permitir que as empresas acelerem a conversão de dados e os transforme em informações valiosas para o negócio. A companhia vai oferecer ferramentas de aprendizado de máquina (ou machine learning) e outros novos recursos que podem ser executados através de dados em larga escala por meio de novos módulos incorporados ao seu sistema de big data IBM BigInsights para Apache Hadoop.
Um número crescente de organizações hoje reconhece o Apache Hadoop como uma tecnologia poderosa para coletar e armazenar um conjunto muito grande de dados, altamente variáveis, mas ainda lutam para realizar o seu pleno potencial em cada área do seu negócio. Como o tamanho e complexidade das aplicações Hadoop continuam a crescer, a ciência de dados tornou-se uma função crítica para obtenção de conhecimentos significativos e identificar ações que possam melhor os resultados em todo o negócio.
O IBM BigInsights inclui um amplo conjunto de ferramentas de ciência de dados para consulta e análise de dados. "Há tantos dados, que muitas vezes é difícil para as empresas encontrarem as informações que realmente importam", disse Anand Mahurkar, CEO da Findability Sciences, fabricante de software de busca e gestão de informações que trabalha em parceria com a IBM. "O novo IBM BigInsights ajuda a conectar os elementos de dados que muitas vezes passam pela descoberta do contexto para o relacionamento com o cliente, por exemplo. Alguns de nossos clientes conseguiram uma retenção de clientes de até 25% com esta compreensão reforçada."
Novos módulos
O novo IBM BigInsights incorporou três novos módulos: o BigInsights Analyst, que inclui o mecanismo de processamento SQL e a planilha intuitiva que permitem explorar e visualizar grandes volumes de dados, de forma rápida e fácil; o BigInsights Data Scientist, que traz um novo recurso de aprendizado de máquina, além de mais de uma dúzia de algoritmos específicos, tais como o PageRank e Clustering para ajudar a resolver problemas complexos; e o BigInsights Enterprise Management, que integra novas ferramentas de gestão para a alocação de recursos e otimização de fluxos de trabalho.
A IBM também anunciou a IBM Open Platform para o Apache Hadoop, que como o próprio nome diz é uma plataforma de código aberto que fornecer os dados necessários, controle de acesso e autenticação.
A ideia com essas soluções baseadas em Hadoop é oferecer uma plataforma coesa de análise mais ampla e uma visão dos dados. "Num mundo em rápida transformação, a capacidade de transformar dados em percepções pode ser a diferença entre o sucesso e o fracasso", diz Beth Smith, diretora geral de plataformas analíticas da IBM. "Com os novos módulos, nossa capacidade de atender às necessidades dos cientistas de dados e melhorar o acesso para uma comunidade mais ampla de analistas, é o valor que nossos clientes esperam de um sistema de big data."