Posicionado no coração da família de produtos EMC, o Banco de Dados Greenplum 4.2 inclui a interconexão gNet de alto desempenho para Hadoop; melhoramentos na linguagem e da compatibilidade para uma migração mais rápida para Greenplum; backup mais simples e escalável com o EMC Data Domain Boost; um framework de extensão e funções analíticas In-Database prontas; e otimizações de desempenho específicas.
Para expandir as soluções que podem ser criadas para integração de dados e processamento, e executar consultas para análises complexas de missão crítica, os clientes buscam uma troca de dados mais eficiente e flexível entre o Banco de Dados Greenplum e Hadoop, em adição ao acesso de dados paralelo já existente.
Agora, a versão 4.2, segundo a EMC, permite a execução paralela de importação e exportação de dados com alto desempenho de todos os dados (estruturados e não estruturados) do Hadoop, usando a gNet para Hadoop, um meio de comunicação paralelo. Essa conquista representa a primeira interoperabilidade direta para consultas da indústria entre o Banco de Dados Greenplum e o Hadoop.
Uma nova funcionalidade chave do novo Banco de Dados Greenplum é a integração avançada com o sistema de armazenamento com desduplicação EMC Data Domain por meio do EMC Data Domain Boost, resultando em um backup mais rápido (de 10 a 30 vezes da redução média de dados) e eficiente.
Essa integração distribui parte do processo de desduplicação para os servidores do Banco de Dados Greenplum, permitindo que eles enviem dados únicos para o sistema Data Domain, aumentando a taxa de transferência agregada, reduzindo a quantidade de dados transferidos pela rede e eliminando a necessidade de criação e gerenciamento de drives virtuais (desduplicação in-line rápida com até 26.3 TB/hora de taxa de transferência; backup de até 173 TB em menos de oito horas).
Endereçando desempenho e gerenciamento, o Banco de Dados Greenplum proporciona uma plataforma ágil e extensiva para estudos analíticos In-Database, alavancando a arquitetura massivamente paralela do sistema. Com a versão 4.2, a solução permite estabelecer estudos analíticos In-Database por meio das extensões Greenplum, que podem ser baixadas pelo EMC Subscribenet e instaladas com o novo Greenplum Package Manager – um novo utilitário que garante a instalação e a atualização automática de extensões funcionais para simplificar a tarefa de habilitar e gerenciar funcionalidades avançadas In-Database em todo o cluster.
A versão 4.2 também suporta a eliminação do particionamento dinâmico e a otimização de memória em consultas, reduzindo os dados acessados durante uma consulta, acelerando o processamento das consulta e permitindo maior concorrência.