Na área de Tecnologia da Informação uma das práticas mais comuns é a extração e consolidação de dados de várias fontes em uma base de dados para a realização de consultas nas tomadas de decisões. A tecnologia vem conduzindo esse processo de transformação de dados em informações, e essas em conhecimento. Neste caso, os assim chamados “Metadados” são essenciais para a gestão do repositório, mantendo e incluindo informações como: origem dos dados, sistemas de origem, versões, responsável pelo dado, cálculos efetuados em sistemas envolvidos etc. Tais informações acrescidas aos dados, têm como objetivo tornar mais fácil a sua organização e facilitar o entendimento dos seus relacionamentos.
No termo Metadado – o seu antepositivo “Meta” tem origem grega e significa “além de, depois”. Assim, podemos definir Metadados como dados sobre dados, ou seja, são informações ou conjuntos de dados que descrevem e fornecem informações sobre outros dados – os Metadados vão além dos dados. E Gerenciamento de Metadados envolve a gestão desses dados sobre outros dados.
Os Metadados podem ser do tipo Estruturados e Não Estruturados. Os Estruturados, apresentam dados em formatos específicos. Um exemplo seria um SGBD – Sistema de Gerenciamento de Banco de Dados, sendo possível prever o tipo de dado que é inserido em um campo de uma tabela. Os Não Estruturados, apresentam dados que não seguem uma regra específica, não possuem uma estrutura definida e tem baixa integridade. Como exemplos podem-se citar documentos, imagens, posts em redes sociais, dados não relacionais dentre outros. Os Metadados podem ser divididos em duas categorias básicas:
- Metadados de Negócios: descrição de dados necessários pelos usuários de negócios, para entender o contexto do negócio e o significado dos dados. Como exemplos podem-se citar os processos e regras de negócios, sistemas e aplicações.
- Metadados Técnicos: descrição dos dados necessários para as diversas ferramentas que precisem armazenar, manipular ou movimentar dados. Como exemplos podem-se citar elementos de BD, triggers, modelos fisicos, tabelas, campos e aspectos de armazenamento.
A necessidade de um Gerenciamento de Metadados mais sofisticado e preciso, é uma preocupação crescente para um grande número de organizações. Quase todos os componentes que compõem a moderna tecnologia da informação, das ferramentas CASE, motores ETL, Warehouses, BI, bem como repositórios de Metadados, contêm, e muitas vezes derivam seu processamento de Metadados.
Metadados são usados para descrever e fornecer o conhecimento necessário para gerenciar, manter e aprimorar os ambientes tecnológicos.
Um sistema de Gerenciamento de Metadados, é uma ferramenta chave em qualquer processo de Governança de Dados.
O Gerenciamento de Metadados é essencial para resolver uma grande variedade de desafios técnicos e de negócios dentro de uma organização. Eles incluem, mas não estão limitados a, como os valores dos relatórios são calculados, entendimento do impacto das mudanças nos dados, relatórios de linhagem de dados e fornecimento de relatórios de todos os Metadados de uma empresa para análise e melhoria.
Conforme apresentado na figura acima, na atual versão do guia DAMA-DMBOK, é recomendado em seu framework um conjunto integrado de dez funções de gestão de dados, sendo o Gerenciamento de Metadados representado como uma dessas funções.
Como principais benefícios na adoção de um Gerenciamento de Metadados podemos citar:
- Rastreabilidade de ponta a ponta e uma maior transparência dos dados;
- Auxílio no gerenciamento de riscos para manter a conformidade;
- Agilidade na visão de dados;
- Maior agilidade em projetos de gerenciamento de mudanças, migração e análise de impacto de mudanças;
- Tradução dos dados em termos comerciais – Glossário de Negócios;
- Aumento da confiança nas informações armazenadas;
- Conformidade dos dados através do controle de modelos, comparações e relatórios;
- Melhora a Governança de Dados e a normalização de dados através do suporte a padrões de Metadados;
- Fornece colaboração.
Existem ferramentas tecnológicas que auxiliam muito todos esses desafios no Gerenciamento de Metadados. A ORACLE possui o OEMM – Oracle Enterprise Metadata Management que foi projetado para resolver todas as necessidades e desafios das organizações no que diz respeito a Gerenciamento de Metadados. Seus principais recursos incluem:
- Atendimento a Governança de Dados;
- Relatório para Linhagem de Origem;
- Análise de impacto;
- Versão do modelo;
- Anotações e marcação;
- Suporta padrões de metadados;
- Glossário de Negócios compatível com o ISO 11179;
- Importação de metadados de BI de terceiros;
- Importação de metadados ETL de terceiros;
- Importação de metadados de Banco de Dados de terceiros;
- Habilitado para Big Data.
O OEMM é uma solução de Gerenciamento de Metadados avançada, porém, muito simples de usar. É uma solução imprescindível para as organizações que desejam compreender o impacto das mudanças nos dados e sua rastreabilidade, exibir relatórios de linhagem de dados ou aumentar a confiança nas informações armazenadas gerenciando os riscos e mantendo a conformidade.
Transformar os dados em informações e insights de negócios é um desejo de muitos gestores. Saber quais informações estão disponíveis, onde estão localizadas, de que forma são manipuladas e onde podem ser distribuídas, são apenas alguns dos desafios. É claro que no dia a dia, a tarefa é mais complexa do que parece. Afinal, o volume de informações que são geradas e circulam dentro e fora das organizações é enorme. Dependendo da forma como esses dados são capturados e armazenados fica complicado descobrir e analisar o que realmente é relevante para o negócio. E nessas horas, contar com apoio de ferramentas tecnológicas, respondendo aos desafios, sempre é um bom caminho.
Ricardo Toledo, pré-vendas de soluções para Governaça de Dados na Oracle.