Lembra das fotos que você tirou durante as férias que ficaram guardadas na sua máquina? Um dia você pode querer ver de novo ou mandar para alguém. Mas, na maioria das vezes, essas fotos ficam apenas ocupando espaço. E isso acontece regularmente, até chegar o dia que você não terá ideia do que existe ali armazenado, devido à enorme quantidade de arquivos.
O mesmo ocorre em maior escala nas empresas. Os dados estão sendo salvos ou coletados todos os dias, e leva tempo para alguém perceber que há uma enorme quantidade de informações sem utilidade armazenadas nos servidores. Isso é o que chamamos de Dark Data. O Gartner define esses dados como os ativos de informações que as organizações coletam, processam e armazenam durante atividades comerciais regulares, mas geralmente não são usados para outros fins, como análises, relacionamentos comerciais e monetização direta.
Armazenar e proteger dados sem uso geralmente incorre em mais despesa (e às vezes maior risco) que valor. Ainda assim, a existência do Dark Data não pode ser ignorada. Segundo Heinz College, da Universidade Carnegie Mellon, cerca de 90% das informações corporativas se enquadram nesta categoria, pois as organizações geralmente retêm estes dados apenas para fins de conformidade.
Esse tipo de informação não deveria se limitar às questões regulatórias. Pode até ser bastante útil para obter insights aos tomadores de decisão. Nesse sentido, a análise de dados é fundamental. Saber qual tipo de dado será relevante e deverá ser armazenado é um diferencial que pode impactar diretamente nos gastos da empresa. Além disso, transformar esses dados em informações e insights de qualidade é outro ponto que também precisa ser levado em consideração.
Em uma pesquisa global de 2019 realizada pela Serasa Experian sobre qualidade de dados, constatou-se que 95% das empresas acreditam que a má qualidade das informações nas empresas impacta negativamente a interação com o consumidor, a reputação e a eficiência das operações. Dessa forma, fica cada vez mais evidente que a melhor maneira de lidar com a situação é aplicar uma base analítica sobre os dados antes mesmo de armazená-los, e quanto mais cedo essas informações forem estruturadas, mais cedo será possível saber o que deve estar disponível e o que deve ser armazenado.
Uma análise posterior também é possível. Com os bilhões de arquivos que muitas empresas guardam, não é possível fazer uma análise manual, mas existem várias ferramentas para este gerenciamento que usam tecnologias de ponta, como all-flash, Inteligência Artificial e machine learning para fazer esta análise, categorizando o que pode ser utilizado, e eliminando o que não tem utilidade à empresa. Esse gerenciamento de informações se torna essencial para o futuro dos negócios, pois permite acesso inteligente ao bem mais precioso da empresa e mantém a sua continuidade, fornecendo ferramentas de tomada de decisão à medida que avança o aumento da criação de dados.
Paulo de Godoy, country manager da Pure Storage Brasil.