"Existem temas mais recorrentes entre aqueles que acompanham a jornada da privacidade de dados no Brasil, porém um que está mais ligado a pós adequação da regulamentação e que representa o momento, diz respeito a análise massiva de dados", disse Pedro Iorio, advogado de Artese Advogados, que fez uma palestra na 5ª edição da Data Protection Forum, nesta terça-feira, 27, no WTC-SP.
Como explicou o especialista, dentro desse aspecto de análises de dados de uso massivo, representada pelo tratamento em amplo sentido, como coleta, armazenamento e uso posterior, realidade das empresas que vivem de dados, é utilizada como diferencial de competitividade. O avanço do uso do analytics pelas organizações como solução para impulsionar seus processos de negócio e insights, traz consigo uma pressão regulatória sobre estes datalakes.
"Começamos a ter um novo cenário para todas as empresas, até as mais convencionais, diante dessa realidade da massificação de dados. Ressaltando que dessa nova realidade há a geração advinda do acúmulo de dados ( quanto maior a atividade do tratamento de dados seja pessoais ou não de forma geral) gerando a criação de repositórios cada vez maiores e a dificuldade que representam", esclareceu Iorio.
Segundo ele, a fim de atender à LGPD, organizações que possuem datalakes precisam fornecer transparência sobre o tratamento de dados pessoais. Neste contexto, a coleta e o uso de metadados, capazes de descrever os tratamentos realizados sobre os dados, tornam-se essenciais. Este trabalho aborda o problema da coleta de metadados em datalakes e apresenta o desenvolvimento de um fluxo de ingestão de dados, o qual possibilita a extração de metadados de proveniência e seu armazenamento em um repositório de dados. Dessa forma, torna-se possível a execução de consultas e análises para fins de monitoramento do cumprimento da LGPD, por exemplo.
"Neste novo capítulo da privacidade de dados, sob a ótica das propostas tecnológicas, a fim de buscar soluções, surgem os desafios que carecem ainda de observações para se formar mais bases regulatórias no futuro que atendam a cada especificidade", ponderou Iorio.
Conforme o especialista, o próprio modelo exige das companhias atenção básica seja no processo de implementação ou aprimoramento datalakes, como um todo, que traz desafios e pontos de atenção. Entre eles, destaca a estruturação do data lake propriamente, depois decidir o que será feito com os dados já em armazenamento ou processamento, examinando a variedade e tamanho dos dados e a finalidade geral desta empreitada e finalmente é ter presente que todo esse processo (de implementação e gestão de datalakes) exige uma governança e compliance, porque tanto a coleta/armazenamento quanto o acesso interno aos dados precisam seguir regras — sejam elas de códigos de ética corporativos (dependendo do setor da empresa), de um regimento interno e principalmente das leis como a LGPD e a GDPR.