INTELIGÊNCIA ARTIFICIAL

Lixo entra, lixo sai: o papel do gerenciamento de dados em uma IA eficaz

Por

Marcos Tadeu

11 de janeiro de 2024

Há muitas informações por aí sobre como a inteligência artificial (IA) está impactando o gerenciamento de dados. Até eu já falei sobre esse tópico algumas vezes. Mas o que é menos falado é o inverso disso: o papel do gerenciamento de dados eficaz na IA.

É verdade que você pode usar plataformas como ChatGPT da OpenAI e Bard do Google para escrever um e-mail marketing ou melhorar as descrições de seus produtos sem se preocupar em como suas práticas de gerenciamento de dados afetam o resultado dessas ferramentas. Mas isso não é verdade quando a sua organização dá o próximo passo na sua jornada de IA e começa a usar ferramentas orientadas por IA para, por exemplo, suporte autônomo ao cliente, otimização da cadeia de abastecimento e resiliência cibernética (ou seja, identificar e prevenir crimes cibernéticos, como ransomware).

Alcançar a eficiência e a eficácia para atividades como essas exige que a IA gere resultados e tome medidas com base em seus próprios dados internos, seja na multinuvem híbrida ou no no ambiente on-premises. E se esses dados não forem gerenciados adequadamente, seus processos de negócios baseados em IA sofrerão as consequências. Para entender por que isso acontece, considere como funcionam os sistemas autônomos.

Autonomia não é a mesma coisa que automação

Autonomia indica que um sistema computacional é autossuficiente e não requer intervenção humana; ele pode aprender e se ajustar a ambientes dinâmicos e evoluir à medida que o ambiente ao seu redor muda. Automação, por outro lado, ocorre quando um sistema computacional está estritamente focado em uma tarefa específica com base em critérios bem definidos e restrito a determinadas tarefas que pode executar.

E o que torna a autonomia possível? IA. IA é a capacidade de um sistema computacional pensar essencialmente por si mesmo, da mesma forma que você e eu fazemos. O sistema usa matemática e lógica para imitar o raciocínio humano para aprender com novas informações e tomar decisões. É "aprender com novas informações" – formalmente conhecido como machine learning – que é a chave para o impacto de um bom gerenciamento de dados na IA.

Entra lixo, saí lixo

Assim como uma tomada de decisão humana depende de uma compreensão completa e precisa, o aprendizado de máquina depende de dados completos, organizados e precisos – o que você pode chamar de dados "bons". Sem ele, mesmo os melhores algoritmos são inúteis. Como diz o ditado: entra lixo, sai lixo.

No entanto, as estimativas sugerem que as organizações capturam apenas 56% dos dados potencialmente valiosos que criam. A pesquisa também descobriu que 77% dos dados que as organizações capturam são redundantes, obsoletos ou triviais (ROT) ou totalmente não classificados. Isso deixa apenas 23% de dados "bons" da quantidade já relativamente pequena que está sendo capturada para treinamento em seus processos de negócios orientados por IA.

Como consertar isso?

Capturar, classificar e limpar

Comece garantindo que você está capturando todos os seus dados potencialmente valiosos. Você pode pensar que já está fazendo isso, mas já considerou seus canais de mídia social, plataformas de colaboração em equipe, serviços de mensagens instantâneas e até mesmo comunicações de voz e vídeo dos funcionários? Na nova forma de trabalhar pós-pandemia de hoje, você precisa pensar fora da caixa para ter certeza de que não está perdendo nada que possa ajudar a construir conjuntos de dados mais completos.

Em seguida, certifique-se de não desperdiçar todos os dados capturados porque não estão classificados e armazenados adequadamente. Superficialmente, existem três etapas principais para isso:

Crie os conjuntos de definições, rótulos e grupos que você usará para organizar seus dados.
Aplique essa taxonomia aos seus dados.
Estabeleça um local único de fonte de verdade – também conhecido como SSOT (single source of truth) – Local para cada categoria de seus dados.

Finalmente, limpe seus dados para livrá-los do ROT. Dados redundantes podem dar à IA a impressão de que algo é mais importante do que realmente é porque se repete. Os dados obsoletos muitas vezes simplesmente não são mais necessário, fornecendo informações falsas à IA. E dados triviais podem produzir uma ou ambas as complicações anteriores.

Como bônus, todas essas três etapas para melhorar sua preparação para IA também ajudarão você a construir, executar e refinar a estratégia de conformidade e governança de dados de sua organização.

Na realidade

Claro, é mais fácil falar tudo isso do que fazer. Vivemos em um mundo onde o volume, a velocidade e a variedade dos dados – também conhecidos como os três Vs dos dados – estão em níveis sem precedentes:

Volume: O mundo está no caminho para produzir 120 zettabytes de dados em 2023.
Velocidade: são quase 4 milhões de gigabytes por segundo.
Variedade: Quase tudo o que fazemos tem um componente digital que produz dados em um formato ou outro.

Pode ser desafiador garantir que os conjuntos de dados nos quais seus processos de negócios baseados em IA dependem sejam tão completos, organizados e precisos quanto precisam ser. Na prática, você provavelmente precisará do auxílio de softwares e serviços especializados para fazer essas coisas de maneira eficiente e eficaz. Comece agora para estar preparado para aproveitar ao máximo a IA.

Marcos Tadeu, senior manager e sales engineering da Veritas Technologies no Brasil.

Cookie	Duração	Descrição
cookielawinfo-checkbox-analytics	11 months	Este cookie é definido pelo plug-in GDPR Cookie Consent. O cookie é usado para armazenar o consentimento do usuário para os cookies na categoria "Analytics".
cookielawinfo-checkbox-functional	11 months	O cookie é definido pelo consentimento do cookie GDPR para registrar o consentimento do usuário para os cookies na categoria "Funcional".
cookielawinfo-checkbox-necessary	11 months	Este cookie é definido pelo plug-in GDPR Cookie Consent. O cookie é usado para armazenar o consentimento do usuário para os cookies na categoria "Necessário".
cookielawinfo-checkbox-others	11 months	Este cookie é definido pelo plug-in GDPR Cookie Consent. O cookie é usado para armazenar o consentimento do usuário para os cookies na categoria "Outros".
cookielawinfo-checkbox-performance	11 months	Este cookie é definido pelo plug-in GDPR Cookie Consent. O cookie é usado para armazenar o consentimento do usuário para os cookies na categoria "Desempenho".
viewed_cookie_policy	11 months	O cookie é definido pelo plug-in GDPR Cookie Consent e é usado para armazenar se o usuário consentiu ou não com o uso de cookies. Ele não armazena nenhum dado pessoal.

Panorama do IoT no Brasil

Conheça os investimentos em cybersegurança das empresas no Brasil

Desafios da jornada do cliente em serviços financeiros

Saiba como usar os novos recursos de tecnologia para se relacionar…

Digital Workplace: Working anywhere ressignificando o trabalho

DEIXE UMA RESPOSTA Cancelar resposta