Nesta série de três artigos abordaremos a Inteligência Artificial de forma descomplicada e pragmática, trazendo uma introdução a conceitos, metodologias e ferramentas de utilização prática.
Evitando entrar em tecnicismos (além dos estritamente necessários), a série é voltada para profissionais que possuem o desafio de considerar a implementação da IA em suas organizações.
Neste primeiro artigo – Desvendando a IA – apresentamos os conceitos fundamentais que ajudarão a compreender a IA como ela é na realidade, distinguindo da imagem de ficção científica que envolve o assunto.
Parte I – Desvendando a IA
Em seu atual estágio de aplicação prática, a Inteligência Artificial (IA) consiste em uma variedade de técnicas de predição. Predição é o processo que possibilita a obtenção de informações que você não possui a partir de informações que você possui. Essa pode parecer uma definição simplista para uma tecnologia tão impressionante, mas é de fato a sua essência, como veremos a seguir.
Por exemplo, uma aplicação de IA que reconhece se uma determinada imagem é de um gato, primeiro teve acesso a uma grande quantidade de imagens sabidamente de gatos, de forma a reconhecer padrões comuns a todas as imagens de gatos. Com isso, diante de uma imagem nova, que você não sabe do que se trata, a aplicação de IA busca pelo "padrão gato" e o resultado é a predição de a imagem nova ser de um gato.
Aqui é importante fazermos uma diferenciação entre Inteligência Artificial e Inteligência Artificial Geral. Esta última simula a inteligência humana de forma plena, executando tarefas como raciocínio abstrato, formulação de conceitos, planejamento estratégico e é ainda objeto de pesquisa e de ficção científica.
Como a capacidade dos sistemas para tratar grandes quantidades de dados e diversidade de padrões é finita, a maioria das aplicações de IA é especializada em um único tema (p.ex. reconhecimento de imagens de gatos).
Dentre as técnicas abrangidas pela IA, a Aprendizagem de Máquina tem sido a utilizada na ampla maioria das aplicações. A Aprendizagem de Máquina permite que computadores trabalhem com um determinado tema, sem terem sido explicitamente programados nele.
No nosso exemplo de reconhecimento de imagem de gatos, não é necessário programar o computador com o "padrão gato". O computador extraiu o padrão gato a partir de um grande conjunto de imagens sabidamente de gatos e com isso "aprendeu" a predizer se uma determinada imagem é ou não de um gato.
Existem vários modelos de implementação da Aprendizagem de Máquina, dentre os quais citamos dois mais comuns:
– Aprendizagem Supervisionada: o nome deriva do fato de que se baseia em um grande conjunto de dados previamente identificados (por um humano) e sua principal aplicação é fornecer uma predição de um dado novo ser (ou não) compatível com o conjunto de dados conhecidos. P.ex. reconhecimento de imagens.
– Aprendizagem Não Supervisionada: como o nome sugere, neste modelo os dados não foram previamente identificados e sua principal aplicação é fornecer uma predição de um dado pertencer ou relacionar-se a um determinado grupo, por apresentar um mesmo padrão. P.ex. segmentação de clientes.
Na IA os dados possuem um papel fundamental e são divididos em três categorias:
– Dados de Treinamento: são usados para a aplicação identificar características ou correlações em um conjunto de dados de forma a "aprender" que um dado pertence a um determinado grupo ou tem uma relação definida com outros dados do conjunto.
– Dados de Entrada: são os dados novos submetidos à aplicação e que desejamos saber se pertencem a um determinado grupo ou se tem relação com outros dados, com base no que foi aprendido pela aplicação.
– Dados de Feedback: a predição feita pela aplicação sobre os dados de entrada, indicando pertencerem um grupo ou terem relação com outros dados, retorna para a própria aplicação para refinar o processo de aprendizagem.
Quanto maior for a quantidade de dados melhor será a qualidade da predição. Uma quantidade grande de dados de treinamento é importante para que a aplicação ofereça bons resultados desde o início. E à medida que a aplicação é usada, submetida a dados de entrada e gerando dados de feedback, a predição tende a melhorar.
Além de revelar informações até então desconhecidas a partir de dados conhecidos, um outro objetivo importante da IA é automatizar tarefas. Para isso, as aplicações precisam ser capazes de usar as predições para a tomada de decisões, o que implica na capacidade de fazer julgamentos.
Para entendermos o julgamento vamos considerar um exemplo onde a IA é usada para predizer se uma mensagem de e-mail é spam e direcioná-la para a caixa de entrada ou para a caixa de spam. Remeter uma mensagem legítima para a caixa de spam pode resultar no usuário descartar algo importante. Por outro lado, encaminhar uma mensagem de spam para a caixa de entrada pode levar o usuário a perder tempo com algo indesejado. A aplicação de IA precisa então ponderar o resultado da ação de direcionamento da mensagem em função da consequência que ela trará para o usuário, ou seja, fazer um julgamento para executar a melhor ação possível.
De maneira geral, o julgamento por uma aplicação de IA pode ocorrer por deliberação ou por experimentação. Por deliberação, se for possível associar previamente a cada predição uma ação correspondente. Por experimentação, usando tentativa-e-erro, com o acompanhamento de um humano, até a IA "aprender" qual a ação que um humano executaria diante das predições possíveis e, depois, poder dispensar o acompanhamento.
Dado, predição e julgamento são os elementos fundamentais da IA. Com a utilização de técnicas e modelos adequados, podemos obter informações valiosas, até então desconhecidas, a partir de dados que estão à disposição da empresa, bem como automatizar inúmeras tarefas, por mais complexas que sejam.
Nos próximos dois artigos trataremos da avaliação da aplicabilidade da IA em um negócio e do planejamento adequado para que uma iniciativa de IA tenha maiores chances de ser bem-sucedida.
Igor Ramos Rocha, Consultor de Empresas em Tecnologia.