Cientistas da IBM e USP criam simulador de mídias sociais que prevê impacto de campanhas

0

Pesquisadores do laboratório IBM Research e do Departamento de Computação do Instituto de Matemática e Estatística (IME) da Universidade de São Paulo (USP) desenvolveram um simulador capaz de prever o impacto das ações de comunicação de empresas e organizações em mídias sociais como Twitter e Facebook, com base nos padrões de comportamento dos usuários.

De acordo com os pesquisadores, prever o impacto que as campanhas terão nessas mídias sociais é um grande desafio, uma vez que elas apresentam um efeito altamente "viral".

Claudio Pinhanez, líder do grupo de pesquisa em sistemas de serviços da IBM Research Brazil, informa que a criação do método para modelar e simular as interações entre os usuários de redes sociais envolveu coleta de mensagens publicadas por 25 mil pessoas nas redes no Twitter do presidente dos Estados Unidos, Barack Obama, e de seu adversário político, Mitt Romney, em outubro de 2012, último mês da recente campanha eleitoral presidencial norte-americana.

Os pesquisadores analisaram o conteúdo das mensagens e o comportamento dos usuários nas redes de Obama e Romney, de modo a identificar padrões de ações, a frequência com que postavam mensagens, se eram mais positivas ou negativas e qual a influência dessas mensagens sobre outros usuários.

Com base nesses dados, desenvolveram um modelo de simulação de agentes – um sistema por meio do qual cada usuário avaliado é representado por programas individuais de computador que rodam integrados e simultaneamente – que indica as probabilidades de ação na rede de cada uma dessas pessoas, apontando qual o momento do dia mais provável para publicar uma mensagem positiva ou negativa com base em seu histórico de comportamento.

Uma das constatações nos experimentos com o simulador foi que a retirada dos dez usuários mais engajados nas discussões realizadas no Twitter do presidente teria mais impacto na rede social do que se o próprio Obama fosse excluído.

Pinhanez alerta que os resultados são preliminares e ainda não se pode afirmar que são válidos. "Servem, contudo, para demonstrar que o modelo é capaz de mostrar situações interessantes e que, quando estiver pronto, será muito útil para testar hipóteses e responder a perguntas do tipo 'será que a frequência com que o presidente Obama publica uma mensagem afeta sua rede social?'", diz ele.

Desafios no Brasil

Segundo os pesquisadores, um dos principais desafios para a análise de sentimento de mensagens publicadas nas redes sociais no Brasil é que o português usado nessas novas mídias costuma não seguir as normas cultas da língua portuguesa, e isso não se deve, necessariamente, ao fato de o usuário não dominar o idioma.

"Existem convenções de como se escrever de maneira cool nas redes sociais", disse Pinhanez. Por causa disso, um dos desafios no Brasil será o de incorporar o novo vocabulário surgido nesses fóruns.

Além disso, os textos são mais curtos e informais do que os publicados em sites de avaliações de filmes, por exemplo, como o do Internet Movie Database, em que os comentários são mais longos, mais bem formatados e rotulados.

"Com base nesse tipo de critério, podemos saber, de antemão, qual o sentimento do texto: se o usuário deu muitas estrelas para o filme é que ele está falando bem. E se deu poucas estrelas é porque sua avaliação foi negativa", disse à Agência Fapesp Samuel Martins Barbosa Neto, doutorando do IME e participante do projeto.

"A linguagem usada no Twitter é muito mais natural. Há muita expressão e variações de palavras, o que torna muito mais complicada a classificação das mensagens. Às vezes não se tem informação suficiente para assegurar que, de fato, um determinado tweet é positivo ou negativo, uma vez que ele não tem um rótulo que permita compará-lo com outros. Por isso, muitas dessas mensagens precisam ser rotuladas manualmente", explicou Barbosa Neto.

Outro desafio é extrair dados das redes sociais. No início, o acesso aos dados das mensagens de redes, como o Twitter, era totalmente aberto. Hoje, é limitado. Além disso, o número de informações geradas por redes sociais cresceu exponencialmente, impondo aos pesquisadores o desafio de extrair mostras significativas de grandes volumes de dados para validar suas pesquisas.

"A rede do Obama no Twitter deve ter chegado aos 25 milhões de seguidores. Como podemos apenas extrair uma pequena parte desses dados, o desafio é garantir que eles não sejam enviesados – representando, por exemplo, apenas um nicho de seguidores – para gerar um resultado válido", explicou Barbosa Neto.

O artigo Large-Scale Multi-Agent-based Modeling and Simulation of Microblogging-based Online Social Network, de Pinhanez e outros, pode ser lido nos anais do 14th International Workshop on Multi-Agent-Based Simulation.

(Com informações da Agência Fapesp)

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui

This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.