Ferramentas DAPP

FGV DAPP lança novo caderno sobre metodologia de identificação de robôs

Estudo refina a Metodologia DAPP e traz a sua aplicação em quatro casos: a exposição do Queermuseu, o debate pré-eleitoral no Paraguai, as discussões sobre oito atores políticos brasileiros e o julgamento do ex-presidente Lula

há 1 mês

O desenvolvimento de novas técnicas faz com que os robôs ganhem gradativamente mais sofisticação e adquiram cada vez mais características humanoides, o que tornam o seu comportamento mais complexo e dificultam a sua identificação. Para acompanhar o progresso da automatização, a FGV DAPP continuamente refina seus parâmetros de identificação de contas automatizadas com o aporte de métodos estatísticos que conferem rigor a esse processo de checagem. É neste contexto que a Diretoria lança o caderno “Robôs, redes sociais e política no Brasil – Volume 2”.

Além de refinar a Metodologia DAPP de identificação de contas automatizadas, o estudo traz a sua aplicação em quatro casos: a exposição do Queermuseu, o debate pré-eleitoral no Paraguai, as discussões sobre oito atores políticos brasileiros e o julgamento do ex-presidente Lula. Em todos eles foi observada presença significativa de robôs.

Com melhores recursos para essa identificação, é possível, de forma mais precisa e acurada, reconhecer padrões, grupos de dispersão e características de replicação de conteúdos na rede. Em resumo, fica mais fácil encontrá-los, ainda que se escondam muito bem. E fica igualmente mais fácil dispor de ferramentas que ajudem a proteger o debate democrático na internet.

Os estudos aplicados evidenciam o desafio que se apresenta às instâncias responsáveis por zelar pela lisura do processo eleitoral de modo a resguardar a sua transparência e a favorecer o seu accountability.

Desde a publicação do primeiro estudo sobre o tema, “Robôs, Redes Sociais e Política no Brasil – Volume 1”, em agosto de 2017, em pelo menos quatro momentos foi identificada presença significativa de robôs interferindo de modo ilegítimo no debate público: (1) a polêmica envolvendo a exposição do Queermuseu, ocorrida em Porto Alegre; (2) o debate pré-eleitoral no Paraguai com vistas às eleições em abril deste ano; (3) as discussões sobre oito atores políticos brasileiros em um contexto pré-eleitoral no final de 2017; e (4) o julgamento do ex-presidente Lula no Tribunal Regional Federal da 4ª Região (TRF-4), ocorrido no final de janeiro de 2018.

A exposição do Queermuseu

O levantamento realizado pela FGV DAPP sobre o cancelamento da exposição “Queermuseu – cartografias da diferença na arte da brasileira”, em Porto Alegre, coletou 778 mil postagens, no Twitter, entre a 0h de 08 de setembro e as 12h de 15 de setembro de 2017. O mapa de interações gerado a partir dessa base identifica os dois grupos em oposição no debate: em azul, aqueles que eram contrários à exposição; em vermelho, aqueles que defenderam a continuidade da mostra.

Conforme a plataforma utilizada para a produção dos tuítes ou o padrão temporal de publicação da mesma conta, foram identificados perfis que atuaram automaticamente no debate. Cerca de 12,97% das interações do cluster azul tiveram indicação de atividade de robôs (pontos em preto), e 7,16% das interações do cluster vermelho. No total, 8,69% das interações do grafo foram identificadas como provenientes do uso de robôs na discussão geral sobre a exposição.

O debate pré-eleitoral no Paraguai

A FGV DAPP mapeou o debate sobre as prévias partidárias paraguaias que ocorreu no Twitter entre os dias 1o e 30 de novembro de 2017 para identificar robôs nessas discussões. Foram analisados cerca de 270 mil tuítes relacionados ao debate, com a presença pontual de robôs sobretudo no debate entre correligionários do Partido Colorado, do então presidente Horacio Cartes.

O grafo exposto a seguir representa o debate sobre as primárias do partido e mostra uma clara polarização entre os grupos de apoio ao ex-ministro Santiago Peña (em vermelho, representando 15,9% do debate), candidato continuísta, e Mario Abdo Benitez (em azul, com 8,85% das discussões). As demais contas analisadas se concentram em perfis de imprensa (cerca de 70% do total).

Algumas contas automatizadas com finalidade de promoção de candidatos foram encontradas na análise. Os robôs possuíam fins eleitorais e trabalhavam aumentando o engajamento e a possível disseminação de tuítes em favor de um candidato ou uma ala do partido. Foram identificados 4.977 robôs, motivando direta e indiretamente 14% das interações totais da rede analisada; 13,35% das interações do grupo vermelho; e 49,87% das interações do grupo azul.

Julgamento do ex-presidente Lula

O julgamento do ex-presidente Lula no dia 24 de janeiro pelo Tribunal Regional Federal da 4a Região (TRF-4) gerou 1,21 milhão de menções no Twitter no Brasil sobre assunto em apenas 24 horas. O mapa de interações mostra que esse debate foi dividido em três principais grupos: o azul, a favor da condenação do ex-presidente, corresponde a cerca de 35,4% das contas que integraram o debate; o vermelho, responsável por 44,1%, é composto, em sua maioria, por atores que se opõem à condenação de Lula; o verde (15,3%), por sua vez, é majoritariamente formado por perfis e tuítes de tom humorístico.

A FGV DAPP identificou 8% de robôs no grupo vermelho e 6% no grupo azul. Em ambos os núcleos de postagens automatizadas, predominam retuítes de publicações dos principais influenciadores de cada núcleo — e não tuítes originais feitos por robôs — e de veículos cuja produção de conteúdo é abertamente partidária, mas não necessariamente empenhada na divulgação de notícias e informações falsas.

Atores políticos

Neste estudo de caso, inclui-se, experimentalmente, um terceiro critério de identificação de robôs, além dos dois já utilizados nos demais casos. Para isso, foram coletados os debates que ocorreram no Twitter no período de um mês (18 de novembro a 17 de dezembro de 2017) sobre oito atores políticos: Lula, Jair Bolsonaro, Ciro Gomes, Marina Silva, Michel Temer, João Doria, Geraldo Alckmin e Gilmar Mendes. A partir daí, seguiu-se a aplicação da Metodologia DAPP acrescida do terceiro critério:

1. Primeiro critério: foi verificado o uso de plataformas geradoras de tuítes, conforme descrito no estudo “Robôs, Redes Sociais e Políticas no Brasil” (RUEDIGER, 2017a);
2. Segundo critério: foi observado o tempo não humano das publicações;
3. Terceiro critério: foram verificadas as contas que produziram exatamente os mesmos tuítes, o chamado método de correlação por mensagens idênticas, um forte indício de automatização de uma conta e que também permite verificar as redes de robôs (botnets) operando em conjunto.

Mapa de interações relacionadas aos atores políticos (731.844 tuítes | 0h de 18/11 às 23h59 de 17/12)

Foram selecionados então os tuítes criados por contas que geraram pelo menos cinco tuítes durante o período analisado e verificou-se qual o percentual de correlação entre cada possível par de contas (proporção de mensagens idênticas feitas pelas duas contas). Este limite mínimo de cinco tuítes por conta procura evitar falsos positivos, uma vez que a possibilidade de correlação é inversamente proporcional ao volume de tuítes. Após este recorte, foram analisados 731.844 tuítes (81,85% do total coletado).

Mapa de interações relacionadas a Jair Bolsonaro

O grupo verde, com 51,96% do total das contas analisadas, tem como principal característica o apoio ao deputado Jair Bolsonaro. Como evidenciado no grafo, o grupo tem alta concentração de contas suspeitas: dos 101 mil perfis do grupo, 915 são suspeitos e estiveram presentes em 33% das interações no grupo.

Mapa de interações relacionadas a Lula

O grupo vermelho, com 27,58% das contas presentes no mapa de interações, consiste no apoio ao ex-presidente Lula. Assim como no grupo de apoio a Bolsonaro, há grande concentração de contas suspeitas: 724 perfis, que estiveram presentes em 27% das interações deste grupo.

O grupo cinza, com 6.74% dos nós desta rede, também tem posição de apoio a Lula, mas é constituído majoritariamente por contas argentinas, que aparentemente mantêm apoio à ex-presidente Cristina Kirchner. Esta comunidade tem 36 contas suspeitas que estiveram presentes em 12% das interações.

Mapa de interações relacionadas a Ciro Gomes e Marina Silva

Já os retuítes das contas oficiais de Ciro Gomes e Marina Silva formaram um grupo comum para ambos. Composto por 3,2% das contas nesta rede, o grupo teve 26 contas suspeitas que estiveram presentes em 3,5% das interações.

Mapa de interações relacionadas a Ciro Gomes e Marina Silva

Os retuítes das contas de Michel Temer, João Doria, Geraldo Alckmin e Gilmar Mendes formaram um grupo comum com 7,19% das contas presentes na rede analisada. Este grupo tem 84 contas suspeitas, que estiveram presentes em 2% das interações da comunidade.

 


Veja mais sobre: , ,