quarta-feira, 27 de agosto de 2014

Quem são os formadores de opinião nessas eleições?

Em nosso último post, Conheça os temas de maior impacto no Twitter envolvendo candidatos à presidência, nós apresentamos os principais temas relacionados às eleições presidenciais discutidos no Twitter pela população brasileira. No post de hoje, apresentaremos as pessoas que mais tiveram impacto nessas discussões e que foram mais comentadas e/ou mencionadas.

Para fazer essa análise, usamos diversos gráficos, algoritmos e detecção de comunidades implícitas ao analisar as trocas de mensagens entre os usuários. Essa última é uma técnica comum de análise de redes sociais.

Quem dominou a discussão?

Como pode ser visto na figura abaixo, no tema 'Aeroporto em fazenda de tio de Aécio Neves', por exemplo, depois da Folha de São Paulo (@folha_com), o usuário do Twitter que foi mais mencionado em um tweet, incluindo retuítes (RT @...), foi o José Simão (@jose_simao). Enquanto a Folha de São Paulo foi mencionada 710 vezes, José Simão ficou ligeiramente atrás com 623 menções. José Simão é um jornalista humorístico brasileiro. Como ele mesmo descreve em seu perfil do Twitter, "Acuerda macacada! Sou eu! Da rádio BandNews FM, da Folha de S. Paulo, e do Monkey News no UOL! Direto do País da Piada Pronta!". O interessante é que quando entramos em seu perfil no Twitter (https://twitter.com/jose_simao), temos uma clara ideia de porque ele pode ser considerado um formador de opinião, afinal, não é todo mundo que possui mais de 611 mil seguidores. Para conhecer um pouco mais os outros usuários que foram bastante mencionados na discussão do tema, clique nas barras para apresentar os principais tweets que fazem referência a cada um deles.



Quais são os grupos envolvidos na discussão?

Outra ferramenta que usamos para identificar aqueles perfis que tiveram maior destaque nas discussões e as comunidades que se formaram foi a análise de rede social, também conhecida como Social Network Analysis (SNA), através de redes como a apresentada na figura abaixo, onde pontos representam usuários e linhas representam uma conexão (tweet, retweet, menção, etc) entre eles. Essa rede, apresenta os usuários que expressaram suas opiniões e que foram mencionados nas discussões sobre o tema 'Campanha presidencial pode custar milhões'. Nela, o tamanho de cada ponto (círculo) é proporcional ao número de vezes que foi mencionado nessas discussões. Ou seja, um usuário que foi muito retuitado, assim como um usuário que foi muito referenciado nas discussões aparecerá no gráfico com um maior destaque (círculo de maior tamanho), como é o caso de @dilmabr, que foi muito referenciada nos tweets e @veja, que foi bastante retuitada. Na imagem abaixo podemos ver o ponto que representa o usuário @veja. Para ter acesso ao gráfico dinâmico e visualizar os outros formadores de opinião, clique na figura abaixo.



Quando tudo começou?

Por fim, gostaríamos de mostrar como nossa ferramenta é capaz de identificar de forma clara quando um assunto nasce e quais os tweets e respectivos usuários que fizeram com que se tornasse um tema relevante e merecedor de destaque e análise. O gráfico abaixo revela de forma cristalina quando isso acontece em relação ao tema 'Multa à Dilma e ao PT por propaganda eleitoral antecipada'. Clique nos pontos do gráfico para ver quais os tweets foram tuitados ou retuitados naquele intervalo de tempo. Ao fazer isso no ponto mais alto da curva (7 de julho às 16 horas), percebemos que os principais atores na divulgação da notícia sobre a propaganda eleitoral antecipada foram iG Último Segundo (@ultimosegundo), PSDB (@Rede45), Alvaro Dias (@alvarodias_) e o próprio TSE (@TSEjusbr).

domingues cuña

@DominguesCuna1



@PazGilberto @MuriloDoro @dilmabr isso é propaganda. DOS americanos.O apenados CONTRA revolucionários,é guerra é guerra, ainda tinham CHANCE

domingues cuña

@DominguesCuna1



@PazGilberto @MuriloDoro @dilmabr isso é propaganda. DOS americanos.O apenados CONTRA revolucionários,é guerra é guerra, ainda tinham CHANCE



E os outros temas e seus respectivos formadores de opinião?

Nossa intenção nesse post foi de apenas mostrar algumas das técnicas que utilizamos para identificar os formadores de opinião em qualquer assunto que envolva comunicação entre diversas pessoas. Caso contrário, nosso texto ficaria demasiadamente extenso e prejudicaria a leitura casual e agradável.

Pedimos aos que se interessaram pelo assunto e que desejam obter mais informações sobre os formadores de opiniões em outros temas que adicionem seus comentários, sugestões e pedidos abaixo. Na medida que os pedidos surgirem e que o tempo permitir, acrescentaremos novos posts com mais detalhes e novas informações.

segunda-feira, 11 de agosto de 2014

Conheça os temas de maior impacto no Twitter envolvendo candidatos à presidência

No nosso post Um mural vale mais que mil tweets, nós discutimos a inviabilidade de se analisar a opinião de milhares de pessoas acerca de um tema de interesse, mesmo que bem específico, sem uma ferramenta adequada. Essa tarefa é extremamente complexa, ainda que se disponha de uma equipe dedicada e especializada para realizá-la.

Hoje apresentaremos uma análise que fizemos dos principais temas discutidos pelos brasileiros em relação aos candidatos à presidência. Coletamos milhões de tweets no mês de julho, desses, um pouco mais de meio milhão falavam sobre a campanha presidencial dos principais candidatos ao cargo, Dilma, Aécio e Eduardo.

Analisar meio milhão de tweets significa ler aproximadamente 15 mil páginas de texto. Será mesmo possível? Como podemos identificar os tópicos de maior destaque dentro desse universo de informações e opiniões?

Para resolver esse problema, a nossa equipe desenvolveu um programa de computador capaz de processar em minutos milhares de tweets e extrair deles os temas que foram mais discutidos em um determinado período e ainda classificá-los em ordem de impacto social alcançado. Além disso, para cada tema, nosso programa é capaz de gerar estatísticas importantes, identificando inclusive as pessoas de maior influência nas redes sociais sobre esse assunto específico, o que será discutido no nosso próximo post.

No post de hoje, traremos alguns desses temas e apresentaremos também algumas das conclusões alcançadas ao se analisar o impacto do Twitter na corrida eleitoral à presidência no mês de julho de 2014.

Temas de maior impacto no mês de julho


No mês de julho, aproximadamente 161 mil pessoas participaram ativamente das discussões sobre as eleições presidenciais, trocando mais de 580 mil mensagens no Twitter, com quase 4 tweets por pessoa e mais de 18 mil tweets por dia sobre o tema.

No entanto, o que essas pessoas discutiram? O que elas consideraram importante? Quais foram os assuntos que tiverem maior destaque?

Ao analisar o mês inteiro de julho, detectamos 16 assuntos diferentes. Como esperado, desses, 7 estão relacionados de alguma forma à Copa do Mundo. De piadas a lamentações, se viu de tudo nessa Copa. Dentre as lamentações e desejo de melhoras, um chamou bastante atenção nas nossas análises. Enquanto a Dilma (ver tweet de @dilmabr abaixo) obteve 761 retuítes e 905 favoritos quando desejou "força ao querido @NeymarJr", a Marina (ver tweet de @silva_marina abaixo) obteve apenas 55 retuítes e 142 favoritos ao torcer "que tudo esteja bem com @neymarjr", repercussão de menos de 12% da obtida por Dilma. Essa diferença reflete os números apresentados pelo Ibope que mostram Eduardo com apenas 8% das intenções de votos, enquanto Dilma aparece com 38%, ou seja, com aproximadamente 21% das intenções de votos de Dilma*.


Por outro lado, nada supera o humor e a criatividade de brasileiros como Dilminha (@DilmaRousselff), com seu famoso "...eu posso tudo meu bem, eu sou Presidente". Ao todo foram 2,124 retuítes e 785 favoritos ao usá-lo para "cancelar o gol da Alemanha" no dia 08/07 e 718 retuítes e 310 favoritos ao usá-lo para "trazer Chay Suede de volta ao 'Império'"** no dia 24/07.


E os outros 9 temas, são sobre o quê? Veja no gráfico abaixo os 9 principais tópicos discutidos no mês de julho sobre a campanha presidencial que não possuem uma relação com a Copa do Mundo. Os assuntos variam de críticas a ambos Aécio e Dilma, assim como indicativos de um possível segundo turno. Além de mostrar os temas com seus respectivos números de tweets e de usuários engajados no debate, é possível também clicar em uma das barras (tweets ou usuários) para apresentar um dos tweets com maior repercussão sobre o tema logo abaixo do gráfico. Dessa forma, fica mais fácil entender do que cada tema trata.





Análise dos temas e algumas descobertas


Ao fazermos essas análises, percebemos que nem sempre um assunto que é bastante discutido nas redes sociais possui um tweet com uma quantidade enorme de retuítes e favoritos, ao contrário do que se imagina. O tema "Campanha presidencial pode custar milhões", por exemplo, foi o terceiro em número de tweets e o segundo maior em número de usuários envolvidos, enquanto um dos tweets com maior impacto apresentou apenas 51 retuítes e 26 favoritos (veja tweet da @VEJA de 05/07, clicando na barra do assunto "Campanha presidencial pode custar milhões"). A diferença nesses casos é que os comentários vieram de diversos perfis diferentes e não se concentraram em apenas retuítes de um mesmo tweet. Temas como esse são mais difíceis de se encontrar em análises manuais, pois, ao se analisar tweets individuais, o assunto não parece ter grande importância/impacto. No entanto, ao analisar os diversos tweets sobre o tema em conjunto, percebe-se que é um assunto muito discutido e de extrema relevância.

Outra descoberta importante durante nossas análises foi a relevância da relação entre quantidade de tweets e de usuários envolvidos na discussão do tema. Um tema não deve ser classificado como importante olhando apenas a quantidade de tweets publicados sobre o assunto. Tão ou mais importante que isso é a quantidade de pessoas envolvidas na discussão. Percebam que o tema "Nomeação de agentes da PF", por exemplo, embora seja o segundo tema com maior quantidade de tweets, com mais de 6 mil, foi o penúltimo assunto mais relevante em termos de quantidade de usuários envolvidos, com apenas 304. Ao analisarmos a diferença de um número para o outro, passamos a entender o que está acontecendo. Esse é um caso clássico que ocorre com certa frequência, quando poucas pessoas publicam diversos e repetidos tweets sobre o mesmo assunto com o objetivo de chamar a atenção daqueles que acompanham as redes sociais, dando a impressão que o tema está sendo bastante discutido. Essa situação ocorre geralmente em dois casos: ou são perfis falsos, geralmente robôs, publicando a mesma mensagem com pequenas variações (como acrescentando um número sequencial ao final do tweet); ou é um grupo específico de pessoas interessadas no assunto que insistem em discutir o tema até que sejam eventualmente ouvidos/atendidos. Nesse tema das nomeações da PF, temos um exemplo clássico desse último caso, também conhecido como "tuitaço". Aqui, servidores da PF, tentam usar as redes sociais para reivindicarem determinadas ações de agentes políticos. O perfil @AllaneTributino, que mais tuitou sobre o tema (808 tweets), teve sua conta suspensa pelo Twitter***.

O que o povo brasileiro realmente quer? Quais são os principais assuntos discutidos sobre educação, saúde, segurança, etc?


Vocês por acaso sabem? Nós sabemos! Se quiserem uma análise sobre qualquer um desses temas (ou outro qualquer), entre em contato conosco! Será um prazer ajudar a responder perguntas tão importantes para o futuro do nosso país e da nossa nação!

No nosso próximo post nós apresentaremos os principais formadores de opinião na campanha presidencial em 2014. Descubra quem foi responsável por chamar a atenção de milhares de pessoas nas redes sociais e tornar esses assuntos uns dos mais discutidos no mês de julho.


* Veja resultado do dia 22/07 em Pesquisa Eleitoral para Presidente.
** Veja notícia do UOL sobre o tema em Com o fim da 1ª fase, internautas lamentam saída de Chay Suede de "Império".
*** Isso não quer dizer que a conta foi suspensa pelos repetidos tweets. É apenas uma constatação que não significa, necessariamente, uma correlação.