Академический Документы
Профессиональный Документы
Культура Документы
EM MDIAS SOCIAIS
Grafos, visualizaes, mtricas e
comunidades
SUMRIO
tambm j
nova, sendo utilizada por reas to diferentes quanto economia, engenharia de telecomunicaes ou
ecologia.
A anlise estrutural de redes sociais, ento, permite ver as pessoas ou organizaes e suas conexes,
permitindo gerar diversos tipos de informaes, como: descobrir comunidades; perceber grupos de
pessoas que possuem caractersticas em comum; identificar buracos estruturais; ns isolados;
uma informao circula pela rede; identificar influenciadores; e muitas outras aplicaes.
Como um gerente de nvel hierrquico relativamente baixo consegue influenciar mais as decises dos
funcionrios do que seus chefes? Que tipos de caminhos um meme percorre ao ser disseminado na
blogosfera? Como prever a resoluo de um conflito que dividiu uma sala de estudantes? Como um blog
chegou ao Page Rank 6? Como as inovaes surgem numa universidade? Quais so os tipos de pblico
que seguem uma marca no Twitter? Estas so apenas algumas das perguntas que pesquisas utilizando
anlise estrutural de redes sociais conseguem responder, graas a dados relacionais.
A anlise estrutural de redes sociais se refere aplicao deste tipo de anlise quando falamos de pessoas
e/ou grupos ou objetos que representam pessoas e/ou grupos. Estamos falando de ns e ligaes, que
so os principais elementos das redes sociais, mas ainda no o descrevemos. Futuramente detalharemos
melhor os elementos, mas observe aqui que o foco em um elemento (ator social, no caso), que tem
conexes com outros. Em outros tipos de pesquisa, digamos surveys, por exemplo, o foco est
nos atributos (por ex., gnero, local, inteno de voto) e o cruzamento entre estes dados com outros
dados de atributos. J na anlise estrutural, o foco est nas relaes. Parte-se da anlise de como os ns
se conectam e relacionam para realizar a anlise que, posteriormente, pode agregar dados de atributos e
outros. E as conexes podem ser de diversos tipos, intensidades e direes.
Abaixo um exemplo de rede a partir de uma busca relacionada a comunicao poltica. Os dois grandes
agrupamentos, quando analisados, mostram conversas de ativistas de direita e de esquerda, bem
separados (colorimos esquerda com vermelho e direita com azul). Conversam muito entre si, mas s uma
Poltica s um dos muitos temas que pode ser bem analisado com a ajuda das visualizaes de redes.
Neste guia apresentaremos uma introduo anlise de redes, que hoje pode ser feita de forma facilitada
atravs da exportao em arquivo GraphML atravs da ferramenta de monitoramento BrandCare, para
posterior visualizao em ferramentas gratuitas e de cdigo aberto como Gephi e NodeXL.
Visualizao
de Redes
Monitoramento de Mdias Sociais
Armazenamento dos Dados
Anlise de Sentimento
Categorias e Tags de Assuntos,
Temas, Eventos
Atributos, mtricas e informaes
demogrficas
Exportao em formato otimizado
para redes (GraphML)
Visualizao de Redes
Mtricas de Redes
Algoritmos de Clusterizao
O tema muito complexo e o guia pretende ser uma introduo aos principais conceitos e aplicaes.
Acompanhe nossos canais para receber mais guias, exemplos e dicas sobre anlise de redes sociais.
PROGRAMAS
Para realizar anlise de redes em mdias sociais, voc precisa basicamente de dois tipos de programas:
um de coleta de dados e um para anlise e visualizao das redes. Entre as mdias sociais mais frutferas
para a anlise de redes sociais, est o Twitter. Por este motivo, a primeira mdia social para a qual
implantamos a exportao em formato GraphML.
BrandCare: nossa ferramenta de monitoramento
de
mdias
sociais
(solicite
um
trial
em
considerada
uma
das
15
melhores
NS E ARESTAS
Qualquer rede baseada em dois elementos, os ns e os laos. A depender do objetivo e tipo de anlise,
os ns e laos podem ser coisas muito diferentes. Qualquer rede uma representao convencional do
que se est sendo observado. Manejar, construir e analisar redes envolve atos de escolha sobre o que
ser analisado2.
Desta forma, uma anlise pode considerar apenas uma pequena rede na qual se considera um n cada
pessoa e um lao cada relao de amizade. Outra, por sua vez, pode considerar cada n um artigo
acadmico e um lao as referncias bibliogrficas. Tudo vai depender dos objetivos e informaes
buscadas. Para entendermos estes elementos bsicos, precisamos entender bem o que so ns e laos.
Vamos comear pelos primeiros.
Os nomes utilizados aqui para falar dos ns so muitos: ns (nodes), vrtices
(vertices), pontos. Geralmente, existe pouca distino entre um termo ou
outro e, na maioria dos casos, no importa. Mas, como Barabsi3 nos
explica, na cincia das redes se fala de redes, ns (nodes) e laos (links),
enquanto na teoria dos grafos se fala de grafo, vrtices (vrtices) e
arestas (edges). A teoria dos grafos, proveniente da matemtica, uma das
bases para a cincia das redes e sua anlise estrutural. A maioria dos
softwares de redes, como Gephi e NodeXL, usam sua terminologia, pois so conectados (trade)
aplicveis no s a redes sociais, mas redes de todos os tipos.
Importante pontuar que, na anlise estrutural de redes sociais, os elementos analisados so aqueles que
podem ser individualizados e representam algum ator social, grupo social ou produto realizado por estes.
Por exemplo, na imagem acima, est representado um grupo de trs pessoas que so amigos entre si.
Como explicam os criadores do NodeXL:
O conceito de n extremamente simples, como podemos ver nas definies que so dadas a
estes. Como explicam os criadores do NodeXL, Vrtices, tambm chamados de ns, agentes,
entidades ou itens, podem representar muitas coisas. Frequentemente representam pessoas ou
estruturas sociais como grupos de trabalho, times, organizaes, instituies, estados ou
mesmo pases. Em outros casos eles representam contedo como web pages, tags keywords ou
4
feito por ela. Na maioria dos casos, pessoas, que so representadas nas mdias sociais por perfis.
Para fins de pesquisa, podemos adicionar atributos aos ns e laos analisados. No algo obrigatrio,
pois a simples estruturao dos ns em formato de rede, atravs das ligaes, gera uma amplitude de
informaes. Mas os atuais programas de coleta e armazenamento de dados de redes permitem
adicionar variveis personalizadas. Por exemplo: idade, sexo, classe, categoria de cliente, etc. No
monitoramento de mdias sociais, os analistas esto constantemente adicionando atributos aos ns e
laos, como tags, sentimentos, localizao etc. A exportao do arquivo .graphml pelo BrandCare, por
exemplo, permite levar a anlise que voc fez de perfis e tweets no monitoramento para a anlise de
redes.
Resumindo: os ns podem representar pessoas, organizaes e objetos; podemos adicionar dados
relacionais ou de atributos nos ns; e estes dados podem ser calculados e visualizados nas redes.
Mas os ns s ganham o status de tais e suas importncias em rede quando existem os laos. Para
operacionalizar e mostrar como os ns se relacionam,
representam ligaes, conexes ou relaes de algum tipo. Estas so referenciadas por diversos nomes,
como laos (links), arestas (edges) etc. Nas palavras de importantes pesquisadoras brasileiras da rea
(Suely Fragoso, Raquel Recuero e Adriana Amaral),
Enquanto os ns so geralmente representados pelos atores envolvidos e suas representaes
na internet [...], as conexes so mais plurais em seu entendimento
Os laos podem ser de diferentes Tipos. A flexibilidade do que pode ser considerado um lao ou ligao
muito grande, por isso a anlise estrutural de redes se aplica em muitos domnios diferentes do
conhecimento e em diferentes tipos de problemas.
Transmite-se, troca-se, estabelece-se ou cria-se algo nesta relao entre dois elementos que, por sua vez,
esto ligados a outros. Isto o que compe uma rede e o motivo da metfora de rede ser to til para
explicar tantos fenmenos. As mdias sociais so chamadas de redes justamente por causa disto: nos
ligamos a outras pessoas atravs de nossos perfis, mensagens, posts, tweets etc.
Nas
pesquisas
em
torno
de
redes
sociais,
entre
os
laos
mais
comuns
temos
os
de amizade e conhecimento. Podemos avaliar muitas coisas a partir deste tipo de lao, que
socialmente estabelecido. Para cada rede social que vai sendo construda ou revelada, preciso
identificar quais so os tipos de conexes que sero consideradas. No caso do monitoramento de mdias
sociais, o foco est na conversao das pessoas, por isso nos debruaremos sobre as menes e retweets
inicialmente.
representadas. Deste modo, quando a pessoa A amiga da pessoa B, isto tambm significa que a pessoa
ANLISE DE REDES EM MDIAS SOCIAIS | SOCIAL FIGURES | 8
no significa que o perfil Y segue o perfil X. Em alguns casos existe a reciprocidade, mas observem que
aqui temos dois pontos de dados: X seguir Y e Y seguir X so duas coisas diferentes. J no caso do
Facebook, o perfil A ser amigo do B equivale a perfil B ser amigo de A.
Mas um mesmo tipo de relao entre X e Y pode no ser to
intensa quanto a relao entre Y e Z. Afinal de contas, voc
pode comparar a relao social que voc possui com seu
amigo a uma que voc tem com um colega estritamente
profissional? Desse modo, o Peso das arestas pode variar de
acordo com a intensidade do lao ou troca que est sendo
observada. No exemplo da imagem ao lado, a grossura do Rede
lao entre Susan e Letcia utilizada para representar o
pesos
peso da conexo, que pode significar um maior nmero de conversao entre as duas, por exemplo.
No caso do Twitter, muito produtivo analisar uma conversao em torno de um tpico a partir de dois
tipos de laos: quem retuita quem e quem menciona quem. No primeiro caso, estamos falando de laos
que denotam geralmente concordncia de opinio. No segundo, trata-se de laos que representam que
algum est sendo falado
literalmente mencionado
especfico e se comprime as vrias interaes em arestas com peso (quanto maior o nmero de RTs ou
mentions, maior o peso da aresta), possvel ver redes de engajamento com assuntos e pessoas.
Ento, como vimos os ns e laos podem ser caracterizados por um grande rol de mincias. Aprendemos
que tambm importante atentar para o que flui na rede, em que direes flui e com que intensidade.
Quando um lao feito ou identificado, o que est sendo trocado pelos ns? Como uma informao
disseminada? Quais so os ns que mais se engajam naquela atividade? Como os consumidores
engajados esto ligados entre si? Entendendo melhor os laos comearemos a conseguir responder estes
tipos de perguntas em nossas pesquisas.
MTRICAS DE REDES
A partir dos laos entre os ns, possvel medir vrias mtricas prprias da tipologia da rede. Junto com o
poder da visualizao de redes, estas medidas e mtricas so base para a descoberta de informaes e
insights nas redes, assim como referncias para uma boa visualizao. A depender de cada objetivo
informacional, uma ou outra medida/mtrica ser enfatizada nas complexas visualizaes das redes.
Seguem as principais mtricas referentes aos ns, arestas e redes:
Grau (Degree): a mtrica de grau representa a quantidade de conexes que um
usurio possui. Ou seja, se em uma rede de amigos no Facebook, eu possuo 374
amigos, significa que meu grau de 374. Ao lado, uma pequena rede etiquetada
com os graus de cada um dos ns.
Grau de Entrada (In-Degree): uma mtrica que especifica o grau quando ele
for dirigido. O caso mais emblemtico, nas mdias sociais, o fato de seguir ou citar algum no Twitter. Se
um perfil foi citado 47 vezes, uma mtrica simples de in-degree seria justamente 47.
Grau de Sada (Out-Degree): o grau que calcula as conexes partidas do n. Se estamos analisando
uma rede de retweets, um perfil com um out-degree grande uma que realizou muitos retweets. Isto
pode ser indicador de uma pessoa engajada com a temtica analisada no monitoramento, por exemplo.
In-Degree
Out-Degree
(criador do Google), calcula o valor de um n levando em considerao tambm o valor dos ns que
(conectado) est ligado a ouro site, significa que este tambm pode ser importante.
Distncia Mdia de Caminho (Avarage Path Length): a distncia mdia de caminho o exemplo de uma
mtrica mais focada nas arestas. Mede o nmero de passos necessrios para percorrer todos os caminhos
mais curtos entre todos os ns da rede. O clculo desta mtrica por Stanley Milgram na dcada de 1970 e
experimentos recentes no Facebook e Twitter6 so grandes responsveis pela popularizao da ideia de
Assim como acontece com A Distncia Mdia de Caminho, a maioria das mtricas de ns individuais
tambm pode ser calculada na rede toda. J outras mtricas so especficas para a anlise de redes ou
clusters.
Densidade (Density): a mtrica de densidade mede o quo prxima de estar totalmente conectada uma
rede est. Uma rede contendo todas as conexes possveis entre todos os ns teria densidade 1. Isto
raramente acontece, ento a mtrica bem til pois a Densidade pode ajudar a entender o quo um
cluster forte, no caso de conversaes em mdias sociais.
COMUNIDADES E CLUSTERS
Os softwares de anlise e visualizao de redes permitem aplicar mtodos que identificam, atravs das
conexes entre os ns, relativa rede completa, quais seriam os clusters (agrupamentos) presentes na
rede. Este tipo de anlise essencial para encontrar similaridades entre perfis, grupos de conversaes e
at comunidades que interagem com frequncia.
e redes sociais) um dos principais objetivos da anlise de redes. Dessa forma, existem vrios mtodos e
algoritmos que procuram alcanar o objetivo de encontrar estes grupos. Vejamos alguns deles:
Mtodo Louvain:
na rede, que podem representar clusters ou comunidades. a terminologia utilizada pelo Gephi, que
processa o algoritmo do Mtodo Louvain7. Com o objetivo de encontrar os mdulos o mais rapidamente
possvel, os autores do mtodo citam redes de 2 milhes de ns processadas em apenas 2 minutos.
Abaixo um exemplo de rede particionada em mdulos:
Clusters de Marca
Clusters de Comunidades (Community Clusters): so redes com agrupamentos mais claros, menores,
que se formam em torno de poucos hubs, influenciadores e fontes de informao. Costumam ocorrer em
torno de temas com relevncia global, o que resulta em agrupamentos de linguagem, geografia,
referncias de fontes de informao ou influenciadores.
Rede Broadcast (Broadcast Network): o desenho Broadcast
de redes anlogo mdias tradicionais, na comunicao
um->muitos. Costuma se apresentar em torno de perfis de
notcias, marcas que publicam contedo e personalidades
da rea, como jornalistas, ncoras e comentaristas.
Geralmente as pessoas que esto replicando o contedo do
perfil central no possuem conexo ou conversam entre si.
Quando a conversa ocorre, geralmente so pequenos
VISUALIZAO
Ao se abrir uma rede, o primeiro passo process-la com algoritmos de visualizao, que vo dispor os
ns e arestas de acordo com parmetros que prezem pela visualizao de algumas caractersticas
especficas. Geralmente isto ser feito mesmo antes da modificao de elementos visuais dos ns e
arestas individuais. Mas como provavelmente voc ver muitas redes antes de fazer as suas prprias,
vamos comear por estes ltimos elementos:
Tamanho dos Ns: o tamanho dos ns deve ser utilizado para destacar alguma caracterstica,
geralmente quantitativa, associada aos ns. Costuma ser usado como indicador de mtricas de grau,
principalmente. No caso de redes de mdias sociais, pode ser usado tambm para mtricas como nmero
de seguidores, tweets realizados ou Klout score, por exemplo. O tamanho dos ns na rede abaixo
baseado em seu nmero de conexes. Observe como este elemento visual direciona o olhar:
Formato dos Ns: a manipulao dos formatos dos ns pode ser utilizada para representar categorias
com poucas alternativas, como gnero, por exemplo.
Grossura das Arestas: como vimos, a grossura das arestas
utilizada, na maioria dos casos, para representar a intensidade
da conexo entre os ns (representando o Peso/Weight). Numa
anlise de redes de conversao, este elemento pode ser usado
para mostrar a quantidade de tweets trocados entre os perfis.
Cores dos Ns e Arestas: o modo mais simples de mostrar
parties entre grupos de ns ou arestas usar a codificao por
cor. A rede ao lado mostra trs mdulos codificados por cor
quanto peso das arestas (tambm utilizado como ndice para a
ANLISE DE REDES EM MDIAS SOCIAIS | SOCIAL FIGURES | 15
modularidade de redes).
Presena/Ausncia de Rtulo: em grandes redes, nem sempre vai ser necessrio
nem possvel
mostrar todos os rtulos dos ns. Exibir s os que melhor representam o que est sendo enfatizado na
rede uma soluo que direciona o olhar para a informao acionvel desejada.
Layout
Harel-Koren
Fast
Multiscale
organizar os ns de acordo com um parmetro, como ID, mtricas ou atributos. J a Radial-Axis organiza
de acordo com os eixos. Similar Circular, permite agrupar os ns irradiando a partir de um crculo
central. Um exemplo da circular: mostrar uma sub-rede para enfatizar os perfis mais engajados, a partir da
mtrica de out-degree em rede de RTs no Twitter (ou seja, perfis que mencionam e conversam muito
com outros).
GeoLayout: plug-ins de GeoLayout permitem posicionar os
mapas de acordo com latitude e longitude. Plugins adicionais
como Map of Countries trazem os mapas do mundo, continentes
e pases para que todo o preparo da visualizao possa ser
realizada dentro do programa.
PRINCIPAIS APLICAES
Como vimos, o monitoramento de mdias sociais pode ser uma grande fonte para anlise de redes online.
possvel coletar menes a uma marca e analisar as conexes entre as pessoas, temas, eventos e
assuntos.
Depois da introduo anlise de redes nas
pginas anteriores, hora de botar em
prtica a anlise de redes. A imagem ao lado
apresenta a tela da funcionalidade de Social
Network Analysis
ARESTAS
Nome
Contedo do Tweet
Bio/Descrio
Relacionamento (Retweet/Meno/Tweet)
Localizao
Data
Gnero
Hora
Seguidores
Sentimento
Seguidos
Tags
Klout Score
Grupos
Ou seja, todas estas informaes podero ser operacionalizadas nos softwares de redes como Gephi e
NodeXL, para a realizao de relatrios, anlises e gerao dos mais variados insights de redes. Seguem
alguns exemplos de aplicaes:
Identificar Comunidades
A identificao de comunidades de perfis e conversaes uma das aplicaes mais relevantes para o
profissional de mdias sociais. Hoje comum que as marcas tenham base de fs e seguidores de centenas
de milhares ou at milhes de pessoas. Toda esta audincia no deve ser vista como uma massa amorfa,
mas sim como uma fonte de valiosas informaes para a compreenso deste pblico.
Ao encontrar segmentos e comunidades dentro das audincias e pblicos engajados, possvel
desenvolver contedo, aes, produtos e servios customizados. Um procedimento bsico usar
algoritmos de clustering para encontrar os agrupamentos e, a partir da, medir e cruzar com dados e
informaes de atributos, como contedo do tweet, bio dos perfis, localizao etc.
Encontrar Influenciadores
Diversas mtricas de atributos so utilizadas para se analisar o
potencial de disseminao ou influncia de perfis nas mdias sociais.
Nmero de seguidores, escore Klout e engajamento so
frequentemente usados para se definir que pessoas sero acompanhadas e atendidas com mais cuidado
nas mdias sociais.
Mas influncia um valor social! Analisando a estrutura das redes, as referncias de influencie a
autoridade so medidas atravs de mtricas como grau de centralidade e PageRank. E nem sempre as
mtricas quantitativas so as mais importantes. Para encontrar influenciadores de nicho, podemos ter a
ajuda do grau de centralidade relativo em pequenos e densos clusters de pessoas.
Entender as Crises
Como uma crise foi deflagrada e se disseminou pelas redes? Ao utilizar a anlise de rede possvel gerar
visualizaes sequenciais estticas ou, ainda, grficos dinmicos para exibir em vdeo como uma rede se
movimenta ao longo do tempo.
O grau de centralidade pode demonstrar qual perfil gerou mais impacto negativo na disseminao da
crise. Mtricas como intermediao podem ser usadas para entender como a dinmica de retaliao da
marca alcanou grupos para alm dos primeiros atingidos. Mtricas de tamanho da rede permitem
analisar a amplitude do alcance da crise de comunicao, enquanto a densidade de cluster pode ajudar a
encontrar comunidades coordenadas de detratores.
MAIS CONTEDO
Os outros guias da Social Figures podem te ajudar muito a operacionalizar as informaes de redes. Que
tal utilizar a funcionalidade de Grupo para marcas os Segmentos de Pblico? Ou usar as redes para
encontrar ativistas influentes nas Eleies? Ou desenvolver um plano de tags otimizado para encontrar as
temticas de conversas nas redes?
CONHEA O BRANDCARE
O BrandCare um software on-line de monitoramento de mdias sociais que usa palavras-chave para
coletar as mensagens relevantes das redes e ento analis-las. Atendemos a agncias, empresas, polticos
e consultorias que desejam explorar a fora das mdias sociais para: relacionamento com os
consumidores e eleitores; evitar e gerenciar crises; compreender a fundo o pblico atravs de estudos,
benchmarkins e pesquisas.
Alertas
de
palavras-chaves
para
preveno
de
crises
aproveitamento de oportunidades;
Diferencial no custo-benefcio para monitorar feeds, perfis Twitter, fanpages e blogs para pesquisas, estudos
avanados;
Recurso Top Profiles que permite, com uma crescente database de milhes de perfis, pesquisar os tuiteiros mais
influentes de cada Estado ou Cidade brasileira;
Gerao automtica de relatrios em diversos formatos (PDF, Word, Excel) com os dados e anlise realizadas.
www
Saiba mais sobre o BrandCare no nosso
website
Informaes em http://blog.socialfigures.com/2013/06/13/melhores-ferramentas-de-2013/
http://tarciziosilva.com.br/blog/recursos/analise-estrutural-de-redes-sociais/
3
Network Science, do Barabsi http://barabasilab.neu.edu/networksciencebook
4
Livro Analyzing Social Media Networks with NodeXL: Insights from a connected world, de Derek Hansen, Ben
Shneiderman, Marc A. Smith http://www.connectedaction.net/book
5
Mtodos de Pesquisa para Internet, de Suely Fragoso, Raquel Recuero e Adriana Amaral
6
Ver http://www.telegraph.co.uk/technology/facebook/8906693/Facebook-cuts-six-degrees-of-separation-tofour.html e http://www.sysomos.com/insidetwitter/sixdegrees/
7
Saiba mais em https://sites.google.com/site/findcommunities/
8
Artigo dos autores em http://arxiv.org/abs/condmat/0408187
9
Artigo disponvel em http://arxiv.org/abs/cs/0702048
10
Artigo disponvel em http://arxiv.org/abs/condmat/0308217
11
Relatrio disponvel em http://www.pewinternet.org/2014/02/20/mapping-twitter-topic-networks-frompolarized-crowds-to-community-clusters/
12
A descrio dos algoritmos de visualizao baseada nos artigos de seus criadores (referenciados em cada um
deles posteriormente) e nos materiais de Gephi e NodeXL: http://pt.slideshare.net/gephi/gephi-tutorial-layouts;
http://sebastien.pro/gephi-esnam.pdf; e
13
Artigo de apresentao do algoritmo em http://dl.acm.org/citation.cfm?id=137557
14
http://dl.acm.org/citation.cfm?id=729397
15
http://webatlas.fr/tempshare/ForceAtlas2_Paper.pdf