Técnicas para el análisis de datos digitales

1 Técnicas para el análisis de datos digitalesAnálisis de...
Author: Miguel Navarrete Ojeda
0 downloads 0 Views

1 Técnicas para el análisis de datos digitalesAnálisis de redes sociales online y minería de texto para las ciencias sociales Camilo Cristancho

2 Día 3 Análisis de redes sociales Consideraciones teóricasDescripción Actores más prominentes y prestigiosos Patrones de difusión y niveles de influencia Análisis dinámico Estudio de caso - SNA – Gephi Tweets Hipervínculos

3 Análisis de redes sociales

4 Redes Colecciones de entidades que están interconectadas con enlacesAmigos Equipo páginas web con hipervínculos Proteínas que interactúan

5 Análisis de redes socialesUna red social se compone de un conjunto de actores (vértices o nodos) y las relaciones (lazos o bordes) entre estos actores (Wasserman y Faust, 1994). Mapeo de las relaciones y los flujos entre los usuarios, grupos, organizaciones, equipos, personas o cualquier otra entidad en un modelo formal Representaciones de los patrones de relaciones entre los miembros de una estructura social Modelado por un gráfico Los individuos representados como nodos Las relaciones entre pares de nodos representados como enlaces Medición de criterios que representan diferentes funciones y propiedades de las entidades en las redes

6 Análisis de redes sociales 23 tipos Análisis Estructural: posiciones relativas y conectividad de los usuarios Análisis del comportamiento: interacción entre los usuarios Análisis semántico: similitud tópica

7 Grafos dirigidos Vertex Edge Edge list Vertex 1 2 3 4 Graph (directed)Adjacency matrix 3 4 Vertex 1 2 3 4 -

8 Grafos no dirigidos Directed Edge list remains the same(who contacts whom) Vertex 1 2 3 4 1 2 3 4 1 Adjacency matrix becomes symmetric 2 Vertex 1 2 3 4 - 3 4 Undirected (who knows whom)

9 Tipos de redes 1 2 alter ego 1 2 3 5 3 4 5 1 4 2 7 isolate 6 4 5‘whole’ network 1 2 alter ego 1 2 3 3’s ego network 5 3 4 5 4 1 2 3’s ego network without ego** 7 isolate 6 4 5

10 Enlaces con peso Frecuencia de la interacciónEdge list: add column of weights 30 Vertex Weight 1 2 30 3 5 22 4 37 1 2 22 5 2 3 4 37 Frecuencia de la interacción Número de objetos intercambiados Percepciones individuales de la fuerza de la relación Costes en la comunicación o intercambio Adjacency matrix: add weights instead of 1 Vertex 1 2 3 4 - 30 5 22 37

11 Propiedades de las redesLa mayoría de los nodos tienen pocos vecinos (grado), pero hay algunos nodos con muy alto grado (grado de distribución de ley de potencia) redes libres de escala Si un nodo x está conectado a Y y Z, entonces Y y Z son propensos a estar conectados entre sí Alto coeficiente de clustering La mayoría de los nodos están a pocos enlaces de distancia en promedio “small world effects” Redes de áreas muy diversas (desde Internet a las redes biológicas) tienen propiedades similares

12 Identificación de comunidadesPiensa en todos los grupos en los que eres miembro Issue networks Grupos - conexiones que unen los miembros individuales Clusters - formación de subgrupos criterios para clasificar un determinado conjunto de relaciones como grupo Clique - un conjunto totalmente conectado de relaciones Cómo elegir los valores de corte?

13 Redes en Twitter

14 Network flow model – Steve Borgatti1414 Network flow model – Steve Borgatti Backcloth Relational events Similarities Social relations Interactions Flows Implicit ties physical proximity co-membership sharing behaviors, attitudes and beliefs Explicit ties role-based cognitive/affective Discrete and separate events Exchanges from node to node (resources, information, diseases, …)

15 Twitter networks Backcloth Relational events Attribution Attention1515 Twitter networks Backcloth Relational events Similarities Social relations Interactions Flows Commonalities FF network AT network RT network Attribution Common interests, locations, communities, … Co-membership in lists Co-citation Attention Friends and Followers Interaction @mention Mentions and replies Diffusion Retweets Plotkowiak, Thomas -

16 Actores más prominentes y prestigiosos

17 Influencia El poder o capacidad de causar un efecto en formas indirectas o intangibles Influencia Social Normativa (Necesidad de ser querido) - Aceptación Pública Influencia Social Informativa (necesidad de tener razón) - Aceptación privada "La capacidad de, a través de la propia conducta, promover un comportamiento y pasar información a otras personas". (Rosenman 2012) Carisma, presión de grupo, manipulación psicológica, reputación, tendencias sociales y estructura social

18 Influencia 2 Atributos individuales para influir en los demás dentro de su esfera social con respecto a un asunto o tema en particular Relevancia: La creación de contenido que es importante Alcance: La capacidad de llegar a un público que es valioso Resonancia: La proliferación o el compromiso con contenido relevante

19 Influencia 3 Tamaño de la audienciaGrandes públicos - broadcast Pequeña audiencia de nicho - narrowcast Issue / tema / especificidad de marca Influencia en un tema, no significa influencia en otro

20 Influencia en redes socialesLíderes de opinión / influenciadores Ubicación de los actores de la red Interacciones Diferentes indicadores de centralidad y de prestigio (Freeman et al 1989;. Wasserman y Faust 1994; Scott y Carrington 2011) Grado, intermediación o centralidad de vector propio Proximidad o rango de prestigio Determinado por muchos factores (Romero et al. 2011) Novedad y la resonancia de los mensajes Calidad y la frecuencia de contenido

21 Influencia en redes sociales2121 Influencia en redes sociales Medidas SNA - cuantificar nociones intuitivas Conectividad Influencia Centralidad Importancia social Teoría de grafos Representar nodos interconectados Vocabulario y métodos para operacionalización

22 Influencia en redes socialesTipos generales de preguntas: ¿Qué forma tiene la red? (Visualización) ¿Quiénes son los actores clave? (Key players) ¿Que subgrupos existen ? (Clustering) ¿Cuáles son las estructuras de los grupos en la red? Preguntas específicas ¿Quién interactúa con quién? ¿Acerca de qué? ¿Cómo surgen las ideas e innovaciones? ¿Cómo se difunden, cambian o desaparecen? ¿Qué beneficios y riesgos tiene una estructura de red?

23 Influencia en redes sociales2323 Influencia en redes sociales Medidas de centralidad para identificar líderes de opinión Centralidad de vector propio (Eigenvector) - muchos seguidores o relaciones PageRank (Google) - relaciones con los demás, quienes a su vez, están bien comunicados Betweenness - aquellos que están en la mayoría de los caminos entre otros en la red

24 Influencia en redes sociales2424 Influencia en redes sociales Enlaces de puente Agujeros estructurales (Burt 1992) Fuerza de los enlaces no determina el potencial de un puente Agujeros estructurales vinculados por actores que determinan el flujo potencial de información Lazos establecidos por enlaces no redundantes entre los actores

25 Influencia en Twitter El comportamiento del Influenciador determina el comportamiento de otros tweeters Un mensaje que se difunde / RT por otros Introducir un nuevo tema o noticia que se discute después por otros El sentimiento positivo o negativo en los tweets del influyente se refleja en un cambio en el sentimiento de los tweets de los demás

26 Twitter Influence La influencia puede ser ejercida entre las personas que no están relacionadas y que pueden no interactuar directamente Papel de los usuarios influyentes de Twitter (Cha et al 2011;.. González-Bailón et al 2012) Los Retweets y menciones recibidos por sus mensajes siguen una distribución de Power Law Las personas más influyentes son muchos órdenes de magnitud más influyentes que el usuario promedio Los influyentes principales tienen el potencial de difundir la información a un público muy amplio

27 Cuantificar la influencia en TwitterFollowing relationships - follower count (Cha et al. 2009) intimate friendships? common interests? passion for breaking news or celebrity gossip? fake Followers Mentions or references (talking about a person or topic) - level of interest / trendiness Fandom? or Approval? Criticism? Contempt?

28 Cuantifiar la influencia en Twitter2828 Cuantifiar la influencia en Twitter Medidad de centralidad para identificar líderes de opinión Retweet Indegree -> reconocimiento @ Indegree = Ser mencionado FF Indegree = Ser seguido FF Pagerank = Autoridad @ Outdegree = Mencionar a otros

29 Broadcasters Common usersCentrality Influentials Hidden influentials Broadcasters Common users Received messages / Sent messages Following / Followers Visibility González-Bailón et al. 2013

30 Estudio de caso - SNA – Gephi

31 Gephi - http://gephi.orgHerramienta para la comprensión y exploración de grafos/redes Diferentes formatos - https://gephi.github.io/users/supported-graph-formats/ Métricas Layout Ranking Exportación gráfica Plugins

32 Instalar Gephi Instalar Java primero - https://helpx.adobe.com/x- productkb/global/install-java-jre-mac-os.html Instaladores -