Abstract
La Web, que nació bajo el espíritu de la colaboración y la libertad de información frente al modelo vigente de competitividad y derechos de propiedad, ha ido evolucionando hasta nuestros días de una manera que nadie podría haber supuesto. Actualmente, la sociedad está fuertemente conectada y comparte una gran cantidad de información pero no lo hace de una forma distribuida, como se esperaba, sino centralizada desde plataformas conocidas como redes sociales. El lado positivo de esta concentración es la facilidad para obtener los datos de interacción social. De todas las redes sociales, Twitter se ha caracterizado por su carácter abierto tanto en sus contenidos como en el acceso a sus datos mediante APIs, y aunque el caudal completo de sus datos no está accesible de forma gratuita, es hoy por hoy la fuente más importante de datos sociales de la que disponen los investigadores en Internet. Esta tesis aborda el análisis de la propagación de mensajes en Twitter en temas sociales y el papel que desempeñan las personas en la difusión. El enfoque se realiza desde un análisis empírico a través de un conjunto de casos de estudio con diferentes dimensiones, duraciones y contextos. Para poder abordar esta investigación he diseñado la plataforma T-hoarder que captura los mensajes que publican los usuarios de Twitter, los analiza y visualiza los resultados, permitiendo detectar los momentos más virales y los usuarios más destacados. Esta plataforma dispone de mecanismos de procesado por partes y su posterior integración, gracias a los cuales ha funcionado continuamente durante más de cuatro años sin problemas de escalabilidad. Desde ella he podido observar más de cuarenta casos relacionados con los acontecimientos de impacto social, los movimientos sociales, las elecciones en España, las tendencias en Twitter y la relación entre Twitter y Televisión. Basándome en las observaciones en sucesivos experimentos y mediante un proceso de refinamiento, he establecido la clasificación de usuarios que se presenta en esta tesis. Esta clasificación se valida con distintas métricas en las que la agrupación de los tipos de usuarios es coherente. Por otro lado, he definido los atributos de Alcance, Difusión, Participación, Incorporación y Automatismo y los he medido cada hora para cada uno de los casos. Las correlaciones encontradas para estos atributos, salvo el Automatismo, respecto al número de tuits publicados en cada intervalo de tiempo son muy altas en la mayoría de los casos. Macroscópicamente he encontrado una burbuja de actividad en todos los casos en la que el 80% de los mensajes difundidos fueron publicados por una minoría y los causantes del 80% de la propagación formaron grupos reducidos de usuarios. Analizados año a año los casos de estudio de duración superior a los dos años he descubierto que cada año va aumentando el porcentaje de retransmisiones mientras que el tamaño de los grupos que las producen disminuye. Un rasgo de meritocracia descubierto ha sido que la capacidad de propagación de mensajes de un usuario no depende la estructura de su red.
The Internet, which was born in the spirit of collaboration and freedom of information in the presence of the prevailing model of competitivity and copyright has evolved until now in a way which nobody could have imagined. Nowadays we are all very connected and we share a lot of information but we do not do it in a distributed way, as may have been imagined, but in a more centralised way from platforms we call Social Media. The positive part of this concentration is the ease with which social interaction data can be gathered. Of all the Social Media, Twitter stands out for its openness both in content and in accessibility of data through API’s and although the complete flow of data is no available freely, it is today, the most important source of social data that researchers have on the Internet. This thesis tackles the analysis of propagation of messages on Twitter about social issues and the role carried out by people in the spread. The focus was done by experiential analysis through eighteen case studies of different dimensions, durations and contexts. In order to carry out this research I have designed the T- hoarder platform which captures messages posted by Twitter users, analyses and visualises the results, allowing the detection of the most viral moments and the most prominent users. This platform has process mechanisms, and its later integration, thanks to which it has functioned continually for over four years without any scale problems. From it, over forty cases related to social impact, social movements, the elections in Spain, trends on Twitter and the relation between Twitter and television. Based on observations in successive experiments and through a process of refinement, I have established the classification of users which is presented in this thesis. This classification was validated using distinctive metrics in which the grouping of types of user is coherent. On the other hand, I have defined the attributes of Reach, Diffusion, Participation, Incorporation and Automation and I have measured them every hour in each of the cases. The correlations found for these attributes, except for the Automation, with respect to the number of tweets posted at each interval of time are very high in the majority of cases. Macroscopically I have found a bubble of activity in all the cases in which 80% of the messages spread were posted by a minority and the source of 80% of the spread formed small groups of users. Analyzing year on year the cases studied for a duration of over two years I have discovered that each year the percentage of retweets is increasing while the size of the groups producing them is falling. A feature of meritocracy uncovered has been that the capacity of spread of messages of a user is not related to his/her network.
Congosto Martínez, M. L. (2016). Caracterización de usuarios y propagación de mensajes en Twitter en el entorno de temas sociales.
https://e-archivo.uc3m.es/handle/10016/22826