Las matemáticas que esconde Twitter

Saber el nivel de desempleo a través de Twitter


¿Y si te digo que se puede saber el nivel económico, y por tanto, de desempleo con Twitter? Parece un poco descabellado, ¿no? Pues Llorente y colaboradores publicaron hace ya 7 años un artículo donde mediante el uso de matemáticas pudieron asociar dos variables: desempleo y Twitter. 


Los autores basaron su trabajo en diversos parámetros como la actividad en las redes sociales y el contenido de las redes sociales, entre otras. Analizaron que pasaría en regiones económicamente diferentes, donde la actividad en las redes sociales sería diferente. 

En regiones donde el desempleo es bajo, supondríamos que la actividad en las redes sociales sería mayor bien temprano, debido a que las personas se dedican el resto del día a otras cosas (trabajo, ocio, etc). Eso fue exactamente lo que vieron (os dejo una imagen donde se correlaciona el bajo desempleo con uso de Twitter a primer hora de la mañana). 

Por otro lado, analizaron cómo los usuarios interaccionan entre ellos. Hay una correlación entre el desarrollo económico de un área con una mayor diversidad en la comunicación. Llorente y colaboradores vieron que las áreas con mayor desempleo tiene menos patrones de comunicación que las áreas donde hay menos desempleo.

Y finalmente, también analizaron el contenido de los mensajes. Buscaron palabras clave como trabajo en los propios mensajes o enlaces a búsquedas de Google. ¿Y qué observaron? Que la gente desempleada buscaba o publicaba más acerca del trabajo, lo cual tiene bastante sentido.

Correlación entre diversos factores. Fuente.

¿Cómo han posible todo esto? Muy sencillo y poco sencillo a la vez. Gracias a las matemáticas. Los autores analizaron 19,6 millones de mensajes de Twitter con geolocalización desde noviembre de 2012 a junio de 2013. Además, tuvieron que establecer que las personas estaban mandando mensajes desde su casa y no en un viaje. Por lo que, antes de hacer cualquier análisis, analizaron la frecuencia de las publicaciones de los usuarios. De tal forma, que si una persona twitteaba más de X veces desde una misma localización, se consideraba que estaba en casa. 

Este estudio se hizo a través de la red social Twitter, pero, ¿os imagináis la cantidad de información que se podrían extraer de otras redes sociales? Las matemáticas nos pueden ayudar a analizar toda esa gran (pero muy grande) cantidad de datos.

Toda la información ha sido obtenida de: 

Social Media Fingerprints of Unemployment (2015). Llorent, A; García-Herranz, M; Cebrian, M; Moro, E. PLoS ONE 10(5): e0128692. doi:10.1371/journal.pone.0128692

No hay comentarios:

Publicar un comentario

Reportaje sobre MCLA-158

¿Es el Cáncer una preocupación actual? Cáncer, una palabra que gran parte de la población teme. Cáncer, la enfermedad que está a la orden de...