Predicción temprana de preferencias y tendencias en Twitter, basada en el comportamiento del entorno

31 Marzo 2021 - https://meet.google.com/qeh-kntz-som

Fecha: 31/03/2021 11hs.

Expositores: Emanuel Meriles y Martín Ariel Domínguez (Grupo de grandes redes sociales y semánticas - Famaf)

Sala Virtual: link a meet, Canal de Youtube.

Resumen:

En los últimos años, las redes sociales se han vuelto cada vez más
masivas. En consecuencia, son una fuente fundamental de información y una poderosa herramienta para difundir ideas y opiniones. Basado en Twitter, este artículo estudia el problema de predecir la preferencia de retweet de un usuario para un tweet dado, utilizando la información de cómo el tweet ha sido compartido por el entorno de ese usuario. Además, estudiamos cómo predecir si un tweet será popular o no, según el comportamiento de retweet de los usuarios centrales ("influencers"). Para ambos problemas, exploramos la evolución de la calidad de la predicción dependiendo de la cantidad de información disponible a lo largo del tiempo desde que se publicó el tweet. Así analizamos el compromiso entre la cantidad de la predicción y la cantidad de información disponible.
Para el problema de predicción de retweet del usuario, este modelo de predicción social logra, por ejemplo, un 63,76% en la medida F1 utilizando los primeros 15 información de minutos, 75,2% a las 4 horas y 86,08% con toda la información disponible. Para la predicción de popularidad, logramos puntajes del 65,67% con 60 minutos de información y del 74,4% con 4 horas y 80.73% sin restricción de ventana de tiempo, basándonos en comportamiento del 15% de usuarios centrales. Todos estos resultados se obtienen sin considerar el contenido de los tweets.

En una segunda instancia, incorporamos "word embeddings" FastText para representar el contenido de los tweets. Si bien los modelos basados sólo en el contenido no tienen buen desempeño, al combinar con el modelo social obtenemos mejoras.  

Publicaciones Relacionados: