Dime a quién sigues y te diré qué prefieres

El martes 30 de mayo se llevó a cabo en el Aula Magna de FAMAF la presentación de la tesis de Licenciatura del hoy Licenciado Pablo Celayes. El trabajo final, Dirigido por el Dr. Martín Domínguez bajo cuya tutela la investigación supo acomodarse a diferentes obstáculos y emprender ciertos giros poco evidentes pero imprescindibles para lograr los resultados que la tesis alcanzó, indaga sobre cuestiones que definen en este tiempo no solo nuestra realidad personal, subjetiva, sino también procesos de construcción de la opinión pública y la conformación incluso de identidades políticas: las redes sociales.

Más que un dato de la realidad

A esta altura del partido, del que se juega en cualquier plataforma interactiva, ese en el que entregamos datos cada vez que hacemos un click o escribimos algo en un muro, ya todos más o menos sabemos que cualquier información podrá ser y será usada (a favor o en contra). Dejamos nuestras huellas de consumo inscriptas en monstruosos artefactos de almacenamiento. Algunos se inscriben en una posición de rango paranoica, otros se conforman con los datos que brindan seguros de que la información volverá en forma de una contrapropuesta mejorada, una recomendación precisa o una oferta muy difícil de rechazar. Pero en el ámbito de las redes sociales no sólo se expresan preferencias en el contenido de un posteo sino que se establecen relaciones (precisamente las que nos permiten hablar de redes) entre los distintos actores. El entramado resultante dibuja un espacio social virtual que define una especie de horizonte de sentido, un sentido común.

Diferentes y diferenciadas

En Argentina las dos redes sociales que aglutinan mayor cantidad de usuarios son Facebook y Twitter. Una de las mayores diferencias entre ellas, más allá del evidente límite de caracteres (ciento cuarenta) que tiene la red social del pajarito, es que cualquiera que pretenda seguir a alguien, puede acceder a todos los tweets (unidad de expresión de esa red social) de la persona/entidad. Facebook, en cambio, restringe, bajo diferentes modalidades, el acceso a las cuentas. El análisis de redes sociales que permite arribar a información clave para la toma de decisiones, de distinto tipo y para diferentes objetivos, depende del acceso a esos datos. Ya sea para comprender o manipular (o ambos fines: una manipulación exitosa depende en muchos casos de una acabada comprensión) permite dirigir, reorientar y simplificar los esfuerzos para impactar en un público determinado. Pero como Facebook brinda también esos servicios (microsegmentación) ejerce un control sobre los datos que residen de forma más o menos latente dentro del ámbito de aquello que denominamos preferencias. Y ese control que ejerce de la información que se genera a través de su plataforma, se lleva a cabo para evitar que puedan ser utilizados por potenciales competidores en la prestación de dicho servicio.

Por este motivo twitter ofrece menos resistencia al estudio de su conformación, estructura y contenidos para quienes intentan vislumbrar regularidades significativas.

Camino sinuoso

El flamante Licenciado en Ciencias de la Computación Pablo Celayes junto al Dr. Martín Domínguez, experimentaron, en los albores del Trabajo Final, esas dificultades. Pretendían desarrollar algún modelo predictivo, basado en análisis de contenidos, utilizando herramientas de Procesamiento de Lenguaje Natural (PLN), sobre las preferencias de los usuarios. Es decir, en base a lo expresado en posteos previos cuáles serían las preferencias que se podrían presumir dado un usuario determinado, hacer esto en forma masiva, para un gran número de usuarios. Frente a las dificultades que presentaba Facebook en el acceso a los datos que le interesaban, optaron por trabajar sobre Twitter. Primer ladrillo en el edificio de su objeto de estudio.

En ese proceso dialéctico que gobierna toda investigación, otro deslizamiento de la idea inicial fue pasar a segundo plano el análisis de contenido dada la dificultad constitutiva de Twitter en relación a la cantidad de caracteres. Es así que surgió una idea original para lo relacionado con las Ciencias de la Computación y que arrojó resultados verdaderamente asombrosos. Original para el ámbito de la computación porque en definitiva es algo habitual dentro del campo de la sociología: establecer mapa de las relaciones entre usuarios, un entramado social. Cada persona en twitter sigue a alguien que a su vez lo hace con otras personas/entidades, de ese modo se va tejiendo un sistema de relaciones que, de acuerdo a la perspectiva de análisis que se adopte, resulta más o menos significativa.

Denominado entonces como entorno social, construyeron un cuerpo de trabajo de dos grados de separación en relación a un usuario determinado (a quién sigo y a quién sigue a su vez la persona/entidad que yo sigo). Habitualmente la predicción de preferencias se realiza sobre el contenido textual manifiesto, pero en este caso se intentaba identificar si era posible predecir el comportamiento en base al entorno social al que se pertenece, tomando la acción de “seguir”, la acción de “twitear” y “retwitear” como una preferencia no textual. Y los resultados fueron asombrosos: se puede predecir con un 84 % de certeza que un individuo vaya a retwitear independientemente del contenido del tweet, solo determinado por el entorno social construido.

Epílogo de una pesquisa

El trabajo continuó luego en el intento de reducir aún más el riesgo estadístico utilizando herramientas de PLN y aprendizaje automático (machine learning). Pero el extraordinario hallazgo ya se había producido, con solo invertir el orden habitual que suele regular el análisis de redes sociales.

Al comienzo hablábamos de un “sentido común” como resultante de las interacciones en las redes sociales. El trabajo realizado por Pablo Celayes y dirigido por Martín Domínguez, resalta la importancia del entorno social en la determinación de preferencias. La mayoría de las veces las acciones no están determinadas por una mente que descifra, sino por una inercia que se deja llevar.

Lic. Mariano Barsotti, Prosecretaría de Comunicación y Divulgación Científica de FAMAF