Integrando Interpretabilidad y Eficiencia en la Detección Anticipada de Riesgos en las Redes Sociales

28 Julio 2021 - Google Meet - Youtube

Fecha: 28/07/2021 11 hs.

Título: Integrando Interpretabilidad y Eficiencia en la Detección Anticipada de Riesgos en las Redes Sociales

Expositores:

Dr. Sergio Gaston Burdisso (Universidad Nacional de San Luis, Bec. CONICET)

Dr. Marcelo Luis Errecalde (Universidad Nacional de San Luis, Universidad Nacional de la Patagonia Austral) 

Meet: https://meet.google.com/qeh-kntz-som

Youtube: https://youtu.be/FoDCeozBnHo

Resumen:

Las redes sociales no sólo facilitan que las personas expresen y compartan sus ideas, pensamientos, y opiniones sino que, además, son un lugar de encuentro que permite que las personas nos conectemos entre sí eliminando las limitaciones espacio-temporales inherentes a los métodos de comunicación tradicionales, lo que puede ser tanto positivo como negativo.
En este contexto, una problemática que está ganando cada vez más atención es la Detección Anticipada de Riesgo (DAR) en las redes sociales. En particular, la DAR consiste en procesar secuencialmente el contenido textual que cada usuario va generando hasta determinar en algún momento, lo antes posible, si dicho usuario está en (o puede provocar) una situación de riesgo. Algunos ejemplos concretos de DAR serían la detección de depredadores sexuales, la detección de rumores, la detección de terrorismo, o incluso la detección de depresión u otros problemas de salud mental. Como se puede intuir, el objetivo central que impulsa el reconocimiento temprano de estas situaciones de riesgo es su prevención, ya que en casos extremos incluso se podrían pagar hasta con la vida.
Sin embargo, abordar esta tarea es extremadamente desafiante ya que, a diferencia de otras tareas de clasificación de texto, aquí los sistemas no sólo deben poder clasificar a los usuarios, sino que, además, deben ser capaces de decidir si la información procesada hasta el momento es suficiente para hacerlo con ciertas garantías o, si de lo contrario, se debe esperar a que el usuario genere más contenido, con el riesgo que esto implique. Más aún, al igual que con cualquier otra aplicación crítica en salud, finanzas o seguridad nacional, este es un dominio que demandan sistemas que no sólo hagan predicciones correctas, sino que también sean confiables, facilitando la comprensión de cómo las llevaron a cabo. De hecho, la mayoría de los modelos de aprendizaje supervisados resultan no ser adecuados para abordar este tipo de escenarios, ya sea porque o bien no son interpretables al funcionar como cajas negras o bien porque no fueron pensados para clasificar secuencias, sino documentos completos.
De esta manera, en esta charla introduciremos a SS3, un nuevo modelo de aprendizaje automático para la clasificación de texto que fue diseñado específicamente con el objetivo de abordar la DAR de una forma integral, siendo un modelo interpretable a la vez que capaz de procesar secuencias de una forma natural. SS3 ha obtenido resultados sobresalientes en las distintas tareas de diversas ediciones del eRisk, un desafío anual sobre la DAR que forma parte del congreso internacional CLEF.