Descifrando mensajes implícitos y sutiles en discursos de odio

2 Ago. 2023 - Google meet Estudiantes

Seminario virtual a cardo del Lic. Nicolás Benjamín Ocampo

MIércoles 2 de agosto a las 11 h.

A través de meet en el siguiente enlace:

Resumen:

La investigación llevada a cabo hasta ahora para detectar contenido abusivo en las redes sociales se ha centrado principalmente en formas explícitas de discurso de odio. Si bien el discurso de odio explícito es más fácilmente identificable mediante el reconocimiento de expresiones ofensivas, los mensajes que contienen formas lingüísticamente sutiles e implícitas de odio (como circunloquios, metáforas y sarcasmo) constituyen un verdadero desafío para los sistemas automáticos. Si bien la naturaleza engañosa de los mensajes sutiles puede percibirse como menos dañina con respecto al mismo contenido expresado de manera directa, dicho abuso es al menos tan dañino como el abuso explícito. En este seminario, primero proporcionamos un análisis profundo y sistemático de 7 conjuntos de datos estándar para la detección de lenguaje de odio, confiando en una definición detallada y lingüísticamente fundamentada de mensajes implícitos y sutiles. Luego, experimentamos con arquitecturas de redes neuronales en dos tareas supervisadas: clasificación implícita y sutil de mensajes de odio. Mostramos que, si bien dichos modelos funcionan satisfactoriamente en mensajes explícitos, no detectan contenido implícito y sutil, lo que destaca el hecho de que la detección de lenguaje de odio no es un problema resuelto y merece una mayor investigación. Al mismo tiempo, con el fin de mejorar el rendimiento de clasificadores y la creación y anotación de conjunto de datos en este dominio, proponemos una estrategia para generar mensajes de odio implícito utilizando modelos de lenguaje autorregresivos agrupando los mensajes generados por sus niveles de complejidad con respecto a clasificadores actuales.

Minibio:

Nicolás Benjamin Ocampo es estudiante de doctorado en la Université Côte d'Azur en Niza, Francia, miembro del equipo WIMMICS, donde actualmente trabaja en la detección automática del lenguaje de odio y la generación de contra narrativas para su mitigación. En 2021, completó la Licenciatura en Ciencias de la Computación en la FAMAF con mención especial y obtuvo el segundo promedio más alto de ese año. En 2022, fue seleccionado como uno de los diez jóvenes sobresalientes de Córdoba por su desempeñó académico. Actualmente, continúa dedicándose al área de la investigación y contribuir de manera significativa al avance del conocimiento en su campo.