Equipo de NLP Integrado por académico y estudiantes DCC UC triunfa en IberLEF 2024 - Departamento de Ciencia de la Computación

El equipo de Procesamiento de Lenguaje Natural (NLP) conformado por estudiantes del Departamento de Ciencia de la Computación (DCC UC), Instituto Milenio Fundamento de los Datos (IMFD) y el Centro Nacional de Investigación en Inteligencia Artificial (CENIA) obtuvieron el primer lugar en la shared task de IberLEF 2024 “Automatic detection and characterization of propaganda techniques and narratives from Diplomats of major power” en dos categorías. La competencia, denominada DIPROMATS 2024, desafió a los participantes a desarrollar sistemas avanzados para la detección y caracterización automática de técnicas de propaganda y narrativas en tweets emitidos por diplomáticos de potencias mundiales como Estados Unidos, Europa, Rusia y China.

“La competencia consistió en diseñar sistemas para la detección automática de técnicas de propaganda en lenguaje natural en específico en comentarios que se producen en redes sociales, el data set con el cual se trabajó corresponde a un Data que se construyó específicamente para esta competencia y que consiste en tweets extraídos desde cuentas de políticos y diplomáticos importantes de las grandes potencias del mundo como Estados Unidos, Europa, Rusia y China.” según explicó el académico Marcelo Mendoza.

El equipo, conformado por Miguel Fernández (IMFD y doctorado DCC UC), Maximiliano Ojeda (IMFD y doctorado DCC UC), Lilly Guevara (CENIA RL5 e Ingeniería USM), Diego Varela (CENIA RL5 e Ingeniería USM) y Marcelo Mendoza (académico DCC UC e investigador IMFD y CENIA), alcanzaron el primer lugar en dos categorías clave de la competencia y obtuvieron posiciones destacadas en todas las demás categorías. Su éxito los hizo recibir la invitación para presentar su solución en el evento que se llevará a cabo del 24 al 26 de septiembre en Valladolid, España.

Marcelo Mendoza, miembro del equipo, comentó que: “Como los mensajes vienen de distintos países, hay algunos que son en castellano y otros que son en inglés. Entonces la competencia se evalúa en tres categorías uno que es bilingüe, inglés y español, nosotros ganamos en inglés y en bilingüe, en español ocupamos podio es decir, llegamos o en segundo o en tercer lugar en todas las otras tareas”.

DIPROMATS 2024 no solo se centró en identificar técnicas de propaganda, sino también en analizar las narrativas subyacentes utilizadas para influir en las percepciones políticas. Esta edición ampliada de la competencia buscó mejorar la comprensión y detección de campañas de desinformación a través de un análisis exhaustivo de tweets en inglés y español de autoridades diplomáticas.

La competencia dividió las tareas en dos principales:

Identificación y Caracterización de la Propaganda: Incluyendo la detección de técnicas de propaganda y la clasificación de tweets en categorías específicas como Apelación a la Comunidad o Lenguaje Cargado.
Detección de Narrativas: Donde los sistemas debían clasificar los tweets según las narrativas predefinidas asociadas a cada actor internacional.

Cabe destacar que IberLEF 2024 tiene como objetivo el alentar a la comunidad de investigadores e investigadoras a organizar tareas competiticas de procesamiento, comprensión y generación de texto, para así definir nuevos retos de investigación y avanzar en los desafíos de Procesamiento del Lenguaje Natural.

Sigue explorando

Académico DCC UC habló sobre los computadores optimizados para la Inteligencia Artificial

Académico Jorge Baier comenta sobre cómo la Inteligencia Artificial puede ayudar en Educación.

Estudiante de Ingeniería UC ganó el premio a “mejor programador del mundo”