X

Ciencia

Latam GPT el modelo de lenguaje con identidad Latinoamericana que lidera Álvaro Soto a través de CENIA

“Latam GPT: Una iniciativa latinoamericana para desarrollar un modelo de lenguaje construido enteramente en la región”. Para contextualizar y argumentar, se presenta la pregunta: ¿Por qué es necesario un LLM Latinoamericano? Según lo publicado en la página oficial del modelo Latam GPT, esta pregunta se responde: “Es importante que en la región podamos desarrollar capacidades para tener independencia y tomar decisiones sobre cómo esta tecnología impacta a la sociedad. Hasta el momento, no tenemos un modelo de lenguaje regional, y esta tarea no la puede asumir solo un grupo ni un solo país: es un desafío que requiere el esfuerzo de toda la región”. (fuente: www.latamgpt.org/) De hecho, hace unas semanas, el medio El Mercurio publicó el titular: “Así se crea LatamGPT, la inteligencia artificial con identidad latinoamericana” En la nota, se publicó que por ejemplo en junio habrá una versión de prueba para expertos y que en cuanto a la participación y colaboración de la región, hay más de 100 personas de aprox 35 instituciones de América Latina que colaboran en su creación. ¿Qué relación tiene el DCC UC con Latam GPT? La respuesta más cercana sería: Álvaro Soto y por consecuencia CENIA (entidad que lidera el proyecto). El profesor Álvaro Soto, es académico del Dpto Ciencia de la Computación y también es director del Centro Nacional de Inteligencia Artificial, centro de investigación asociado al DCC UC y en donde; profesores y estudiantes del Departamento investigan, trabajan, colaboran, etcétera. Información disponible: https://dcc.ing.uc.cl/investigacion/centros-de-investigacion-asociados/ “Si a ChatGPT y otros modelos creados en el hemisferio norte le preguntas por literatura chilena, probablemente sepa mucho de Pablo Neruda, por su fama y asocie muchas respuestas a él. Pero no te dará buenas respuestas de escritores más desconocidos porque, probablemente, no los tiene en los datos con que fue entrenado”, comentó Álvaro Soto. El académico e investigador ha sido categórico que Latam GPT es parte de la revolución digital, y que Chile, mediante al Ministerio de Ciencia, Tecnología, Conocimiento e Innovación decidió “subirse al carro de este cambio”, pero destacando que la riqueza de este proyecto, radica en su identidad Latinoamericana. “Queremos ser parte de esta revolución, que tengamos la capacidad de desarrollar la tecnología, que no necesitemos pedirle a alguien en otra parte del mundo que desarrolle herramientas para nuestro sistema de salud o educativo. Quedarse afuera es relegarnos a no estar en la vanguardia tecnológica que es lo que ha sucedido a Latinoamérica en los últimos dos siglos”. declara una vez más el académico UC, Álvaro Soto. Por parte del Gobierno, y en las declaraciones de Aisén Etchverry, Ministra de Ciencias, se destaca: “”Avanzar en un LLM que sea de nuestra región, y liderarlo desde el Cenia, en Chile, nos permite desarrollar conocimientos prácticos y generar capacidades técnicas locales. También nos beneficia en términos de soberanía tecnológica y regulación”. A continuación, encontrarán la nota emitida por El Mercurio de forma complementaria a esta publicación

Latam GPT el modelo de lenguaje con identidad Latinoamericana que lidera Álvaro Soto a través de CENIA Leer más ”

Valeria Herskovic y Carla Gallardo participan del boletín dedicado al Día Internacional de las Niñas en las TIC emitido por la SCCC

Mediante el Boletín Informativo de la Sociedad Chile de Ciencia de la Computación se visibilizó y reconoció el valioso aporte de investigadoras y académicas en el área de la computación en Chile, con el fin de promover espacios más diversos e inclusivos en las áreas STEAM. El compromiso de la SCCC con la inclusión y la diversidad en el campo de la computación y la tecnología es firme y continuo” declaró en su saludo inicial del Boletín, Dra. Ania Cravero, Presidenta de SCCC, Académica Depto. de Cs. de la Computación e Informática, Universidad de la Frontera. La introducción fue sólida El próximo 24 de abril se conmemora el Día Internacional de las Niñas en las Tecnologías de la Información y la Comunicación (TIC), una iniciativa de la Unión Internacional de Telecomunicaciones (UIT) que busca promover la participación de niñas y mujeres jóvenes en áreas tecnológicas. Esta fecha resalta la persistente brecha de género en el acceso y desarrollo de carreras STEM, y nos invita a reflexionar sobre la importancia de generar entornos educativos inclusivos y equitativos. Valeria HerskovicA través de una entrevista titulada: “Dra. Valeria Herskovic: Desafíos Actuales de las Mujeres en Computación“, la académica y directora del DCC UC, compartió cómo vivió su experiencia universitaria y cuáles fueron sus desafíos de elegir la carrera de Ingeniería, históricamente masculinizada y con pocos referentes femeninos dentro del aula. “Les dejaría el mensaje de que crean en sus capacidades, que formen redes y se apoyen, que abran puertas a otras mujeres, que cada una desde donde esté pueda crear ambientes de bienestar y de comunidad en los que otras mujeres puedan desarrollar sus carreras” dedicó Valeria Herskovic. En el Boletín se hace mención al podcast “Ellas Programan”, conducido por la doctora DCC UC, Carla Gallardo. El podcast “Ellas Programan” es una iniciativa del equipo de comunicaciones del Instituto Milenio Fundamentos de los Datos (IMFD). Es especialmente significativo que este equipo esté conformado por dos destacadas profesionales: Paula Silva y Pamela Bacho. Ambas aportan una gran dosis de espíritu, creatividad y pasión a este proyecto, lo que se refleja en cada episodio del podcast. En palabras de Carla: Para mi, Carla Gallardo, conducir el podcast “Ellas Programan” es una tarea de gran relevancia y un verdadero honor, ya que se presenta como un espacio vital para visibilizar y empoderar a mujeres en el ámbito de la informática, la computación y la programación. En un mundo donde la brecha de género en las carreras tecnológicas es aún notable, este proyecto se convierte en una herramienta esencial para inspirar a nuevas generaciones y fomentar un entorno más inclusivo. A continuación dejamos disponible el boletín:

Valeria Herskovic y Carla Gallardo participan del boletín dedicado al Día Internacional de las Niñas en las TIC emitido por la SCCC Leer más ”

Marcelo Arenas fue distinguido como Fellow de la ACM

Según lo publicado por 24 horas TVN, mediante el programa Con Ciencia 24.7, el académico UC e investigador IMFD, Marcelo Arenas fue distinguido como Fellow de la ACM, considerado el mayor honor en informática por su trabajo en fundamentos del manejo de datos. El académico chileno Marcelo Arenas, investigador del Instituto Milenio Fundamentos de los Datos (IMFD) y profesor en la Pontificia Universidad Católica de Chile, fue distinguido como Fellow de la ACM, el máximo reconocimiento que otorga la Association for Computing Machinery, la sociedad científica más importante del área de la computación a nivel global”, publico 24.7. Este prestigioso nombramiento destaca al 1% más influyente de sus miembros por sus contribuciones a la ciencia de la computación y la tecnología. Arenas fue distinguido por sus aportes en fundamentos del manejo de datos, área en la que ha desarrollado una destacada trayectoria científica. Declaraciones del profesor UC e investigador IMFD Marcelo Arenas: “Recibo este reconocimiento muy feliz, muy contento, pues esta organización es la más importante de computación en el mundo, y este es el reconocimiento de más alto honor que da a sus miembros” Un reconocimiento que destaca a Chile Marcelo Arenas se convierte en el tercer chileno y quinto latinoamericano en recibir este galardón. Los otros dos chilenos también forman parte del IMFD: Ricardo Baeza-Yates, reconocido en 2009, y Gonzalo Navarro, premiado en 2023. Al respecto, Juan Reutter también académico UC y director del Instituto Milenio Fundamentos de los datos, comentó: “este reconocimiento destaca el trabajo de Marcelo, que ha sido crucial para el desarrollo del instituto y del área en Chile e internacionalmente. Que tres de los cinco Fellows latinoamericanos sean parte del IMFD nos llena de orgullo”. Una carrera al servicio de la ciencia de datos Marcelo Arenas es PhD en Ciencias de la Computación por la Universidad de Toronto (Canadá) y ha centrado su carrera en áreas como bases de datos, lógica aplicada y web semántica. Ha dirigido el IMFD y el Centro de Investigación de la Web Semántica, y en diferentes ocasiones ha sido invitado como experto por el W3C y la OCDE. Sus investigaciones han sido ampliamente citadas en la comunidad científica, con más de 12.000 citas según Google Scholar. En 2021, ya había sido reconocido como Miembro Distinguido de la ACM, y ese mismo año fue destacado en la sección “People of ACM”, donde se resaltó tanto su aporte académico como su historia personal. La ACM y el valor de la excelencia técnica La Association for Computing Machinery (ACM) es la mayor sociedad científica y educativa del mundo en el área de la computación. Fundada en 1947, promueve el diálogo, la excelencia técnica y el desarrollo profesional de investigadores, docentes y profesionales. Desde 1993, el programa ACM Fellows reconoce a quienes han realizado contribuciones significativas a la ciencia de la computación, influyendo en la investigación, el desarrollo de tecnologías y su aplicación en la vida diaria. La incorporación de Marcelo Arenas a esta distinguida lista posiciona a Chile como referente en ciencia de datos, y reafirma la calidad de la investigación nacional en el escenario científico global. La nota web oficial de 24 horas se encuentra disponible en el siguiente enlace: https://www.24horas.cl/conciencia-24-7/tecnologia/importante-reconocimiento-marcelo-arenas-es-nombrado-fellow-de-la-acm

Marcelo Arenas fue distinguido como Fellow de la ACM Leer más ”

Carla Gallardo y Martín Muñoz obtienen su grado de Doctorado en Ciencias de la Ingeniería, área Ciencia de la Computación

Felicitamos a los nuevos doctores; Carla y Martín quienes en este primer período del año recibieron su grado de Doctor. Es importante destacar que la defensa de Carla estuvo enfocada en la línea de investigación: “Sistemas y computación orientada a humanos”, y en el caso de Martín, se enfocó en la otra línea de investigación “Ciencia de la informática”. La presentación de Carla Gallardo se tituló: “Propuesta metodológica para fortalecer pensamiento crítico y Grit en contexto de educación básica rural“.Resumen: La educación en contextos rurales enfrenta desafíos como la falta de recursos y oportunidades de desarrollo profesional. Para abordar estos problemas, se implementó una intervención en seis escuelas rurales con el objetivo de mejorar el grit y el pensamiento crítico en alumnos y profesores mediante un modelo de clase innovador. El desarrollo de habilidades del siglo XXI, como el pensamiento crítico y la perseverancia (grit), es esencial en un mundo globalizado. La intervención incluyó un programa de formación docente con un enfoque pedagógico diseñado para fomentar estas habilidades en los estudiantes. Se proporcionó a los profesores materiales y estrategias para aplicar en el aula, utilizando la lectura de textos con preguntas que promovieran el análisis y la reflexión. Durante un año, los estudiantes participaron en actividades diseñadas para fortalecer su grit y pensamiento crítico, mientras que los docentes recibieron sesiones de coaching para mejorar su propia perseverancia. Los resultados mostraron mejoras significativas en ambos grupos. Se concluyó que el grit y el pensamiento crítico pueden desarrollarse en conjunto mediante metodologías adecuadas. Además, el enfoque reflexivo en el aula fortaleció la cohesión entre estudiantes y docentes, generando un ambiente de aprendizaje más resiliente y dinánico. La presentación de Martín Muñoz se tituló: “Output-linear enumeration for extensions of MSO“ Resumen:En una realidad donde la cantidad de datos a manejar alcanzan volúmenes muy elevados, las tareas de procesamiento automatizado de datos necesitan hacerse de forma realmente óptima. Lo ideal sería leer los datos una vez, y en el momento que termina la lectura obtener algún resultado puntual o una cierta estadística. ¿Qué pasa si uno no necesita extraer de los datos no un resultado, sino una lista muy larga de ellos? Acá las técnicas conocidas podrían no funcionar. Sin embargo, existe una estrategia que consiste en procesar los datos, y terminar con un archivo comprimido de los resultados, que además viene con un método para enlistarlas todas de forma rápida. Esto implica cambiar el paradigma de procesamiento de datos hacia los llamados algoritmos de enumeración. En esta tesis, estudiamos tareas complejas de procesamiento que se pueden expresar a través de un cierto lenguaje de especificación de consultas, llamado Segundo Orden Monádico, que se puede evaluar muy rápido sobre distintas topologías de datos. Para estas topologías ya se conocen soluciones óptimas, pero solo para el caso de respuesta puntual. Acá extendemos estas soluciones para resolver el caso de listas de resultados, y con un método de enumeración que toma tiempo óptimo. Martín Muñoz Más información sobre el programa de doctorado, área Ciencia de la Computación UC: https://www.ing.uc.cl/programas-de-estudio/postgrado/doctorado-ciencias-la-ingenieria/areas-especializacion-doctorado/

Carla Gallardo y Martín Muñoz obtienen su grado de Doctorado en Ciencias de la Ingeniería, área Ciencia de la Computación Leer más ”

“K-chai ¿Qué es y qué implica LatamGPT?” Álvaro Soto participa en una sesión online para hablar sobre el nuevo modelo de lenguaje en español

Según lo publicado en febrero del presente año por el Centro Nacional de Inteligencia Artificial LatamGPT es el nombre del primer modelo de lenguaje de gran tamaño (Large Language Model, LLM por sus siglas en inglés) que se está desarrollando de manera colaborativa en Latinoamérica y el Caribe. Coordinado por el Centro Nacional de Inteligencia Artificial (CENIA) e impulsado en conjunto con más de 30 instituciones de América Latina y el Caribe y más de 60 expertas y expertos, el proyecto cuenta con el apoyo del Ministerio de Ciencia, Tecnología, Conocimiento e Innovación en la coordinación internacional con los distintos estados de la región y el apoyo de recursos desde CAF para la ejecución del mismo. Actualmente, los modelos de lenguaje que han sido generados en el Norte Global y han estado expuesto a datos, no necesariamente reflejan la idiosincrasia y matices propios de Latinoamérica y el Caribe, una brecha de representatividad que conduce a limitaciones en su desempeño y puede generar inexactitudes o “alucinaciones” respecto de la información que involucra a nuestros países. El hecho se agrava con el uso cada más frecuente de datos sintéticos para el entrenamiento de modelos de otra generación. En febrero de 2023, se comenzó a trabajar en el primer LLM regional, en un modelo de lenguaje con un enfoque colaborativo en la construcción de las bases de datos, de modo que su entrenamiento reflejara la cultura, el lenguaje y la historia de Latinoamérica, ofreciendo información más precisa y representativa de los contextos locales.Información disponible: https://cenia.cl/2025/02/13/cenia-impulsa-el-primer-modelo-de-lenguaje-colaborativo-de-latinoamerica/ En marco del lanzamiento de LatamGPT, es fundamental y trascendental democratizar qué es y cuál será el impacto de este proyecto para Chile. Para ello, K-chai, quien tiene un propósito: “Que todas las personas aprendan del futuro ahora!”, impartirá una sesión online, que tiene de invitados/as a: Álvaro Soto, académico DCC UC y director de Cenia, Edmundo Casas Founder & CEO Kaul, Rodrigo Reyes director Beekonect, Tania Yovanovic directora TBC. Para participar puedes hacerlo en los siguientes enlaces: Youtube (suscríbete):https://www.youtube.com/watch?v=q-RS1QgppNALinkedIn: https://www.linkedin.com/events/7302436330184069121/comments/

“K-chai ¿Qué es y qué implica LatamGPT?” Álvaro Soto participa en una sesión online para hablar sobre el nuevo modelo de lenguaje en español Leer más ”

Álvaro Soto participó del Informe Internacional AI Safety Report

Álvaro Soto, académico UC y director del Centro Nacional de Inteligencia Artificial, fue uno de los chilenos que participó en el proceso de redacción de AI Safety Report, informe internacional independiente sobre seguridad de inteligencia artificial. Por parte de Chile, también participó del proceso, Raquel Pezoa, académica de la UTFSM. El medio La Tercera, publico el titular: “Dos chilenos participan en informe mundial que identificó principales riesgos de la inteligencia artificial”. El cual hace alusión a las declaraciones del académico e investigador, Álvaro Soto, quien comentó sobre la profundidad y metodología que se ocupó para la confección colaborativa del documento: AI Safety Report. “De los muchos informes que he leído creo que por su profundidad, completitud, diversidad y timming porque incluye mucho de lo que está sucediendo ahora- este es un gran aporte”, comentó en la nota Álvaro Soto. En cuanto a la confección del informe, se expone que Álvaro, participó en dos capítulos técnicos del estado del arte de la IA en términos de sus principales técnicas y cómo están impactando tanto en el caso de los modelos de lenguaje y los modelos multimodales. Lo que contó el profesor del Departamento de Ciencia de la Computación UC, es que “los autores principales hicieron un primer draft y sobre él tuvimos varias iteraciones para indicar “acá falta esto o de frontón esto no es así”. Pudimos aportar significativamente porque ese primer draft cambió bastante”. Según la publicación, AI Safety Report, es un informe que busca convertirse en el primer entendimiento científico integral y compartido de los sistemas avanzados de IA y sus riesgos. Catalogado incluso como “el reporte más esperado a nivel mundial para tomar medidas de seguridad frente a la IA“. Escrito por expertos de 30 países, se espera que el AI Safety Report sea una guía para los responsables e las políticas públicas en todo el mundo. AI Safety Report en profundidad: El texto identificado tres categorías de riesgos1.- Riesgos de uso malintencionado: estos incluyen ciberataques, la creación de material de absorción sexual infantil generado por IA excluso el desarrollo de armas biológicas. 2.- Fallas del sistema: estos incluyen sesgos, problemas de confiabilidad y la posible pérdida de control sobre sistemas avanzados de IA. 3.- Riesgos sistémicos: estos se derivan de la adopción generalizada de IA e incluyen interrupciones en la fuerza laboral, preocupaciónes sobre la privacidad e impactos ambientales. Finalmente, desde desde el gobierno, está Aisen Etcheverry, quién, a través del Ministerio de Ciencia, Tecnología, Conocimiento e Innovación ha liderado políticas públicas en colaboración con la academia: “Chile se ha consolidado como referente en esta materia dentro de América Latina, gracias a las iniciativas como la publicación de la Política Nacional de IA, y el proyecto de ley de Inteligencia Artificial actualmente en discusión en el Congreso, que busca establecer un marco para el desarrollo seguro y ético de esta tecnología en el país. En palabras de la ministra: “Esto no debiera sorprendernos. Como Gobierno hemos participado activamente de todas las instancias internacionales sobre IA durante dos años. Y el último Índice Latinoamericano de IA, que nos pone en el primer lugar del continente”. Puedes encontrar la nota publicada sobre el Índice Latinoamericano de IA: “Cenia y Cepal presentaron la II° edición del Índice Latinoamericano de Inteligencia Artificial”. Revisa a continuación la nota original publicada por el medio La Tercera

Álvaro Soto participó del Informe Internacional AI Safety Report Leer más ”

Domingo Mery se adjudica Fondecyt titulado: Búsqueda basada en IA en archivos históricos multimodales: Reflexiones sobre la época de la dictadura

Proyecto Numero 1251890Título: AI-Driven Search in Multimodal Historical Archives: Insights from the Chilean Dictatorship EraInvestigador Principal: Domingo MeryCo-Investigadores: Juan Reutter (DCC UC), Jocelyn Dunstan (DCC UC) y Hugo Rojas (Universidad Alberto Hurtado) El proyecto de investigación propuesto tiene como objetivo aprovechar el poder transformador de la Inteligencia Artificial (IA) para gestionar, analizar e interpretar archivos históricos de la época de la dictadura chilena. Impulsado por la necesidad crítica de consolidar y examinar miles de documentos, fotografías antiguas y grabaciones de audio dispersos en varios archivos y colecciones, este proyecto aborda los desafíos de los archivos fragmentados, una tarea casi imposible de lograr manualmente. El proyecto planea digitalizar, transcribir y analizar metódicamente grandes conjuntos de datos utilizando técnicas avanzadas de IA, incluido el procesamiento del lenguaje natural (PLN), el aprendizaje automático (AA) y la visión artificial (VI). Este enfoque holístico no solo preservará la integridad de los registros históricos, sino que también revelará nuevas perspectivas y conocimientos más profundos sobre la dinámica sociopolítica de la dictadura chilena, lo que hará una contribución sustancial a los campos de la investigación histórica, la educación y la justicia transicional.Nuestro equipo, experto en IA y guiado por su experiencia en historia y ciencias sociales, está preparado para investigar temas relacionados con la dictadura chilena. El desarrollo del proyecto se verá potenciado por el apoyo continuo de la Fundación Vicaría de la Solidaridad, el Museo de la Memoria, el Instituto Nacional de Derechos Humanos, el Comité para la Prevención de la Tortura, la Subsecretaría de Derechos Humanos y el Archivo Histórico General. Se espera que este proyecto de investigación produzca resultados transformadores en el análisis de archivos históricos asociados a la dictadura chilena. Utilizarán IA para analizar imágenes, audio y documentos, creando gráficos de conocimiento manteniendo estándares éticos y observando la privacidad y confidencialidad. El proyecto reconstruirá líneas de tiempo y relaciones contextuales, ofreciendo una comprensión más rica de los eventos históricos. El enfoque propuesto mejorará significativamente la forma en que los historiadores, investigadores y el público se relacionan con el pasado, particularmente con la historia chilena, asegurando una comprensión más profunda de este período crítico. Puedes encontrar más información sobre el proyecto en la página oficial de Nuestra MemorIA: https://nuestramemoria.ing.uc.cl Además, Domingo Mery participará en un segundo proyecto Fondecyt Regular como co-investigador. Proyecto Numero 1251081Titulo: Enhancing equity in computer vision and deep learning: integrating skin color measurements for fair and diverse datasetsInvestigador Principal: Ana Cabanas (Universidad Alberto Hurtado, Postdoctorado a cargo del profesor D. Mery). Co-Investigadores: Domingo Mery (DCC UC), Cristián Navarrete (Medicina UC) Este proyecto tiene por objetivo mejorar la equidad en la visión artificial y el aprendizaje profundo: integración de mediciones del color de la piel para conjuntos de datos justos y diversos. Los algoritmos predictivos influyen cada vez más en las decisiones críticas, pero los sistemas de IA pueden amplificar los sesgos derivados de datos o algoritmos defectuosos, lo que genera discriminación y desconfianza en áreas como la atención sanitaria, la seguridad y las finanzas. La equidad en la IA, especialmente en la visión artificial (CV), es esencial para crear modelos imparciales e inclusivos. Capturar con precisión la representación demográfica en los conjuntos de datos y el entrenamiento de modelos es esencial para evitar que los algoritmos sesgados perjudiquen sistemáticamente a ciertos grupos.

Domingo Mery se adjudica Fondecyt titulado: Búsqueda basada en IA en archivos históricos multimodales: Reflexiones sobre la época de la dictadura Leer más ”

“La educación es la actividad transformadora de mayor impacto en la sociedad” Marcelo Mendoza – Columna de opinión El Mercurio

Marcelo Mendoza, académico UC e investigador del Centro Nacional de Inteligencia Artificial (CENIA) y del Instituto Milenio Fundamentos de los datos (IMFD) publicó una columna de opinión en marco del Día Internacional de la Educación en el medio El Mercurio sobre el rol docente en la era digital. Entre sus declaraciones el académico e investigador destacó: “La educación en la era de la información requiere de la adopción de metodologías activas. El rol docente ya no es más el de la transmisión de conocimientos, sino el del facilitador de actividades prácticas basadas en la interacción entre estudiantes. Hoy, la comunicación en el aula sigue un modelo horizontal de comunicación, en el cual el docente transmite experiencias, orienta y acompaña. Es el estudiante el principal gestor de su proceso de aprendizaje”. Marcelo Mendoza, ha sido muy categórico en hablar de herramientas digitales o asistencia tecnológica cuando le han preguntado sobre la Inteligencia Artificial u otros avances tecnológicos al servicio de las personas.Te invitamos a leer: “Marcelo Mendoza habló con El Mercurio acerca de los desafíos tecnológicos para este 2025”, disponible: https://dcc.ing.uc.cl/marcelo-mendoza-hablo-con-el-mercurio-acerca-de-los-desafios-tecnologicos-para-este-2025/ Fuente de información: https://www.ing.uc.cl/wp-content/uploads/2025/01/5658864_4206953-scaled.jpg

“La educación es la actividad transformadora de mayor impacto en la sociedad” Marcelo Mendoza – Columna de opinión El Mercurio Leer más ”

Explorando los Archivos de la Memoria de Chile (1973-1990) | Domingo Mery | TEDxPUCdeChile

En agosto del 2024, Domingo Mery, académico UC, resumió los principales logros que ha obtenido el equipo en esta etapa del año del proyecto Nuestra MemorIA en marco de charlas TEDx PUCdeChile. Puedes encontrar la nota publicada: “Domingo Mery presentó: “Explorando los Archivos de la Memoria de Chile (1973-1990): Una mirada desde la Ciencia de Datos” en TEDx PUC de Chile“, disponible: https://dcc.ing.uc.cl/domingo-mery-presento-explorando-los-archivos-de-la-memoria-de-chile-1973-1990-una-mirada-desde-la-ciencia-de-datos-en-tedx-puc-de-chile/ Según lo publicado en la descripción por TEDx Talks: “Domingo Mery nos lleva a reflexionar sobre un capítulo doloroso de nuestra historia reciente, explorando cómo la tecnología puede ayudar a rescatar la memoria de las violaciones a los derechos humanos ocurridas durante la dictadura chilena. A través de herramientas como el análisis de fotografías, documentos y audios, Domingo nos muestra cómo la ciencia de datos puede contribuir a la búsqueda de verdad, justicia y reparación. ¿Qué sucede cuando unimos memoria, tecnología y humanidad? Descubrámoslo juntos. Profesor Titular en el Departamento de Ciencia de la Computación de la Pontificia Universidad Católica de Chile (UC). Obtuvo su M.Sc. en Ingeniería Eléctrica de la Universidad Técnica de Karlsruhe y su Doctorado con distinción de la Universidad Técnica de Berlín. Fue investigador en el Instituto de Tecnología de Medición y Automatización de la Universidad Técnica de Berlín, colaborando con YXLON X-Ray International, y recibió becas de la Konrad-Adenauer Foundation y el DAAD. En la UC, ha sido Jefe del Departamento de Ciencia de la Computación y Profesor Asociado Visitante en la Universidad de Notre Dame. También fue Director de Investigación e Innovación de la Escuela de Ingeniería. Es Editor Asociado de varias revistas científicas. Ha publicado más de 90 artículos técnicos en revistas indexadas por el SCI y más de 100 artículos en conferencias. Fue Co-presidente Local de ICCV2015 y presidente del programa general de PSIVT2007, PSIVT2009 y Co-presidente General de PSIVT2011″. Charla disponible en el siguiente enlace: https://www.youtube.com/watch?v=C1qcwSY_nLs

Explorando los Archivos de la Memoria de Chile (1973-1990) | Domingo Mery | TEDxPUCdeChile Leer más ”

Jocelyn Dunstan habló con Cooperativa sobre la diversidad cultural en los modelos de lenguaje

Jocelyn Dunstan, académica del Departamento de Ciencia de la Computación UC y del Instituto de Ingeniería Matemática y Computacional UC e investigadora del Instituto Fundamentos de los datos, conversó recientemente con Cooperativa Ciencia sobre los avances en la inclusión cultural en los modelos de lenguaje. La entrevista se centró en un significativo encuentro realizado en febrero de este año, donde investigadores de 28 países se unieron con el objetivo de aumentar la diversidad cultural en los modelos de inteligencia artificial, una iniciativa crucial para corregir la sobre representación del norte global en estas tecnologías. La académica e investigadora, destacó que muchos modelos de lenguaje actuales tienden a estar sesgados hacia las culturas del norte global, lo que resulta en fallos al interpretar realidades de otras partes del mundo. Un ejemplo citado por la académica fue el de un modelo incapaz de reconocer un matrimonio en un contexto asiático, simplemente porque no se ajustaba al estereotipo del vestido blanco de boda occidental. Este tipo de limitación subraya la necesidad de entrenar los modelos con una mayor variedad de representaciones culturales. En este proceso, Jocelyn y la periodista Paula Silva, quienes representaron a Chile, participaron activamente en la creación de preguntas y respuestas que diversificaron los conocimientos utilizados para alimentar estos modelos. Un ejemplo ilustrativo fue la foto de una minga en Chiloé, una tradición local en la que se traslada una casa con la colaboración de vecinos y amigos. El desafío consistió en formular preguntas y respuestas que, sin ser demasiado obvias, permitieran que quienes conocieran la cultura chilena pudieran reconocer la situación. “La pregunta era: ¿Qué están haciendo las personas con la casa?”, con respuestas que incluían: “Trasladarla”, “Lavarla” y “Botarla al mar”. El resultado de este trabajo colaborativo es un paper con 9.000 preguntas y respuestas diseñadas para ampliar la representatividad de diversas regiones del mundo, como África, Asia y Latinoamérica, en los modelos de lenguaje. Las categorías utilizadas para alimentar estos modelos fueron diversas, abarcando temas como historia y arte, vestimenta, cocina, deportes, plantas, vehículos, entre otros. “Este paper propone una nueva manera de crear bases de datos para la Inteligencia Artificial”, aseguró Dunstan, quien también destacó la importancia del enfoque multimodal del trabajo, donde los modelos de lenguaje aprenden tanto de imágenes como de texto. Aunque el paper se publicará oficialmente en una conferencia en diciembre, hasta el momento se han evaluado 14 modelos que intentan responder las preguntas del dataset, generando un entorno de competencia interesante y promoviendo una mayor equidad en el uso de imágenes y datos del sur global. “Es muy interesante generar la conversación y la competencia en un dataset diverso. Eso ya es tremendo. Es como aparecer en el mapa, en especial para Asia, África y Latinoamérica, que usualmente no están representados en estos contextos. Esto hace que las imágenes del sur global empiecen a ser utilizadas, algo que no teníamos antes”, concluyó Dunstan.

Jocelyn Dunstan habló con Cooperativa sobre la diversidad cultural en los modelos de lenguaje Leer más ”

Desplazamiento al inicio