Grupo de Evaluación de Modelos de Lenguaje e Inteligencia Artificial agéntica
Con el despliegue general de modelos de lenguaje en sistemas agénticos y aplicaciones interactivas, la evaluación cuidadosa de estos modelos se ha convertido en una necesidad central de investigación. Nuestro grupo se enfoca en desarrollar métodos claros y reproducibles para comprender el comportamiento de los modelos a través de diferentes tareas y contextos. Tenemos por objetivo caracterizar las fortalezas y limitaciones de los modelos con rigor, fundando nuestro trabajo en evidencia empírica más que en supuestos. Nuestra filosofía es que el progreso en inteligencia artificial debe estar apoyado por marcos de evaluación transparentes que den forma al desarrollo, guíen el uso responsable y ayuden a la comunidad a construir modelos que son confiables, interpretables y útiles.
Coordinadores: Ramiro Caso, Mauro Santelli, Joaquín Toranzo Calderón
Página web: https://referentia-group.github.io/