Santiago Mazuelas Franco, Aritz Pérez Martínez y Yuan Shen

PREMIOS SOCIEDAD DE ESTADÍSTICA, INVESTIGACIÓN OPERATIVA Y CIENCIA DE DATOS (SEIO)-FUNDACIÓN BBVA

Mejor Contribución en Estadística e Investigación Operativa Aplicada a la Ciencia de los Datos y el Big Data

2025

Por su artículo “Generalized Maximum Entropy for Supervised Classification” (“Entropía máxima generalizada para la clasificación supervisada”), publicado en IEEE Transactions on Information Theory.

CONTRIBUCIÓN

Vídeo

Entrevista a Santiago Mazuelas

Discurso

“Casi todo el mundo utiliza actualmente la inteligencia artificial, y todos hemos observado que habitualmente los resultados son muy buenos pero, de vez en cuando, comete errores muy grandes y lo hace con una confianza muy alta”, afirma Santiago Mazuelas, Ikerbasque Research Associate Professor en el Centro Vasco de Matemática Aplicada (BCAM). “La IA tiende a estar muy segura de que la respuesta es correcta, aunque sea errónea. Nuestro trabajo intenta hacer que la inteligencia artificial sea más confiable”.

Su artículo Generalized Maximum Entropy for Supervised Classification (“Entropía máxima generalizada para la clasificación supervisada”), publicado en IEEE Transactions on Information Theory y escrito junto a Yuan Shen, catedrático en el Departamento de Ingeniería Electrónica de la Universidad Tsinghua (China), y Aritz Pérez, investigador posdoctoral en el Centro Vasco de Matemática Aplicada (BCAM), presenta nuevos métodos para el aprendizaje máquina —una rama de la IA— que dan “garantías de comportamiento”, según explica Mazuelas.

“Sistemas como ChatGPT están cambiando la manera en que vivimos, y su base metodológica y algorítmica está en las técnicas estadísticas y de investigación operativa. Es importante que todo el mundo tenga conocimientos en estos campos”

En concreto, se centran en los algoritmos de clasificación supervisada, como aquellos capaces de predecir si una persona está sana o padece una patología a partir de imágenes médicas. Este tipo de algoritmos se entrena con datos reales para los que ya se conoce el diagnóstico, y existen muchos de ellos que difieren, además de en el contexto de aplicación (desde la detección del fraude o la predicción de consumos energéticos), en su planteamiento matemático.

Debido a estas diferencias, no siempre es inmediato saber qué algoritmo elegir para una aplicación concreta, y el trabajo galardonado propone un criterio para comparar el rendimiento de unos algoritmos frente a otros. Además de obtener un marco metodológico común basado en el principio de máxima entropía —que constituye un notable avance para la ciencia de datos y el aprendizaje automático—, los autores emplean este mismo marco para proponer además nuevos algoritmos de clasificación. “Una de las mayores aplicaciones prácticas de nuestro trabajo es lograr que los algoritmos de aprendizaje automático sean más confiables, al dar una estimación del error máximo que pueden tener”, argumenta Mazuelas. “Esta estimación es útil, por ejemplo, para que un doctor pueda saber hasta qué punto confiar o no en ese algoritmo en un determinado momento”.

“Sistemas como ChatGPT están cambiando la manera en que vivimos”, continúa el galardonado, “y su base metodológica y algorítmica está en las técnicas estadísticas y de investigación operativa. Es muy importante que todo el mundo tenga al menos ciertos conocimientos en estos campos, porque nos pueden ayudar a interpretar los datos o a tomar mejores decisiones”, concluye.