Alberto Gutiérrez ha presentado recientemente su Trabajo Fin de Máster dentro del ámbito del proyecto GenObIA, este desarrollo lleva por título “Clasificador Multi-nivel para la identificación de individuos en riesgo de desarrollar sobrepeso». En este trabajo se ha desarrollado un sistema clasificador basado en técnicas de inteligencia artificial y aprendizaje automático. El sistema consiste en un novedoso mecanismo de clasificación Multi-nivel en el que se combinan hasta tres clasificadores diferentes. Éstos han sido seleccionados de un conjunto de 14 algoritmos de clasificación supervisada mediante un proceso previo de validación cruzada. El clasificador funciona colocando por niveles distintos algoritmos de clasificación y estableciendo unos umbrales para la aceptación de la respuesta de cada uno de los algoritmos. Los algoritmos de clasificación proporcionan tanto el grupo que asignan, como la probabilidad de que esa clasificación sea correcta. Si la probabilidad que proporciona el primer algoritmo es superior a este umbral, la decisión del clasificador se da por correcta, en caso contrario se solicita una clasificación al algoritmo del siguiente nivel y así sucesivamente.
Este clasificador Multi-nivel se ha diseñado específicamente para adaptarse a los datos del proyecto Genobia-CM, aunque su diseño permite aplicarlo a cualquier otro problema que utilice el formato de datos de entrada adecuado, que es el habitual en problemas de clasificación. Genobia es un proyecto participado por un consorcio de 20 instituciones, hospitales y empresas, financiado por el Fondo Social Europeo y la Comunidad de Madrid. El proyecto busca diseñar, utilizando inteligencia artificial, algoritmos predictivos para la identificación de personas en riesgo de desarrollar sobrepeso, obesidad y sus patologías asociadas. En este trabajo se ha utilizado una base de datos con 1179 individuos proporcionada por el Consorcio en el que se recoge información de los hábitos de vida y adherencia a la dieta mediterránea. Se ha implementado el clasificador Multi-nivel como algoritmo predictivo y de clasificación del riesgo de padecer sobrepeso, adaptándolo a los datos proporcionados donde el número de casos de obesidad es muy reducido. Mediante nuestra propuesta se consigue reducir el número de falsos negativos (casos de personas que padecen sobrepeso clasificadas como que no lo padecen), lo que es fundamental dentro del problema en cuestión, ya que, al tratarse de salud pública, esto implica reducir el número de acciones clínicas erróneas u omitidas.
Los resultados obtenidos rondan el 80 % de tasa de exactitud y nuestro sistema está perfectamente preparado para aceptar los datos que proporcione el consorcio en el futuro. Estos datos incluirán información genética de cada individuo y esperamos que además incluya un mayor número de casos. Además, se han realizado otros tipos de clasificadores basados en árboles de decisión, así como un exhaustivo análisis de las variables, su influencia en los modelos, redundancias y un estudio de sensibilidad de los modelos a las mismas.