La Fundación TIC Salut Social y Bioinformatics Barcelona generarán datos sintéticos de salud para facilitar la investigación en inteligencia artificial

La Fundación TIC Salut Social ha firmado un convenio de colaboración con Bioinformatics Barcelona (BIB) para definir y ejecutar actuaciones conjuntas para el desarrollo y utilización de tecnologías de la información en el ámbito del servicio de la salud de las personas. El primer proyecto consistirá en la generación de datos sintéticos que puedan dar respuesta a los retos del Programa de Salud/IA y ser empleados en la investigación en inteligencia artificial en el ámbito de la salud.

El director de la Fundación TIC Salut Social, Joan Guanyabens, destaca que “la alianza con el BIB permitirá probar la metodología de evaluación de la calidad de los datos sintéticos que hemos desarrollado, así como explorar el comportamiento de los algoritmos de inteligencia artificial en salud, con la incorporación de este tipo de datos que simulan los datos reales”.

Por su parte, la presidenta del BIB, la Dra. Ana Ripoll, asegura que “a través de esta colaboración, los grupos de investigación del BIB aplicarán su conocimiento y su experiencia en la generación de datos sintéticos que permitirán transformar las limitaciones de los datos reales en oportunidades para avanzar tanto en la investigación, como en la generación de soluciones industriales y la docencia, contribuyendo de este modo al abordaje de los problemas de salud que nos afectan.

¿Qué son los datos sintéticos?

Los datos sintéticos son datos artificiales que se generan a partir de datos reales, de forma que se mantienen la distribución estadística y las características, a fin de que puedan ser analizados para extraer conclusiones estadísticas equivalentes a las que sacaría con los datos reales. En otras palabras, los datos sintéticos permiten el entrenamiento de modelos de inteligencia artificial, de forma menos intrusiva para la privacidad de los individuos, porque los datos utilizados en el proceso de entrenamiento no se refieren directamente a ninguna persona identificada o identificable.

En cuanto a su explotación, los datos sintéticos pueden ser utilizados en los diferentes entornos y escenarios para los que han sido creados, de forma segura y en cumplimiento con el Reglamento General de Protección de Datos (RGPD) de la Unión Europea, que sólo permite la explotación de datos reales de salud en entornos de investigación muy específicos y limitados.

Generalmente, los datos sintéticos se crean con ayuda de técnicas de inteligencia artificial diversas. Así, se pueden crear mediante modelos de simulación con técnicas de data augmentation y de sobremuestreo, entre otros. Las redes neuronales generativas adversarias (GAN) y los autoencoders variacionales (VAE) conforman el estado del arte de los métodos de generación de datos sintéticos.

Retos del Programa Salud/IA

Los datos sintéticos que se crearán a partir de la colaboración con el BIB se utilizarán en el marco de los retos del Programa Salud/IA. Los retos tienen como objetivo evaluar soluciones de inteligencia artificial que ayuden a resolver problemas concretos en el ámbito sanitario y se materializan con una convocatoria pública y abierta de proyectos. Actualmente, ya está en marcha un reto para buscar soluciones de apoyo al proceso de retinopatía diabética, integradas e interoperables en el ámbito de la atención primaria del Sistema Sanitario Integral de Utilización Pública de Cataluña, y se están preparando otros retos para buscar soluciones de inteligencia artificial para la dermatología y explotación de pruebas de diagnóstico como las radiografías de tórax o los electrocardiogramas, entre otros.

Al margen del uso de los datos sintéticos para el Programa, en el marco de la alianza con el BIB también se estudiarán otros casos de uso y cómo estos datos se pueden poner a disposición de otras posibles partes interesadas en la investigación en inteligencia artificial en el ámbito de la salud; un campo que precisa disponer del mayor volumen de datos posible y de una diversidad que represente a toda la población.

Sobre Bioinformatics Barcelona (BIB)

El BIB es la asociación sin ánimo de lucro que reúne a más de 50 socios públicos y privados del sector de ciencias de la vida, incluyendo centros académicos, tecnológicos, hospitalarios, grandes infraestructuras científicas y empresas, con el objetivo de impulsar la generación de conocimiento en el ámbito de la Bioinformática. Las entidades asociadas del BIB abarcan todas las actividades de la cadena de valor de la Bioinformática, desde la adquisición y preparación de los datos hasta la generación de nuevo conocimiento y la creación de soluciones específicas, pasando por todas las etapas intermedias de análisis avanzado, de interpretación de los datos, la creación de prototipos y su validación.

  • Los datos sintéticos se generan mediante técnicas de inteligencia artificial y permiten su uso por investigación en cumplimiento de la normativa de protección de datos.