La Fundació TIC Salut Social i Bioinformatics Barcelona generaran dades sintètiques de salut per facilitar la recerca en intel·ligència artificial

La Fundació TIC Salut Social ha signat un conveni de col·laboració amb Bioinformatics Barcelona (BIB) per definir i executar actuacions conjuntes per al desenvolupament i la utilització de tecnologies de la informació en l’àmbit del servei de la salut de les persones. El primer projecte consistirà en la generació de dades sintètiques que puguin donar resposta als reptes del Programa de Salut/IA i ser emprades en la recerca en intel·ligència artificial en l’àmbit de la salut.  

El director de la Fundació TIC Salut Social, Joan Guanyabens, destaca que “l’aliança amb el BIB permetrà provar la metodologia d’avaluació de la qualitat de les dades sintètiques que hem desenvolupat, així com explorar el comportament dels algorismes d’intel·ligència artificial en salut, amb la incorporació d’aquest tipus de dades que simulen les dades reals ”.  

Per la seva banda, la presidenta del BIB, la Dra. Ana Ripoll, assegura que “a través d’aquesta col·laboració, els grups de recerca del BIB aplicaran el seu coneixement i la seva experiència en la generació de dades sintètiques que permetran transformar les limitacions de les dades reals en oportunitats per avançar tant en la recerca, com en la generació de solucions industrials i la docència, contribuint d’aquesta manera a l’abordatge dels problemes de salut que ens afecten.” 

Què són les dades sintètiques? 

Les dades sintètiques són dades artificials que es generen a partir de dades reals, de forma que es mantenen la distribució estadística i les característiques, per tal que puguin ser analitzades per extreure conclusions estadístiques equivalents a les quals trauria amb les dades reals. En altres paraules, les dades sintètiques permeten l’entrenament de models d’intel·ligència artificial, de manera menys intrusiva per a la privacitat dels individus, perquè les dades utilitzades en el procés d’entrenament no es refereixen directament a cap persona identificada o identificable.   

Pel que fa a la seva explotació, les dades sintètiques poden ser emprades en els diferents entorns i escenaris per als quals han estat creades, de forma segura i en compliment amb el Reglament General de Protecció de Dades (RGPD) de la Unió Europea, que només permet l’explotació de dades reals de salut en entorns de recerca molt específics i limitats.  

Generalment, les dades sintètiques es creen amb l’ajuda de tècniques d’intel·ligència artificial diverses. Així, es poden crear mitjançant models de simulació amb tècniques de data augmentation i de sobremostreig, entre d’altres. Les xarxes neuronals generatives adversàries (GAN) i els autoencoders variacionals (VAE) conformen l’estat de l’art dels mètodes de generació de dades sintètiques. 

Reptes del Programa Salut/IA 

Les dades sintètiques que es crearan a partir de la col·laboració amb el BIB s’empraran en el marc dels reptes del Programa Salut/IA. Els reptes tenen l’objectiu d’avaluar solucions d’intel·ligència artificial que ajudin a resoldre problemes concrets en l’àmbit sanitari i es materialitzen amb una convocatòria pública i oberta de projectes. Actualment, ja està en marxa un repte per buscar solucions de suport al procés de la retinopatia diabètica, integrades i interoperables en l’àmbit de l’atenció primària del Sistema Sanitari Integral d’Utilització Pública de Catalunya, i s’estan preparant altres reptes per buscar solucions d’intel·ligència artificial per a la dermatologia i l’explotació de proves de diagnòstic com les radiografies de tòrax o els electrocardiogrames, entre d’altres.  

Al marge de l’ús de les dades sintètiques per al Programa, en el marc de l’aliança amb el BIB també s’estudiaran altres casos d’ús i de quina manera aquestes dades es poden posar a disposició d’altres possibles parts interessades en la recerca en intel·ligència artificial en l’àmbit de la salut; un camp que precisa disposar del major volum de dades possible i d’una diversitat que representi tota la població.  

Sobre Bioinformatics Barcelona (BIB) 

El BIB  és l’associació sense ànim de lucre que aplega més de 50 socis públics i privats del sector de ciències de la vida, incloent centres acadèmics, tecnològics, hospitalaris, grans infraestructures científiques i empreses, amb l’objectiu d’impulsar la generació de coneixement en l’àmbit de la Bioinformàtica. Les entitats associades del BIB abasten totes les activitats de la cadena de valor de la Bioinformàtica, des de l’adquisició i preparació de les dades fins a la generació de nou coneixement i la creació de solucions específiques, passant per totes les etapes intermèdies d’anàlisi avançada, d’interpretació de les dades, la creació de prototips i la seva validació. 

  • Les dades sintètiques es generen mitjançant tècniques d’intel·ligència artificial i permeten el seu ús per investigació en compliment de la normativa de protecció de dades.