¿Qué es un Data Lake Sanitario?
Un Data Lake sanitario es un repositorio de datos de gran capacidad y flexibilidad que almacena todos los datos de una organización sanitaria. El propósito es generar un análisis masivo con capacidad de respuesta en tiempo real para mejorar la gestión sanitaria.
En el caso del proyecto impulsado por el Gobierno español, el Data Lake sanitario tiene como finalidad identificar y mejorar el diagnóstico y tratamiento de enfermedades, identificar factores de riesgo, analizar tendencias, identificar patrones y predecir situaciones de riesgo sanitario. Para ello, se utilizarán algoritmos de inteligencia artificial y nuevas arquitecturas de sistemas escalables, así como herramientas de procesamiento y descubrimiento de modelos.
El proyecto, que ha recibido una inversión de 100 millones de euros entre 2021 y 2023, forma parte de los fondos de recuperación Next Generation y será llevado a cabo por la Secretaría de Estado de Digitalización e Inteligencia Artificial en colaboración con el Ministerio de Sanidad.
La definición de usos se establecerá en fases posteriores del proyecto y se prevé la posibilidad de incorporar a los proveedores sanitarios privados.
La diferencia de este repositorio de datos respecto de los conocidos como ‘data warehouse’ estriba en que “una base de datos, la organizas en base a lo que tú quieres saber; en cambio, cuando construyes un data lake, construyes un dato en base a qué preguntas futuras te harás” (Orlando Vergara, director del Área de Neurociencias de Novartis).
Ahora ya parece todo más claro…