Codificación semántica avanzada y análisis predictivo en UCI

Este caso de uso aplica técnicas avanzadas de Procesamiento del Lenguaje Natural (PLN) para transformar los informes clínicos de alta de las Unidades de Cuidados Intensivos (UCI), tradicionalmente no estructurados, en datos clínicos estructurados, interoperables y reutilizables. Para ello, se emplean modelos de lenguaje de gran tamaño (LLMs) desplegados en entornos locales, como gemma-4-31B y medgemma-1.5-4b, que permiten la extracción automatizada de información clínica a partir de texto libre. A partir del contenido generado durante el proceso asistencial, el sistema identifica y extrae información relevante, como diagnósticos, procedimientos, complicaciones, tratamientos farmacológicos y variables temporales, que posteriormente se normalizan mediante estándares internacionales como SNOMED CT, CIE-10, LOINC o ATC. Esta normalización garantiza la calidad semántica de la información y facilita su integración en modelos comunes de datos, como OMOP CDM. Todo ello se realiza garantizando la anonimización de los datos, preservando la privacidad de los pacientes y el cumplimiento de la normativa vigente.

Fotografía de un quirófano con un monitor de frecuencia cardiaca en primer plano

El resultado es la generación de conjuntos de datos clínicos estructurados de alta calidad, anonimizados y listos para su explotación, que permiten su uso en analítica avanzada y el desarrollo de modelos predictivos orientados a anticipar complicaciones, mejorar la toma de decisiones clínicas y optimizar la atención a pacientes críticos. Además, este enfoque impulsa la reutilización segura del dato clínico y la interoperabilidad entre sistemas, contribuyendo al desarrollo de un ecosistema de datos de salud más eficiente y alineado con los principios del Espacio Europeo de Datos Sanitarios.

Entidades impulsoras

Comunidad Autónoma de Castilla La Mancha
Comunidad Autónoma de Castilla-La Mancha
Ministerio de Sanidad
Ministerio de Sanidad

Origen de datos

Ilustración de una persona usando un ordenador portátil

Historia Clínica Electrónica (HCE) hospitalaria

Fuente principal de datos clínicos no estructurados. Incluye la información generada durante el proceso asistencial en UCI, en particular los informes de alta, a partir de los cuales se realiza la extracción semántica.

Ilustración de un profesional sanitario delante de la entrada a la UCI

Conjunto Mínimo Básico de Datos (CMBD)

Fuente estructurada de actividad hospitalaria utilizada como complemento para análisis, validación y enriquecimiento de la información clínica.

Resultados del caso de uso

Profesional sanitario atendiendo a un paciente con tecnología futurista

Conjunto de datos clínicos estructurado y normalizado (Fase I)

El caso de uso permite transformar la información clínica no estructurada procedente de las UCI en un conjunto de datos estructurado, codificado y normalizado.

A partir del texto libre, se extraen automáticamente variables relevantes que se organizan conforme a estándares comunes, alineados con el modelo de la BDCAP, generando una base de datos homogénea, interoperable y preparada para su reutilización.

Profesionales sanitarios contemplando varios monitores con datos anatómicos

Base de datos preparada para analítica avanzada

El dataset resultante constituye una base sólida para el desarrollo de modelos analíticos y predictivos, permitiendo la explotación de la información clínica de forma sistemática, escalable y reproducible.

Beneficios del caso de uso

Ilustración de una tablilla con tareas marcadas como correctas

Mejora de la calidad y disponibilidad de la información clínica

La estructuración y normalización de los datos permite disponer de información homogénea, comparable y reutilizable, facilitando su análisis y explotación.

Ilustración de un profesional sanitario con una tablilla, un reloj y una rueda dentada

Optimización de recursos y eficiencia operativa

La automatización del procesamiento de información clínica reduce la carga asociada a tareas manuales de revisión y codificación, acelerando la disponibilidad del dato y mejorando la eficiencia asistencial.

Ilustración de un candado, una base de datos, un gráfico de barras y una nube

Impulso a la analítica avanzada y modelos predictivos

La disponibilidad de datos estructurados habilita el desarrollo de modelos orientados a anticipar complicaciones, mejorar la toma de decisiones y apoyar la investigación clínica.

Ilustración de un profesional sanitario y otro usuario enfrente de un monitor

Interoperabilidad y reutilización del dato en el ecosistema ENDS

El uso de estándares comunes facilita la integración con otros sistemas y su reutilización en distintos contextos de uso secundario, contribuyendo a un ecosistema de datos más conectado y eficiente.