1 Identificación priorizada de pacientes con enfermedades crónicas a través del análisis de historias clínicas electrónicas Estudiante: David Elías Peña Clavijo Director: Ing. Alexandra Pomares Q. PhD
2 A GENDA 1.Problemática de Aplicación. 2.Objetivos. 3.Metodología de Investigación. 4.Estado del arte. 5.Modelo de Análisis de Historias Clínicas Electrónicas. 6.Aplicación – DISEARCH. 7.Evaluación Funcional. 8.Conclusiones y Trabajo Futuro.
3 P ROBLEMÁTICA DE APLICACIÓN H ISTORIA C LÍNICA Información depositada en las historias clínicas es de gran utilidad para médicos y pacientes. Describe: –Diagnóstico. –Tratamiento. –Seguimiento. De gran utilidad para realizar análisis que favorezcan la prestación y administración de servicios de salud.
4 P ROBLEMÁTICA DE APLICACIÓN I NVESTIGACIONES CLÍNICAS RETROSPECTIVAS Enfermedad crónica tiene tratamiento pero no cura. Orientan a enfermedades crónicas en historias clínicas. Identificación de historias médicas. Proceso manual, limitado y tedioso. Uso inadecuado del estándar CIE10.
5 P ROBLEMA DE APLICACIÓN Las historias clínicas contienen en gran medida texto narrativo o texto libre. Por lo tanto, un método fiable y eficiente para extraer información estructurada puede beneficiar en gran medida los esfuerzos de investigación.
6 P ROBLEMA DE APLICACIÓN La dificultad para realizar búsquedas y análisis sobre historias clínicas electrónicas, cuando contienen datos estructurados y no estructurados (como los textos narrativos) son el principal problema que aborda esta investigación.
7 O BJETIVO GENERAL Identificar de manera priorizada pacientes con enfermedades crónicas a través del análisis de historias clínicas electrónicas. Los resultados del trabajo de grado podrán ser empleados para el proyecto de “Búsqueda y análisis semiautomático de pacientes con enfermedades crónicas a partir de la exploración retrospectiva de las historias clínicas electrónicas” asociado al departamento de Ingeniería de sistemas y al hospital San Ignacio.
8 O BJETIVOS E SPECÍFICOS Diseñar un modelo de análisis basado en técnicas de minería de datos que facilite la detección de pacientes con enfermedades crónicas. Construir un prototipo funcional del modelo que analice historias clínicas electrónicas que contengan texto narrativo y datos estructurados para la detección priorizada de pacientes con enfermedades crónicas. Validar el prototipo funcional usando como casos de estudio las enfermedades falla cardiaca, diabetes e hipertensión pulmonar.
9 M ETODOLOGÍA DE INVESTIGACIÓN
10 E STADO DEL ARTE C LASIFICACIÓN TAXONÓMICA Atributos relevantes dentro de la revisión de la bibliografía. Apoyar el análisis de la bibliografía.
11 E STADO DEL ARTE A NÁLISIS COMPARATIVO Análisis comparativo de los trabajos relacionados con base en la taxonomía obtenida.
12 E STADO DEL ARTE I DENTIFICACIÓN DE MEJORAS Proceso estándar y repetible en diferentes sistema de información hospitalario. Enfoque en texto narrativo y tomar en cuenta los campos estructurados asociados a una HCE. Permitir definición para diferentes enfermedades. Enriquecimiento de definiciones de enfermedades. Parámetros simples para la identificación de enfermedades. Contemplar más que la “mejor” historia clínica.
13 M ODELO DE A NÁLISIS DE H ISTORIAS C LÍNICAS E LECTRÓNICAS Entrevistas, tanto con el cuerpo médico como a los expertos del Sistema de Información Hospitalario Mejoras Identificadas en Estado del Arte.
14 M ODELO DE A NÁLISIS DE H ISTORIAS C LÍNICAS E LECTRÓNICAS Modelo propuesto Definir enfermedad. –Base de conocimiento de enfermedades. Preseleccionar HCE. –Historias clínicas electrónicas. Generar vista minable. Analizar HCE. Priorizar Resultados. Mostrar Resultados.
15 M ODELO DE A NÁLISIS DE H ISTORIAS C LÍNICAS E LECTRÓNICAS E STRATEGIA
16 M ODELO DE A NÁLISIS DE H ISTORIAS C LÍNICAS E LECTRÓNICAS Definir Enfermedad Preseleccionar de HCE Generación vista minable Análisis de HCE Priorizar Resultados Mostrar Resultados
17 SubgrupoLiteral Vocabulario Nombre científico del diagnóstico. Nombre formal del diagnóstico. (Según el CIE 10) Nombre informal del diagnóstico Sinónimos diagnóstico Acrónimo Taxonomía de Vocabulario Especializaciones del diagnóstico Generalizaciones del diagnóstico Exámenes confirmatorios (Si existen) Nombre formal del examen Nombre informal del examen Exámenes Asociados Nombre formal del examen Nombre informal del examen Síntomas Síntomas característicos por género (en lenguaje científico, formal e informal) Síntomas característicos por etapa de vida (en lenguaje científico, formal e informal) Medicamentos Nombre Formal Nombre Genérico Tratamiento Nombre Tratamiento Antecedentes Antecedentes y Factores de Riesgo Complicaciones o desenlaces Elementos de Exclusión (si existen) Términos excluyentes Frases típicas de descarte que incluyan nombre del diagnóstico M ODELO DE A NÁLISIS DE H ISTORIAS C LÍNICAS E LECTRÓNICAS Definir Enfermedad El propósito de esta plantilla es documentar todos los elementos necesarios para configurar la búsqueda automática de historias clínicas electrónicas que tienen como diagnóstico una enfermedad crónica establecida.
18 M ODELO DE A NÁLISIS DE H ISTORIAS C LÍNICAS E LECTRÓNICAS Definir Enfermedad Preseleccionar de HCE Generación vista minable Análisis de HCE Priorizar Resultados Mostrar Resultados
19 M ODELO DE A NÁLISIS DE H ISTORIAS C LÍNICAS E LECTRÓNICAS P RESELECCIONAR HCE Fase del modelo el cual transforma la información proveniente de un Sistema de Información Hospitalario, que contiene los registros médicos asociados a los pacientes. También define los parámetros para acotar el conjunto de historias clínicas a analizar.
20 M ODELO DE A NÁLISIS DE H ISTORIAS C LÍNICAS E LECTRÓNICAS Definir Enfermedad Preseleccionar de HCE Generación vista minable Análisis de HCE Priorizar Resultados Mostrar Resultados
21 M ODELO DE A NÁLISIS DE H ISTORIAS C LÍNICAS E LECTRÓNICAS G ENERACIÓN VISTA MINABLE Fase que estructura y estandariza la información asociada a una historia clínica para su posterior análisis. Contiene campos estructurados asociados a una HCE. Contiene el texto narrativo del diagnóstico asociado a una HCE.
22 M ODELO DE A NÁLISIS DE H ISTORIAS C LÍNICAS E LECTRÓNICAS Definir Enfermedad Preseleccionar de HCE Generación vista minable Análisis de HCE Priorizar Resultados Mostrar Resultados
23 M ODELO DE A NÁLISIS DE H ISTORIAS C LÍNICAS E LECTRÓNICAS A NÁLISIS DE HCE Análisis de texto no estructurado o narrativo Análisis de datos estructurados Análisis de historias clínicas Electrónicas
24 M ODELO DE A NÁLISIS DE H ISTORIAS C LÍNICAS E LECTRÓNICAS A NÁLISIS DE HCE Técnicas de minería de texto y de extracción de información (Information Extraction). No estructurado. –Proceso de preparación de datos. –Minería de texto –Extracción de información. Estructurado. –Consultas estructuradas.
25 M ODELO DE A NÁLISIS DE H ISTORIAS C LÍNICAS E LECTRÓNICAS A NÁLISIS DE HCE – P REPARACIÓN DE DATOS Segmentación Eliminación de palabras irrelevantes Etiquetado gramatical POSTagger Lematización
26 M ODELO DE A NÁLISIS DE H ISTORIAS C LÍNICAS E LECTRÓNICAS A NÁLISIS DE HCE – A NÁLISIS DE TEXTO Expresiones regulares – * +( | ) –Ejemplos: Negativo de diabetes. Descartar diabetes. No hay curse de TEP. Proceso de etiquetado consiste en reconocer y asignar los hallazgos en una Historia Clínica Electrónica.
27 M ODELO DE A NÁLISIS DE H ISTORIAS C LÍNICAS E LECTRÓNICAS A NÁLISIS DE HCE – C ONSULTAS SQL SELECT [VALOR A RECUPERAR] FROM [ENTIDAD A CONSULTAR] WHERE [CONDICIONES DE BÚSQUEDA]. Campos como: –Medicamentos. –Exámenes. –CIE10.
28 M ODELO DE A NÁLISIS DE H ISTORIAS C LÍNICAS E LECTRÓNICAS Definir Enfermedad Preseleccionar de HCE Generación vista minable Análisis de HCE Priorizar Resultados Mostrar Resultados
29 M ODELO DE A NÁLISIS DE H ISTORIAS C LÍNICAS E LECTRÓNICAS Priorizar Resultados Distancia semántica s i U es la utilidad del subgrupo para detectar una enfermedad, igual a p si. s i H es el número de coincidencias del literal de un subgrupo. s i I es la intensidad del literal de un subgrupo. S i es 1 si al menos uno de los literales de un subgrupo es encontrado en una historia clínica M k, de lo contrario su valor es 0.
30 M ODELO DE A NÁLISIS DE H ISTORIAS C LÍNICAS E LECTRÓNICAS Priorizar Resultados La historia clínica con la menor distancia es la primera en la lista priorizada. Las demás son organizadas de acuerdo al valor de la distancia, del menor al mayor.
31 M ODELO DE A NÁLISIS DE H ISTORIAS C LÍNICAS E LECTRÓNICAS Definir Enfermedad Preseleccionar de HCE Generación vista minable Análisis de HCE Priorizar Resultados Mostrar Resultados
32 M ODELO DE A NÁLISIS DE H ISTORIAS C LÍNICAS E LECTRÓNICAS Mostrar Resultados Resultados para evaluación por parte del experto médico. Permitan ajustar definición de enfermedad.
33 A PLICACIÓN – DISEARCH Arquitectura de tres capas: Componentes de DISEARCH Capa de presentación –Formularios y Consola. Capa lógica. –ETL. –Priorizador. –Motor de análisis. –Motor de Conocimiento Capa de datos –SAHI(Sistema del HUSI). –Vista minable. –Resultados.
34 A PLICACIÓN – DISEARCH Desarrollo de DISEARCH JAVA y JPA. –Java JDK 7. –EclipseLink JPA. MS SQL SERVER 2008. –ETL con SQL Server Integration Services. GATE. –JAPE reconoce expresiones regulares en anotaciones sobre documentos.
35 A PLICACIÓN – DISEARCH C APA DE DATOS – V ISTA MINABLE Preselección de HCE. –Acotar los resultados almacenados en la vista minable. Vista minable. –Conjunto de tablas con todos los atributos relevantes para el proceso de minera de datos. –Proceso CRISP-DM. –Exploración de datos. –Migración de datos usando ETL.
36 A PLICACIÓN – DISEARCH C APA DE DATOS – M ODELO E/R Soporta el rol y especialización del investigador médico como usuario de DISEARCH. Implementa la definición de enfermedad. –Base de conocimiento SNOMED CT. Integra resultados del análisis de HCE. Persiste resultados de priorización.
37 A PLICACIÓN – DISEARCH C APA LÓGICA Diagrama de Clases Patrones de Diseño: –Cadena de responsabilidad. –Estrategia.
38 A PLICACIÓN – DISEARCH C APA DE PRESENTACIÓN
39 E VALUACIÓN F UNCIONAL D EFINICIÓN DE ENFERMEDAD TEP GrupoLiteral Tromboembolismo Pulmonar. Vocabulario Nombre científico del diagnóstico. Tromboembolismo pulmonar Nombre formal del diagnóstico. (Según el CIE 10) I26 Nombre informal del diagnóstico Embolismo Pulmonar Sinónimos diagnóstico Embolia pulmonar Acrónimo TEP Taxonomía de Vocabulario Especializaciones del diagnóstico Cor pulmonar secundario a embolia pulmonar Generalizaciones del diagnóstico Tromboembolismo pulmonar Exámenes confirmatorios (Si existen) Nombre formal del examenAngiotomografía pulmonar Nombre informal del examenAngioTac pulmonar Exámenes Asociados Nombre formal del examen Doppler venoso de Miembros inferiores Ecocardiograma Nombre informal del examen Doppler de MMI Rx de Tórax Síntomas Síntomas característicos por género (en lenguaje científico, formal e informal) Taquicardia Taquipnea Síntomas característicos por etapa de vida (en lenguaje científico, formal e informal) Presencia de Hipotermia Medicamentos Nombre Formal Enoxaparina Dalteparina Nombre Genérico Metoprolol Dobutamina Tratamiento Nombre TratamientoTrombolisis Antecedentes Antecedentes y Factores de Riesgo Trombofila Complicaciones o desenlaces Falla cardíaca derecha Elementos de Exclusión (si existen) Términos excluyentes Angiotac negativo Frases típicas de descarte que incluyan nombre del diagnóstico Se descarta TEP
40 E VALUACIÓN F UNCIONAL R ESULTADOS EnfermedadHCE Relevantes HCE Positivas Total Relevantes PrecisiónExhaustividad TEP 2625260,961 DM 3633360,911 HiPul 1112110,921 Enfermedades: –Tromboembolismo Pulmonar. –Hipertensión Pulmonar. –Diabetes Mellitus. Preselección: –Hombre y mujer. –Mayores de edad. –Se limito a 1581. Resultados: –150 HCE analizadas cada hora y media.
41 C ONCLUSIONES Y T RABAJO F UTURO Reducir los tiempos y aumentar la precisión en los resultados de las investigaciones médicas retrospectivas. Permitir al investigador médico dedique mayores esfuerzos al análisis de las historias clínicas con fines diferentes a la identificación de enfermedades. Lograr una mejora gradual en la calidad de vida de los pacientes con enfermedades crónicas.
42 C ONCLUSIONES Y T RABAJO F UTURO Ofrecer la funcionalidad de detección de errores ortográficos al momento del análisis de texto narrativo, esto con el fin de mejorar la identificación de términos médico en las historias clínicas. Analizar dentro de los campos estructurados los resultados de exámenes y valores en las fórmulas médicas, y con base en reglas poder tener más elementos de juicio para identificar una enfermedad en una historia Clínica Electrónica.
43 B IBLIOGRAFÍA Chapman, W.W., Bridewell, W., Hanbury, P., Cooper, G.F., Buchanan, B.G.: A simple algorithm for identifying negated ndings and diseases in discharge summaries.Journal of Biomedical Informatics 34 (2001). Averbuch, M., Karson, T.H., Ben-Ami, B., Maimon, O., Rokach, L.: Contextsensitivemedical information retrieval. Studies in health technology and informatics107 (2004) Rokach, L., Romano, R., Maimon, O.: Negation recognition in medical narrative reports. Information Retrieval 11 (2008) 499{538 10.1007/s10791- 008-9061-0. Han, H., Choi, Y., Choi, Y.M., Zhou, X., Brooks, A.D.: A generic framework: From clinical notes to electronic medical records. Computer-Based Medical Systems, IEEE Symposium on 0 (2006) Huang, M.J., Chen, M.Y., Lee, S.C.: Integrating data mining with case-based reasoning for chronic diseases prognosis and diagnosis. Expert Syst. Appl. 32 (2007) 856{867 Zhou, X., Han, H., Chankai, I., Prestrud, A., Brooks, A.: Approaches to text mining for clinical medical records. In: Proceedings of the 2006 ACM symposium on Applied computing. SAC '06, New York, NY, USA, ACM (2006) 235{239 Antal, P., Verrelst, H., Timmerman, D., Huel, S.V., de Moor, B., Vergote, I.: Bayesiannetworks in ovarian cancer diagnosis: Potentials and limitations. Computer- Based Medical Systems, IEEE Symposium on 0 (2000) 103 Spasic, I., Ananiadou, S., McNaught, J., Kumar, A.: Text mining and ontologies in biomedicine: Making sense of raw text. Briengs in Bioinformatics 6 (2005) Breault, J.L., Goodall, C.R., Fos, P.J.: Data mining a diabetic data warehouse. Articial Intelligence in Medicine 26 (2002) Seyfried, L., Hanauer, D.A., Nease, D., Albeiruti, R., Kavanagh, J., Kales, H.C.: Enhanced identication of eligibility for depression research using an electronic medical record search engine. International Journal of Medical Informatics 78 (2009) Antal, P., de Moor, B., Meszaros, T., Dobrowiecki, T.: Annotated bayesian networks: A tool to integrate textual and probabilistic medical knowledge. In: Proceedingsof the Fourteenth IEEE Symposium on Computer-Based Medical Systems. CBMS '01, Washington, DC, USA, IEEE Computer Society (2001) 177{ Claster, W., Shanmuganathan, S., Ghotbi, N.: Text mining of medical records for radiodiagnostic decision-making. JCP 3 (2008) Kusiak, A., Dixon, B., Shah, S.: Predicting survival time for kidney dialysis patients: a data mining approach. Computers in Biology and Medicine 35 (2005) Zhou, X., Han, H., Chankai, I., Prestrud, A.A., Brooks, A.D.: Converting semistructured clinical medical records into information and knowledge. In: Proceedings of the 21st International Conference on Data Engineering Workshops. ICDEW '05, Washington, DC, USA, IEEE Computer Society (2005) 1162{ Hripcsak, G., Knirsch, C., Zhou, L., Wilcox, A., Melton, G.B.: Using discordance to improve classication in narrative clinical databases: An application to communityacquired pneumonia. Comput. Biol. Med. 37 (2007) Ginter, F., Suominen, H., Pyysalo, S., Salakoski, T.: Combining hidden markov models and latent semantic analysis for topic segmentation and labeling: Method and clinical application. I. J. Medical Informatics 78 (2009)
44