Ir al contenido
Información para Aseguradoras
International services
Main Menu
  • Preguntas frecuentes
  • 01 8000 180 280
  • +573208718677
Contáctenos
  • Preguntas frecuentes
  • 01800 519 0175
logo-colombiana-trasplantes-2024-blanco
Main Menu
  • Nosotros
    • Quiénes Somos
    • Historia
    • Nuestro Equipo
    • Instalaciones
    • Indicadores
    • Estados Financieros
    • Línea Ética
  • Servicios
    • Nacionales
    • Internacionales
  • Investigación
    • Centro de investigación
    • Grupo de investigación
    • Publicaciones
  • Educación
    • Centro de Artículos
    • Enfermedad renal
  • Donación

Inicio › Publicaciones › Using Natural Language Processing and Machine Learning to classify the status of kidney allograft in Electronic Medical Records written in Spanish

Logo CDT

Using Natural Language Processing and Machine Learning to classify the status of kidney allograft in Electronic Medical Records written in Spanish

  • mayo 13, 2025
  • 9 Número de vistas

Comparte en:

Introduction

Accurate identification of graft loss in Electronic Medical Records of kidney transplant recipients is essential but challenging due to inconsistent and not mandatory International Classification of Diseases (ICD) codes. We developed and validated Natural Language Processing (NLP) and machine learning models to classify the status of kidney allografts in unstructured text in EMRs written in Spanish.

Methods

We conducted a retrospective cohort of 2712 patients transplanted between July 2008 and January 2023, analyzing 117,566 unstructured medical records. NLP involved text normalization, tokenization, stopwords removal, spell-checking, elimination of low-frequency words and stemming. Data was split in training, validation and test sets. Data balance was performed using undersampling technique. Feature selection was performed using LASSO regression.

We developed, validated and tested Logistic Regression, Random Forest, and Neural Networks models using 10-fold cross-validation. Performance metrics included area under the curve, F1 Score, accuracy, sensitivity, specificity, Negative Predictive Value, and Positive Predictive Value.

Results

The test performance results showed that the Random Forest model achieved the highest AUC (0.98) and F1 score (0.65). However, it had a modest sensitivity (0.76) and a relatively low PPV (0.56), implying a significant number of false positives. The Neural Network model also performed well with a high AUC (0.98) and reasonable F1 score (0.61), but its PPV (0.49) was lower, indicating more false positives. The Logistic Regression model, while having the lowest AUC (0.91) and F1 score (0.49), showed the highest sensitivity (0.83) with the lowest PPV (0.35).

Conclusion

We developed and validated three machine learning models combined with NLP techniques for unstructured texts written in Spanish. The models performed well on the validation set but showed modest performance on the test set due to data imbalance. These models could be adapted for clinical practice, though they may require additional manual work due to high false positive rates.

Download
PrevAnteriorCorrelating Tacrolimus levels with dose formulation: Implications for toxicity and renal graft rejection in a cohort of kidney transplant recipients with steroid-free maintenance immunosuppression
SiguienteBioethical challenges in the integration of artificial intelligence in transplant surgery 4.0: A scoping reviewNext

Datos de contacto

  • Línea gratuita de atención nacional:
    01 800 519 0 175
  • contactenos@colombianadetrasplantes.com
  • (57) 320 871 8677
  • Contacto del Programa de Donante Vivo:
    (57) 322 893 0725
    donantevivo@colombianadetrasplantes.com
Facebook Linkedin-in Instagram Youtube Tiktok

Información de Sedes

  • Sede principal - Bogotá
    Av. Cra. 30 # 47A-74
  • Puerto Colombia
    Cra 30, Corredor Universitario 1-850, Torre médica. Consultorio 307 y 308
  • Cali
    Edificio Vida. Calle 5D #38A - 35. Piso 2, local 23
  • Armenia
    Cra 12 No. 0-75. Consultorio 506, Clínica del Café

Enlaces rápidos

  • Contáctenos - PQRSF
  • Asociación de usuarios
  • Derechos y deberes de pacientes
  • Política de tratamiento de datos
  • Términos y condiciones
  • Trabaje con Nosotros

Servicios para empleados

  • Intranet
SUPERSALUD
Todos los derechos reservados © 2025 Colombiana de Trasplantes SAS
descarga la novena en tu celular

WhatsApp

Aviso de privacidad

Colombiana de Trasplantes SAS, en cumplimiento de la Ley 1581 de 2012 y demás normas concordantes, es responsable del tratamiento de sus datos personales. Los datos personales que Colombiana de Trasplantes solicita serán utilizados para los siguientes fines:

  • Adelantar los trámites y servicios que tiene a cargo, en ejercicio de sus funciones.
  • Dar a conocer los servicios ofrecidos por la empresa.
  • Participar en eventos organizados por la empresa.
  • Evaluar la calidad de los servicios de empresa.
  • Adelantar los trámites y servicios que tiene a cargo, en ejercicio de sus funciones.
Como titular de información tiene derecho a conocer, actualizar y rectificar sus datos personales y, sólo en los casos en que sea procedente, a suprimirlos o revocar la autorización otorgada para su tratamiento.
Si requiere mayor información para conocer nuestra política de tratamiento de datos personales y los cambios sustanciales que se produzcan en ella, ingrese aquí.
Si desea presentar una petición, queja, reclamo, sugerencia o felicitación relacionada con la protección de datos personales puede ingresar a la página web de Colombiana de Trasplantes SAS en la opción de Contáctanos , comunicarse a la línea gratuita nacional 018000 180 280, escribir al whatsapp número: 320-8718677 o dirigirse a la Sede Principal, AV Carrera 30 No. 47A – 74.

Para continuar por favor acepte nuestra política de protección de datos y pulse “Enviar”

Muchas gracias.