Modelos impulsados por inteligencia artificial para la predicción de la respuesta al tratamiento antituberculoso: estudio de cohorte retrospectivo en el subtrópico ecuatoriano
DOI:
https://doi.org/10.70099/BJ/2026.03.01.2Palabras clave:
Inteligencia Artificial; Random Forest; Tuberculosis; Smote; redes neuronas artificiales; regresión logística binaria.Resumen
La tuberculosis (TB) sigue siendo un desafío global, cada año aumentan la tasa de nuevos infectados y de forma preocupante los pacientes que fracasan en su tratamiento.
Se evaluaron predictores clínicos y demográficos altamente relacionados con el fracaso de la terapia en una cohorte de adultos (18-64 años) con tuberculosis (n: 922, Hombres: 538 Mujeres:384). Se emplearon y evaluaron con un enfoque comparativo, modelos estadísticos partiendo de la regresión logística binaria (RLB), y modelos más complejos como Random Forest (RF) y redes neuronales artificiales con 2 capas ocultas (RNA) para capturar relaciones e interacciones entre variables. Además, se evaluaron dos escenarios: datos originales desbalanceados y datos balanceados a través de la técnica SMOTE, como un medio para abordar el desbalance entre fracasos y éxitos. Mientras que la RLB delineó una interpretabilidad clara, tuvo el mejor rendimiento en los escenarios sobre la RF y RNA ((Accuracy: 0,7111, Sensitivity: 0,44, Specificity: 0,7548 Precision: 0,2245 F1-Score: 0,2973 AUC-ROC:0,6591 Kappa: 0,1389), destacando sus capacidades de detección de patrones en edad, peso e historia de abandono inter variable. RLB logró el mejor equilibrio entre sensibilidad y especificidad con moderado rendimiento general para lograr la predicción de casos con posible fracaso terapéutico.
Citas
1. World Health Organization. Estrategia Fin a la Tuberculosis: avances en la aplicación de la estrategia mundial y las metas para la prevención, la atención y el control de la tuberculosis. Informe del Director General. Consejo Ejecutivo 154.ª reunión, EB154/10 [Internet]. Ginebra: Organización Mundial de la Salud; 2023 [cited 2026 Feb 12]. Available from: https://apps.who.int/gb/ebwha/pdf_files/EB154/B154_10-sp.pdf
2. World Health Organization. Tuberculosis incidence (per 100 000 population): Ecuador [Internet]. WHO Data; [cited 2026 Feb 12]. Available from: https://data.who.int/countries/218
3. Ministerio de Salud Pública del Ecuador. Guía de práctica clínica: tamizaje y diagnóstico de la tu-berculosis [Internet]. Quito: Ministerio de Salud Pública; 2024 [cited 2026 Feb 12]. Available from: https://www.salud.gob.ec/wp-content/uploads/2024/04/GPC-tamizaje-y-diagnostico-de-tuberculosis.pdf
4. Muñoz Roca OA, Moreno Gaona AJ. Abandono al tratamiento antifímico en pacientes atendidos en un Centro de Salud Público de Guayaquil. Rev Med Investig Clin Guayaquil. 2023;4(6):9-15. doi:10.51597/rmicg.v4i6.132.
5. Culqui DR, Munayco CV, Grijalva CG, et al. Factores asociados al abandono de tratamiento an-ti-tuberculoso convencional en Perú. Arch Bronconeumol. 2012;48(5):150-5. doi:10.1016/j.arbres.2011.12.008.
6. World Health Organization. Ethics and governance of artificial intelligence for health: guidance on large multi-modal models [Internet]. Geneva: World Health Organization; 2024 [cited 2026 Feb 12]. Available from: https://iris.who.int/bitstream/handle/10665/379365/9789240084759-eng.pdf
7. Vertti J. Análisis multivariado. 1a ed. Aguascalientes; 2019.
8. Sánchez E, Tenesaca S. Modelo logístico y redes neuronales para pronóstico de anemia en menores de 5 años en el Hospital Pediátrico Alfonso Villagómez Román en el periodo 2020–2021. Riobamba; 2023.
9. Fernández A. Guía completa sobre Random Forest [Internet]. 2024 [cited 2025 Oct 27]. Available from: https://anderfernandez.com/blog/guia-completa-random-forest/
10. Schmidhuber J. Deep learning in neural networks: an overview. Neural Netw. 2015;61:85-117. doi:10.1016/j.neunet.2014.09.003.
11. LeCun Y, Bengio Y, Hinton G. Deep learning. Nature. 2015;521(7553):436-44. doi:10.1038/nature14539.
12. Rodriguez Montero L, Ambrosio Bastián J, Pérez Sanpablo AI. Classification of Daily Living Ac-tivities in subjects with Parkinson’s Disease using Artificial Neural Networks. Rev Mex Ing Biomed. 2023;44(4):128-139. doi:10.17488/RMIB.44.4.9.
13. McClean M, Panciu TC, Lange C, et al. Artificial intelligence in tuberculosis: a new ally in disease control. Breathe. 2024;20(3):240056. doi:10.1183/20734735.0056-2024.
14. Instituto Nacional de Estadística y Censos (Ecuador). Clasificación internacional uniforme de ocupaciones (CIUO-08). Quito: INEC; 2010.
15. Briones-Hernández M, Villalba-Martínez V. Análisis factorial exploratorio del instrumento para medir el impacto del COVID-19 en estudiantes de educación superior. Rev Espacios. 2025;46(4):85. doi:10.48082/espacios-a25v46n04p08.
16. Peduzzi P, Concato J, Kemper E, et al. A simulation study of the number of events per variable in logistic regression analysis. J Clin Epidemiol. 1996;49(12):1373-9. doi:10.1016/S0895-4356(96)00236-3.
17. Ortega Calvo M, Cayuela Domínguez A. Regresión logística no condicionada y tamaño de muestra: una revisión bibliográfica. Rev Esp Salud Publica. 2002;76(2):85-93.
18. Ochoa Sangrador C, Molina Arias M, Ortega Páez E. Regresión logística múltiple. Evid Pediatr. 2023;19:34.
19. Liebl S, Lemaître G, Nogueira F. Over-sampling: Naive random over-sampling; from random over-sampling to SMOTE and ADASYN. In: imbalanced-learn documentation, version 0.14.0 [Inter-net]. 2025 [cited 2026 Feb 12]. Available from: https://imbalanced-learn.org/stable/over_sampling.html
20. Wadhwa K, Kumari R, Gosain A. Enhancing model performance in hybrid class imbalance tech-niques. Procedia Comput Sci. 2025;246:288-97. doi:10.1016/j.procs.2025.04.266.
21. Lunardon N, Menardi G, Torelli N. ROSE: a package for binary imbalanced learning. R J. 2014;6(1):79-89. doi:10.32614/RJ-2014-008.
22. Lemaître G, Nogueira F, Aridas CK. Imbalanced-learn: a Python toolbox to tackle the curse of imbalanced datasets in machine learning. J Mach Learn Res. 2017;18(17):1-5.
23. Ortega Páez E, Ochoa Sangrador C, Molina Arias M. Regresión logística binaria simple. Evid Pediatr. 2022;18:11.
24. Piury Pinzón J, Cayuela Rodríguez L, Cayuela Domínguez A, et al. Regresión logística binaria para clínicos poco amantes de las matemáticas. NURE Investigacion. 2024;21:3-8. doi:10.58722/nure.v21i131.2553.
25. Kuhn M, Wickham H. Tidymodels: a collection of packages for modeling and machine learning using tidyverse principles. R package version 1.1.1 [Internet]. 2024 [cited 2025 Oct 23]. Available from: https://www.tidymodels.org/
26. Hosmer DW, Lemeshow S, Sturdivant RX. Applied logistic regression. 3rd ed. Hoboken (NJ): Wiley; 2013.
27. Probst P, Wright MN, Boulesteix AL. Hyperparameters and tuning strategies for random forest. WIREs Data Min Knowl Discov. 2019;9(3):e1301. doi:10.1002/widm.1301.
28. Liaw A, Wiener M. Classification and regression by randomForest. R News. 2002;2(3):18-22.
29. Silfiana L, Asyifah Q, Rafika A, et al. Optimizing random forest parameters with hyperparameter tuning for classifying school-age KIP eligibility in West Java. Jambura J Math. 2025;7(1):40-48. doi:10.37905/jjom.v7i1.28736.
30. Wright MN, Ziegler A. ranger: a fast implementation of random forests for high dimensional data in C++ and R. J Stat Softw. 2017;77(1):1-17. doi:10.18637/jss.v077.i01.
31. Nair V, Hinton GE. Rectified linear units improve restricted Boltzmann machines. In: Proceedings of the 27th International Conference on Machine Learning (ICML-10). Haifa, Israel; 2010. p. 807-14.
32. Ba JL, Kiros JR, Hinton GE. Layer normalization. arXiv [Preprint]. 2016. arXiv:1607.06450.
33. Kingma DP, Ba J. Adam: a method for stochastic optimization. arXiv [Preprint]. 2014. ar-Xiv:1412.6980.
34. Abadi M, Agarwal A, Barham P, et al. TensorFlow: large-scale machine learning on heterogeneous distributed systems. arXiv [Preprint]. 2016. arXiv:1603.04467.
35. Géron A. Hands-on machine learning with Scikit-Learn, Keras, and TensorFlow: concepts, tools, and techniques to build intelligent systems. 3rd ed. Sebastopol (CA): O’Reilly Media; 2022.
36. Pongsuwun K, Puwarawuttipanit W, Nguantad S, et al. A systematic review of the accuracy of machine learning models for diagnosing pulmonary tuberculosis: implications for nursing practice and implementation. Nurs Health Sci. 2025;27(1):e70077. doi:10.1111/nhs.70077.
37. Guerrero DA, Código B. Aplicación de modelos machine learning para predecir el riesgo de pérdida de seguimiento en tuberculosis. Cali (Colombia); 2025.
38. Perplexity AI. Asistencia en búsqueda de artículos médico y resumen interpretativo [Internet]. 2025 [cited 2025 Oct 28]. Available from: https://www.perplexity.ai
39. Perplexity AI. Asistencia en generación de código para preprocesamiento de datos para RStudio [Internet]. 2025 [cited 2025 Oct 28]. Available from: https://www.perplexity.ai
40. Jim A, González C. La tuberculosis: una mirada desde la Atención Primaria de Salud. 2024:4-10.
41. de Lucena LA, Dantas GB da S, Carneiro TV, et al. Factors associated with the abandonment of tuberculosis treatment in Brazil: a systematic review. Rev Soc Bras Med Trop. 2023;56:e0155-2022. doi:10.1590/0037-8682-0155-2022.
42. Melo Villalobos B, Weber S. Regresión logística en estudios epidemiológicos de casos y controles. Bogotá; 1992.
43. Orwa J, Oduor P, Okelloh D, et al. Comparison of logistic regression with regularized machine learning methods for the prediction of tuberculosis disease in people living with HIV: cross-sectional hospital-based study in Kisumu County, Kenya. Res Sq [Preprint]. 2023 Sep 26. doi:10.21203/rs.3.rs-3354948/v1.
44. Tervi A, Junna N, Broberg M, et al. Large registry-based analysis of genetic predisposition to tu-berculosis identifies genetic risk factors at HLA. Hum Mol Genet. 2023;32(1):161-171. doi:10.1093/hmg/ddac212.
45. Phat NK, Lee Y, Vu DH, et al. Risk factors for tuberculosis treatment outcomes: a statistical lear-ning-based exploration using the SINAN database with incomplete observations. BMC Med Inform Decis Mak. 2025;25(1):301. doi:10.1186/s12911-025-03139-9.
46. Lino Ferreira da Silva Barros MHL, Alves GO, Morais Florêncio Souza L, et al. Benchmarking machine learning models to assist in the prognosis of tuberculosis. Informatics. 2021;8(2):27. doi:10.3390/informatics8020027.
47. Asad M, Mahmood A, Usman M. A machine learning-based framework for predicting treatment failure in tuberculosis: a case study of six countries. Tuberculosis (Edinb). 2020;123:101944. doi:10.1016/j.tube.2020.101944.
48. Sekandi JN, Shi W, Zhu R, et al. Application of artificial intelligence to the monitoring of medica-tion adherence for tuberculosis treatment in Africa: algorithm development and validation. JMIR AI. 2023;2(1):e40167. doi:10.2196/40167.
49. Umeta AK, Yermosa SF, Dufera AG. Bayesian parametric modeling of time to tuberculosis co-infection of HIV/AIDS patients at Jimma Medical Center, Ethiopia. Sci Rep. 2022;12(1):16475. doi:10.1038/s41598-022-20872-7.
50. Londoño Ruíz AM, Castaño Quintero AE. Regresión logística [Internet]. 2025 [cited 2025 Oct 27]. Available from: https://es.scribd.com/document/485532978/practica-de-regresion-logistica-abandono-TB-2
51. Orjuela-Cañón AD, Jutinico AL, Awad C, et al. Machine learning in the loop for tuberculosis diagnosis support. Front Public Health. 2022;10:876949. doi:10.3389/fpubh.2022.876949.
52. Hossain MdS, Khandocar MdP, Riti FA, et al. A comprehensive machine learning for high throughput tuberculosis sequence analysis, functional annotation, and visualization. Sci Rep. 2025;15(1):25866. doi:10.1038/s41598-025-98654-0.
Publicado
Cómo citar
Número
Sección
Categorías
Licencia
Derechos de autor 2026 Alex Armijos-Hernández, Nadia N. Sánchez -Pozo (Author)

Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.
Authors who publish with BioNatura Journal agree to the following terms: Authors retain copyright and grant the BioNatura Institutional Publishing Consortium (BIPC) right of first publication with the work simultaneously licensed under a Creative Commons Attribution 4.0 International License (CC BY 4.0). This allows others to share the work with an acknowledgment of the work's authorship and initial publication in this journal.This is an open access article distributed under the terms of the Creative Commons Attribution 4.0 International License (CC BY 4.0), which permits unrestricted use, distribution, and reproduction in any medium, provided the original work is properly cited.