Evaluación comparativa en el desempeño de modelos de machine learning en la predicción  de pagadores del impuesto predial de la ciudad de Tingo María para el año 2019

Junco Aranciaga, Antonio Gabriel

Repository
→
Pregrado
→
Facultad de Ingeniería en Informática y Sistemas
→
Ingeniería en Informática y Sistemas
→
View Item

Evaluación comparativa en el desempeño de modelos de machine learning en la predicción de pagadores del impuesto predial de la ciudad de Tingo María para el año 2019

Junco Aranciaga, Antonio Gabriel

URI: https://hdl.handle.net/20.500.14292/2634

Date: 2023

Abstract:

Para está investigación se recopiló información socioeconómica y de percepción de 372 contribuyentes de Tingo María mediante encuestas telefónicas. Se efectuó un análisis descriptivo y se evaluó la influencia de estos factores en la clasificación de tipo de pagador ‘No pagador’, ‘Impuntual’ y ‘Pagador’, mediante la prueba de Chi2 , estos datos recogidos se usaron para entrenar los modelos de Machine Learning que incluyeron Árbol de Decisión, SVM, KNN, Naive Bayes, Ensemble y RNN, y se midieron las métricas de exactitud, precisión, sensibilidad y Puntuación F1. Se aplicó una validación cruzada k-fold de 10 pliegues y se optimizaron hiperparámetros. Las diferencias en el rendimiento de los modelos se determinaron mediante ANOVA de Friedman y pruebas post hoc de Nemenyi. Como resultados, los factores socioeconómicos y percepciones influyeron notablemente en la clasificación de los contribuyentes (p-valor < 0.01). En la predicción, los modelos KNN y RNN destacaron con exactitudes de 97.04% ± 0.30 y 96.89% ± 0.14. Para la precisión, RNN lideró en "No Pagadores" con 93.85 ± 0.25 y KNN en "Impuntuales" con 99.10 ± 0.12, mientras que Naive Bayes sobresalió en "Pagadores" con 99.90 ± 0.04. En sensibilidad, RNN tuvo 95.55 ± 0.31 en "No Pagadores" y 99.92 ± 0.04 en "Pagadores"; KNN logró 95.67 ± 0.05 en "Impuntuales". Para la puntuación F1, KNN y RNN tuvieron los mejores resultados en "No Pagadores" con 99.13 ± 0.15 y en "Pagadores" con 99.73 ± 0.15, respectivamente. Mediante el ANOVA de Friedman, se concluye que existen diferencias significativas (p-valor < 0.01) entre los algoritmos en la evaluación de pagadores de impuestos

Show full item record