Abstract:
Para está investigación se recopiló información socioeconómica y de percepción de 372
contribuyentes de Tingo María mediante encuestas telefónicas. Se efectuó un análisis
descriptivo y se evaluó la influencia de estos factores en la clasificación de tipo de pagador ‘No
pagador’, ‘Impuntual’ y ‘Pagador’, mediante la prueba de Chi2
, estos datos recogidos se usaron
para entrenar los modelos de Machine Learning que incluyeron Árbol de Decisión, SVM, KNN,
Naive Bayes, Ensemble y RNN, y se midieron las métricas de exactitud, precisión, sensibilidad
y Puntuación F1. Se aplicó una validación cruzada k-fold de 10 pliegues y se optimizaron
hiperparámetros. Las diferencias en el rendimiento de los modelos se determinaron mediante
ANOVA de Friedman y pruebas post hoc de Nemenyi. Como resultados, los factores
socioeconómicos y percepciones influyeron notablemente en la clasificación de los
contribuyentes (p-valor < 0.01). En la predicción, los modelos KNN y RNN destacaron con
exactitudes de 97.04% ± 0.30 y 96.89% ± 0.14. Para la precisión, RNN lideró en "No
Pagadores" con 93.85 ± 0.25 y KNN en "Impuntuales" con 99.10 ± 0.12, mientras que Naive
Bayes sobresalió en "Pagadores" con 99.90 ± 0.04. En sensibilidad, RNN tuvo 95.55 ± 0.31 en
"No Pagadores" y 99.92 ± 0.04 en "Pagadores"; KNN logró 95.67 ± 0.05 en "Impuntuales".
Para la puntuación F1, KNN y RNN tuvieron los mejores resultados en "No Pagadores" con
99.13 ± 0.15 y en "Pagadores" con 99.73 ± 0.15, respectivamente. Mediante el ANOVA de
Friedman, se concluye que existen diferencias significativas (p-valor < 0.01) entre los
algoritmos en la evaluación de pagadores de impuestos