Evaluación comparativa en el desempeño de modelos de machine learning en la predicción de pagadores del impuesto predial de la ciudad de Tingo María para el año 2019
Loading...
Date
2023
Authors
Journal Title
Journal ISSN
Volume Title
Advisor
Abstract
Para está investigación se recopiló información socioeconómica y de percepción de 372
contribuyentes de Tingo María mediante encuestas telefónicas. Se efectuó un análisis
descriptivo y se evaluó la influencia de estos factores en la clasificación de tipo de pagador ‘No
pagador’, ‘Impuntual’ y ‘Pagador’, mediante la prueba de Chi2
, estos datos recogidos se usaron
para entrenar los modelos de Machine Learning que incluyeron Árbol de Decisión, SVM, KNN,
Naive Bayes, Ensemble y RNN, y se midieron las métricas de exactitud, precisión, sensibilidad
y Puntuación F1. Se aplicó una validación cruzada k-fold de 10 pliegues y se optimizaron
hiperparámetros. Las diferencias en el rendimiento de los modelos se determinaron mediante
ANOVA de Friedman y pruebas post hoc de Nemenyi. Como resultados, los factores
socioeconómicos y percepciones influyeron notablemente en la clasificación de los
contribuyentes (p-valor < 0.01). En la predicción, los modelos KNN y RNN destacaron con
exactitudes de 97.04% ± 0.30 y 96.89% ± 0.14. Para la precisión, RNN lideró en "No
Pagadores" con 93.85 ± 0.25 y KNN en "Impuntuales" con 99.10 ± 0.12, mientras que Naive
Bayes sobresalió en "Pagadores" con 99.90 ± 0.04. En sensibilidad, RNN tuvo 95.55 ± 0.31 en
"No Pagadores" y 99.92 ± 0.04 en "Pagadores"; KNN logró 95.67 ± 0.05 en "Impuntuales".
Para la puntuación F1, KNN y RNN tuvieron los mejores resultados en "No Pagadores" con
99.13 ± 0.15 y en "Pagadores" con 99.73 ± 0.15, respectivamente. Mediante el ANOVA de
Friedman, se concluye que existen diferencias significativas (p-valor < 0.01) entre los
algoritmos en la evaluación de pagadores de impuestos
Description
Keywords
Machine Learning, Impuesto predial, Métricas de rendimiento, Friedman, Factores socioeconómicos