Modelo de Machine Learning basado en la Maquina Potenciadora de Gradiente de Luz para predecir la probabilidad de impago en clientes de la cartera de Tarjeta de Crédito
DOI:
https://doi.org/10.15381/risi.v16i2.27140Palabras clave:
Riesgo de crédito, aprendizaje automático, análisis de datos, probabilidad de incumplimiento, tarjeta de crédito, comprobante de pagoResumen
Los créditos bancarios son un medio de pago muy utilizado en los últimos tiempos, cada vez más personas acceden a productos como tarjeta de crédito, prestamos, etc. Los bancos han implementado modelos clásicos de predicción, la gran mayoría basados en regresión logística ya que permite una gran interpretabilidad de cara al negocio y efecto de las variables del modelo. El propósito de esta investigación es realizar un análisis predictivo sobre la probabilidad de impago de clientes en la cartera de tarjeta de crédito mediante un score de riesgo. El dataset utilizado es el denominado default of credit card clients Data Set proveniente de la BD de UCI Machine Learning, el enfoque es cuantitativo y la metodología es analítica descriptiva, se utilizará técnicas basada en potenciadores de gradiente para realizar la predicción, entre los algoritmos entrenados tenemos Regresión Logística con WOE, CatBoost, XGBoost y LigthGBM, además para poder suplir la falta de interpretabilidad de los algoritmos de Machine Learning se utilizará en enfoque basado en Importancia Gain y Shapley para medir el impacto de las variables en la predicción. Como resultado se obtuvo la máquina potenciadora de gradientes de luz (LightGBM) tuneada con una búsqueda bayesiana obtuvo un GINI de 57.4 lo cual mejora en +6 puntos a la Regresión Logística con Woe y en +3p a XgBoost y CatBoost. Finalmente obteniendo los valores de Gain y Shapley se suplió la falta de interpretabilidad de las variables, permitiendo una mejor toma de decisiones a la hora de evaluar a los clientes. Así mismo como trabajos futuros se pretende agregar variables no estructuradas que permitan mejorar los indicadores del Modelo.
Descargas
Descargas
Publicado
Número
Sección
Licencia
Derechos de autor 2023 Eduardo Rafael Jáuregui Romero
Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.
LOS AUTORES RETIENEN SUS DERECHOS:
a. Los autores retienen sus derechos de marca y patente, y también sobre cualquier proceso o procedimiento descrito en el artículo.
b. Los autores retienen el derecho de compartir, copiar, distribuir, ejecutar y comunicar públicamente el artículo publicado en la Revista de investigación de Sistemas e Informática (por ejemplo, colocarlo en un repositorio institucional o publicarlo en un libro), con un reconocimiento de su publicación inicial en la Revista de investigación de Sistemas e Informática.
c. Los autores retienen el derecho a hacer una posterior publicación de su trabajo, de utilizar el artículo o cualquier parte de aquel (por ejemplo: una compilación de sus trabajos, notas para conferencias, tesis, o para un libro), siempre que indiquen su publicación inicial en la Revista de investigación de Sistemas e Informática (autores del trabajo, revista, volumen, número y fecha).