Modelo de Machine Learning basado en la Maquina Potenciadora de Gradiente de Luz para predecir la probabilidad de impago en clientes de la cartera de Tarjeta de Crédito

Autores/as

  • Eduardo Rafael Jáuregui Romero Universidad Nacional Mayor de San Marcos, Lima, Perú

DOI:

https://doi.org/10.15381/risi.v16i2.27140

Palabras clave:

Riesgo de crédito, aprendizaje automático, análisis de datos, probabilidad de incumplimiento, tarjeta de crédito, comprobante de pago

Resumen

Los créditos bancarios son un medio de pago muy utilizado en los últimos tiempos, cada vez más personas acceden a productos como tarjeta de crédito, prestamos, etc. Los bancos han implementado modelos clásicos de predicción, la gran mayoría basados en regresión logística ya que permite una gran interpretabilidad de cara al negocio y efecto de las variables del modelo. El propósito de esta investigación es realizar un análisis predictivo sobre la probabilidad de impago de clientes en la cartera de tarjeta de crédito mediante un score de riesgo. El dataset utilizado es el denominado default of credit card clients Data Set proveniente de la BD de UCI Machine Learning, el enfoque es cuantitativo y la metodología es analítica descriptiva, se utilizará técnicas basada en potenciadores de gradiente para realizar la predicción, entre los algoritmos entrenados tenemos Regresión Logística con WOE, CatBoost, XGBoost y LigthGBM, además para poder suplir la falta de interpretabilidad de los algoritmos de Machine Learning se utilizará en enfoque basado en Importancia Gain y Shapley para medir el impacto de las variables en la predicción. Como resultado se obtuvo la máquina potenciadora de gradientes de luz (LightGBM) tuneada con una búsqueda bayesiana obtuvo un GINI de 57.4 lo cual mejora en +6 puntos a la Regresión Logística con Woe y en +3p a XgBoost y CatBoost. Finalmente obteniendo los valores de Gain y Shapley se suplió la falta de interpretabilidad de las variables, permitiendo una mejor toma de decisiones a la hora de evaluar a los clientes. Así mismo como trabajos futuros se pretende agregar variables no estructuradas que permitan mejorar los indicadores del Modelo.

Descargas

Los datos de descarga aún no están disponibles.

Descargas

Publicado

2023-12-30

Número

Sección

Artículos de Investigaciones Originales

Cómo citar

[1]
“Modelo de Machine Learning basado en la Maquina Potenciadora de Gradiente de Luz para predecir la probabilidad de impago en clientes de la cartera de Tarjeta de Crédito”, Rev.Investig.sist.inform., vol. 16, no. 2, pp. 155–168, Dec. 2023, doi: 10.15381/risi.v16i2.27140.