Fraud Detection Pipeline

Python LightGBM SHAP imbalanced-learn Kaggle Optuna FastAPI
Fraud Detection Pipeline
Pipeline de detección de fraude financiero entrenado sobre datos tipo IEEE-CIS (150k transacciones, 3.5% fraude). LightGBM con SMOTE + scale_pos_weight, AUC-ROC > 0.97. Explicabilidad por transacción con SHAP waterfall. Listo para integración en sistemas de pago reales.

Resultados

0.9999
AUC-ROC
150k
transacciones
0.97
F1-score fraude
<50ms
latencia inferencia

Funcionalidades implementadas

  • Manejo de clases desbalanceadas. Combina scale_pos_weight, SMOTE y threshold optimization para maximizar la detección de fraude sin disparar falsos positivos.
  • Explicabilidad waterfall por transacción. SHAP genera un waterfall plot por transacción: cada feature del IEEE-CIS contribuye (en rojo o azul) al score final de fraude.
  • Features V de comportamiento anónimo. Replicación del patrón de distribución lognormal fraud/legit del dataset IEEE-CIS para features de identidad anonimizadas.
  • Listo para integración real. API REST con schema IEEE-CIS, validación Pydantic y respuesta en <50ms. Desplegable como microservicio en producción.
Try Live Demo View Code
🤖 Asistente Virtual