Система предсказания оттока клиентов с автоматизацией обработки данных и обучения модели. End-to-end ML-пайплайн: сбор и очистка данных, feature engineering, обучение, версионирование (DVC, MLflow).
Выявление клиентов с риском оттока для превентивных мер. Бизнес-ценность: снижение оттока, оптимизация работы с клиентами.
Бинарная классификация (отток / не отток). Метрики: F1-score, Accuracy, Precision, Recall.
git clone https://github.com/DataClasse/churn-prediction.git
cd churn-prediction
pip install -r requirements.txtНастройте .env (БД, S3). Запуск: Airflow DAGs для сбора/очистки данных, затем DVC-пайплайн (dvc repro) для обучения и версионирования модели.
churn-prediction/
├── part1_airflow/ # Airflow DAGs (сбор, очистка данных)
├── part2_dvc/ # DVC-пайплайн обучения (dvc.yaml, scripts)
├── requirements.txt
└── README.md
Python, Scikit-learn, Pandas, Airflow, DVC, MLflow. Инфраструктура: PostgreSQL, S3.
Дмитрий Щербаков
- Код: github.com/DataClasse/churn-prediction
- Email: aiopendata@gmail.com
- GitHub: @DataClasse
Если проект был полезен, поставьте звезду.