Skip to content

DataClasse/churn-prediction

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

13 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Предсказание оттока клиентов

Описание проекта

Система предсказания оттока клиентов с автоматизацией обработки данных и обучения модели. End-to-end ML-пайплайн: сбор и очистка данных, feature engineering, обучение, версионирование (DVC, MLflow).

Бизнес-задача

Выявление клиентов с риском оттока для превентивных мер. Бизнес-ценность: снижение оттока, оптимизация работы с клиентами.

Задача ML

Бинарная классификация (отток / не отток). Метрики: F1-score, Accuracy, Precision, Recall.

Клонирование и запуск

git clone https://github.com/DataClasse/churn-prediction.git
cd churn-prediction
pip install -r requirements.txt

Настройте .env (БД, S3). Запуск: Airflow DAGs для сбора/очистки данных, затем DVC-пайплайн (dvc repro) для обучения и версионирования модели.

Структура проекта

churn-prediction/
├── part1_airflow/     # Airflow DAGs (сбор, очистка данных)
├── part2_dvc/        # DVC-пайплайн обучения (dvc.yaml, scripts)
├── requirements.txt
└── README.md

Технологический стек

Python, Scikit-learn, Pandas, Airflow, DVC, MLflow. Инфраструктура: PostgreSQL, S3.

Автор

Дмитрий Щербаков


Если проект был полезен, поставьте звезду.

About

Предсказание оттока клиентов: ML-пайплайн, Airflow, DVC, MLflow. Классификация, метрики F1/Accuracy.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors