Skip to content
View DataClasse's full-sized avatar
💭
Work, study and enjoy my life.
💭
Work, study and enjoy my life.

Block or report DataClasse

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don't include any personal information such as legal names or email addresses. Markdown supported. This note will be visible to only you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
DataClasse/README.md

Дмитрий Щербаков

ML-инженер: полный цикл от данных до внедрения моделей в эксплуатацию, 6 проектов. Сертификация Yandex EdTech (2026).

GitHub LeetCode Kaggle Хабр Карьера Email

ML Engineer: end-to-end pipelines, 6 production-ready projects (churn prediction, recommender systems, uplift modeling, service deployment). Yandex EdTech professional certificate, 2026. Open to remote work and relocation. Projects · Contact

Профиль

Опыт в ML: 6 проектов полного цикла (данные → модель → внедрение в эксплуатацию). Направления: пайплайны данных и обучения (Airflow, DVC), внедрение ML‑сервисов (Docker), рекомендательные системы, uplift-моделирование. Сертификация Yandex EdTech 2026.

Результаты

  • Churn: F1-score (бинарная классификация), автоматизация пайплайнов (Airflow, DVC, MLflow)
  • Рекомендательная система: метрики Precision@5, Recall@5, Coverage, Novelty@5; гибридная модель (Implicit + CatBoost), REST API и Docker
  • Uplift-модель: Uplift@30% = 0.0518 (отлично), прирост +26.3% относительно базовой модели (baseline); A/B тестирование, внедрение в Yandex Cloud
  • Внедрение ML‑моделей в эксплуатацию: контейнеризация, мониторинг (Grafana, Prometheus)
  • Версионирование данных и моделей: DVC, MLflow; воспроизводимость экспериментов

Технический стек

Область Технологии
Core ML Python, Pandas, NumPy, Scikit-learn, CatBoost, Implicit, Scikit-uplift, Optuna
MLOps и пайплайны DVC, MLflow, Airflow
Production Docker, FastAPI, Uvicorn
Cloud и мониторинг Yandex Cloud, S3, Prometheus, Grafana

Проекты

1. Предсказание оттока клиентов

Технологии: Python, Scikit-learn, Airflow, DVC, MLflow

Разработка системы предсказания оттока клиентов с полной автоматизацией процесса. Метрики: F1-score, Accuracy, Precision, Recall.

Подробнее →

2. Улучшение baseline

Технологии: Python, Scikit-learn, feature engineering

Улучшение базовой модели и метрик качества.

Подробнее →

3. Релиз модели в продакшен

Технологии: Docker, мониторинг

Внедрение ML‑модели в эксплуатацию, процесс доставки и мониторинг качества.

Подробнее →

4. Рекомендательная система

Технологии: Python, Implicit, CatBoost, FastAPI, Docker

Гибридная рекомендательная система для музыкального стриминга (Яндекс Музыка). Метрики: Precision@5, Recall@5, Coverage, Novelty@5.

Подробнее →

5. Uplift-моделирование

Технологии: Python, Scikit-uplift, A/B тестирование

Модель для определения эффективной аудитории маркетинговых кампаний. Uplift@30% = 0.0518 (отлично), прирост +26.3% от baseline.

Подробнее →

6. Рекомендательная система в продакшен (полный цикл ML)

Технологии: Python, Implicit, CatBoost, FastAPI, Docker

Полный цикл: постановка задачи → данные → модель → внедрение в эксплуатацию.

Подробнее →

Статистика GitHub

GitHub Stats

Top Languages

Образование

АНО ДПО «Образовательные технологии Яндекса» (Yandex EdTech) | 2025–2026

  • Программа «Инженер машинного обучения» (для специалистов с опытом)
  • Квалификация: специалист по большим данным (Big Data Specialist)
  • 6 проектов в портфолио: пайплайны данных, улучшение базовых моделей, внедрение решений в эксплуатацию, рекомендательные системы, uplift‑моделирование
  • Менторинг от практикующих ML-инженеров Яндекса

Сертификация

  • Диплом о профессиональной переподготовке (2026, документ 2026-14499-001). Сертификаты и дипломы: github.com/DataClasse/certificates.

Карьерные цели

  • ML Engineer
  • MLOps Engineer
  • Data Scientist (продуктовые задачи)
  • AI Engineer

Контакты


Готов к обсуждению возможностей сотрудничества.

Popular repositories Loading

  1. ecommerce-recsys-prod ecommerce-recsys-prod Public

    E-commerce рекомендательный сервис: ALS, re-ranking, мониторинг и переобучение по расписанию

    Python 1

  2. churn-prediction churn-prediction Public

    Предсказание оттока клиентов: ML-пайплайн, Airflow, DVC, MLflow. Классификация, метрики F1/Accuracy.

    HTML

  3. baseline-improvement baseline-improvement Public

    Улучшение baseline-модели: feature engineering, CatBoost, Optuna, MLflow. Прогноз стоимости недвижимости, метрики RMSE/R2.

    Jupyter Notebook

  4. churn-prediction-api churn-prediction-api Public

    Churn Prediction API: FastAPI-сервис предсказания оттока клиентов (CatBoost), контейнеризация, готовность к мониторингу.

    Python

  5. DataClasse DataClasse Public

  6. music-recommender music-recommender Public

    Система персональных музыкальных рекомендаций

    Jupyter Notebook