Skip to content

Latest commit

 

History

History
54 lines (39 loc) · 4.75 KB

README.md

File metadata and controls

54 lines (39 loc) · 4.75 KB

Прогнозирование оттока клиентов телеком компании "Теледом"

Оператор связи «ТелеДом» хочет бороться с оттоком клиентов. Для этого будет предлагать промокоды и специальные условия всем, кто планирует отказаться от услуг связи. Чтобы заранее находить таких пользователей, «ТелеДому» нужна модель, которая будет предсказывать, разорвёт ли абонент договор. Команда оператора собрала персональные данные о некоторых клиентах, информацию об их тарифах и услугах.

Задача

Обучить на этих данных модель для прогноза оттока клиентов.

Инструменты

  • pandas
  • numpy
  • sklearn
  • matplotlib
  • seaborn
  • lightgbm
  • xgboost
  • shap
  • phik
  • torch

Отработанные методы и навыки:

  • сгрузили таблицы с базы PostgreSQL;
  • разобрали и проанализировали каждый столбец, имеющихся таблиц, поменяли названия согласно PEP-8;
  • объединили таблицы в единий датафрейм;
  • заполнили пропуски;
  • удалили дубликаты;
  • извлекли целевой признак;
  • выбрали наиболее коррелируемые признаки;
  • разделили данные на обучающую и тестовую, согласно заданию;
  • провели кодирование категориальных признаков;
  • масштабировали числовые признаки.

Во второй части обучили 7 моделей: LogisticRegression, RandomForestClassifier, LightGBM, CatBoostClassifier, AdaBoostClassifier, XGBClassifier, NeuralNetwork. Получили следующие показания метрики на обучающей выборке ROC-AUC:

  • NeuralNetwork 0.852864
  • CatBoostClassifier 0.848276
  • LightGBM 0.847483
  • XGBClassifier 0.846769
  • AdaBoostClassifier 0.846620
  • RandomForestClassifier 0.839790
  • LogisticRegression 0.8362

Итоги проекта

NeuralNetwork опередила остальные модели. На тестовой выборке NeuralNetwork показала ROC-AUC: 0.85. Что удовлетворяет поставленным требованиям компании оператора связи.

По полученному дополнительному анализу наблюдаем значительное увеличение новых абонентов, среди которых и идёт "текучка" абонентов. Самое большее количество, ушедших абонентов, это абоненты с общими раходами за весь период пользования услуг до 200 единиц с помесячной оплатой от 70 до 100 единиц. Т.е. в среднем 2 месяца пользования. У большинства из них была подключена услуга интернета по оптико-волокну. Можно предположить, что новые клиенты после подключения не довольны ценой или качеством интернета за данную сумму, при этом месячные платежи не минимальны, т.е клиенты с набором услуг.

Для оператора связи рекомендуется использовать модель NeuralNetwork для рассылки промокодов и специальных условий всем, кто планирует отказаться от услуг связи в течение 2 месяцев от заключения абонентского договора (True Positive, False Negative). Отправлять специальные предложения и промокоды целесообразно на электронный почтовый ящик, так как большинство ушедших получали электронные счета. Также рекомендуется добавить в таблицы данные о тарифах, что могло бы яснее понять причину оттока абонентов.