Стажировка по проекту
Компания: Юздеск
Прогнозирование поведения потребителей продукта
Юздеск
Суть проекта
Задача
Для чего
Вводные данные
Выходные данные
Проект направлен на разработку и применение искусственного интеллекта (AI) для прогнозирования поведения клиентов IT-компании «Юздеск»
1 команда: Ноутбук с возможностью подгрузки базы, обучения модели и вывода предсказаний по компаниям

2 команда: Разбалансированность датасета и статичность предсказываемых данных позволили опровергнуть гипотезу заказчика. При этом была получена модель нейросети, способной предсказывать уход с вероятностью до 70%, тогда как то, что клиент останется с вероятностью 96%
Историческая база данных на основе активности компании
Основная цель проекта - предсказать, как клиенты будут взаимодействовать с компанией «Юздеск» в будущем: будут ли они покупать дополнительные лицензии, продлевать текущие лицензии или прекращать сотрудничество
Участники
1 команды проекта
  • Терещенко Алексей
    Тимлид проекта
    Алексей - руководитель группы разработчиков, отвечал за полную разработку проекта
  • Шалунов Андрей
    Технический руководитель, Системный Архитектор / Работал по всему миру на проектах внедрения OSS, BSS в Telecom и IoT сфере
    • Анализирование технического задания и исходного датасета;
    • Преобразование данных о покупках и параметрах компаний за 6 месяцев в плоский вектор с колонками для каждого месяца;
    • Добавление колонок, отражающих параметры между месяцами для повышения объема данных;
    • Обучение нейронной сети, точность 97%;
    • Анализ результатов обучения, выявление необходимости изменения скалирования данных на последующих этапах;
    • Реализация проверки нейронной сети, используя данные только за последние 6 месяцев,вывод таблиц с вероятностями рейтингов;
    • Проведение анализа вероятностей для компаний, включая те, которые уже ушли, но имели потенциал остаться
  • Глазырина татьяна
    специалистом отдела сопровождения СПС «Гарант»
    • Проведение экспериментов с Фреймворком AutoML(тюнерами 1. Grid Search, 2. Random Search, 3. Bayesian Optimization, 4. Hyperband) для того, чтобы упростить процесс разработки моделей и автоматически выбирать наиболее подходящие конфигурации моделей для конкретных задач;
    • Использование разных подходов по подготовке датасетов, и разных способов их обработки. Получение точности 65-99% ;
    • Использование новых автоматических подходов в обработке табличных данных - библиотеки FEDOT и H2O
  • Самохин Кирилл
    ИТ-директор в Компаниях сеть магазинов «Пятерочка», сеть магазинов «Аленка»
    Руководитель проектов в компании «Астор» автоматизация розничной торговли: ERP, WMS ,SCM, Loyalty
    • Создание и обучение модели на пред обработанных данных, оптимизация функции потерь и весов, оценка точности;
    • Применение классических методов (регрессия, классификация), настройка гипер параметров, оценка производительности;
    • Автоматизация модельного процесса, выбор архитектуры и гипер параметров, оценка и сравнение результатов;
    • Оценка точности, метрик, времени обучения; выбор наилучшего метода и дальнейшие шаги
  • Туз Любовь
    Преподаватель программирования для детей
    • Применение AutoKeras, как основы на данном проекте;
    • Предобработка данных;
    • Создание нейронной сети с применением AutoKeras, используя разные наборы данных, предоставленные заказчиком;
    • Эксперименты с различными вариантами преобразования метки рейтинга, включая классификацию 2 и 3 класса
Участники
2 команды проекта
  • Рубцов Антон
    Тимлид проекта
    Антон - руководитель группы разработчиков, отвечал за полную разработку проекта
  • Яшин Михаил
    ,старший специалист отдела выявления и анализа сомнительных операций в Тинькофф банк
    • Исследование данных и поиск корреляций в датасете;
    • Подготовка данных с помощью Sklearn, Numpy, Pandas, MinMaxScaler;
    • Балансировка классов методами downsampling и oversampling;
    • Подбор архитектуры нейросети с помощью tensorflow.keras и использование callbacks;
    • Использование фреймворка AutoKeras для решения задачи;
    • Визуализация корреляций и результатов обучения с помощью Matplotlib, Seaborn, ConfusionMatrix
  • Вишняков Дмитрий
    Сопровождение учётных систем БЭСТ, 1С
    • Чтение и редактирование кода на Python;
    • Анализ корреляций и подготовка данных Sklearn, Numpy, Pandas;
    • Подбор архитектуры нейросети с помощью tensorflow.keras;
    • Визуализация результатов обучения с помощью Matplotlib
  • Мурунов Роман
    Консалтинг по вопросам выстраивания ИТ проектов и инфраструктуры
    • Анализ задачи и поиск методов решения;
    • Подготовка данных с помощью Numpy, Pandas, Sweetviz, Sklearn, StandardScaler;
    • Подбор архитектуры нейросети с помощью tensorflow.keras для решения задачи, использование метрик F1 Score;
    • Визуализация результатов обучения. Использование Matplotlib, Seaborn, Confusion Matrix
Благодарность университетУ