Стажировка по проекту
Компания: Ingate Digital Marketing Integrator https://ingate.ru
Прогнозирование продаж товара на маркетплейсах
Суть проекта
Задача
Для чего
Вводные данные
Выходные данные
Разработка и реализация алгоритмов AI для выполнения следующих подзадач:
  • Определение корреляции по всем параметрам статистики для понимания работы алгоритмов в разных категориях и их зависимостей;
  • Прогнозирование продаж для любого клиента в категории на основе общих продаж всех продавцов в этой категории;
  • Прогнозирование продаж товара в нескольких вариантах с учетом данных общих продаж, статистики товара
Данная система будет являться помощником при оценки влияния определенных параметров на продажи магазинов маркетплейсов, предоставлять полную картину того, что нужно сделать продавцу на маркетплейсе для достижения желаемого оборота (в руб)
Для разработки системы использовались csv таблицы со всеми метриками, влияющими на целевую переменную, которые необходимо было склеить в одну общую таблицу
1 команда: На выходе получаем систему способную с 90% точностью предсказания на основе всех данных (фичей)

2 команда: Исследования данных и корреляции параметров из разных таблиц показали, что, в условиях ограниченных данных, возможно получение модели нейросети, предсказывающей целевой показатель по ограниченному количеству входящих параметров с точностью до 96% на месяц вперёд
Участники
1 команды проекта
Данная команда занималась полным анализом имеющейся базы данных, созданием модуля предобработки данных, а также экспериментами с различными подходами для получения желаемого результата
  • Колбенев Василий
    Тимлид проекта
    Василий - руководитель группы разработчиков, отвечал за полную разработку проекта
  • Майоров Сергей
    индивидуальный предприниматель в сфере ИТ
    • Анализ данных/поиск материалов;
    • Обработка данных;
    • Разработка и обучение модели с помощью AutoML;
    • Подготовка интеграционного этапа, упаковка модели в Docker
  • Светозаров Андрей
    Руководитель IT-проектов в АльфаБанк
    • Анализ данных/поиск материалов;
    • Предобработка данных;
    • Эксперименты с различными архитектурами нейросетей;
    • Применение фреймворка AutoTS с целью предсказания изменения цены
  • Каширский Антон
    Продакт-менеджер отдела промышленного оборудования
    • Анализ данных/поиск материалов;
    • Предобработка данных;
    • Эксперименты с различными архитектурами нейросетей
  • Окуловский Владимир
    Ведущий инженер 2 линии поддержки в сотовой компании
    • Анализ данных/поиск материалов;
    • Предобработка данных;
    • Эксперименты с различными архитектурами нейросетей
  • Маевский Андрей
    Руководитель отдела морской робототехники Санкт-петербургский Государственный Морской Технический Университет / Занимается разработками систем и алгоритмов для управления морскими робототехническими комплеками
    • Анализ данных/поиск материалов;
    • Предобработка данных;
    • Эксперименты с различными архитектурами нейросетей;
    • Применение подходов ML & AutoML
  • Шипунова Екатерина
    backend python-developer в STM Labs
    • Анализ данных/поиск материалов;
    • Обработка данных;
    • Эксперименты с различными архитектурами нейросетей
  • Малашева Кермен
    Экономист: Работала в финансовом отделе АО «Газпром Оргэнергогаз»
    • Анализ данных и поиск подходов к решению данной задачи;
    • Эксперименты с различными архитектурами нейросетей
  • Губский Дмитрий
    Юрист, коммерческая недвижимость
    • Анализ данных/поиск материалов;
    • Предобработка данных;
    • Эксперименты с различными архитектурами нейросетей;
    • Применение подходов ML & AutoML
Участники
2 команды проекта
  • Рубцов Антон
    Тимлид проекта
    Антон - руководитель группы разработчиков, отвечал за полную разработку проекта
  • Шишкин Сергей
    Руководитель группы продвижения продукции
    • Анализ задачи и исследование корреляций между данными из разных таблиц;
    • Подготовка данных с помощью Pandas, Numpy, SkLearn, Math;
    • Построение моделей временных рядов, регрессии и гибридных моделей ARIMAX;
    • Использование фреймворка AutoKeras для решения задачи;
    • Визуализация корреляций и результатов обучения с помощью Matplotlib
  • Космылев Владислав
    Программист 1С
    • Анализ задачи и исследование корреляций между данными из разных таблиц;
    • Подготовка данных с помощью Pandas, Numpy, SkLearn;
    • Применение CatBoostRegressor для решения задачи и подбор гиперпараметров;
    • Использование auto timeseries для решения задачи временных рядов;
    • Визуализация результатов обучения с помощью Matplotlib, Seaborn
  •  Мосеева Евгения
    аналитик в ООО "Инструмент-Сервис"
    • Анализ данных и подбор подходов к решению задачи;
    • Применение алгоритмов ML-обучения для регрессионного исследования и анализа корреляций входящих данных;
    • Подбор архитектуры модели нейронной сети с помощью tensorflow.keras, использование Callbacks;
    • Поиск регрессионного ML-решения задачи предсказания целевых параметров;
    • Проведение эксперимента по предсказанию количества заказов с помощью модели временных рядов - Orbit;
    • Визуализация результатов обучения и корреляций данных с помощью Matplotlib, Seaborn
  • Романов Сергей
    Инженер АСУТП в буровой компании
    • Анализ задачи и исследование корреляций данных;
    • Подготовка данных с помощью Pandas, Numpy, SkLearn;
    • Подбор архитектуры модели нейронной сети с помощью tensorflow.keras, FunctionalAPI;
    • Визуализация результатов обучения с помощью Matplotlib
  • Домосканова Ирина
    Бизнес-аналитик
    • Анализ задачи и исследование корреляций данных;
    • Подготовка данных с помощью Pandas, Numpy, SkLearn;
    • Проведение экспериментов по предсказанию продаж по самой продаваемой категории товаров с помощью модели временных рядов;
    • Подбор гиперпараметров и подаваемых данных для обучения моделей;
    • Визуализация результатов обучения и корреляций данных с помощью Matplotlib;
    • Консультация группы по вопросам маркетинга и базе данных (мпстатс, озон)
  • Койбагаров Кайрат
    • Чтение и редактирование кода Python;
    • Подготовка данных с помощью Pandas, Numpy, SkLearn;
    • Создание модели нейросети регрессии средствами tensorflow.keras;
    • Подбор гиперпараметров модели для решения начальной задачи – по всем метрикам таблицы аналитики за год (озон);
    • Визуализация результатов обучения с помощью Matplotlib
Благодарность университетУ