Стажировка по проекту
Компания: ООО «Центр перспективных технологий ТМХ»
Система прогнозирования износа колес локомотива
Суть проекта
Задача
Для чего
Вводные данные
Выходные данные
Используя алгоритмы нейросетевого анализа предсказать износ колесных пар локомотивов находящихся на линии
1 команда: Ноутбук для объединения исходных данных в единый датасет.
Ноутбук для обучение нейронной сети на предоставленных данных.
Сохраненная архитектура и веса наиболее удачной модели.
Ноутбук для загрузки и тестирования модели

2 команда: Учитывая характер и качество предоставленных заказчиком данных, разработка моделей машинного и глубокого обучения для прогнозирования износа колес позволила получить точность предсказания до 57% (средняя ошибка в предсказании износа - 0,86 мм), что ниже требуемой точности. Разработка моделей для прогнозирования периода обточки колес позволила получить точность предсказания до 83% (средняя ошибка - 27 дней)
  • Таблица пробегов локомотивов по различным направлениям и радиусам кривых
  • Таблица данным измерений толщины гребней колесных
  • Таблица с данными о датах и причинах обточек колесных пар
По достижении критического износа толщины гребня колесной пары для его восстановления требуется ресурсоемкая технологическая процедура (обточка). Если в центр обслуживание поступает одновременно несколько локомотивов колесные пары которых требуется обточить, то поскольку делать это одновременно не представляется возможным, то это приводит к простою локомотивов, ждущих своей очереди. Система предсказания износа колес локомотивов на линии позволит ЦПТ ТМХзаранее предполагать необходимость обточки, оптимизировать нагрузку на центры обслуживания и снизить простои
Участники
1 команды проекта
  • Бойцов Антон
    Тимлид проекта
    Антон - руководитель группы разработчиков, отвечал за полную разработку проекта
  • Прохоренко Евгений
    Помощник Тимлида
    Евгений помогал руководителю команды организовывать процесс разработки проекта
  • Ларина Нина
    Помощник Тимлида
    Нина помогала руководителю команды организовывать процесс разработки проекта
  • Пискарева Евгения
    Менеджер по аудиту, анализу данных и внедрению BIM-технологий в
    ООО «СЗ «Стадион Спартак»
    • Детальная предобработка и анализ датасета средствами ПО Power BI;
    • Вычисление первичных статистик и построение корелляционных матриц;
    • Построение различных моделей нейросетей и эксперименты с объемом входных данных;
    • Систематизация результатов работы команды
  • Шадрина Ольга
    ИТ-менеджер на промышленном предприятии
    • Поиск и детальный анализ научных материалов по теме проекта;
    • Детальный анализ и обработка данных заказчика;
    • Построение корелляционных матриц;
    • Расширение датасета дополнительными параметрами;
    • Построение моделей при помощи Autokeras;
    • Подбор архитектуры моделей генетическим алгоритмом
  • Рыбин Игорь
    Специалист по системам автоматического химического контроля водно-химического режима электростанций
    • Очистка и анализ датасета;
    • Сравнение датасета с данными научных публикаций;
    • Эксперименты с архитектурами нейронных сетей (Dence слои, RandomForestRegressor, DecisionTreeRegressor, LassoCV, RidgeCV);
    • Подбор оптимальных гиперпараметров для обучения моделей;
    • Визуализация и подробный анализ результатов
  • Еремин Сергей
    Системный администратор, ООО «Деревенское молочко»
    • Предобработка датасета;
    • Генетический алгоритм предсказания износа
  • Ивашкин Роман
    Руководитель направления исследований в области Big Data
    Тестирование различных архитектур моделей;
    • Feature Engineering датасета
  • Черный Ариэл
    Аналитик, Банк Юникредит
    • Анализ, объединение и фильтрация данных;
    • Построение LinearRegression модели;
    • Применение генетических алгоритмов для подбора коэффициентов модели
  • Назаров Сергей
    • Многократное тестирование различных архитектур моделей на готовых датасетах;
    • Подобрал оптимальную архитектуру с наилучшей точностью предсказания
  • Шумилова Любовь
    SEO-оптимизатор
    • Предобработка и анализ датасета;
    • Тестирование нейросевых моделей
Участники
2 команды проекта
  • Рубцов Антон
    Тимлид проекта
    Антон - руководитель группы разработчиков, отвечал за полную разработку проекта

    Определение направлений разработки;
    Постановка гипотез по решению стоящих задач;
    Проведение еженедельных;
    Организация работы и контроль задач
  • Докучаева Светлана
    Помощник Тимлида
    • Координация стажеров в проекте, помощь в управлении проектом. Организация и контроль исследовательских процессов;
    • Управление разработкой, помощь в выборе направления параметризации данных;
    • Контроль выполнения текущих и выдача новых заданий. Поддержка в анализе и визуализации данных;
    • Сбор результатов работы стажёров и отчётность перед заказчиком. Отслеживание прогресса проекта, метрик моделей нейросетей;
    • Проведение еженедельных встреч в спринт формате, помощь тимлиду
  • Блохин Максим
    Специалист 1 категории в АО «ЕРП»
    • Анализ и обработка данных: Pandas, Sweetviz, Numpy;
    • Подбор архитектуры нейросетей – использование полносвязанных и сверточных НС;
    • Подбор гиперпараметров и использование Callbacks и Functional API;
    • Использование AutoKeras и автоматизация подбора оптимальных гиперпараметров с помощью Keras Tuner;
    • Использование для классификации и регрессии классических ML-решений: RandomForestRegressor, DecisionTreeRegressor;
    • Визуализация результатов обучения с помощью Matplotlib
  • Середина МаринА
    Аналитик данных
    • Анализ данных и поиск путей решения задачи;
    • Обработка данных и анализ корреляций с помощью Pandas, Sweetviz, Numpy;
    • Нормирование числовых данных с помощью Sklearn.MinMaxScaler;
    • Использование Callbacks и Functional API при подборе архитектур и обучении моделей нейросетей;
    • Использование AutoKeras и автоматизация подбора оптимальных гиперпараметров с помощью Keras Tuner;
    • Визуализация результатов обучения с помощью Matplotlib
  • Демина Людмила
    Аналитик ИТ/Менеджер проектов ИТ
    • Анализ данных и поиск путей решения задачи
    • Подготовка данных и анализ корреляций с помощью Pandas, Numpy
    • Нормирование числовых данных с помощью Sklearn.MinMaxScaler
    • Подбор архитектуры нейросети с помощью Tensorflow.Keras
    • Визуализация корреляций и результатов обучения с помощью Matplotlib, Seaborn, ConfusionMatrix
  • Пономарев Иван
    Руководитель проектов в строительстве и эксперт по календарному планированию и организации строительного производства
    • Анализ данных и выявление корреляций с помощью Pandas, Numpy, Seaborn;
    • Нормализация и стандартизация при подготовке данных: Sklearn's StandardScaler и MinMaxScaler;
    • Кластеризация и классификация: Sklearn's KMeans и LinearRegression для моделирования;
    • Разработка и обучение регрессионных моделей с помощью XGBoost и LinearRegression;
    • Визуализация данных и результатов: создание графиков и диаграмм с помощью Matplotlib и Seaborn;
    • Построение и оценка моделей машинного обучения: применение XGBoost, рассчет R2 Score для оценки моделей
  • Щетинин Алексей
    Главный специалист-архитектор ООО «Метрополис»
    • Анализ данных и поиск путей решения задачи
    • Обработка данных с помощью Pandas, Numpy, Sklearn
    • Кластеризация данных с помощью Sklearn.KMeans
    • Нормирование числовых данных с помощью Sklearn’s MinMaxScaler, StandardScaler
    • Разработка и обучение регрессионных моделей с помощью XGBoost, LinearRegression
    • Визуализация данных и результатов обучения нейросетей с помощью Matplotlib, Seaborn
Демонстрация проекта 2 команды