Стажировка по проекту
Разработка системы прогнозирования в задачах в области ветренной энергетики
Компания: Московский энергетический институт
Суть проекта
Задача
Для чего
Вводные данные
Требуется выполнить пилотную разработку системы прогнозирования развития временных рядов скорости ветра измеряемых на ветроизмерительных комплексах (ВИК), установленных в географических локациях Камчатского полуострова, а так же систему прогнозирования временного ряда скорости ветра в целевой локации при наличии в ней ограниченного интервала наблюдений и длительного интервала наблюдений в окружающих локациях
Башни ВИК устанавливаются на длительный интервал (год и более) в заданных географических локациях для определения перспективности выбранной локации с точки зрения ветрогенерации на основании измерений скоростей ветра. Интерес к созданию моделей для предсказания временного ряда скорости ветра обусловлен возможностью минимизации для новых локаций временного интервала проведения с помощью башни ВИК измерений на основании которых можно было бы судить о перспективности оцениваемой локации для целей ветрогенерации с учетом предсказания обученной моделью развития ряда скорости ветра
Временные ряды показаний датчиков ветроизмерительных комплексов (ВИК), установленных в локациях полуострова Камчатка, включающие наблюдения скорости и направления ветра, а так же температуры воздуха. Целевой метрикой к предсказанию в настоящем проекте является временной ряд средней скорости ветра датчика, установленного на 10-и на метровой отметке башни ВИК
Временной ряд со средней скоростью ветра на 10-и на метровой высоте башни ВИК
Выходные данные
Участники
1 команды проекта
  • Резер Артем
    Тимлид проекта
    Артем - руководитель проекта, участие в разработке, координация работы команды, постановка задач, контроль качество и сроков их выполнения
  • Некрасова Татьяна
    Помощник Тимлида
    • Анализ данных заказчика, визуализация рядов скорости ветра на разных высотах башен ВИК, вычисление корреляции Пирсона и Спирмена между ними;
    • Изучение материалов статьи по прогнозированию скорости ветра для задач ветроэнергетики с помощью слоев TCN;
    • Создание архитектуры и обучение нейронной сети, содержащей слои TCN;
    • Содействие тимлиду по общим вопросам
  • Харламов Михаил
    Помощник Тимлида
    • Содействие тимлиду по общим вопросам
  • Шелагурова Марина
    Работает в АО «Раменское приборостроительное конструкторское бюро». Начальник сектора по индикации и картографии, к.т.н.
    • Разработка веб-приложения на базе библиотеки Gradio с интерфейсом позволяющим выполнять комплексную предобработку рядов исходных данных с созданием выборок (датасетов) и выполнять предсказаний скорости ветра для различных башен ВИК обученными моделями с визуализацией результатов предсказаний и выводом точностных метрик моделей;
    • Разработка функции-конвертера исходных данных заказчика с временными рядами в согласованный табличный вид с экспортом в форматы csv, xlsx для целей выполнения последующего разведывательного анализа;
    • Разработка функций агрегирования и визуализации рядов исходных данных;
    • Выполнение разведывательного анализа данных специализированными библиотеками dtale, sweetviz;
    • Проверка данных на пропуски и написание функций заполнения пропусков методами linear, spline, nearest, mean, median;
    • Проверка данных на стационарность методом Дики-Фуллера;
    • Построение матриц корреляций, вычисление VIF фактора, определение сезонности в данных;
    • Разработка класса генерации датасета, позволяющего выполнять заданную предобработку исходных рядов данных по каждому ВИК, вычислять синтетические столбцы и генерировать датасет с требуемым набором столбцов и преобразований, таких как перевод направлений ветра в ряды синусов и косинусов, удаление сезонности, удаление тренда, дифференцирование заданных столбцов, агрегирование, нормализация, заполнение пропусков, разделение на обучающую и тестовую выборки, подготовка словаря с набором данных для выполнения обратных преобразований;
    • Разработка класса обратной трансформации преобразованных в датасет данных, денормализация, интегрирование дифференцированных данных, возврат тренда и сезонности;
    • Обучение моделей архитектурами, включающими слои CNN, RNN, GRU, LSTM на датасетах, подготовленных из рядов по всем башням ВИК заказчика, интеграция обученных моделей в разработанное веб-приложение
  • Калюжный Денис
    системный администратор
    • Первичный парсинг данных заказчика в формате csv;
    • Написание первичного класса датасета с функционалом автоматического парсинга данных из csv и формированием промежуточной базы данных в формате sqlite;
    • Проведение разведывательного анализа данных с применением специализированных библиотек, выявление корреляций в имеющихся данных и выбор опорных рядов для целей прогнозирования;
    • Расширение класса датасета до возможностей формирования выборок из датасета с произвольными параметрически задаваемыми условиями отбора по времени / каналам / башням ВИК и другим параметрам в различных вариантах, как в одноканальном, так и в многоканальном режимах;
    • Применение для прогнозирования функционала фреймворка для временных рядов ETNA от Tinkoff
  • Шеханова Елена
    • Проведение разведывательного анализа данных с применением библиотеки sweetviz;
    • Подготовка доклада по методу предсказания скорости ветра на основе гауссовского процесса;
    • Подготовка датасета для моделей на основе гауссовского процесса, обучение моделей для разных башен ВИК;
    • Интеграция обученных моделей в разработанное веб-приложение на Gradio;
    • Тестирование обученных моделей для разных башен ВИК в интерфейсе веб-приложения
  • Драгинда Юлия
    Научный сотрудник (CIRMMT, Монреаль, Канада)
    • Проведение разведывательного анализа данных с применением специализированных библиотек, исследование мультиколлинеарности в данных с помощью VIF фактора;
    • Изучение встроенных в pandas методов заполнения пропусков в данных;
    • Заполнение пропусков в данных с помощью метода Кригинга, подготовка датасетов по всем вышкам, не содержащих пропущенных значений;
    • Построение модели предсказания скорости ветра на основе обратного преобразования Фурье
  • Молчанов Денис
    системный администратор
    • Тестирование статистических моделей семейства ARMA (ARIMA, SARIMA, SARIMAX), выполнение доклада группе по моделям данного семейства;
    • Тестирование влияния вариантов нормализаций временного ряда (Standard Scaler, MinMax Scaler, Quantile Transformer) на результаты обучения НС;
    • Исследование архитектуры модели Informer для предсказания временных рядов, доклад группе по архитектуре данной модели с подготовкой демонстрационного ноутбука;
    • Создание конвейеров обучения и тестирование моделей нейронных сетей глубокого обучения (Linear Model, Simple NN Model, BiLSTM+NN, Transformer, Informer(Embedding+ProbAttention+Distilling+Mix)) для прогнозирования временного ряда на одно- и много-канальном датасете с применением библиотек tensorflow и pytorch