Стажировка по проекту
Компания: Государственное бюджетное учреждение здравоохранения Республиканский кардиологический центр
Система индивидуального прогнозирования дозировок препарата при антикоагулянтной терапии
Суть проекта
Задача
Для чего
Вводные данные
Выходные данные
Создать рекомендательную систему индивидуального прогнозирования дозировок препарата при антикоагулянтной терапии

Система предназначена для автоматизации процесса подбора стабильной дозы варфарина и помощи врачам при выборе корректной стартовой дозировки препарата
В качестве входных данных принимаются датасеты пациентов со следующими параметрами: пол, возраст, диагноз (в этой реализации модели использовались только три диагноза – Фибрилляция предсердий, протезирование аортального клапана, протезирование митрального клапана), показатель анализа МНО и дата анализа, пропуск дозы (для стартового высокого значения МНО), целевое значение МНО (выбирается врачом исходя из диагноза), через сколько дней предполагается получить целевой показатель МНО. Размер очищенной базы - 800 пациентов.

Предсказываемая доза в мг с точностью +/- 0,49 мг (1 таблетка - 2,5 мг, минимальный шаг в дозе – 0,25 таблетки)

Участники
1 команды проекта
  • Суслин Герман
    Тимлид проекта
    Герман - руководитель группы разработчиков, отвечал за полную разработку проекта
  • Казанцева Оксана
    Андеррайтер в банке и крупной логистической компании
    • Поиск и анализ существующих решений задачи;
    • Анализ, очистка данных, поиск выбросов в данных;
    • Создание моделей предсказания с использованием нейронных сетей;
    • Проведение экспериментов по поиску оптимальных моделей предсказания с использованием нейронных сетей;
    • Поиск наиболее подходящих под задачу оптимизаторов
  • Алюнов Дмитрий
    Data Scientist в банке
    • Анализ, очистка данных, поиск выбросов в данных;
    • Построение моделей предсказания с использованием методов классического машинного обучения;
    • Интеграция проекта в виде веб-сервиса;
    • Разработка системы авторизации в веб-сервисе
  • Евсеев Денис
    Программист в отделе исследования финансовых рынков
    • Очистка, обработка и парсинг данных;
    • Проверка работы AutoML в решении задачи проекта;
    • Интеграция проекта в виде веб-сервиса;
    • Построение моделей предсказания с использованием методов классического машинного обучения
  • Клычков Аксентий
    Графический дизайнер
    • Очистка, обработка и парсинг данных;
    • Создание моделей предсказания с использованием нейронных сетей;
    • Проведение экспериментов по поиску оптимальных моделей предсказания с использованием нейронных сетей
  • Миронов Максим
    Руководитель отдела по работе с клиентами
    • Очистка, обработка и парсинг данных;
    • Создание моделей предсказания с использованием нейронных сетей и методов классического машинного обучения;
    • Интеграция проекта в виде веб-сервиса;
    • Внедрение решений участников в веб-сервис
  • Князев Денис
    Разработчик ПО
    • Анализ данных, поиск выбросов;
    • Изучение оптимального способа нормализации данных;
    • Проведение экспериментов по поиску оптимальных моделей предсказания с использованием нейронных сетей
  • Юкина Наталья
    Старший научный сотрудник (сфера геоэкология)
    • Создание моделей предсказания с использованием нейронных сетей;
    • Проведение экспериментов по поиску оптимальных моделей предсказания с использованием нейронных сетей;
    • Проверка обработанных данных
  • Гребнев Алексей
    Программист
    • Создание моделей предсказания с использованием нейронных сетей и методов классического машинного обучения;
    • Анализ, очистка данных, поиск выбросов в данных
  • Масленников Виталий
    Программист
    • Создание моделей предсказания с использованием нейронных сетей;
    • Поиск наиболее подходящих под задачу оптимизаторов
  • Нагорная Валерия
    Digital-маркетинг специалист
    • Создание моделей предсказания с использованием нейронных сетей;
    • Построение pipeline модели
  • Чеснокова Анастасия
    Эксперт по подбору персонала в нефтехимической отрасли
    • Создание моделей предсказания с использованием нейронных сетей;
    • Проведение экспериментов по поиску оптимальных моделей предсказания с использованием нейронных сетей
  • Самойлов Андрей
    Программист ГБУЗ МО «МОБ им. проф. Розанова В.Н.»
    • Создание моделей предсказания с использованием нейронных сетей;
    • Проведение экспериментов по поиску оптимальных моделей предсказания с использованием нейронных сетей
  • Няньчур Оксана
    Специалист отдела экономической безопасности в банке
    • Создание моделей предсказания с использованием нейронных сетей;
    • Проведение экспериментов по поиску оптимальных моделей предсказания с использованием нейронных сетей
  • Кузнецов Максим
    Инженер по автоматизированному тестированию
    • Создание моделей предсказания с использованием нейронных сетей;
    • Проведение экспериментов по поиску оптимальных моделей предсказания с использованием нейронных сетей
  • Процевский Роман
    Инженер Института Молекулярной Генетики Курчатовского НИЦ
    • Создание моделей предсказания с использованием нейронных сетей;
    • Проведение экспериментов по поиску оптимальных моделей предсказания с использованием нейронных сетей
  • Козлов Георгий
    Преподаватель
    • Создание моделей предсказания с использованием нейронных сетей;
    • Проведение экспериментов по поиску оптимальных моделей предсказания с использованием нейронных сетей
  • Макаров Александр
    • Создание моделей предсказания с использованием нейронных сетей;
    • Анализ данных и поиск выбросов;
    • Исследование возможностей применения готовых решений автоматизации подбора гиперпараметров моделей
Участники
2 команды проекта
  • Колбенев Василий
    Тимлид части проекта
    Василий - руководитель группы разработчиков, отвечал за частичную разработку проекта
  • Шадрина Ольга
    ИТ-менеджер на промышленном предприятии
    • Анализ данных/поиск материалов;
    • Предобработка данных;
    • Эксперименты с различными подходами и архитектурами нейросетей;
    • Разработка рекомендаций к заказчику по поводу хранения и структуры данных на будущее для корректного использования модели
  • Беззубенко Егор
    Проектировщик деревянных строений, создает эскизные проекты для BAUMHAUS
    • Анализ данных/поиск материалов;
    • Обработка данных;
    • Эксперименты с различными архитектурами нейросетей, а также с методами ML, AutoKeras, Auto-sklearn
  • Кузнецов Александр
    Специалист по конвейерным компонентам: ООО «Майнинг элемент»
    • Анализ данных/поиск материалов;
    • Предобработка данных;
    • Эксперименты с различными подходами и архитектурами нейросетей
  • Бойцов Антон
    Главный инженерный специалист по продажам, установке, обслуживанию и ремонту неэлектрических дозирующих насосов французской компании Dosatron International
    • Анализ данных/поиск материалов;
    • Предобработка данных;
    • Эксперименты с различными подходами и архитектурами нейросетей, собственный подход к обработке данных
  • Остапенко Валерия
    Руководитель отдела финансовой аналитики
    • Анализ данных/поиск материалов;
    • Предобработка данных, эксперименты с различными подходами и архитектурами нейросетей;
    • Обработка датасета исходного датасета в более структурированный вид
  • Чурина Анастасия
    Инженер-геофизик
    • Анализ данных/поиск материалов;
    • Предобработка данных;
    • Эксперименты с различными подходами и архитектурами нейросетей
  • Сулим Андрей
    Работает в Минэнерго России по вопросам аварийности в электроэнергетике
    • Анализ данных/поиск материалов;
    • Предобработка данных;
    • Эксперименты с различными подходами и архитектурами нейросетей, применение AutoKeras, Auto-sklearn
  • Петайкин Алексей
    Предприниматель, блокчейн энтузиаст, частный инвестор
    • Анализ данных/поиск материалов;
    • Предобработка данных;
    • Эксперименты с различными подходами и архитектурами нейросетей
  • Курапов Михаил
    Инженер поддержки в МФЦ
    • Анализ данных/поиск материалов и подходов к решению данной задачи;
    • Эксперименты с различными архитектурами нейросетей
  • Кагарманов Ильдар
    • Анализ данных/поиск материалов;
    • Предобработка данных;
    • Эксперименты с различными подходами и архитектурами нейросетей
  • Заикин Михаил
    • Анализ данных/поиск материалов;
    • Предобработка данных;
    • Эксперименты с различными подходами и архитектурами нейросетей
Участники
3 команды проекта
  • Колбенев Василий
    Тимлид части проекта
    Василий - руководитель группы разработчиков, отвечал за частичную разработку проекта
  • Афанасенко Сергей
    Руководитель отдела ИТ в дистрибуторской компании
    • Анализ данных/поиск материалов;
    • Обработка данных;
    • Эксперименты с различными архитектурами нейросетей;
    • ML & AutoML
  • Красиков Виталий
    Проектировщик деревянных строений, создает эскизные проекты для BAUMHAUS
    • Анализ данных/поиск материалов;
    • Предобработка данных;
    • Эксперименты с различными подходами и архитектурами нейросетей;
    • Применение ML|AutoML
  • Матвеев Алексей
    Предприниматель/автоматизированный мониторинг цен на сайтах интернет магазинов
    • Анализ данных/поиск материалов;
    • Предобработка данных;
    • Эксперименты с различными архитектурами нейросетей;
    • Применение подходов ML|AutoML
  • Шляпников Сергей
    Инженер строитель – технолог /
    Малоэтажное строительство домов и коттеджей
    • Анализ данных/поиск материалов;
    • Предобработка данных;
    • Эксперименты с различными архитектурами нейросетей;
    • Применение подходов ML|AutoML
  • Федоренко Екатерина
    Студент университета
    • Анализ данных/поиск материалов и подходов к решению данной задачи;
    • Эксперименты с различными архитектурами нейросетей
  • Яцко Юрий
    Инженер-конструктор
    • Анализ данных/поиск материалов и подходов к решению данной задачи
  • Аникеев Артем
    Основатель ИТ проектов в сфере E-commerce и ИИ
    • Анализ данных/поиск материалов и подходов к решению данной задачи;
    • Эксперименты с различными архитектурами нейросетей;
    • Применение подходов ML|AutoML
  • Ким Сергей
    Руководитель работ по экспресс-аналитике в здравоохранении, Казахстан, Астана
    • Анализ данных/поиск материалов;
    • Предобработка данных
  • Заикин Михаил
    • Анализ данных/поиск материалов;
    • Предобработка данных;
    • Эксперименты с различными архитектурами нейросетей;
    • Применение подходов ML|AutoML
Участники
4 команды проекта
  • Резер Артем
    Тимлид части проекта
    Артем - координация работы команды, постановка задач, контроль качество и сроков их выполнения.
  • Ткачев Виктор
    CTO, биотех, финтех
    • Анализ датасета;
    • Разработка способов и написание скриптов для обогащения данных в датасете;
    • Проведение экспериментов с регрессионными моделями из бибилиотек sklearn, lightgbm, catboost, xgboost;
    • Разработка пайплайна для очистки, предобработки и обогащения датасета разработанными группой функциями с применением класса pipeline.Pipeline библиотеки sklearn;
    • Разработка основного пайплайна проекта для получения оптимальной нормализациии данных предобработанного датасета и регрессионных моделей с оптимальными гиперпараметрами с применением AutoML фреймворков GAMMA и TPOT;
    • Обучение и сериализация полученных с помощью средств AutoML моделей;
    • Подготовка разработанной модели к интеграции в существующее у заказчика web-приложение на базе Django для предсказания оптимальной дозировки Варфарина на основе данных о пациентах.
  • Ильенко Александр
    Занимает инженерные и руководящие должности в электроэнергетике
    • Выполнение продвинутого анализа датасета с исследованием распределения данных, оценке целесообразности использования методов для нормального распределения, применением автоматизированного отбора наиболее релевантных признаков;
    • Разработка способов и написание скриптов для обогащения данных в датасете;
    • Проведение экспериментов с регрессионными моделями из бибилиотек sklearn, lightgbm, catboost, xgboost;
    • Написание скрипта стратификации датасета несколькими способами, в том числе с контролем попадания данных по одному и тому же пациенту в одну выборку. Анализ влияния стратификации на качество обучения регрессоров;
    • Внедрение в проект AutoML фреймворка TPOT, основанного на генетическом алгоритме, проведение экспериментов с TPOTRegressor и получение вариантов пайплайнов с регрессионными моделями с наиболее оптимальными гиперпараметрами и достижением высокой точности регрессора на имеющихся данных MAPE 12.96% (точность 87%);
    • Проведение докладов группе об устройстве и принципах работы AutoML фреймворка TPOT;
    • Активное участие в разработке итогового пайплайна проекта.
  • Совцов Андрей
    Разработчик систем БД. Работал в проектах крупного рекламного холдинга
    • Анализ датасета;
    • Разработка способов и написание скриптов для обогащения данных в датасете;
    • Проведение экспериментов с регрессионными моделями из бибилиотек sklearn, lightgbm, catboost, xgboost;
    • Внедрение в проект AutoML фреймворка GAMMA, проведение экспериментов с применением фреймворка GAMMA и получение вариантов пайплайнов с регрессионными моделями с наиболее оптимальными гиперпараметрами и достижением высокой точности регрессора на имеющихся данных MAPE 13.52% (точность 86,5%);
    • Проведение докладов группе об устройстве и принципах работы AutoML фреймворка GAMMA;
    • Активное участие в разработке итогового пайплайна проекта.
  • Казанцев Александр
    Руководитель CRM департамента Coral Travel
    • Анализ датасета;
    • Разработка способов и написание скриптов для обогащения данных в датасете;
    • Проведение экспериментов с регрессионными моделями из бибилиотек sklearn, lightgbm, catboost, xgboost;
    • Активное участие в разработке итогового пайплайна проекта.
Демонстрация проекта
Благодарность университетУ