Стажировка по проекту
Компания: INSPECTRUM CLINIC
Рекомендательная система для профпатолога
Суть проекта
Задача
Для чего
Вводные данные
Выходные данные
Разработать прототип системы, реализующей функцию рекомендательной системы для врача профпатолога
Сократить время, требуемое врачу-профпатологу для принятия решения о пригодности конкретного лица для определенной должности, либо о необходимости созыва врачей специалистов для проведения коллегиального совещания по пациенту
Архивные данные медицинского осмотра с записями от различных специалистов для людей, претендующих на разнообразные производственные роли. Данные содержат качественные и количественные характеристики, полученные в результате медкомиссии
1 команда: точность определения класса достигает 98%, на расширенных данных, взятых из нормативного документа 29Н.
2 команда: точность классификации достигает 98% на синтетически сбалансированных данных.
3 команда: достигнута точность классификации в 98% на искусственно сбалансированных данных.

Всеми командами реализованы текстовые рекомендации для врача, ориентирующие его в вынесении финального решения
Участники
1 команды проекта
  • Рубцов Антон
    Тимлид проекта
    Антон - руководитель группы разработчиков, отвечал за полную разработку проекта
  • Земляков Сергей
    Менеджер по продажам в Группе компаний Техполимер
    • Использование методов Numpy, Pandas, Regex, Keras.Tokenizer для подготовки данных;
    • Балансировка классов: срез из общего dataframe, генерация данных на основании нормативного документа «Приказ 29н»;
    • Использование фреймворка AutoKeras для решения задачи;
    • Реализация алгоритма текстовых рекомендаций врачу профпатологу, дополняющее решение от нейронной сети;
    • Визуализация результатов обучения. Использование Matplotlib, Confusion Matrix
  • Дунаев Артем
    Врач-терапевт/врач-эксперт
    • Анализ задачи и подготовка данных. Sklearn, Numpy, Pandas, Regex;
    • Использование Tokenizer, Embedding и LSTM в парсинге текстовых данных;
    • Балансировка классов: срез из общего dataframe, генерация данных на основании нормативного документа «Приказ 29н»;
    • Подбор гиперпараметров и использование Callbacks при обучении нейросети;
    • Реализация алгоритма текстовых рекомендаций врачу профпатологу, дополняющее решение от нейронной сети;
    • Визуализация результатов обучения. Использование Matplotlib, Confusion Matrix
  • Некрасова Татьяна
    Разработчик - куратор в Университете Искуственного Интеллекта
    • Анализ и подготовка данных. Использование методов Numpy, Pandas, Regex, Word2Vec;
    • Эксперименты с кластеризацией для решения задачи: K-Means, Agglomerative Clustering и DBSCAN;
    • Балансировка классов. Scikit-learn upsampling, downsampling;
    • Использование фреймворков AutoKeras, TerraAI;
    • Визуализация результатов обучения. Использование Matplotlib, Confusion Matrix
  • Сусарев Андрей
    ведущий эксперт в Управлении автодорог Республики Карелия
    • Анализ и исследование корреляций данных, подбор алгоритмов решения;
    • Подготовка данных с помощью Sklearn, Numpy, Pandas, Regex;
    • Нормализация данных MinMaxScaler;
    • Использование алгоритмов ML - GradientBoostingRegressor, RandomForestRegressor, XGBRegressor для решения задачи;
    • Использование фреймворка AutoKeras для решения задачи;
    • Визуализация результатов обучения с помощью Matplotlib.
  • Черный Ариэл
    Аналитикв банке Юникредит
    • Анализ данных и подбор алгоритмов решения;
    • Подготовка данных с помощью Sklearn, Numpy, Pandas, Regex;
    • Алгоритмы ML(XGBClassifier, LGBMClassifier) для решения задачи;
    • Подбор архитектуры для DL решения, работа с метриками F1Score;
    • Визуализация и анализ результатов обучения
  • Химяк Павел
    Программист и преподаватель йоги
    • Анализ и обработка данных. Numpy, Pandas, Regex, Tokenizer;
    • Подготовка данных с помощью самописных классов и функций Python;
    • Подбор архитектуры для DL решения, работа с Callback и метриками F1Score;
    • Использование фреймворка AutoKeras для решения задачи;
    • Анализ корреляций данных и их визуальное представление, визуализация оценки ошибки на выборках Matplotlib
  • Мороз Алеся
    Упрaвление проектами (Руководитель проекта)
    • Анализ данных и подбор алгоритмов решения;
    • Обработка данных с помощью Sklearn, Numpy, Pandas, Regex, Tokenizer;
    • Подбор DL-архитектуры, работа с Callback и метриками F1Score;
    • Визуализация результатов обучения с помощью Matplotlib, Seaborn, ConfusionMatrix;
    • Реализация раздела текстовых рекомендаций для профпатолога
Участники
2 команды проекта
  • Козлов Алексей
    инженер-программист в ООО «ТАиП» (Технологии Автоматизации и Программирования - taip.su)
    • Анализ и обработка табличных данных Sklearn, Pandas;
    • Подготовка данных с помощью Numpy, Regex, Tokenizer, Bag Of Words;
    • Балансировка классов методами downsampling и oversampling;
    • Подбор DL-архитектуры, визуализация обучения с помощью Matplotlib;
    • Создание алгоритма текстового представления по пациенту на основе нормативного документа
  • Косенков Александр
    Студент в КамчатГТУ
    • Анализ данных и подбор алгоритмов решения;
    • Обработка данных с помощью Sklearn, Numpy, Pandas;
    • Подбор гиперпараметров Deep Learnig модели нейросети;
    • Визуализация результатов обучения с помощью Matplotlib
  • Гриднев Андрей
    Гейм-дизайнер
    • Анализ данных и подбор алгоритмов решения;
    • Обработка данных с помощью Sklearn, Numpy, Pandas;
    • Подбор гиперпараметров Deep Learnig модели нейросети;
    • Визуализация результатов обучения с помощью Matplotlib
  • Гаврилков Николай
    • Анализ данных и подбор алгоритмов решения;
    • Обработка данных с помощью Numpy, Pandas, Regex, Tokenizer, Bag Of Words;
    • Балансировка классов методами downsampling и oversampling;
    • Подбор DL-архитектуры, работа с Callback и метриками F1Score;
    • Визуализация результатов обучения с помощью Matplotlib, Seaborn, ConfusionMatrix;
    • Реализация раздела текстовых рекомендаций для профпатолога
  • Марфида Александр
    • Анализ, обработка и очистка табличных данных;
    • Обработка данных с помощью Sklearn, Numpy, Pandas, Tokenizer, BoW;
    • Подбор гиперпараметров DL-архитектуры, использование Callback при обучении модели;
    • Визуализация результатов обучения с помощью Matplotlib
  • Алешин Денис
    • Чтение и редактирование кода Python;
    • Обработка данных с помощью Numpy, Pandas, Regex, Tokenizer;
    • Подбор гиперпараметров Deep Learnig модели нейросети;
    • Реализация раздела текстовых рекомендаций для профпатолога;
    • Визуализация результатов обучения с помощью Matplotlib
Участники
3 команды проекта
  • Борисов Василий
    Руководитель проектов внедрения корпоративных систем 1с
    • Анализ данных и подбор алгоритмов решения
    • Обработка и подготовка данных Sklearn, Pandas, Numpy;
    • Токенизация текстовых данных Fasttext;
    • Использование архитектуры FunctionalAPI и Callback при обучении DL-модели нейросети;
    • Визуализация результатов обучения с помощью Matplotlib, Seaborn, ConfusionMatrix
  • Костин Сергей
    Студент МГТУ им. Н.Э. Баумана
    • Статистический анализ данных и подбор алгоритмов решения;
    • Параметризация и очистка данных. Sklearn, Pandas, Datetime, Numpy;
    • Подбор гиперпараметров Deep Learnig модели нейросети;
    • Визуализация результатов обучения с помощью Matplotlib, Seaborn, ConfusionMatrix
  • Федосеев Сергей
    Преподаватель в учебном центре ОАО «РЖД»/Тренер по бразильскому джиу-джитсу
    • Анализ данных и подбор алгоритмов решения;
    • Обработка и подготовка данных Sklearn, Pandas, Regex, Tokenizer, Numpy;
    • Использование архитектуры FunctionalAPI при обучении DL-модели нейросети;
    • Визуализация результатов обучения с помощью Matplotlib;
    • Обучение модели, на основе архитектуры, предложенной ChatGPT
  • Сидоров Александр
    • Загрузка и анализ данных. Gdrive, ZipFile, Pandas;
    • Подготовка данных. Sklearn, Pandas, Regex, Tokenizer, Numpy;
    • Подбор гиперпараметров Deep Learnig модели нейросети;
    • Использование архитектуры FunctionalAPI;
    • Визуализация результатов обучения с помощью Matplotlib, Seaborn, ConfusionMatrix
  • Таранов Анатолий
    • Анализ данных и подбор алгоритмов решения;
    • Подготовка данных. Sklearn, Pandas, Regex, Tokenizer, Numpy;
    • Подбор гиперпараметров Deep Learnig модели нейросети;
    • Визуализация результатов обучения с помощью Matplotlib, Seaborn, ConfusionMatrix
  • Ромашенков Леонид
    • Анализ данных и подбор алгоритмов решения;
    • Обработка и подготовка данных Sklearn, Pandas, Tokenizer, Numpy;
    • Подбор гиперпараметров Deep Learnig модели нейросети, FunctionalAPI архитектура;
    • Визуализация результатов обучения с помощью Matplotlib, Seaborn, ConfusionMatrix
Демонстрация проекта