Стажировка по проекту
Компания: INSPECTRUM CLINIC
Анализ резюме кандидатов
Суть проекта
Задача
Для чего
Вводные данные
Выходные данные
Разработать прототип системы, реализующей функцию рекомендательной системы для HR-специалиста
Система должна помогать HR- специалисту ускорить процесс принятия решения о годности человека на определенную должность
Данные взяты из заполненных анкет соискателей, претендующих на конкретные должности. Они состоят и качественных и количественных признаков
Достигнута точность классификации в 99% на искусственно сбалансированных данных. Разработана колонка под названием «оценка резюме», дополняющая оригинальные данные процентным распределением вероятностей между классами «подходит» и «не подходит», по мнению обученной модели
Участники
1 команды проекта
  • Рубцов Антон
    Тимлид проекта
    Антон - руководитель группы разработчиков, отвечал за полную разработку проекта
  • Выймов Зорислав
    Бизнес-аналитик В ФГАУ НИИ Восход
    • Анализ данных и подбор алгоритмов решения;
    • Парсинг датасета с помощью Sklearn, Pandas, Regex, Fasttext, Tokenizer, WordNetLemmatizer, RandomOverSampler, Numpy;
    • Подбор гиперпарамтеров при обучении модели DL-архитектуры;
    • Балансировка входных данных для обучения, использование CallBacks и FunctionalAPI;
    • Реализация колонки с процентным распределением вероятностей принадлежности экземпляра к классам;
    • Визуализация результатов обучения с помощью Matplotlib
  • Кипаренко Николай
    Начальник отдела автоматизации информационных систем в Энергосбытовой компании
    • Анализ данных и подбор алгоритмов решения;
    • Подготовка данных с помощью Pandas, Numpy, H2O;
    • Использование фреймворка H2OAutoML для решения задачи;
    • Реализация колонки с процентным распределением вероятностей принадлежности экземпляра к классам;
    • Визуализация результатов обучения с помощью Matplotlib
  • Ватолин Иван
    • Анализ данных и подбор алгоритмов решения;
    • Подготовка данных. Sklearn, Pandas, Regex, Difflib, Numpy;
    • Подбор гиперпараметров для Deep Learning модели нейросети;
    • Визуализация результатов обучения с помощью Matplotlib
  • Новиков Иван
    • Анализ данных и подбор алгоритмов решения;
    • Подготовка данных. Sklearn, Pandas, Regex, Numpy;
    • Подбор гиперпараметров для Deep Learning модели нейросети;
    • Визуализация результатов обучения с помощью Matplotlib
Участники
2 команды проекта
  • Соколова Елена
    Разработчик в крупной outsource компании, занимается системной интеграцией приложений
    • Анализ и подготовка данных Pandas, Regex, Numpy, Sklearn/FeatureHasher;
    • Токенизация текстовых данных gensim/Word2Vec, Natural Language Toolkit;
    • Подбор гиперпараметров DL-модели;
    • Использование фреймворка AutoKeras для решения задачи;
    • Реализация колонки с процентным распределением вероятностей принадлежности экземпляра к классам;
    • Визуализация результатов обучения с помощью Matplotlib, Seaborn, ConfusionMatrix
  • Кулиниченко Александр
    Начальник отдела программного обеспечения в компании по кадастровым работам и геодезии
    • Анализ данных и подбор алгоритмов решения;
    • Подготовка данных. Sklearn, Pandas, Regex, Functools, Numpy, Fasttext;
    • Фреймворк AutoKeras для решения задачи, подбор гиперпараметров;
    • Реализация колонок с процентным распределением вероятностей принадлежности экземпляра к классам;
    • Визуализация результатов обучения с помощью Matplotlib, Seaborn, ConfusionMatrix
  • Мартыненко Анна
    Ведущий специалист по работе с клиентами в сфере пенсионного и социального обеспечения
    • Чтение и редактирование кода Python;
    • Анализ данных и подбор алгоритмов решения;
    • Подготовка данных. Sklearn, Pandas, Regex, Numpy;
    • Подбор гиперпараметров DL-модели;
    • Визуализация результатов обучения с помощью Matplotlib
  • Абдрахманова Гузель
    Специалист по чат ботам и автоматизации бизнеса
    • Анализ и подготовка данных Chardet, Sklearn, Pandas, Regex, Numpy;
    • Обработка текстовых данных Tokenizer;
    • Подбор метрик и гиперпараметров для Deep Learning модели нейросети;
    • Реализация колонки с процентным распределением вероятностей принадлежности экземпляра к классам;
    • Визуализация результатов обучения с помощью Matplotlib, Seaborn, ConfusionMatrix
Демонстрация
проекта