Стажировка по проекту
Компания: ООО Финтех солюшнс https://navigator.sk.ru/orn/1124110
Скоринг клиентов
оценка платежеспособности и приоритета клиентов
Суть проекта
Задача
Для чего
Вводные данные
Выходные данные
Разработать AI-решение, которое будет классифицировать клиентов на основе их кредитной истории для выявления надежности заемщиков и предоставления советов по улучшению кредитной истории неблагонадежным заемщикам
Данная система будет являться помощником БКИ и банков при принятии решения о выдаче кредитов добросовестным заемщикам и отказе недобросовестным, за счет чего процент возвращенных вовремя кредитов увеличится
Для разработки системы использовались csv таблицы с миллионами записей по каждой категории клиентов (всего 4), которые включали в себя демографические данные о клиенте, его id в системе БКИ, а также его кредитную историю
На выходе получаем систему способную с 99% точностью классифицировать клиентов на основе всех данных (фичей)
Участники
1 команды проекта
Данная команда занималась полным анализом имеющейся базы данных, созданием модуля предобработки данных, а также экспериментами с различными подходами для получения желаемого результата детекции
  • Колбенев Василий
    Тимлид проекта
    Василий - руководитель группы разработчиков, отвечал за полную разработку проекта
  • Одегов Дмитрий
    • Анализ данных/поиск материалов;
    • Обработка данных;
    • Разработка и обучение модели с помощью AutoML;
    • Интеграция итогового решения на сервер заказчика;
    • Frontend-разработка с помощью bootstrap
  • Шульцев Дмитрий
    Коммерческий директор в ООО инсерв
    • Анализ данных/поиск материалов и подходов к решению данной задачи;
    • Обработка данных;
    • Разработка и обучение модели с помощью AutoML;
    • Интеграция итогового решения на сервер заказчика;
    • Frontend-разработка
  • Мазурин Евгений
    системный аналитик / Занимается системным анализом в области ДБО (дистанционное банковское обслуживание)
    • Анализ данных/поиск материалов;
    • Предобработка данных;
    • Эксперименты с различными архитектурами нейросетей
  • Лапова Юлия
    Специалист финансового отдела в крупной строительной компании
    • Анализ данных/поиск материалов;
    • Предобработка данных;
    • Эксперименты с различными архитектурами нейросетей;
    • Применение подходов AutoML
  • Бугаев Виталий
    директор обособленного подразделения в городе Санкт-Петербург, компания «Дизайнмастер»
    • Анализ данных/поиск материалов;
    • Предобработка данных;
    • Эксперименты с различными архитектурами нейросетей;
    • Применение подходов AutoML
  • Цыденов Майдари
    системный аналитик кхд (АО Согаз)
    • Анализ данных/поиск материалов;
    • Предобработка данных;
    • Эксперименты с различными архитектурами нейросетей
  • Макаров Александр
    • Анализ данных/поиск материалов;
    • Предобработка данных;
    • Эксперименты с различными архитектурами нейросетей
  • Ельцов Михаил
    • Анализ данных/поиск материалов и подходов к решению данной задачи
Участники
2 команды проекта
Данная команда занималась полным анализом имеющейся базы данных, созданием модуля предобработки данных, а также экспериментами с различными подходами для получения желаемого результата детекции
  • Титов Михаил
    Тимлид проекта
    Михаил - руководитель группы разработчиков, отвечал за полную разработку проекта
  • Волков Кирилл
    Инженер-программист/Разработка программ обработки телеметрии и объективного контроля
    • Анализ данных по кредитам и задолженностям по городам, профессиям и id_клиента, а также составление общей картины каждого пользователя;
    • Построение корреляционной таблицы с плохими и хорошими клиентами, сравнение параметров, влияющих на кредитную историю, добавление метки кредитной истории, преобразование данных в числовой вид и объединение данных в одну таблицу;
    • Перевод данных в числовой вид и нормировка, создание серии нейронных сетей и проведение экспериментов по выявлению лучшей архитектуры;
    • Подготовка базы для ввода в модель с разделением на валидационную и тренировочную выборки, проведение серии экспериментов с использованием AutoKeras;
    • Создание единой базы с исправленным столбцом даты рождения в новых данных, балансировка данных и подготовка данных для вывода в модель, решение проблемы с запуском AutoKeras;
    • Проведение 50 вариантов архитектур с помощью AutoKeras, получение наилучшего результата 0.84% на валидационной выборке, анализ причин низкой точности 9% на тестовой выборке;
    • Объединение 1 и 2 класса (хорошие клиенты) и 3 и 4 класса (плохие клиенты), перебалансировка базы и отправка в AutoKeras на 20 моделей, получение точности 29% на тестовой выборке
  • Свириденко Дмитрий
    Инженер-программист (старший разработчик), индивидуальный предприниматель в сфере ИТ (c#, asp.net, javascript/nodejs, sql, html+css, cryptocoins)
    • Произведение первичного анализа исходных данных и подготовка ноутбука для дальнейшей работы над задачей. Изучение данных с помощью библиотеки Pandas, построение графиков с помощью библиотеки Matplotlib и проверка гипотез с помощью библиотеки SciPy;
    • Проверка пустых значений, исключение бесполезных столбцов, объединение датасетов и формирование дополнительного датасета, сгруппированного по клиентам;
    • Использование AutoKeras для автоматического построения модели машинного обучения. Оценка качества модели с помощью метрик, таких как точность, полнота и F1-мера;
    • Улучшение модели до желаемых 90% точности;
    • Разработка методики обработки огромного датасета;
    • Увеличение максимальной точности модели до 99% по смешанной базе
  • Якушева Анна
    Арт-менеджер, маркетолог
    • Анализ данных, поиск зависимостей, вывод тепловых матриц по списку пунктов. Построение тепловых матриц для отображения корреляции между разными переменными;
    • Объединение данных из разных источников в одну таблицу. Шифрофка личных данных клиентов для обеспечения конфиденциальности;
    • Сбор модели и улучшение точности на распознавание 4 классов;
    • Использование фреймворка Terra для построения модели машинного обучения, которая предсказывала кредитную историю клиента по его параметрам. Проведение экспериментов с разными параметрами модели, такими как коэффициент регуляризации, скорость обучения и количество итераций
  • Новикова Элина
    специалист по закупкам ООО НПФ Винар
    • Анализ данных, попытка выявления зависимостей между данными и целевой переменной, предочистка данных. Изучение данных с помощью библиотеки Pandas, поиск корреляции, выбросы и пропуски
    • Аугментация, с добавлением баз к модели;
    • Эксперименты с разными вариантами моделей с помощью AutoKeras;
    • Обучение модели, проведение экспериментов
  • Тагаев Александр
    Руководитель проекта / Директор департамента / Генеральный директор в Инвестиционной компании.
    • Проведение стандартных процедур анализа с помощью Pandas - библиотеки для работы с данными на Python;
    • Объединение баз с последующим анализом некоторых зависимостей и построением тепловой матрицы;
    • Создание и работа над построением модели с использованием AvtoKeras;
    • Проведение экспериментов с базой над улучшением точности модели
Демонстрация проекта
1 команды
Благодарность университетУ