Стажировка по проекту
Ии-система для подбора состава полимерного композиционного материала
Компания: ООО «ТатхимПласт»



Суть проекта
Задача
Для чего
Вводные данные
Подбор компонентов и их процентного содержания для получения полимера с заданными свойствами. Необходимо создать приложение для специалистов где они вводят требуемые итоговые характеристики ПКМ для конкретной задачи и на выходе получают несколько наиболее подходящих вариантов состава

На данный момент подбор соотношения компонентов и состава осуществляется специалистами вручную на основе требований заказчика к конечным характеристикам продукта и их опыта и экспериментов. Подбор компонентов вышеуказанным образом занимает много времени (от 2 мес. до полугода). Целью внедрения ИИ в процесс подбора компонентов является сокращение времени разработки ПКМ
Заказчик проекта предоставил 175 составов с соответствующими им характеристиками
Качественный и количественный состав ПКМ соответствующий искомым характеристикам
Внедренное решение позволяет сократить сроки разработки ПКМ от 20%. С дальнейшим развитием продукта прогнозируемое сокращение сроков до 50%

Выходные данные
Участники
1 команды проекта
  • Ерошина Елена
    Тимлид проекта
    Елена - руководитель группы разработчиков, отвечала за полную разработку проекта
  • Каргальцев Владислав
    Помощник тимлида
    • Ведение документации и отчетности по проекту
    • Контроль за заполнением отчетности стажерами
    • Замена тимлида на встречах при необходимости
  • Зайнеев фарид
    Технический директор
    • Обучение и тестирование модели на AutoML для прогнозирования состава ПКМ
    • Подготовка модели и скейлеров к интеграции
    • Корректировка методики формирования и аугментации датасета, позволившая кратно увеличить качество прогнозирования
    • Разработка web-инструмента работы с прогнозами моделей (Витрины)
    • Упаковка витрины в докер контейнере для развертывания в ИТ-инфраструктуре Заказчика
  • пицуков михаил
    менеджер группы танкеров, выполняющих круглогодичные перевозки топлива в Арктике
    • Исследовании возможности применения трансформеров для решения задач проекта
    • Тестирование использования готовых открытых фреймворков и решений таких как GT4SD, Reaction T5 и др
    • Создание кастомных моделей, основанных на базовом классе трансформера библиотеки torch и адаптированных к задачам регрессии
    • Валидация полученных моделей и визуализация результатов
    • Файн-тюнинг лучшей трансформерной модели и доведение ее до высокой точности предсказания состава ПКМ
    • Подготовка модели и скейлеров к интеграции
  • Карпов Сергей
    Программист C#, Python. Документовод, разработчик офисной автоматизации
    • Первоначальная систематизация данных: обработаны и проанализированы 16 источников информации
    • Создание структурированной базы по проблематике для дальнейшей аналитики и разработки модели
    • Валидация 14 моделей регрессии из библиотеки Scikit-Learn, включая LinearRegression, Ridge, Lasso и RandomForestRegressor
    • Подбор модели на основе библиотеки Keras/AutoML
    • Разработка решения с интегрированной функцией вероятностной оценки присутствия вещества и количественного анализа
    • Оптимизация двухфакторного решения до получения детализированных и достоверных результатов с высокой точностью
    • Подготовка модели и скейлеров к интеграции
    • Аналитика результатов и их визуализация, включающие создание графиков и таблиц, наглядно демонстрирующих работу модели и точность предсказаний
  • Ткаченко Дмитрий
    Менеджер инженерно-технологического отдела в компании РУСАЛ-ИТЦ
    • Тестирование моделей классического ML для решения задачи
    • Создание алгоритма и функции на VBA для генерации и аугментации датасетов, соответствующих правилам исходных данных в формате Excel, а также алгоритма объединения всех блоков исходных данных, полученных от заказчика
    • Внедрение разработанных алгоритмов для создания датасета с заданными процентными разбросами значений: оптимизация алгоритмов для очистки и итоговой подготовки данных на Python в формате CSV
    • Проведение валидации моделей, включая гибридные архитектуры KAN и трансформеры
    • Проведение многоуровневых тестов сгенерированных датасетов, итоговый результат показал высокую точность при использовании датасетов с 3%-м разбросом значений, что подтвердилось тестами других участников
  • Миролюбова Анастасия
    Преподаватель в области экономики и менеджмента, д. э. н.
    • Поиск статей в области применения ИИ для подбора состава полимерного композиционного материала (ПКМ) на платформах: github.com, habr.com, cyberleninka.ru и др
    • Поиск датасетов для предтрейнинга на платформе Kaggle
    • Анализ найденных датасетов в разрезе формата и характеристик данных
    • Визуализация данных по датасету заказчика: построение корреляционных матриц взаимосвязей между компонентами ПКМ и их характеристиками по датасету заказчика и аугментированному датасету
    • Аналитика и оформление полученных выводов о взаимосвязи составляющих ПКМ и его характеристик в разрезе четырех групп компонентов
    • Тестирование библиотеки AutoML на предсказании отдельных групп компонентов. Результаты внесли вклад в формирование стратегии развития продукта
  • Спащенко артем
    технический директор в компании ооо «Нефтехимремонт»
    • Создание и обучение гибридной модели KAN + Transformer для прогнозирования свойств материалов, построение классификатора для анализа данных, ансамблирование моделей для улучшения точности предсказаний
    • Тонкая настройка гибридной модели
    • Оценка производительности гибридной модели (проводилась по метрикам MSE и Accuracy) достигнута высокая точность и стабильность работы
    • Оптимизация гибридной модели с помощью поиска лучших гиперпараметров с использованием Keras Tuner
    • Подготовка модели и скейлеров к интеграции
  • Шабалин Николай
    Senior Data analyst, BI developer
    • Аугментация датасета заказчика для каждого компонента
    • Тестирование моделей классического ML и нейросетевых моделей с ассамблированием моделей предсказывающих каждый отдельный компонент
    • Валидация моделей как по предсказанию характеристик, так и составов в обе стороны
    • Оценка полученных метрик качества предикта, результат экспериментов внес вклад в направление развития итогового решения
    • Тестирование гибридных моделей на логистическую регрессию + регрессию, для задачи ликвидации предсказания тех элементов, где их массовая доля равна нулю
  • Туз Любовь
    Преподаватель программирования для детей
    • Поиск схожих датасетов из открытых источников для предобучения моделей
    • Исследование и предобработка данных
    • Создание кастомных моделей с различной архитектурой для решения задачи
    • Настройка гиперпараметров моделей с использованием генетических алгоритмов
    • Эксперименты с различными вариантами структуры выходных данных
    • Оценка зависимости точности предсказания модели от количества предсказанных параметров
  • Сулоев Алексей
    Программист-инженер нейронных сетей
    • Тестирование моделей классического ML
    • Тестирование и тонкая настройка ElasticNet, autokeras
    • Проведение ряда экспериментов для определения возможности применения модели ElasticNet для решения задач проекта
    • Полученный результат внес весомый вклад в направление развития проекта