Стажировка по проекту
Компания: ООО «Технопром»
Создание программного обеспечения на основе искусственного интеллекта для классификации спецификаций на продукцию кабеленесущей системы «OSTEC»
Суть проекта
Задача
Для чего
Вводные данные
Выходные данные
Результат
  • Автоматизация сбора и предобработки спецификаций заказчика, их приведения к единому формату.
  • Поиск (маппинг) однозначных аналогов из ассортимента компании для позиций, указанных в исходной спецификации.
  • Выгрузка спецификаций на базе номенклатуры компании в учетные системы и в стандартные форматы документов (excel, pdf).
Приложение для сбора данных из файлов со спецификациями сторонних производителей (Excel, PDF), подбора аналогов продукции «Технопром» и формирование единой таблицы с номенклатурой «Технопром» и ценами. Проект автоматизирует обработку спецификаций заказчика, преобразуя их в коммерческое предложение с номенклатурой «Технопром».
Сокращение трудозатрат сотрудников на подготовку коммерческих предложений.

  • каталог «Ostec» 2025г.,
  • полный перечень изделий, содержащий информацию о наименовании, типе и коде изделий, с характеристиками в виде файла «Номенклатура OSTEC»;
  • таблица соответствия базы данных продукции Остек к продукции конкурентов (IEK, ДКС, OBO);
Веб приложение принимающее на вход загрузку спецификаций конкурентов в форматах PDF,  xlsx и отдающее на выходе таблицу сопоставления продукции конкурентов позициям OSTEC. В приложении представлены две роли:
  • Администратор, который может добавлять пользователей и управлять ими
  • Пользователь, которому доступно только обработка спецификаций и получение результата.
Форма таблицы в excel, в которой должен быть представлен результат сопоставления продукции конкурентов позициям OSTEC.
Участники команды проекта
  • Елена Ерошина
    Тимлид проекта
    ЕЛЕНА - руководитель группы разработчиков, отвечала за полную разработку проекта
  • Елена Михно
    ПОмощник тимлида и Управление задачами команды
    • Организация коммуникации между подгруппами и контроль информационного потока;
    • Поддержка коммуникации между участниками проекта
    • Координация подготовки итоговых данных проекта.
  • Михаил Кудряшов
    ПОмощник тимлида

    • Управление проектной документацией и ведение организационных таблиц.
    • Подготовка еженедельной отчётности по встречам и прогрессу команды.
  • Мазетова Оксана Валентиновна
    руководитель подразделения
    Принимала участие в следующих направлениях проекта:
    • Анализ технических материалов заказчика и формирование базы для сборки комплектов к изделиям
    • Разработка модуля составления комплектов к изделиям
    • Рефакторинг и документирование кода
  • Козлов Алексей Сергеевич
    Руководитель отдела регионального выпуска СПС «Консультант Плюс»
    Принимал участие в следующих направлениях проекта:
    • Разработка end-to-end решения для семантического поиска товаров, включающего имплементацию LLM-компонентов.
    • Разработка модуля многофакторной фильтрации для уточнения результат.
    • Исследование и сравнительный анализ производительности различных LLM (DeepSeek, QWEN, Mixtral, Gemini) для выбора оптимальной модели под бизнес-задачу.
    • Оптимизация командного кода, включающая полный рефакторинг, внедрение асинхронности, создание архитектуры для мульти модельной системы (с использованием абстрактных классов), повышающей гибкость и производительность решения.
    • Визуализация полной архитектуры проекта и потоков данных, в виде детальной схемы рабочего процесса для улучшения понимания системы всей командой и заказчиком.
  • Гуща Наталья Васильевна
    к.э.н., Мировая экономика
    Принимала участие в следующих направлениях проекта:
    • Поиск и анализ возможных готовых подходов и решений
    • Разработка модуля составления комплектов к изделиям
    • Разработка блока по извлечению соответствующих метизов для лотков
    • Рефакторинг и документирование кода.
  • Нора Сердюкова
    Доцент кафедры статистики
    Принимала участие в следующих направлениях проекта:
    • Анализ и подбор моделей NER
    • Подготовка датасета для обучения моделей.
  • Шукейр Абдалла
    инженер программист
    Принимал участие в следующих направлениях проекта:
    • Разработка модуля регистрации пользователей с ролевой системой доступа и административной панелью управления учетными записями.
    • Доработка модуля обработки файлов конкурентов, включающая интеграцию с AI-сервисами и оптимизацию алгоритмов парсинга данных.
    • Создание интерактивного PDF-просмотрщика с функциями поворота, навигации и выбора страниц для обработки в веб-интерфейсе.
    • Расширение аналитических возможностей Mapper - разработка модулей "Сравнение с конкурентами" и "Статистика" для визуализации результатов AI-маппинга.
    • Развитие системных настроек Price-Extractor - модуль прямого импорта готовых прайс-листов в БД OSTEC с функциями управления данными.
    • Создание системы экспорта результатов в форматах TXT и CSV с детализированными отчетами AI-маппинга.
    • Архитектура и интеграция пользовательского интерфейса - создание единого Gradio-интерфейса, объединяющего все модули команды в комплексную систему.
  • Мазетов Олег Юрьевич
    Начальник отдела эксплуатации мультимедийных средств
    Принимал участие в следующих направлениях проекта:
    • Создание базы знаний заказчика, преобразовании данных из разных источников,
    • Создание векторных баз
    • Разработка и тестирование гипотез применения LLM и написание запросов к ней,
    • Развертывание облачных и локальных интерфейсных решений реализаций.
  • Умеров Рушан Харисович
    CIO
    Принимал участие в следующих направлениях проекта:
    • Руководство подгруппой по подготовке датасета.
    • Организация коммуникаций с заказчиком.
    • Ведение документооборота с заказчиком: получение исходных материалов и информации, уточнение вопросов команды, сбор и актуализация документов и примеров.
    • Сбор и структурирование каталога заказчика.
    • Консультирование команды по документам заказчика.
    • Участие в обсуждении альтернативного решения (совместно с Олегом Мазетовым), помощь в оценке вариантов, разборе данных, выработке решений.
  • Аббад Ирина Валерьевна
    Экономист
    Принимала участие в следующих направлениях проекта:
    • Обработка и объединение разрозненных данных заказчика в единый датасет и базу данных
    • Первичная обработка файлов с использованием GPT-web (автоматизация обработки части файлов) и ручная обработка в Excel.
    • Объединение старой и новой базы OSTEC
    • Аналитика и систематизация позиций.
    • Перенос конкурентного маппинга через сопоставление старых и новых товарных позиций заказчика.
  • Гаврикова Ирина Юрьевна
    Доцент МФТИ
    Принимала участие в следующих направлениях проекта:
    • Участие в следующих направлениях разработки проекта:
    • Разработка алгоритма поиска позиций по базе заказчика с использованием LLM (DeepSeek);
    • Тестирование и оптимизация модуля поиска позиций по имеющейся базе на базе LLM (DeepSeek).
  • Голдобина Влада
    SQA
    Принимала участие в следующих направлениях проекта:
    • Подбор архитектуры  NER, составление таблицы для понятия сущностей на основании анализа каталога и сравнительной таблицы
    • Сбор и разметка датасета для обучения моделей
    • Разработка модуля авторазметки
    • Тестирование и корректировка методики подбора параметров авто разметки
    • Анализ списка типов изделий, подбор параметров изделий для извлечения сущностей. На основании этого списка формирование словарь типов изделий
    • Проверка и тестирование его на "уникальных" значениях в таблице  и откорректировала его в процессе разметки  
    • Разработка модуля по выявлению сущности артикула из любых данных
    • Проведение серии экспериментов по обучению и тестированию модели на артикулах как заказчика, так и сторонних данных
    • Подготовка итогового pipeline с наилучшей моделью для интеграции в общий проект.
  • Даньшова Анна Анатольевна
    специалист тендерного отдела
    Принимала участие в следующих направлениях проекта:
    • Разработка модуля предобработки входящих документов
    • Разработка подсистемы обработки «проблемных» PDF сформированных в профильнм програмном обеспечении - сканами через конвертацию в изображения (PNG) и дальнейшее распознавание.
    • Разработка модуля по извлечению сущностей с помощью LLM: наименование изделия, характеристики, марка/тип, код, единица измерения, количество.
  • Егоров Александр Николаевич
    Ведущий инженер-программист
    Принимал участие в следующих направлениях проекта:
    • Тестирование LLM и отбор наиболее подходящей модели для проекта
    • Тестирование технологии автоматического формирования LLM-промптов для Yandex GPT для извлечения сущностей из текстовых данных
    • Разработка LLM-промптов для Gemini-2.5-flash
    • Разработка решения для оценки возможного совпадения строк артикулов-заявок с артикулами в БД.
    • Разработка применения sentence_transformers, FAISS, fuzzywuzzy, rapidfuzz
    • Разработка класса локальной предварительной обработки наименования артикула, который позволил отказаться от затрат на использование LLM для значимого количества артикулов-заявок
    • Разработка пайплайна проекта
    • Рефакторинг кода проекта перед передачей проекта заказчику.
  • Лесков Евгений Васильевич
    IT- директор
    Принимал участие в следующих направлениях проекта:
    • Разработка системы предобработки документов, состоящей из блоков:
    a) конвертации кириллического текста из нестандартных кодировок
    b) очистки таблиц от пустых строк и столбцов, а также от неинформационных строк
    c) оценки качества обработки таблицы
    d) распознавания текста с помощью LLM
    e) выделения сущностей из данных таблицы
    f) формирования json на основе информации таблицы.
  • Семенова Диана Владимировна
    Начальник коммерческого отдела
    Принимала участие в следующих направлениях проекта:
    • Анализ подходов и инструментов для реализации поставленной задачи (RoBERTa, SpaCy, DeepPavlov, RuBERT)
    • Исследование возможностей различных инструментов разметки данных (Label Studio, CVAT), выявлении ограничений каждого из них применительно к задачам проекта
    • Разработка методов подготовки набора данных для реализации подхода к выявлению сущностей на основе NER
    • Подготовка набора данных для дообучения модели Spacy
    • Дообучение русскоязычной модели Spacy на подготовленном датасете с последующей проверкой эффективности путем сравнения результатов до и после дообучения
    • Тестирование и оценка результатов работы модели по выявлению сущностей на основе NER.
  • Степановский Дмитрий Владимирович
    директор ОАО "Минсктелекомстрой"
    Принимал участие в следующих направлениях проекта:
    • Разработка интеллектуальной системы для автоматического анализа и сопоставления номенклатуры ОСТЕК со сторонними производителями на базе LLM Gemini 2.5 flash
    • Коллегиальное создание концепции и принципов работы всей модели.
    • Разработка базового модуля извлечения данных из прайс-листов заказчика и формирования базы данных товаров ОСТЕК в json-формате.
    • Унификация общего словаря типов изделий. Оптимизация данных, используемых в работе модели.
    • Разработка и “тонкая” настройка 3-х каскадной AI-модели для сопоставления товаров (маппера)
    • Тестирование работы модели, поиск ее уязвимых мест и их устранение.
    • Оптимизация кода.
    • Интеграция модуля каскадной LLM-модели  с модулями коллег: фильтрация БД, поиск товара по артикулу, подбор комплектации.
    • Создание и демонстрация заказчику полнофункционального MVP.
    • Подготовка технической документации по проекту и данных для презентации.


  • Хамидуллина Елена Игоревна
    инженер АСУ ТП

    Принимала участие в следующих направлениях проекта:
    • Разработка системы автоматического извлечения артикулов из текстовых описаний товаров с использованием технологии NER (Named Entity Recognition) на основе библиотеки spaCy.
    • Подготовка датасета, проведение аннотации текстов
    • Обучение кастомной модели распознавания сущностей на размеченных данных, где артикулы выступали в роли целевых сущностей.
    • Тестирование и оценка качества модели по метрикам точности, полноты и F1-меры.
    • Интеграция обученной модели в пайплайн обработки JSON-файлов.