Стажировка
Создание нейро-помощника для консультаций по нормативно-правовым документам по
неразрушающему контролю с сайта diagnostpb.ru
Компания: ООО «ВДГБ:ИТС»
Суть проекта
Для чего
Вводные данные
Автоматизировать ответы на профессиональные вопросы по нормативной базе, повысить точность и оперативность консультаций, сократить нагрузку на экспертов и инспекторов
Разработать интеллектуального ассистента, способного консультировать специалистов по нормативной документации в области строительного контроля (СК) и неразрушающего контроля (НК) с использованием векторного поиска, RAG-архитектуры и LLM
  • Telegram-бот с голосовым и текстовым вводом
  • Веб-бот
  • Гибридная RAG-система (BM25 + FAISS + GPT-4o-mini)
  • Автоматическое логирование в Google Sheets
  • Унифицированная архитектура AI-помощника
  • Нормативные документы (PDF, Word, DjVu, сайты)
  • Техническое задание
  • Материалы от заказчика
  • Результаты экзаменационных сессий (вопросы/ответы)
Основная идея проекта
выходные данные
Участники
команды проекта
  • Николай кус
    Тимлид проекта
    • Руководство проектом и наставничество
    • Постановка задач, контроль сроков, поддержка участников
    • Коммуникация с заказчиком
  • Рушан Умеров
    IT директор
    • Сбор и формирование базы знаний
    • Программирование и тестирование Telegram-бота по строительному контролю
    • Тестирование ассистентов
    • Поддержка и мотивация команды
  • Евгений Горборуков
    менеджер холодных продаж
    • Разработка кода по векторизации базы SQL
    • Гибридная система поиска (FAISS + BM25)
    • Тестирование модели: массовый и интерактивный режимы
    • Система кеширования, логирования, автоматической записи в Google Sheets
  • Пётр Петров
    Предприниматель
    • Анализ и парсинг нормативной документации
    • Построение RAG-системы (FAISS + OpenAI)
    • Интеграция LangChain API
    • Telegram-бот с голосовым вводом
    • Логирование, деплой на Beget, автозапуск через systemd
    • Интеграции с Google Sheets и внешними API
  • Анна Даньшова
    тендерный менеджер
    • Написание Python-скрипта (без LLM) для тестирования НК
    • Очистка и сортировка документов
    • Сравнительное тестирование GPT-моделей
    • Составление тестов и проверка ассистентов коллег
  • Константин Алексеев
    Разнорабочий
    • Парсинг документов с diagnostpb.ru
    • Скрипт конвертации DJVU → PDF с текстовым слоем
    • Оптимизация графики для OCR
  • Екатерина Симонова
    Промт-инженер
    • Поиск и систематизация документов из разных источников
    • Каталогизация в Excel и создание реестра документов заказчика
    • Разработка, подготовка и внедрение базы знаний с использованием различных инструментов
    • Разработка веб-бота
    • Тестирование Telegram-ботов и RAG-моделей
  • Игорь Кузнецов
    Финансовый аналитик
    • Разработка чат бота с использованием платформы pro-talk.ru, представил альтернативное решение на базе внешней AI-платформы и провёл сравнение подходов
    • Разработка альтернативного варианта с веб-поиском, реализовал прототип без локальной базы знаний (с открытым веб-поиском) и детально проанализировал его эффективность и стоимость.
    • Настройка промптов и параметров генерации
    • Повышение точности ответов в RAG-режиме
  • Евгений Расюк
    Руководитель направления LLM-продуктов в компании Лидрекорд
    • Разработка чат-бота и базы знаний по направлению НК
    • Структурирование и загрузка нормативной информации
    • Настройка векторного поиска и SQLite-хранилища
    • Интеграция гибридной логики и подготовка к передаче заказчику