Стажировка
Разработка нейро-помощника для консультации клиентов и сотрудников Академии ДПО
Компания ООО «Академия ДПО»
Суть проекта
Задача
Создать прототип чат-ассистента (нейро-координатора) на основе ChatGPT API для автоматизации консультирования сотрудников и клиентов «Академии ДПО», обеспечив быстрый и стандартизированный доступ к актуальной информации из базы знаний компании.

Этап 1 (Анализ и проектирование):
  • Уточнение требований;
  • Согласование использования ChatGPT API;
  • Проектирование архитектуры (RAG-механизм, интеграции) и структуры базы знаний;
  • Подготовка спецификации парсинга сайта, схемы базы знаний (каталог курсов, регламенты, НПА) и планы обновления.

Этап 2 (Разработка MVP):
  • Парсинг и подготовка данных;
  • Обработка нормативных документов;
  • Векторизация и индексирование;
  • Интеграция ChatGPT API и RAG;
  • Разработка интерфейсов;
  • Разработка multi-agent «нейропродажник» на базе OpenAI;
  • Разработка пилота системы управления базой знаний.

Этап 3 (Тестирование и доработка):
  • Тестирование: проверка точности ответов RAG-системы (включая «штормовые» диалоги с ошибками и неполными вопросами), измерена производительность (RPS, латентность, потребление памяти) при разных сценариях нагрузки;
  • На основе фокус-группы сотрудников собрана обратная связь, оптимизированы параметры промптов и выбранных моделей;
  • Итеративная доработка компонентов (улучшение чанкинга, промтов и постобработки): отлажена система логирования запросов для последующего анализа.

По результатам всех этапов подготовлена техническая документация прототипа.
  • Парсер сайта «Академия ДПО»;
  • База знаний;
  • Векторизация: построены индексированные векторные БД (Faiss, ChromaDB) на основе нескольких эмбеддингов;
  • Интеграция RAG;
  • Диалоговый ассистент;
  • Нейропродажник: разработаны и протестированы сценарии «нейро-специалистов»;
  • Голосовой бот;
  • Производительность: проведено нагрузочное тестирование RAG-чата: до 50 пользователей на воркере задержка запроса составляла от 11 до 84 секунд (в зависимости от QPS и числа воркеров); при использовании 2–4 воркеров время ответа снижается. Показана возможность масштабирования на выделенных GPU;
  • Выводы тестирования: на основе результатов экспериментов разработаны рекомендации по дальнейшим улучшениям. Например, выявлено, что реранкер в локальном эксперименте не повышает качество ответов, тогда как оптимизация чанкинга и промтов обещает лучший эффект.
Ход реализации проекта
Результаты работы
Участники
команды проекта
  • николай кус
    Тимлид проекта
    • Определял стратегию проекта
    • Курировал архитектуру и ход разработки
    • Согласовывал с заказчиком технические решения и интеграции
  • Елена михно
    Помощник тимлида
    • Координировала команду
    • Участвовала в обсуждениях архитектурных решений
    • Помогала организовать тестирование и сбор обратной связи
  • олег бойков
    технический директор
    • Отвечал за сбор и предобработку данных
    • Реализовал универсальный парсер сайта Академии ДПО (Selenium, BeautifulSoup)
    • Настроил регулярный сбор страниц
    • Занимался удалением «шума» и сохранением разметки в Markdown
    • Получил чистую структурированную информацию для индексации
  • юлия демидова
    Менеджер в управлении человеческими ресурсами
    • Проводила исследования LLM и RAG
    • Настраивала Faiss для векторного поиска
    • Устанавливала и оптимизировала локальные модели Qwen-7B, Gemma-7B, Llama 3 8B
    • Занималась prompt-инжинирингом
    • Предложила оптимальные сочетания моделей (GPT-4-O, FRIDA) и механизмы генерации
  • максим кирюшкин
    Системный администратор
    • Работал над автоматизацией и векторизацией
    • Интегрировал ChatGPT API
    • Настраивал плотные индексы Faiss
    • Тестировал различные эмбеддинги (в т.ч. FRIDA, intfloat/multilingual-e5) для RAG
    • Участвовал в сборе выборки вопросов и настройке тестирования моделей
  • иван панченко
    Медицина, фриланс
    • Специализировался на диалоговом интерфейсе
    • Создал голосового Telegram-бота: интегрировал Whisper STT для распознавания речи пользователя и Silero TTS для генерации голосовых ответов
    • Проводил нагрузочные тесты бота, измерил потребление памяти и задержки
    • Собрал и протестировал тестовую версию чат-бота с локальной базой знаний (FastAPI, SQLite, Faiss)
  • станислав писаревский
    зам.директора колледжа
    • Отвечал за компонент «нейропродажника»
    • Разработал логику последовательного анализа диалога: «нейроспециалисты» выявления потребностей, обработки возражений, презентации продукта и приглашения в Zoom
    • Создал систему, умеющую вести клиентский диалог и подсказывать оптимальные курсы
  • сергей таранов
    инженер-программист
    • Работал над архитектурой и векторизацией
    • Разрабатывал схемы разбиения данных на векторные чанки и подбора оптимальных эмбеддингов
    • Создал прототип архитектуры решения (Gradio) для демонстрации RAG-процесса
    • Участвовал в тестировании производительности эмбеддингов и перенастройке векторной БД
  • Николай клюкин
    • Работал над архитектурой и векторизацией
    • Разрабатывал схемы разбиения данных на векторные чанки и подбора оптимальных эмбеддингов
    • Создал прототип архитектуры решения (Gradio) для демонстрации RAG-процесса
    • Участвовал в тестировании производительности эмбеддингов и перенастройке векторной БД
  • Андрей Попов
    руководитель процесса цифровизации юридической функции
    • Анализировал требуемые для базы знаний проекта нормативные акты на предмет актуальности, полноты и правильности отражения исходных данных
    • Актуализировал исходную базу нормативных актов
    • Написал код для парсинга актуальных федеральных нормативных актов с gov.ru
    • Написал код для полного пайплайна от парсинга до непосредственного диалога с RAG-системой по базе нормативных актов
    • Написал модуль с наследным классом от основного базового класса проекта, осуществляющий чанкование (сплиттинг) нормативной базы с подмодулем валидации для определения качества чанкования структурированных документов
    • Провел анализ качества работы 6-ти различных моделей эмбеддингов, как с реранкингом, так и без
    • Провел оценку качества ответов финальной RAG-системы с полной базой знаний по направлению отдельно нормативных актов и общих вопросов
    • Анализировал код файлов проекта на предмет возможных улучшений или наличия ошибок
  • никита горбунов
    ведущий системный инженер
    • Разработал скрипт для парсера раздела «Лаборатории» сайта заказчика с сохранением структурированных данных в JSON
    • Модифицировал скрипт для тестирования производительности векторных баз данных. В финальной реализации использовал оптимизированный командный вариант скрипта
    • Провел стресс-тестирование чат-интерфейса и Telegram-бота
    • По результатам тестов командой внес улучшения в логику работы системы
  • сергей чабанов
    главный специалист в научно-исследовательском институте
    • Занимался транскрипцией документов
  • раиль зайнутдинов
    Защита информации и информационные технологии
    • Занимался парсингом сайта
    • Работал над созданием базы знаний
    • Делал интеграции моделей chatGPT для диалоговых систем
    • Разрабатывал нейро-консультанта
    • Работал с embedding, алгоритмами LangChain, использовал методы Faiss
  • юрий чайка
    инженер химик-технолог
    • Занимался автоматическим парсингом сайта (Selenium)
    • Работал с Markdown-документами
    • Проводил тестирование RAG
  • екатерина симонова
    специалист по кодированию медицинских данных
    • Тестировала модели на релевантность по клиенту
    • Провела сравнительный анализ OCR-методов
    • Тестировала RAG и реранкеры
    • Организовывала допоплнительные созвоны
    • Работала с клиентом: проводила техконсультации
  • Дорошенко Евгений
    Системный администратор
    • Разработка и тестирование парсера
    • Тестирование и проверка БЗ
  • Федосеев Сергей
    Руководитель ИТ отдела
    • Разработка и тестирование парсера
    • Тестирование и проверка БЗ
  • Кудрявцев Станислав
    Самообучение (фронтенд, английский, AI)
    • Разработка и тестирование парсера
    • Тестирование и проверка БЗ