Стажировка
Разработка нейро-помощника для консультации клиентов и сотрудников Академии ДПО
Компания ООО «Академия ДПО»
Суть проекта
Задача
Создать прототип чат-ассистента (нейро-координатора) на основе ChatGPT API для автоматизации консультирования сотрудников и клиентов «Академии ДПО», обеспечив быстрый и стандартизированный доступ к актуальной информации из базы знаний компании.

Этап 1 (Анализ и проектирование):
  • Уточнение требований;
  • Согласование использования ChatGPT API;
  • проектирование архитектуры (RAG-механизм, интеграции) и структуры базы знаний;
  • Подготовка спецификации парсинга сайта, схемы базы знаний (каталог курсов, регламенты, НПА) и планы обновления.

Этап 2 (Разработка MVP):
  • Парсинг и подготовка данных;
  • Обработка нормативных документов;
  • Векторизация и индексирование;
  • Интеграция ChatGPT API и RAG;
  • Разработка интерфейсов;
  • Разработка multi-agent «нейропродажник» на базе OpenAI;
  • Разработка пилота системы управления базой знаний.

Этап 3 (Тестирование и доработка):
  • Тестирование: проверка точности ответов RAG-системы (включая «штормовые» диалоги с ошибками и неполными вопросами), измерена производительность (RPS, латентность, потребление памяти) при разных сценариях нагрузки;
  • На основе фокус-группы сотрудников собрана обратная связь, оптимизированы параметры промптов и выбранных моделей;
  • Итеративная доработка компонентов (улучшение чанкинга, промтов и постобработки): отлажена система логирования запросов для последующего анализа.

По результатам всех этапов подготовлена техническая документация прототипа.
  • Парсер сайта «Академия ДПО»;
  • База знаний;
  • Векторизация: построены индексированные векторные БД (Faiss, ChromaDB) на основе нескольких эмбеддингов;
  • Интеграция RAG;
  • Диалоговый ассистент;
  • Нейропродажник: разработаны и протестированы сценарии «нейро-специалистов»;
  • Голосовой бот;
  • Производительность: проведено нагрузочное тестирование RAG-чата: при до 50 пользователей на воркере задержка запроса составляла от 11 до 84 секунд (в зависимости от QPS и числа воркеров); при использовании 2–4 воркеров время ответа снижается. Показана возможность масштабирования на выделенных GPU;
  • Выводы тестирования: на основе результатов экспериментов разработаны рекомендации по дальнейшим улучшениям. Например, выявлено, что реранкер в локальном эксперименте не повышает качество ответов, тогда как оптимизация чанкинга и промтов обещает лучший эффект.
Ход реализации проекта
Результаты работы
Участники
команды проекта
  • николай кус
    Тимлид проекта
    • Организовывал работу команды
    • Координировал архитектурные решения и планировал проект
  • Елена михно
    Помощник тимлида
    • Помогала в управлении проектом
    • Поддерживала коммуникации внутри команды
  • олег бойков
    технический директор
    • Отвечал за сбор и предобработку данных
    • Реализовал универсальный парсер сайта Академии DPO (Selenium, BeautifulSoup)
    • Настроил регулярный сбор страниц
    • Занимался удалением «шума» и сохранением разметки в Markdown.
    • Получил чистую структурированную информацию для индексации
  • юлия демидова
    Менеджер в управлении человеческими ресурсами
    • Проводила исследования LLM и RAG
    • Настраивала Faiss для векторного поиска
    • Устанавливала и оптимизировала локальные модели Qwen-7B, Gemma-7B, Llama 3 8B
    • Занималась prompt-инжинирингом
    • Предложила оптимальные сочетания моделей (GPT-4-O, FRIDA) и механизмы генерации
  • максим кирюшкин
    Системный администратор
    • Работал над автоматизацией и векторизацией
    • Интегрировал ChatGPT API
    • Настраивал плотные индексы Faiss
    • Тестировал различные эмбеддинги (в т.ч. FRIDA, intfloat/multilingual-e5) для RAG
    • Участвовал в сборе выборки вопросов и настройке тестирования моделей
  • иван панченко
    Медицина, фриланс
    • Специализировался на диалоговом интерфейсе
    • Создал голосового Telegram-бота: интегрировал Whisper STT для распознавания речи пользователя и Silero TTS для генерации голосовых ответов
    • Проводил нагрузочные тесты бота, измерил потребление памяти и задержки
    • Собрал и протестировал тестовую версию чат-бота с локальной базой знаний (FastAPI, SQLite, Faiss)
  • станислав писаревский
    зам.директора колледжа
    • Отвечал за компонент «нейропродажника»
    • Разработал логику последовательного анализа диалога: «нейроспециалисты» выявления потребностей, обработки возражений, презентации продукта и приглашения в Zoom
    • Создал систему, умеющую вести клиентский диалог и подсказывать оптимальные курсы
  • сергей таранов
    инженер-программист
    • Работал над архитектурой и векторизацией
    • Разрабатывал схемы разбиения данных на векторные чанки и подбора оптимальных эмбеддингов
    • Создал прототип архитектуры решения (Gradio) для демонстрации RAG-процесса
    • Участвовал в тестировании производительности эмбеддингов и перенастройке векторной БД