Стажировка | Академия ДПО

AI проекты

Этапы подбора

Резюме

Оставить заявку на трудоустройство

Блог

Почему услуга бесплатна

Стажировка

Разработка нейро-помощника для консультации клиентов и сотрудников Академии ДПО

Компания ООО «Академия ДПО»

Суть проекта

Задача

Создать прототип чат-ассистента (нейро-координатора) на основе ChatGPT API для автоматизации консультирования сотрудников и клиентов «Академии ДПО», обеспечив быстрый и стандартизированный доступ к актуальной информации из базы знаний компании.

Этап 1 (Анализ и проектирование):

Уточнение требований;
Согласование использования ChatGPT API;
Проектирование архитектуры (RAG-механизм, интеграции) и структуры базы знаний;
Подготовка спецификации парсинга сайта, схемы базы знаний (каталог курсов, регламенты, НПА) и планы обновления.

Этап 2 (Разработка MVP):

Парсинг и подготовка данных;
Обработка нормативных документов;
Векторизация и индексирование;
Интеграция ChatGPT API и RAG;
Разработка интерфейсов;
Разработка multi-agent «нейропродажник» на базе OpenAI;
Разработка пилота системы управления базой знаний.

Этап 3 (Тестирование и доработка):

Тестирование: проверка точности ответов RAG-системы (включая «штормовые» диалоги с ошибками и неполными вопросами), измерена производительность (RPS, латентность, потребление памяти) при разных сценариях нагрузки;
На основе фокус-группы сотрудников собрана обратная связь, оптимизированы параметры промптов и выбранных моделей;
Итеративная доработка компонентов (улучшение чанкинга, промтов и постобработки): отлажена система логирования запросов для последующего анализа.

По результатам всех этапов подготовлена техническая документация прототипа.

Парсер сайта «Академия ДПО»;
База знаний;
Векторизация: построены индексированные векторные БД (Faiss, ChromaDB) на основе нескольких эмбеддингов;
Интеграция RAG;
Диалоговый ассистент;
Нейропродажник: разработаны и протестированы сценарии «нейро-специалистов»;
Голосовой бот;
Производительность: проведено нагрузочное тестирование RAG-чата: до 50 пользователей на воркере задержка запроса составляла от 11 до 84 секунд (в зависимости от QPS и числа воркеров); при использовании 2–4 воркеров время ответа снижается. Показана возможность масштабирования на выделенных GPU;
Выводы тестирования: на основе результатов экспериментов разработаны рекомендации по дальнейшим улучшениям. Например, выявлено, что реранкер в локальном эксперименте не повышает качество ответов, тогда как оптимизация чанкинга и промтов обещает лучший эффект.

Ход реализации проекта

Результаты работы

Участники
команды проекта

николай кус

Тимлид проекта
- Определял стратегию проекта
- Курировал архитектуру и ход разработки
- Согласовывал с заказчиком технические решения и интеграции
Елена михно

Помощник тимлида
- Координировала команду
- Участвовала в обсуждениях архитектурных решений
- Помогала организовать тестирование и сбор обратной связи
олег бойков

технический директор
- Отвечал за сбор и предобработку данных
- Реализовал универсальный парсер сайта Академии ДПО (Selenium, BeautifulSoup)
- Настроил регулярный сбор страниц
- Занимался удалением «шума» и сохранением разметки в Markdown
- Получил чистую структурированную информацию для индексации
юлия демидова

Менеджер в управлении человеческими ресурсами
- Проводила исследования LLM и RAG
- Настраивала Faiss для векторного поиска
- Устанавливала и оптимизировала локальные модели Qwen-7B, Gemma-7B, Llama 3 8B
- Занималась prompt-инжинирингом
- Предложила оптимальные сочетания моделей (GPT-4-O, FRIDA) и механизмы генерации
максим кирюшкин

Системный администратор
- Работал над автоматизацией и векторизацией
- Интегрировал ChatGPT API
- Настраивал плотные индексы Faiss
- Тестировал различные эмбеддинги (в т.ч. FRIDA, intfloat/multilingual-e5) для RAG
- Участвовал в сборе выборки вопросов и настройке тестирования моделей
иван панченко

Медицина, фриланс
- Специализировался на диалоговом интерфейсе
- Создал голосового Telegram-бота: интегрировал Whisper STT для распознавания речи пользователя и Silero TTS для генерации голосовых ответов
- Проводил нагрузочные тесты бота, измерил потребление памяти и задержки
- Собрал и протестировал тестовую версию чат-бота с локальной базой знаний (FastAPI, SQLite, Faiss)
станислав писаревский

зам.директора колледжа
- Отвечал за компонент «нейропродажника»
- Разработал логику последовательного анализа диалога: «нейроспециалисты» выявления потребностей, обработки возражений, презентации продукта и приглашения в Zoom
- Создал систему, умеющую вести клиентский диалог и подсказывать оптимальные курсы
сергей таранов

инженер-программист
- Работал над архитектурой и векторизацией
- Разрабатывал схемы разбиения данных на векторные чанки и подбора оптимальных эмбеддингов
- Создал прототип архитектуры решения (Gradio) для демонстрации RAG-процесса
- Участвовал в тестировании производительности эмбеддингов и перенастройке векторной БД
Николай клюкин
- Работал над архитектурой и векторизацией
- Разрабатывал схемы разбиения данных на векторные чанки и подбора оптимальных эмбеддингов
- Создал прототип архитектуры решения (Gradio) для демонстрации RAG-процесса
- Участвовал в тестировании производительности эмбеддингов и перенастройке векторной БД
Андрей Попов

руководитель процесса цифровизации юридической функции
- Анализировал требуемые для базы знаний проекта нормативные акты на предмет актуальности, полноты и правильности отражения исходных данных
- Актуализировал исходную базу нормативных актов
- Написал код для парсинга актуальных федеральных нормативных актов с gov.ru
- Написал код для полного пайплайна от парсинга до непосредственного диалога с RAG-системой по базе нормативных актов
- Написал модуль с наследным классом от основного базового класса проекта, осуществляющий чанкование (сплиттинг) нормативной базы с подмодулем валидации для определения качества чанкования структурированных документов
- Провел анализ качества работы 6-ти различных моделей эмбеддингов, как с реранкингом, так и без
- Провел оценку качества ответов финальной RAG-системы с полной базой знаний по направлению отдельно нормативных актов и общих вопросов
- Анализировал код файлов проекта на предмет возможных улучшений или наличия ошибок
никита горбунов

ведущий системный инженер
- Разработал скрипт для парсера раздела «Лаборатории» сайта заказчика с сохранением структурированных данных в JSON
- Модифицировал скрипт для тестирования производительности векторных баз данных. В финальной реализации использовал оптимизированный командный вариант скрипта
- Провел стресс-тестирование чат-интерфейса и Telegram-бота
- По результатам тестов командой внес улучшения в логику работы системы
сергей чабанов

главный специалист в научно-исследовательском институте
- Занимался транскрипцией документов
раиль зайнутдинов

Защита информации и информационные технологии
- Занимался парсингом сайта
- Работал над созданием базы знаний
- Делал интеграции моделей chatGPT для диалоговых систем
- Разрабатывал нейро-консультанта
- Работал с embedding, алгоритмами LangChain, использовал методы Faiss
юрий чайка

инженер химик-технолог
- Занимался автоматическим парсингом сайта (Selenium)
- Работал с Markdown-документами
- Проводил тестирование RAG
екатерина симонова

специалист по кодированию медицинских данных
- Тестировала модели на релевантность по клиенту
- Провела сравнительный анализ OCR-методов
- Тестировала RAG и реранкеры
- Организовывала допоплнительные созвоны
- Работала с клиентом: проводила техконсультации
Дорошенко Евгений

Системный администратор
- Разработка и тестирование парсера
- Тестирование и проверка БЗ
Федосеев Сергей

Руководитель ИТ отдела
- Разработка и тестирование парсера
- Тестирование и проверка БЗ
Кудрявцев Станислав

Самообучение (фронтенд, английский, AI)
- Разработка и тестирование парсера
- Тестирование и проверка БЗ