Стажировка
Нейро‑помощник для автоматизации приёма заказов на полиграфическую продукцию
Компания ООО «алгофьюжн»
Суть проекта
Задача
Автоматизировать ответы/расчёты и ввод данных в ERP. Нужен ассистент, который понимает макеты и бриф, отвечает клиенту, считает цену и заводит данные в 1С.

  • Backend: FastAPI (Python 3.12)
  • RAG: pgvector/FAISS + эмбеддинги RU; reranker
  • OCR/Vision: Tesseract, пайплайн конвертаций
  • Телефония: Asterisk / Jambonz (SIP/WebRTC)
  • STT/TTS: Whisper large-v3 / SpeechKit
  • Хранение: Postgres 16 + pgcrypto; логи — ClickHouse (этап 2)
  • CI/CD: GitHub Actions; Docker (→ Kubernetes на PROD).
  • Чат и TG-бот отвечают по RAG на ≥90 % типовых вопросов;
  • Макеты/письма обрабатываются, параметры извлекаются, формируется бриф;
  • Черновой расчёт выполняется через связку «таблицы/шаблоны → 1С»;
  • Исходящий звонок собирает недостающие слоты, итог — КП (PDF) клиенту;
  • Логи диалогов доступны в дашборде;
  • Голос: устойчивая сессия, средняя задержка ≤4 с.
Технологический стек
Результаты работы
Участники
команды проекта
  • сергей коваленко
    Тимлид проекта
    • Определял стратегию проекта
    • Курировал архитектуру и ход разработки
    • Согласовывал с заказчиком технические решения и интеграции
  • Елена михно
    Помощник тимлида
    • Декомпозиция задач на управляемые этапы.
    • Управление загрузкой команды и поддержание баланса задач
    • Оперативная координация стажировки: организационная поддержка встреч/разборов, мотивация команды, навигация по артефактам в чате/Docs, фиксация изменений
    • Мониторинг проектных рисков и своевременное реагирование на возникающие блокеры
    • Разработка архитектуры решения и помощь с визуализацией алгоритмов (draw.io)
    • Обеспечение прозрачности и предсказуемости проекта для ключевых стейкхолдеров
    • Контроль прогресса и консолидация результатов для регулярных статус-отчётов
    • Ведение постановки и отслеживания задач
    • Участие в подготовке итоговой проектной документации
    • Поддержка команды на этапе формировани финальной презентации для заказчика.
  • максим башкиров
    -
    • Создание ядра: клиентский чат/TG-бот (разработка  агентов) + парсер писем/макетов; извлечение размеров/материалов/цветов по чек-листу Заказчика; формирование JSON-брифа и отчётов (Excel/XML)
    • Создание анализатора изображений с приемом почты - анализ изображений и тела письма, созданием автоматических отчетов
    • Создание базы в PostgreSQL
    • Vision-апдейты: контур по области интереса, жёсткая стабилизация замеров, правки лагов; чистка кода и документация
    • Настройка интеграции: передача результатов через «табличные шаблоны» в контур 1С; совместное тестирование с группой.
  • дмитрий борисов
    -
    • Реализация этапа голосового пайплайна: интеграционные точки для звонков, отработка ошибок и ретраев, обеспечение устойчивости сценариев
    • Настройка подключения к TTS/STT, связка последовательности вызовов, участие в построении голосовых прототипов
    • Подготовка финальной интеграционной сборки: стыковка ядра (бот + Vision + почта) с голосовым пайплайном, end-to-end тесты, оптимизация производительности и подготовка демо для релиза.
  • анна саламатина
    -
    • Создание архитектуры проекта и регулярное дополнение по результатам встреч (блок-схема)
    • Создание Telegram-бота: генерация БЗ, RAG, промпт-маршрутизация; оптимизация под сценарий досбора недостающих значений в профиле клиента; совместное тестирование и улучшение
    • Тестирование программы распознавания изображений (кейсы/обратная связь).
  • иван панченко
    Медицина, фриланс
    • Специализировался на диалоговом интерфейсе
    • Создал голосового Telegram-бота: интегрировал Whisper STT для распознавания речи пользователя и Silero TTS для генерации голосовых ответов
    • Проводил нагрузочные тесты бота, измерил потребление памяти и задержки
    • Собрал и протестировал тестовую версию чат-бота с локальной базой знаний (FastAPI, SQLite, Faiss)
  • станислав писаревский
    зам.директора колледжа
    • Отвечал за компонент «нейропродажника»
    • Разработал логику последовательного анализа диалога: «нейроспециалисты» выявления потребностей, обработки возражений, презентации продукта и приглашения в Zoom
    • Создал систему, умеющую вести клиентский диалог и подсказывать оптимальные курсы
  • сергей таранов
    инженер-программист
    • Работал над архитектурой и векторизацией
    • Разрабатывал схемы разбиения данных на векторные чанки и подбора оптимальных эмбеддингов
    • Создал прототип архитектуры решения (Gradio) для демонстрации RAG-процесса
    • Участвовал в тестировании производительности эмбеддингов и перенастройке векторной БД
  • Николай клюкин
    • Работал над архитектурой и векторизацией
    • Разрабатывал схемы разбиения данных на векторные чанки и подбора оптимальных эмбеддингов
    • Создал прототип архитектуры решения (Gradio) для демонстрации RAG-процесса
    • Участвовал в тестировании производительности эмбеддингов и перенастройке векторной БД
  • Андрей Попов
    руководитель процесса цифровизации юридической функции
    • Анализировал требуемые для базы знаний проекта нормативные акты на предмет актуальности, полноты и правильности отражения исходных данных
    • Актуализировал исходную базу нормативных актов
    • Написал код для парсинга актуальных федеральных нормативных актов с gov.ru
    • Написал код для полного пайплайна от парсинга до непосредственного диалога с RAG-системой по базе нормативных актов
    • Написал модуль с наследным классом от основного базового класса проекта, осуществляющий чанкование (сплиттинг) нормативной базы с подмодулем валидации для определения качества чанкования структурированных документов
    • Провел анализ качества работы 6-ти различных моделей эмбеддингов, как с реранкингом, так и без
    • Провел оценку качества ответов финальной RAG-системы с полной базой знаний по направлению отдельно нормативных актов и общих вопросов
    • Анализировал код файлов проекта на предмет возможных улучшений или наличия ошибок
  • никита горбунов
    ведущий системный инженер
    • Разработал скрипт для парсера раздела «Лаборатории» сайта заказчика с сохранением структурированных данных в JSON
    • Модифицировал скрипт для тестирования производительности векторных баз данных. В финальной реализации использовал оптимизированный командный вариант скрипта
    • Провел стресс-тестирование чат-интерфейса и Telegram-бота
    • По результатам тестов командой внес улучшения в логику работы системы
  • сергей чабанов
    главный специалист в научно-исследовательском институте
    • Занимался транскрипцией документов
  • раиль зайнутдинов
    Защита информации и информационные технологии
    • Занимался парсингом сайта
    • Работал над созданием базы знаний
    • Делал интеграции моделей chatGPT для диалоговых систем
    • Разрабатывал нейро-консультанта
    • Работал с embedding, алгоритмами LangChain, использовал методы Faiss
  • юрий чайка
    инженер химик-технолог
    • Занимался автоматическим парсингом сайта (Selenium)
    • Работал с Markdown-документами
    • Проводил тестирование RAG
  • екатерина симонова
    специалист по кодированию медицинских данных
    • Тестировала модели на релевантность по клиенту
    • Провела сравнительный анализ OCR-методов
    • Тестировала RAG и реранкеры
    • Организовывала допоплнительные созвоны
    • Работала с клиентом: проводила техконсультации
  • Дорошенко Евгений
    Системный администратор
    • Разработка и тестирование парсера
    • Тестирование и проверка БЗ
  • Федосеев Сергей
    Руководитель ИТ отдела
    • Разработка и тестирование парсера
    • Тестирование и проверка БЗ
  • Кудрявцев Станислав
    Самообучение (фронтенд, английский, AI)
    • Разработка и тестирование парсера
    • Тестирование и проверка БЗ