Стажировка
Нейро-ассистент для фильтрации и аналитики новостных потоков
ООО «Индлаб»
● Развёртывание MVP на сервере заказчика
● Углубление системы трендов и алертов
● Улучшение извлечения связей с помощью LLM
● Создание веб-аналитической панели для заказчика
● Персонализация выводов и событийных прогнозов
● Расширение числа тематик, каналов и источников
Перспектива развития
● Протестировано 17 моделей эмбеддингов, выбраны 3 лидера (GT, E5)
● Проведена кластеризация 37 000 постов, выделено 800+ тем
● Разработаны графовые структуры сущностей (Госдума, США, Украина и др.)
● Создан рабочий UI-инструмент с полным аналитическим пайплайном
● Построены метрики: Accuracy, MRR, Recall@5
● Подготовлены Docker-сервисы: Qdrant, Postgres, backend
● Проект успешно показан заказчику, подтверждено соответствие ТЗ
● Сформированы тестовые датасеты и методология оценки качества
Результаты проекта
● Полный рабочий прототип нейро-ассистента
● Тематическая кластеризация и категоризация новостей
● Векторная база Qdrant для поиска
● Граф сущностей и событий
● Сравнительные метрики моделей
● Авто-дайджесты с LLM-обработкой
● Docker-окружение для развёртывания
● UI-инструмент для демонстрации работы пайплайна
Выходные данные
● Telegram-каналы (10+ тематик, 37 000+ постов)
● Датасеты за 100 дней
● Модели эмбеддингов: E5, BERT-семейство, MiniLM, GT-модели.
● LLM: ChatGPT / GigaChat
● Технологии: Python, Telethon, Qdrant, Postgres, Redis, Neo4j, Docker, Cursor, Colab
вводные данные
● Очистить новостной поток от «шума» и дублей
● Автоматизировать анализ событий, каналов и тенденций
● Обеспечить поиск по смыслу, а не по ключевым словам
● Выявлять тренды, ключевые сущности и связи
● Формировать дайджесты и краткие объяснения событий
● Создать прототип ассистента, готового к интеграции в систему заказчика
Для чего
● Построение архитектуры пайплайна обработки данных:
парсинг → очистка → векторизация → Qdrant → кластеризация → классификация → граф связей → аналитика
● Разработка нескольких подходов к пониманию новостей:
  1. семантические эмбеддинги (E5, BERT, MiniLM, GT-модели)
  2. тематическое моделирование (BERTopic)
  3. графовые структуры (Neo4j, co-mentions)
● Создание интерфейса аналитика — UI-прототип на Python, включающий все модули
● Формирование методологии тестирования моделей (Accuracy, MRR, Recall@5)
● Подготовка MVP-структуры: Docker, Postgres, Qdrant, backend
● Подготовка данных, метрик, презентации и документации для заказчика
Задачи проекта
Проект — разработка интеллектуального нейро-ассистента, который автоматически собирает, фильтрует и анализирует новостные потоки из Telegram-каналов, устраняет дубли, выделяет темы, сущности и связи, а также формирует персональные дайджесты.
Система объединяет семантический анализ, тематическое моделирование, графовую аналитику и LLM-модули для преобразования неструктурированных новостей в чистую аналитическую картину.
Разработан функциональный UI-прототип (Python, Cursor), демонстрирующий полный pipeline:
парсинг → индексация → векторизация → кластеризация → классификация → дайджесты → связи.
ЦЕЛЬ проекта
Участники
команды проекта
  • Кравченко Дмитрий Александрович
    Тимлид команды
    • Руководство командой разработчиков на всех этапах проекта
    • Планирование задач, контроль их выполнение и соблюдение сроков
    • Обеспечение эффективной коммуникации внутри команды и с заказчиком
  • Малицкий Андрей Анатольевич
    Помощник тимлида
    • Поддержка управления проектом и команды, методическое сопровождение стажёров
    • Разработка и систематизация подходов «Схема маршрутизации Ветками» и ДАПУ для проектирования сложных промптов
    • Исследование и внедрение метода Schema-Guided Reasoning (SGR)
    • Создание версии агента-защитника с авторской методикой противодействия манипуляциям с LLM
  • Савченко Даниил Сергеевич
    • Разработка и тестирование промтов по архитектуре ДАПУ
    • Создание Telegram-бота для тестирования промтов и сбора отчётов
    • Реализация логики триггеров состояний и системы отчётности
    • Активное участие в подготовке финальной презентации проекта
  • Подобряев Сергей Валерьевич
    • Разработка промта агента-защитника и системы контекстной безопасности
    • Создание классификации промпт-атак и матрицы угроз
    • Отладка взаимодействия агентов и тестирование профайлов клиентов
  • Турмышева Марина Евгеньевна
    • Разработка более 30 версий промтов (ДАПУ, ветки, цели)
    • Внедрение методик продаж в промт и настройка автотестировщиков
    • Создание 30+ психотипов клиентов и анализ более 500 циклов тестов
    • Работа над структурой презентации и аналитикой результатов
  • Камышов Эдуард Григорьевич
    • Разработка автоматизированной системы генерации, тестирования и анализа диалогов между нейро-продажником и тестировщиком на основе LLM (Нейро-тестировщик)
    • Используя Нейро-тестировщик: тестирование и сравнение эффективности различных промптов , глубокий анализ диалогов и анализ системных промптов с рекомендациями по их улучшению
    • Доработка и улучшение системных промптов на основе рекомендаций Нейро-тестировщика
  • Михно Елена Игоревна
    • Тестирование промптов по архитектуре ДАПУ, ветки, цели
    • Работа над структурой презентации и аналитикой результатов
  • Стороженко Владимир Алексеевич
    • Разработка Colab для автоматического и ручного тестирования, который полностью автономно генерирует диалоги между AI-продажником и тестировщиком и выставляет оценки по 10 критериям (структура, CTA, логика, эмоция, адаптация и т.д.), сохраняет JSON и Excel-отчёты
  • Дегтярева Мария
    • Разработка и тестирование промта по архитектуре ДАПУ и промпта по веткам