Стажировка по проекту
Разработка нейроконсультанта для обработки обращений граждан по вопросам обеспечения единства измерений
Компания: ФГБУ «ВНИИМС»
Суть проекта
Задача
Для чего
Вводные данные
Разработка нейро-консультанта для автоматизированных и точных ответов на пользовательские запросы в сфере метрологии
Нейроконсультант позволит обеспечивать высокую точность и оперативность ответов, что улучшит качество информационной поддержки и эффективность процессов внутри организации
- База из более чем 100 эталонных экспертных ответов на вопросы пользователей
- Более 25 нормативно-технических документов по метрологии
- Требование использования отечественной большой языковой модели (LLM)
Реализация прототипа нейроконсультанта с интеграцией в Telegram. В проекте использовались векторные базы данных для обработки и векторизации текстовой информации, а также интерфейсы для работы с LLM. Пользовательские запросы через Telegram подвергались векторизации, что позволяло находить подходящие ответы в векторном хранилище. В качестве языковых моделей были протестированы YandexGPT, GigaChat и Anthropic, причём YandexGPT показал наилучшее качество ответов
Выходные данные
Участники
1 команды проекта
  • Оболенский Иван
    Тимлид проекта
    • Организация и планирование работ группы, координация работы группы по решению прикладных задач проекта
    • Взаимодействие с заказчиком
    • Экспертная поддержка участников стажировки
  • Семиврагов Сергей
    • Доработка модуля работы с XML и Markdown для оптимизации контент-менеджмента
    • Анализ и выявление отсутствующих нормативно-правовых документов, интеграция с базами данных
    • Конвертация баз знаний в JSON для улучшения интероперабельности систем
    • Дообучение и дебаг модели YandexGPT с использованием релевантных данных для повышения точности ответов
    • Разработка и тестирование прототипа с каскадом из 3 различных моделей - YandexGPT
    • Развертывание телеграм-бота, включая тестирование и упаковку
    • Подготовка аналитических отчетов и таблиц для сравнения Cloud LLM по ключевым метрикам
    • Развертывание прототипа на YandexCloud: конфигурация сервисов и оптимизация для минимизации расходов
  • Григорьян Константин
    Предприниматель//разработка чат-ботов и создание нейросотрудников
    • Разработка и интеграция инструкций в векторные базы данных для оптимизации скорости ответов
    • Адаптация и тестирование модели GigaChat, включая интеграцию сторонних векторов и шаблонов ответов
    • Улучшение алгоритмов поиска по базе данных и переход на использование модели GigaChat
    • Тонкая настройка и доработка ботов для обработки двух различных баз данных: вопросы-ответы и нормативно-правовые документы
  • Леонтьев Дмитрий
    Инженер-механик//предприниматель
    • Тестирование и адаптация подхода RAG к моделям GigaChat
    • Оптимизация кода в VSCode для повышения эффективности качества работы прототипа
    • Тестирование Colab ноутбуков для оценки качества интеграции и работы с моделями GigaChat
    • Разработка и тестирование телеграм-ботов, интегрированных с GPT-3.5 и GigaChatEmbeddings
  • Ковешников Сергей
    начальник отдела логистики
    • Реализация и тестирование модуля работы с документацией с разметкой Markdown для улучшения процессов управления содержимым
    • Конвертация и оптимизация баз данных в JSON, разработка и тестирование векторизованных систем на моделях GigaChat
    • Разработка и доработка Colab ноутбуков для управления кэшированными вопросами и ответами
    • Тестирование и доработка технологий создания и экспорта ботов на платформе SaluteBot
Демонстрация проекта (youTube)
Демонстрация проекта (VK)
Благодарность университетУ