Проект по созданию прототипа нейро-контроля качества работы операторов колл-центра
Компания: ООО «ГИпер»
Суть проекта
Задача
Вводные данные
Создать интеллектуальную систему на базе GPT-моделей для автоматической оценки качества работы операторов колл-центра. Система будет анализировать разговоры, выявлять нарушения стандартов обслуживания и предоставлять рекомендации по улучшению.
1. Алгоритмы анализа разговоров
Транскрибация аудиозаписей.
Локальная обработка аудио для получения текстового формата.
Очистка текста от персональных данных.
Удаление упоминаний клиентов и их персональных данных.
Анализ транскриптов с использованием GPT.
Оценка соблюдения стандартов (приветствие, выявление потребностей, решение вопросов, завершение разговора).
Определение "запретных фраз" и слов-паразитов.
Классификация звонков по темам.
Анализ эмоциональной тональности (нейтральная, агрессивная, позитивная).
Вывод краткой сводки и рекомендаций.
2. Создание отчетов
Итоговая оценка разговора (например, 85/100).
Выделение ошибок оператора с привязкой к критериям чек-листа.
Рекомендации по улучшению для операторов или отдела.
Возможность экспорта отчетов в Excel или PDF.
3. Интеграция системы
Реализация системы в Google Colab для взаимодействия и обработки данных.
4. Тестирование и внедрение
Проведение тестирования на данных заказчика.
Оптимизация алгоритмов по итогам тестирования.
Передача заказчику готовой системы с документацией.
Система, способная:
Анализировать звонки операторов.
Выявлять нарушения стандартов обслуживания.
Предоставлять рекомендации по улучшению качества работы.
Повышение уровня обслуживания клиентов и общей эффективности колл-центра.
Аудиозаписи звонков колл-центра.
Чек-листы для оценки качества обслуживания, предоставленные заказчиком.
Скрипты взаимодействия с клиентами.
Основные задачи
выходные данные
Участники команды проекта
Лунева Светлана
Тимлид проекта
Руководство командой разработчиков на всех этапах проекта
Организация и планирование задач
Контроль и соблюдение сроков
Обеспечение эффективной коммуникации внутри команды и с заказчиком
Оказание технической поддержки команде
Помощь в выборе оптимальных решений
Контроль за качеством кода и соблюдением стандартов разработки
Кравченко Дмитрий
Тимлид проекта
Руководство командой разработчиков на всех этапах проекта
Организация и планирование задач
Контроль и соблюдение сроков
Обеспечение эффективной коммуникации внутри команды и с заказчиком
Оказание технической поддержки команде
Помощь в выборе оптимальных решений
Контроль за качеством кода и соблюдением стандартов разработки
Михно Елена
Помощник тимлида
Помощь в организационных вопросах по проекту
Инициация и проведение дополнительных встреч стажеров
Наставление и обучение стажеров
Малицкий Андрей
Помощник тимлида
Участие в распределении задач
Руководство командой помощников тимлида, обеспечивая эффективное взаимодействие между тимлидом и участниками проекта
Коднянская Олеся
Помощник тимлида
Помощь в организации процесса разработки проекта
Флегонтова Светлана
Инженер по тестированию ПО (manual)
Анализ базы знаний: изучение и комментирование разделов по тематике (Python, LangChain)
Разработка алгоритма кэширования ответов: оптимизация типичных ответов (Cachetools, LRUCache)
Создание вопросов и комментариев для заказчика: уточнение требований (tiktoken, OpenAI API)
Поиск аналогичных решений: исследование открытых проектов для идей и сравнения (GitHub, LangChain)
Дорошенко Евгений
системный администратор
Транскрибирования аудиозаписей
Анализа диалогов
Создание итогового веб-приложение для интеграции на сервер заказчика
Прохоренко Евгений
Ведущий инженер по Слабосточным системам
Подготовка ноутбуков для транскрибации
Проведение исследования и подбор параметров, для выявления лучших результатов
Подготовка вторичного ноутбука на выбранной модели - получивший лучшие результаты
Запуск приложения в среде Windows
Беляева Алена
ведущий специалист группы HR
Подбор локальной модели Виспера, подготовка эталонных транскрипций для оценки качества транскрибации, тестирование моделей, внесение результатов в таблицу, оценка WER, график
Подготовка датасета для дообучения Виспера
Подбор локальной модели для анонимизации ( IlyaGusev_saiga_llama3_8b ), разработка промпта, подбор настроек, тестирование
Проработана идея анализа транскрибированных текстов локальной моделью без предварительной анонимизации
Подготовка выбранных диалогов для анализа, генерация фейковых диалогов с явными нарушениями, для тестирования этапа анализа
Подготовка презентации (совместно с коллегами)
Калюжный Денис
Администратор ЛВС/1С разработчик
Тестирование локальных моделей транскрибации
Дообучение локальной модели транскрибации (whisper) на звуковых файлах заказчика
Реализация альтернативного алгоритма решения рабочей задачи с помощью локальных моделей
чабанов сергей
главный специалист в научно исследовательском институте
Разработка приложения Streamlit для визуализации работы системы нейро-контроля качества работы операторов компании "Гипер"
Разработка кода и тестирование работы ассистента по проверке качества отработки оператором возражений клиента,
Разработка кода и тестирование работы ассистента по проверке качества оператором в части клиентоориентированности, разработка и представление аналитических таблиц
Литвинчук Ольга
Специалист по кадрам, менеджер по персоналу
Тестирование транскрибации звонков для модели Whisper, сделала оценку ответов, написала комментарии и занесла данные в общую
Разработка для анализа оценки на различных моделях LLM: знания и соблюдения регламента и достижения цели в один звонок
На основании документов, которые предоставил заказчик составила "Регламент работы оператора контактного центра". Проанализировала лог ответов моделей gpt-4o-mini и gpt-4o, для внесения корректировок в промты
По результатам тестирования внесла изменения в промты, что позволило улучшить ответы
седлова ксения
Учитель начальных классов в декрете
Разработка критериев и шкалы оценивания для тестирования "Выбор наилучших настроек Whisper", "Критерии оценки качества транскрипций", "Критерии оценки модели на этапе “Анализ”
Создание эффективного промпта для оценки разговора оператора по критерию чек-листа "Деловой стиль общения"
писаревский станислав
Разрабатывает сайты на Тильде на заказ
Разработка кода асуммаризации диалогов и определения темы звонка
Участие в разработке модуля определения стандартов делового общения
бочаров александр
Эксперт-маркетолог, специалист по нейросетям
Участие в транскрибации аудиозаписей, их тестирования (100 единиц), с 10 вариантами в каждом по 2 условиям (корректность и полнота)
Разработка кода для автоматизированной и объективной числовой оценки результатов транскрибирования аудиофайлов
Участие в оформлении презентации
Юмангулов руслан
Проектная занятость
Разработка коллаба, в котором продемонстрирована работа альтернативного подхода
Создание тренажёра-симулятора для операторов колл-центра, с возможностью настройки характеристик клиента или "боли" обращения для точечной отработки методик
Сбор данных при организации полного цикла диалога между нейро-клиентом и нейро-оператором, для отработки новых стратегий, гипотез которые в перспективе могут качественно улучшить клиентский опыт
Обоснование возможности создания нейро-оператора, который придет на смену человеку
мазан татьяна
внутренний аудитор
Определение тональности диалога по 5-ти бальной шкале между оператором колл-центра и клиентом с помощью LLM модели , а также пояснение моделью по какой причине была назначена та или иная оценка
Тестирование правильности оценивания тональности LLM моделью на эталонных и тестовых диалогах
Участие в тестировании итоговой модели транскрибации Whisper large
симонова екатерина
специалист по кодированию мед данных
Составление сводной таблицы этапов анализа на основе требований технического задания и пунктов чек-листа
Создание структурированных промптов для пунктов чек-листа
Проведение тестирования и корректировки промптов, адаптирование для работы с реальными диалогами
серяков николай
Туристическая деятельность. Закончил Московский физико-технический институт
Оценка качества транскрибации модели Whisper Large в зависимости от параметров
Разработка промпта по нахождению критических нарушений в диалогах, тестирование его на большом количестве диалогов