Разработка и внедрение системы, которая автоматически собирает и обрабатывает прайс-листы и каталоги поставщиков, нормализует наименования, объединяет дубли и формирует единый структурированный набор данных. Результат выгружается в корпоративные шаблоны (Excel/БД) и готов к дальнейшему использованию во внутренних процессах.
Для чего был нужен проект
- Единая нормализованная витрина данных (табличная структура) с консолидацией дублей
- Выгрузки Excel по корпоративному шаблону (включая свод и журнал изменений)
- Реляционная база данных/хранилище для интеграции с внутренними системами
- Отчеты о качестве нормализации и покрытии словарями; логи обработки и возможность отката изменений
- Итоговые презентационные материалы (демо-витрины, сводные листы) для передачи заказчику
Проект призван повысить эффективность подготовки коммерческих и закупочных материалов: сократить ручной труд при сведении разнородных источников,уменьшить ошибки в наименованиях и спецификациях, ускорить цикл согласования и последующей аналитики. Система обеспечивает единый словарь нормализации, прозрачные логи операций и быструю выгрузку в согласованные форматы, что повышает качество данных и скорость работы смежных подразделений.
- Каталоги и прайс-листы поставщиков в форматах PDF, DOCX, XLS/XLSX, CSV; изображения (JPG/PNG) для OCR
- Внутренние справочники синонимов и правил нормализации номенклатуры
- Исторические выгрузки и эталонные корпоративные шаблоны (для проверки консистентности)