Задача
Финансовая группа обрабатывала вручную около 50 000 документов в месяц — счета, акты, договоры. Каждый документ проверял оператор: соответствие шаблону, реквизиты, подписи, печати.
Что сделали
- OCR на Tesseract + кастомный pre-processing для русского документооборота
- NLP-классификатор типов документов и извлечение сущностей (даты, суммы, ИНН)
- Бизнес-правила для проверки соответствия и обнаружения аномалий
- Человек-в-контуре для редких и пограничных случаев (5–8% документов)
- Audit log всех решений и действий пользователей с ролевой моделью
Результат
- 12 000+ человеко-часов экономии в год
- 92% документов обрабатываются полностью автоматически
- SLA 99.95% — простой за год менее 4 часов
- Время обработки документа — с 8 минут вручную до 12 секунд автоматически
Стек
Python, FastAPI, OpenCV, Tesseract, spaCy, scikit-learn, PostgreSQL, AWS (с миграцией на Яндекс.Облако в 2026).
Стек проекта
Частые вопросы про этот кейс
Можно ли сделать похожий проект для нашей компании?
Да. Стандартный путь: дискавери (1–2 недели) → оценка → договор → старт. Если у вас задача из той же индустрии (Fintech) — у нас уже есть готовые playbook'и, экономим ~20% бюджета.
Сколько стоил этот проект?
Конкретные цифры под NDA. Похожие проекты в подобной сложности — в диапазоне рыночных оценок на странице соответствующей услуги.
Что было самым сложным?
Распознавание и проверка документов с OCR, NLP и человек-в-контуре. SLA 99.95%. — это итоговая картина. На пути встречались архитектурные компромиссы, которые мы готовы детально разобрать на дискавери под ваш проект.
С какими интеграциями работали?
Стек: python. Полный список интеграций — под NDA, готовы обсудить релевантные вашему проекту на встрече.
Можем ли мы пообщаться с клиентом из этого кейса?
На этапе финальных переговоров — да, при согласии клиента. Стандартно проводим короткий reference-call с CTO или PO.