SicmtCaptchaParser — автоматизация обхода капчи и парсинга данных

Скрипт, который умеет “думать как человек”: сам заходит на сайт, разгадывает капчу, получает нужные данные и возвращает результат в удобном виде.

SicmtCaptchaParser — автоматизация обхода капчи и парсинга данных

Задача

Сайт sicmt.ru защищён капчей и не позволяет выполнять автоматические запросы. Клиенту нужно было получать данные о транспортных средствах без участия оператора. Основная цель — создать систему, которая обходит капчу, делает запрос и возвращает результат в JSON.

  • Автоматический ввод госномера.
  • Распознавание и ввод капчи.
  • Парсинг результатов поиска и скачивание PDF.
  • Работа через API и прокси-сервера.
Распознавание капчи Sicmt.ru

Как это реализовано

Программа написана на Python и объединяет несколько технологий:

Selenium / Playwright
OpenCV + Tesseract OCR
FastAPI
AsyncIO
ThreadPoolExecutor

Система эмулирует действия пользователя: открывает страницу, сохраняет изображение капчи, распознаёт её и вводит правильный ответ. После успешной проверки — извлекает данные и формирует JSON-ответ.

Автоматизация процесса распознавания и парсинга

Надёжность и масштабируемость

Программа устойчива к изменениям на сайте: если формат капчи меняется — обновляется фильтр обработки. Также реализована работа через прокси и логирование всех действий. Это позволяет обслуживать до 5 пользователей в минуту без задержек.

FastAPI REST API для SicmtCaptchaParser

Результат

Готовая система полностью автоматизировала процесс: теперь данные с sicmt.ru получаются без ручного ввода, PDF-файлы скачиваются автоматически, а ответ возвращается в JSON. Благодаря интеграции через FastAPI решение легко подключается к другим системам заказчика.

Поддерживается кэширование, прокси, нейросетевое распознавание и асинхронная загрузка — всё для стабильной и быстрой работы.

Результат работы SicmtCaptchaParser
← Назад ко всем кейсам