SicmtCaptchaParser — автоматизация обхода капчи и парсинга данных
Скрипт, который умеет “думать как человек”: сам заходит на сайт, разгадывает капчу, получает нужные данные и возвращает результат в удобном виде.
Задача
Сайт sicmt.ru защищён капчей и не позволяет выполнять автоматические запросы. Клиенту нужно было получать данные о транспортных средствах без участия оператора. Основная цель — создать систему, которая обходит капчу, делает запрос и возвращает результат в JSON.
- Автоматический ввод госномера.
- Распознавание и ввод капчи.
- Парсинг результатов поиска и скачивание PDF.
- Работа через API и прокси-сервера.
Как это реализовано
Программа написана на Python и объединяет несколько технологий:
Система эмулирует действия пользователя: открывает страницу, сохраняет изображение капчи, распознаёт её и вводит правильный ответ. После успешной проверки — извлекает данные и формирует JSON-ответ.
Надёжность и масштабируемость
Программа устойчива к изменениям на сайте: если формат капчи меняется — обновляется фильтр обработки. Также реализована работа через прокси и логирование всех действий. Это позволяет обслуживать до 5 пользователей в минуту без задержек.
Результат
Готовая система полностью автоматизировала процесс: теперь данные с sicmt.ru получаются без ручного ввода, PDF-файлы скачиваются автоматически, а ответ возвращается в JSON. Благодаря интеграции через FastAPI решение легко подключается к другим системам заказчика.
Поддерживается кэширование, прокси, нейросетевое распознавание и асинхронная загрузка — всё для стабильной и быстрой работы.