Система сбора данных с сайтов объявлений

Программа для сбора данных с сайтов объявлений. Роботы-краулеры имитируют действия пользователя сайта и собирают требуемую информацию. Помимо текстовых данных роботы распознают и информацию с изображений: адреса, номера телефонов.

Результат

Мы внедрили авто тесты для проверки функционала сайтов. Сбор информации на одном ресурсе занимает 3-6 дней. Всего за один день обрабатывалось1 000 000 записей. Поэтому перед запуском тестов нужно проверить, не изменился ли функционал или расположение блоков, чтобы роботы не «потерялись».

10 роботов
разработано
7 месяцев
разработки
90% распознавание данных с изображений

Технологии

Разработка: Scrapy, Spark, Scala, Java, Python, Tesseract.

Инструменты тестирования: XPath, Selenium, PyTest, JSON, request.

Другие работы
Оставьте заявку на проект
Оставьте контакты, чтобы обсудить проект и условия сотрудничества, или позвоните: 8 800 200-99-24
Написать нам
Оставьте контакты, чтобы обсудить проект и условия
сотрудничества, или позвоните: 8 800 200-99-24
Оставьте свои контакты
SimbirSoft регулярно расширяет штат сотрудников.
Отправьте контакты, чтобы обсудить условия сотрудничества.
Экспресс-консультация
Заполните все поля формы.
Эксперт свяжется с вами в течение рабочего дня.
Тематика
Прикрепить файл до 10Мб
Файл выбран
Порекомендуйте друга — получите вознаграждение!
  • Python-paзработчик
  • PHP-разработчик
  • Системный аналитик
  • iOS-разработчик
  • QA Engineer Fullstack (Python)
  • Разработчик на C#
  • Android-разработчик
  • Golang-разработчик
  • Менеджер по привлечению клиентов
  • 1С-аналитик
  • UI/UX дизайнер
  • 1С-разработчик
  • Разработчик DWH
  • Java-архитектор
  • Flutter-разработчик
  • IT-рекрутер
  • Бизнес-аналитик
  • Аналитик DWH
  • Java-разработчик (Kotlin)
  • Scala-разработчик
  • SDET Lead
  • Менеджер по обучению (Skill-мастер)
  • Team Lead
  • Node.js-разработчик
Прикрепить резюме, до 10Мб
Файл выбран