En
Проекты Вакансии Блог

Создание ИТ-системы обработки данных для генеалогической сферы

Проектирование, разработка и поддержка внутренней автоматизированной системы для создания конфигурируемых и production-ready конвейеров обработки больших данных с интеграцией моделей машинного обучения. 

Решение обеспечивает масштабируемость, отказоустойчивость и управление полным жизненным циклом данных — от загрузки и предпроцессинга до инференса и мониторинга.

Клиент

Клиент — компания, которая специализируется на генеалогических исследованиях, обработке и предоставлении доступа к историческим архивным данным.

Задача

Перед командой SimbirSoft стояли следующие задачи:

  • Минимизировать ошибки в процессах интеграции ML-моделей,

  • Снизить ручной труд,

  • Сократить время вывода моделей ML в промышленную эксплуатацию (Time-To-Market),

  • Масштабировать инфраструктуру,

  • Организовать мониторинг и механизмы оповещений.

100 млн
Количество обрабатываемых изображений
90%
Сокращение времени на развертывание новых моделей

Решение

Минимизация ошибок в процессах интеграции ML-моделей

Разработаны шаблоны для генерации конвейеров обработки данных. Использовали Docker-контейнеры для изоляции моделей с разными зависимостями, что снижает риски конфликтов и ошибок развертывания.  Конвейеры проектировались для работы с изображениями и сканами документов и поддерживают высоконагруженные операции: предобработка, OCR и GPU-вычисления.

Снижение ручного труда за счет автоматизации ETL/ML-процессов

Конвейеры построены на базе Python-приложений — это позволяет гибко интегрировать как готовые ML-библиотеки, так и кастомную логику. Такой подход позволил существенно сократить объем ручных операций при обработке данных и работе с моделями.

Уменьшение Time-To-Market

Для сокращения сроков внедрения решений и ускорения разработки реализовали интеграцию с AWS сервисами, включая AWS SageMaker. Применение AWS сервисов обеспечило возможность динамического масштабирования.

Дополнительно организовали мониторинг для отслеживания падений производительности и ошибок обработки. 

Результат

  • Скорость внедрения: Сокращение времени на развертывание новых моделей с недель до часов.

  • Экономия ресурсов: Оптимизация затрат на вычисления за счет автоматического масштабирования в AWS.

  • Надежность: Отказоустойчивость при обработке миллионов изображений

Также благодаря разработанной автоматизированной системе создания ML конвейеров, мы приняли участие в разработке ML решения для извлечения данных из исторических рукописных текстов.

Разработка ИТ-системы обработки данных для международной компании
Читать подробнее
snippet

Трудности

В процессе реализации проекта команда успешно справилась с возникшими проблемами, связанными с повышенной сложностью интеграции кастомных ML-моделей при отсутствии общепринятых стандартов.

Технологии

  • AWS (SQS, SNS, EC2, Lambda, S3, Sagemaker, ASG и тд)

  • Python

  • Terraform

  • Jenkins

  • Docker

  • Harness

  • BentoML


Хотите узнать подробнее об услуге, оставьте заявку прямо сейчас!
Оставить заявку
snippet
Другие работы
Создание приложения управления сном для компании «Аскона»
Создание единой системы авторизации для крупной российской компании
Анализ процессов крупной производственной компании
Разработка мобильного приложения для Подели
Усиление команды по разработке системы управления грузоперевозками для компании «ТЕХНОНИКОЛЬ»
Автоматизация финансовой аналитики для «МК Лизинг»
Разработка корпоративного портала для обучения сотрудников крупной технологической компании
Развитие приложения Askona Sleep для компании «Аскона»
Создание приложения управления сном для компании «Аскона»
Создание единой системы авторизации для крупной российской компании
Анализ процессов крупной производственной компании
Разработка мобильного приложения для Подели
Усиление команды по разработке системы управления грузоперевозками для компании «ТЕХНОНИКОЛЬ»
Автоматизация финансовой аналитики для «МК Лизинг»
Разработка корпоративного портала для обучения сотрудников крупной технологической компании
Развитие приложения Askona Sleep для компании «Аскона»
Оставьте заявку на проект
Оставьте контакты, чтобы обсудить проект и условия сотрудничества, или позвоните: 8 800 200-99-24
Прикрепить файл до 10Мб
Файл выбран
Можно прикрепить один файл в формате: txt, doc, docx, odt, xls, xlsx, pdf, jpg, jpeg, png.

Размер файла до 10 Мб.
Написать нам
Оставьте контакты, чтобы обсудить проект и условия
сотрудничества, или позвоните: 8 800 200-99-24
Прикрепить файл до 10Мб
Файл выбран
Можно прикрепить один файл в формате: txt, doc, docx, odt, xls, xlsx, pdf, jpg, jpeg, png.

Размер файла до 10 Мб.
Оставьте свои контакты
SimbirSoft регулярно расширяет штат сотрудников.
Отправьте контакты, чтобы обсудить условия сотрудничества.
Прикрепить резюме, до 10 Мб
Файл выбран
Можно прикрепить один файл в формате: txt, doc, docx, odt, xls, xlsx, pdf, jpg, jpeg, png.

Размер файла до 10 Мб.
Написать нам
Расскажите, какие задачи сейчас на вашем проекте.
Проконсультируем и предложим подходящих специалистов, а также сориентируем по ставкам на аутстаф.
Направление
Количество специалистов
Middle
TeamLead
Senior
TechLead
Прикрепить файл до 10Мб
Файл выбран
Можно прикрепить один файл в формате: txt, doc, docx, odt, xls, xlsx, pdf, jpg, jpeg, png.

Размер файла до 10 Мб.
Экспресс-консультация
Заполните все поля формы.
Эксперт свяжется с вами в течение рабочего дня.
Тематика
Прикрепить файл до 10Мб
Файл выбран
Можно прикрепить один файл в формате: txt, doc, docx, odt, xls, xlsx, pdf, jpg, jpeg, png.

Размер файла до 10 Мб.
Порекомендуйте друга — получите вознаграждение!
  • iOS-разработчик
  • DevOps-Инженер
  • 1С-аналитик
  • Разработчик на C++
  • 1С-разработчик
  • Разработчик Битрикс 24
  • Flutter-разработчик
  • QA Automation (Java)
  • Team Lead Data scientist
  • QA automation Java (мобильные приложения)
  • SRE-Инженер
  • SQL разработчик
  • Инженер в нагрузочном тестировании
  • QA Engineer Fullstack (Java/Kotlin)
  • Бухгалтер по расчету заработной платы
  • Data Scientist (NLP)
  • 1С-аналитик ERP.УХ
  • QA manual (1C)
  • DWH архитектор
Прикрепить резюме, до 10Мб
Файл выбран
Можно прикрепить один файл в формате: txt, doc, docx, odt, xls, xlsx, pdf, jpg, jpeg, png.

Размер файла до 10 Мб.
Заказать демонстрацию
Оставьте контакты, чтобы обсудить проект и условия
сотрудничества, или позвоните: 8 800 200-99-24
Прикрепить файл до 10Мб
Файл выбран
Можно прикрепить один файл в формате: txt, doc, docx, odt, xls, xlsx, pdf, jpg, jpeg, png.

Размер файла до 10 Мб.