Создание ИТ-системы обработки данных для генеалогической сферы

Проектирование, разработка и поддержка внутренней автоматизированной системы для создания конфигурируемых и production-ready конвейеров обработки больших данных с интеграцией моделей машинного обучения.

Решение обеспечивает масштабируемость, отказоустойчивость и управление полным жизненным циклом данных — от загрузки и предпроцессинга до инференса и мониторинга.

Клиент

Клиент — компания, которая специализируется на генеалогических исследованиях, обработке и предоставлении доступа к историческим архивным данным.

Задача

Перед командой SimbirSoft стояли следующие задачи:

Минимизировать ошибки в процессах интеграции ML-моделей,
Снизить ручной труд,
Сократить время вывода моделей ML в промышленную эксплуатацию (Time-To-Market),
Масштабировать инфраструктуру,
Организовать мониторинг и механизмы оповещений.

100 млн

Количество обрабатываемых изображений

90%

Сокращение времени на развертывание новых моделей

Решение

Минимизация ошибок в процессах интеграции ML-моделей

Разработаны шаблоны для генерации конвейеров обработки данных. Использовали Docker-контейнеры для изоляции моделей с разными зависимостями, что снижает риски конфликтов и ошибок развертывания. Конвейеры проектировались для работы с изображениями и сканами документов и поддерживают высоконагруженные операции: предобработка, OCR и GPU-вычисления.

Снижение ручного труда за счет автоматизации ETL/ML-процессов

Конвейеры построены на базе Python-приложений — это позволяет гибко интегрировать как готовые ML-библиотеки, так и кастомную логику. Такой подход позволил существенно сократить объем ручных операций при обработке данных и работе с моделями.

Уменьшение Time-To-Market

Для сокращения сроков внедрения решений и ускорения разработки реализовали интеграцию с AWS сервисами, включая AWS SageMaker. Применение AWS сервисов обеспечило возможность динамического масштабирования.

Дополнительно организовали мониторинг для отслеживания падений производительности и ошибок обработки.

Результат

Скорость внедрения: Сокращение времени на развертывание новых моделей с недель до часов.
Экономия ресурсов: Оптимизация затрат на вычисления за счет автоматического масштабирования в AWS.
Надежность: Отказоустойчивость при обработке миллионов изображений

Также благодаря разработанной автоматизированной системе создания ML конвейеров, мы приняли участие в разработке ML решения для извлечения данных из исторических рукописных текстов.

Разработка ИТ-системы обработки данных для международной компании

Читать подробнее

Трудности

В процессе реализации проекта команда успешно справилась с возникшими проблемами, связанными с повышенной сложностью интеграции кастомных ML-моделей при отсутствии общепринятых стандартов.

Технологии

AWS (SQS, SNS, EC2, Lambda, S3, Sagemaker, ASG и тд)
Python
Terraform
Jenkins
Docker
Harness
BentoML

Хотите узнать подробнее об услуге, оставьте заявку прямо сейчас!

Оставить заявку

Другие работы

Создание приложения управления сном для компании «Аскона»

Создание единой системы авторизации для крупной российской компании

Анализ процессов крупной производственной компании

Разработка мобильного приложения для Подели

Усиление команды по разработке системы управления грузоперевозками для компании «ТЕХНОНИКОЛЬ»

Автоматизация финансовой аналитики для «МК Лизинг»

Разработка корпоративного портала для обучения сотрудников крупной технологической компании

Развитие приложения Askona Sleep для компании «Аскона»

Создание приложения управления сном для компании «Аскона»

Создание единой системы авторизации для крупной российской компании

Анализ процессов крупной производственной компании

Разработка мобильного приложения для Подели

Усиление команды по разработке системы управления грузоперевозками для компании «ТЕХНОНИКОЛЬ»

Автоматизация финансовой аналитики для «МК Лизинг»

Разработка корпоративного портала для обучения сотрудников крупной технологической компании

Развитие приложения Askona Sleep для компании «Аскона»

Оставьте заявку на проект

Оставьте контакты, чтобы обсудить проект и условия сотрудничества, или позвоните: 8 800 200-99-24

Имя или организация

Телефон или Email

Расскажите про проект

Прикрепить файл до 10Мб

Файл выбран

Можно прикрепить один файл в формате: txt, doc, docx, odt, xls, xlsx, pdf, jpg, jpeg, png.

Размер файла до 10 Мб.

Нажимая на кнопку «отправить», я даю Согласие на обработку персональных данных. Подробнее об обработке в Политике защиты и обработки персональных данных АО «СимбирСофт»

Проекты

Пригласи друга

Наша история

Услуги

Работа в SimbirSoft

Контакты

Вакансии

О компании

Блог

Наши процессы

Проекты

Услуги

Вакансии

Блог

Пригласи друга

Работа в SimbirSoft

О компании

Наши процессы

Наша история

Контакты

Оставить заявку на услуги

request@simbirsoft.com

Вопросы партнерства и предложений

info@simbirsoft.com

Москва

8 800 200-99-24

Аутстаффинг IT-специалистов IT-аутсорсинг IT-продукт под ключ Искусственный интеллект Frontend-разработка Backend-разработка Разработка 1С на заказ Тестирование и обеспечение качества (QA) SDET (Разработка в тестировании) Техническая поддержка по SLA Jira Service Discovery Phase QA-консалтинг Разработка сайтов и корпоративных порталов Спасение продукта IT-консалтинг Внедрение решений 1С DevOps Бизнес-анализ и системный анализ Внедрение Битрикс Дизайн Разработка мобильных приложений UX-аудит IT-архитектура RPA-разработка Модернизация системы Разработка финансовых методологий Аудит ИТ-инфраструктуры Java JavaScript Bitrix C#/.NET 1С PHP QA iOS Android Go Python SDET

Политика защиты и обработки персональных данных Политика по работе с контрагентами Стоимость предоставления прав использования программы для ЭВМ Linkory Стоимость предоставления прав использования программы для ЭВМ InsuranceSimbirsoft Platform

АО «СимбирСофт» осуществляет следующие виды деятельности в соответствии с перечнем, утвержденным Приказом Минцифры от 11 мая 2023 г. N 449: код 1.01, код 2.01. Стоимость услуг является коммерческой тайной АО «СимбирСофт» и определяется индивидуально по запросу.

АО «СимбирСофт» обладает исключительными правами на следующие программы для ЭВМ:

Linkory. Права использования предоставляются на условиях простой (неисключительной) лицензии по лицензионному договору.
InsuranceSimbirsoft Platform. Права использования предоставляются на условиях простой (неисключительной) лицензии по лицензионному договору.
Cash-meter. Права использования предоставляются на условиях простой (неисключительной) лицензии по лицензионному договору.
ShopChatSimbirsoft Platform. Права использования предоставляются на условиях простой (неисключительной) лицензии по лицензионному договору.
Программа для ЭВМ «Места», «События», «Рекомендательная система», «Лента и стена» и «Настройки» для Russian Place. Права использования предоставляются на условиях простой (неисключительной) лицензии по лицензионному договору

Участники Реестра российского ПО: Linkory. Реестровая запись в едином реестре российских программ для электронных вычислительных машин и баз данных №17988. Права использования предоставляются на условиях простой (неисключительной) лицензии по лицензионному договору. InsuranceSimbirsoft Platform. Реестровая запись в едином реестре российских программ для электронных вычислительных машин и баз данных №12889. Права использования предоставляются на условиях простой (неисключительной) лицензии по лицензионному договору.

АО «СимбирСофт» использует следующие языки программирования, ПО и (или) наборы правил и инструментов, которые используются для разработки ПО или построения процессов в программировании: Python, JavaScript (Node.js), Java, C#, PHP, Go, Ruby, JavaScript, TypeScript, CSS, HTML, Dart (Flutter), JavaScript (React Native), Kotlin (Android), Swift (iOS), С/C++, Встроенный язык 1С, R, SQL, языки специфичные для СУБД (PL/pgSQL для PostgreSQL), NoSQL-запросы.

Проекты

Услуги

Вакансии

Блог

Пригласи друга

Работа в SimbirSoft

О компании

Наши процессы

Наша история

Контакты

Оставить заявку на услуги

request@simbirsoft.com

Вопросы партнерства и предложений

info@simbirsoft.com

Москва

8 800 200-99-24

АО «СимбирСофт» обладает исключительными правами на следующие программы для ЭВМ:

Linkory. Права использования предоставляются на условиях простой (неисключительной) лицензии по лицензионному договору.
InsuranceSimbirsoft Platform. Права использования предоставляются на условиях простой (неисключительной) лицензии по лицензионному договору.
Cash-meter. Права использования предоставляются на условиях простой (неисключительной) лицензии по лицензионному договору.
ShopChatSimbirsoft Platform. Права использования предоставляются на условиях простой (неисключительной) лицензии по лицензионному договору.
Программа для ЭВМ «Места», «События», «Рекомендательная система», «Лента и стена» и «Настройки» для Russian Place. Права использования предоставляются на условиях простой (неисключительной) лицензии по лицензионному договору