Разработка продуктов на базе Data Science и Machine Learning
- Обнаружение факторов, которые влияют на качество продукта
- Предсказание отказов оборудования
- Снижение процента брака
- Составление расписания для обслуживания и отладки техники
- Оптимизация производства для максимального объема выпуска продукта
- Прогнозирование объема покупки и продажи облигаций
- Предупреждение о возможном банкротстве
- Определение суммы возмещения или кредита
- Оценка платежеспособности
- Обнаружение и предупреждение мошенничества, утечки данных
- Управление ценообразованием
- Определение товаров-индикаторов (KVI)
- Управление товарными запасами
- Анализ уровня лояльности к компании
- Прогноз спроса на товары и услуги
- Упрощение регистрации клиента
- Постановка диагноза на основании симптомов заболевания
- Выявление маркеров, которые провоцируют болезнь
- Определение склонности к заболеванию
- Составление рекомендаций и выписка рецепта для лечения
- Прогнозирование действий покупателей
- Определение результативности рекламных кампаний и эффективности каналов
- Оценка спроса на продукт
- Прогнозирование и предупреждение оттока клиентов
- Составление персональных предложений на основе интересов клиента
- Оптимизация маршрутов и сокращение количества транспорта
- Предупреждение о возможных рисках для предотвращения сбоев в поставках
- Прогноз по заполняемости складских помещений
- Расчет стоимости перевозки с большим количеством переменных
- Прогноз эффективности перевозок
Полный цикл разработки Data Science
Более 30 специалистов: Data-аналитики, Data-инженеры, Data Scientist, DBA-администраторы, ML-инженеры. Работа с вашим железом — RFID-сканер, 3D-сканер, фото и видеокамера, медицинские приборы и другие.
Например, прогноз возможного простоя на предприятии, загруженности дорог, потенциального спроса на товар и т.д.
Например, распознавание лиц, создание рекомендательных систем для пользователей (фильмов, музыки), контроль остатков на складе, планирование закупок и т.д
Варианты сотрудничества
Отдельные специалисты или готовая команда под ваше управление на полный рабочий день.
- Data-аналитик
- Data-инженер
- Data Scientist
- Database- администратор
- ML-инженер
Полный цикл создания продукта — управление, разработка, тестирование, внедрение.
Передача исключительных прав на разработанное ПО после завершения проекта.
Почему с нами выгодно
Продукт клиента — инновационная система, предназначенная для учёта сырья в области лесной промышленности. Он обратился к нам за разработкой мобильного приложения на Android в рамках единой системы, которая также включает базу данных и web-сервер с интерфейсной частью. Перед нами стояла задача спроектировать основные бизнес-процессы на лесопроизводстве, а также разработать и внедрить в приложение алгоритмы машинного обучения. Их цель — учёт стоячего и спиленного леса («пиловочника») с измерением диаметра стволов деревьев по фото с точностью до сантиметра.
В рамках проекта было необходимо реализовать:
- MVP мобильного приложения.
- Бэкенд для мобильного приложения.
- Синхронизацию данных между бэкендом и мобильным приложением.
- Распознавание диаметра деревьев и пиловочника с помощью машинного обучения.
- Чтение и запись RFID-меток, а также взаимодействие с RFID-сканером.
Наш клиент — крупная американская компания, работающая на рынке более 40 лет. Она развивает несколько IT-сервисов для сбора информации о генеалогическом древе семьи, обработки архивных документов и фотографий. В рамках проекта нам было необходимо извлечь из большого массива данных информацию о свадьбах.
Для решения задачи мы разработали алгоритм машинного обучения, который помогает определить, есть ли на конкретной странице объявления о свадьбах, и классифицировать полученную информацию: дату события, имена невесты, жениха и гостей, место проведения церемонии, локацию медового месяца и другие данные, которые помогают подписчикам сервиса в составлении своего генеалогического древа.
Вместе с партнером мы уже разработали 8 важных продуктовых проектов и продолжаем сотрудничество по другим задачам. Наши разработки легли в основу корпоративного стандарта компании клиента.
Программное обеспечение предсказывает и предотвращает различные негативные инциденты на 600+ серверах инфраструктуры заказчика, выявляя аномалии при анализе логов.
Остановка сервиса имеет значительный экономический эффект в несколько тысяч долларов за час простоя.
В рамках проекта:
- Определены паттерны поведения логов, по ним построены аналитические модели.
- Стало возможно предсказать любые инциденты на серверном массиве за 10-15 минут до их наступления и предупредить персонал.
Система агрегирует данные из различных источников в заданном пользователем формате, сопоставляет информацию и выдает консолидированный результат. Программное обеспечение сочетает в себе возможности ETL (Extract-Transform-Load) платформ с подходом, основанном на моделях данных.
В рамках проекта:
- Разработан механизм трансформации большого объема данных в единую структуру.
- Разработаны UI-элементы для отображения BigData.
Система подбирает квартиры с учетом мест работы и учебы членов семьи, а также анализирует время в пути, пробки и общественный транспорт. Дополнительно мы отобразили на карте инфраструктуру в пешей доступности: магазины, банкоматы, парковки, школы, сервисы.
Программное обеспечение помогает риелторской компании удерживать клиентов и быстрее закрывать сделки. Кроме того, мы автоматизировали систему сбора информации о домах — данные автоматически попадают в CRM, и риэлтор тратит время на клиентов и продажу услуг, а не на бумажную работу.
Система предсказывает стоимость квартир и сроки их продажи. Алгоритм машинного обучения анализирует среднюю стоимость квартиры на рынке и показывает ее пользователю. Он может выбрать рекомендуемую стоимость или назначить свою — тогда система рассчитает новый прогнозируемый срок продажи. Чем выше цена — тем дольше продажа.
Мы внедрили систему в работу портала недвижимости. За время ее использования отток пользователей портала сократился. Погрешность предсказаний системы всего 4%.
Разработан парсер данных с 20+ электронных торговых площадок. Информация собирается по расписанию с веб-страниц, а также автоматически определяется возможность взаимодействия с площадками с помощью API (SOAP, REST). Запуск и управление парсером осуществляется через HTTP запросы.
Особенности проекта:
- Высокие требования к полноте и качеству собираемых данных.
- Валидация структуры сайта на предмет изменения верстки перед началом сбора данных.
- Парсинг данных по запросу, в режиме реального времени по заданному фильтру на все площадки.
- Без пользовательского интерфейса, только backend.
Разработана концепция SaaS-сервиса вычислений объемов на основе облака точек. Система сканирует объем кузова пустого и загруженного транспортного средства. Сканеры передают в систему облако точек, а затем алгоритм машинного обучения строит и рассчитывает объем сыпучего груза.
Результат — SaaS продукт, который будет работать с любыми сканерами.
Особенности проекта:
- Сканер может настраивать плотность, цветность точек.
- Интеграция с основными форматами сканеров.
- 1 сканирование — 100 МБит ориентировочно.
- 1 сканирование 10 — 100 млн точек ориентировочно.