Создание ИИ-систем для российского стримингового сервиса сериалов и фильмов
Мы разработали два рабочих прототипа (MVP) для онлайн-кинотеатра. Первый — интеллектуальная compliance-система, которая в реальном времени «вырезает» из видео объекты, запрещённые законодательством, без видимых артефактов. Второй — умная рекомендательная система, которая анализирует поведение пользователя и предлагает фильмы и сериалы с высокой персонализацией.
Клиент
Российский стриминговый сервис сериалов и фильмов.
Задача
Бизнесу было нужно:
-
проверить, работают ли современные ML-подходы на реальных данных заказчика, без дорогостоящей интеграции в основной продукт;
-
снизить риски: не тратить миллионы на внедрение «вслепую».
Техническая задача
Отобрать лучшие модели, построить пайплайны обработки данных и собрать демо-прототипы, которые наглядно покажут результат.
Оказанные услуги
-
Аналитика и проектирование. Изучили системный контекст, данные и подготовили техзадания на MVP (Minimum Viable Product — минимально жизнеспособный продукт, ранняя версия продукта с базовым набором функций для тестирования бизнес-гипотез)
-
Подготовка инфраструктуры. Развернули среду для разработки, обучения и запуска обеих систем.
-
Разработка MVP. Создали и обучили модели для compliance-фильтрации (фильтр-контроля) видео и для рекомендаций.
-
Демо и отчёт. Показали заказчику работающие прототипы на его данных с полной документацией.
Решение
1. Решение для сompliance-системы (удаление нежелательных объектов из видео)
Гипотеза
Если объединить нейросетевую сегментацию (YOLOv8 + SAM) и алгоритмы видео-инпейнтинга (метод редактирования видео — ProPainter и аналоги), мы сможем автоматически находить и убирать запрещённые объекты в каждом кадре. При этом фон восстановится без «мерцания» и заметных следов правки.
Почему именно так
Ручной монтаж видео — это долго и дорого. Наш конвейер работает автоматически и в реальном времени, соблюдая требования законодательства, но не разрушая зрительский опыт.
2. Решения для рекомендательной системы
Гипотеза
Один алгоритм не справится, нужен ансамбль. Коллаборативная фильтрация + контентные методы + модели последовательностей (последние просмотры) + двухуровневое ранжирование. Первый уровень генерирует кандидатов, второй — ранжирует их с учётом истории и признаков пользователя.
Почему именно так
Ручные плейлисты не масштабируются, а простые алгоритмы дают низкую релевантность. Наш подход увеличивает полноту, точность и устойчивость рекомендаций, а значит удерживает зрителя.
Результат
Заказчик получил два работающих прототипа, которые:
- используют реальные данные клиента;
- демонстрируют работу ML-моделей «вживую»;
- готовы к тестированию без интеграции в продакшен.
Бизнес-эффект
Главный бизнес-результат — снижение рисков.
Проект позволил заказчику:
-
проверить гипотезы на реальных данных;
-
оценить качество моделей до финальных инвестиций;
-
понять, как технологии будут работать именно в их экосистеме (без дорогостоящей интеграции).
ROI подхода
Ошибки и доработки обошлись бы в десятки раз дороже после внедрения в live-системы. MVP-этап окупил себя уже тем, что исключил неверные архитектурные решения и подтвердил эффективность выбранных моделей.
Технологии
Для рекомендаций: ALS, LightFM, TF-IDF + косинусная близость, Sarsrec, Bert4rec, two-tower (DSSM).
Для удаления объектов из видео: deepfillv2-pytorch, lama, QIE-Object-Remover-Bbox, Person_remover, YOLO-seg, Segment Anything Model (SAM).