Как Data Science помогает бизнесу

Как Data Science помогает бизнесу


Автор
Денис
Денис

Развитие бизнеса требует проверки сотен гипотез и взаимосвязанных факторов. Data Science – наука о данных, которая помогает анализировать большие объемы информации, извлекать из них полезные знания и на их основе предпринимать действия для улучшения бизнеса.

Data Science использует инструменты машинного обучения (Machine Learning, ML) и Big Data – комплекс технологий сбора, хранения, обработки, анализа данных. Специалиста в этой области называют data scientist, а массивы данных, с которыми он работает – это Data Set. 

Можно сказать, что Data Science – это наука на стыке математики, программирования, аналитики и даже лингвистики.

Как это работает

Специалист по машинному обучению - data scientist - разрабатывает алгоритм, который на основе данных прогнозирует и моделирует тенденции, поведение, закономерности. Параметры алгоритма определяются автоматически на основе данных. 

Если объяснить простыми словами, алгоритм – это вычисление значения по заранее известной формуле, например, у=5х+2. 

В Data Science формула не известна заранее, а выводится на основе полученных данных. Например, алгоритм может показывать, как меняется продуктивность человека в течение рабочего дня и от каких факторов это зависит. 

Data – это данные и факты

Допустим, у нас есть задача: составить график работы операторов колл-центра, который работает 24 часа в сутки. 

Понятно, что ночью входящих звонков в разы меньше, чем днем, поэтому на смену нужно поставить меньше сотрудников. Однако это не единственный фактор, который требуется учесть. Что еще нужно будет ввести в систему:

  1. Среднее количество входящих звонков в каждый из дней недели, месяцев, времен года (летом, например, их будет меньше из-за поры отпусков).

  2. Распределение звонков в течение суток.

  3. Количество операторов, график их отпусков, положенные по закону 2 выходных в неделю.

  4. Географию расположения клиентов данной службы техподдержки (например, когда в Москве ночь, во Владивостоке – день)

  5. Прочие данные, например, заработная плата сотрудников.

Самообучаемые системы позволяют не просто механически строить график, но учитывать все изменения данных и регулярно его оптимизировать.

Science – это анализ и обработка данных

Как это может помочь в бизнесе

Напрямую, причем с пользой как для продавца, так и для покупателя. Самый простой и яркий пример – таргетированная реклама в поисковых машинах. Google основывается не только на запросах в поисковой строке, но и на перемещениях пользователя (например, видя, что человек часто заходит в Starbucks, начнет показывать рекламу кофе и кофеен), его общению в сети, активности в социальных сетях и т.д.

Многие компании успешно используют Data Science в своей деятельности.

Netflix на основе анализа поведения своих подписчиков рекомендует им индивидуальную подборку потенциально интересных фильмов и сериалов, причем «обложка» контента создается для каждого зрителя персонально.

YouTube также ежедневно обрабатывает миллиарды единиц данных по миллионам параметров и создает персонализированные рекомендации для пользователей.

Target – сеть американских супермаркетов присылает покупателям персонализированные скидочные купоны, основываясь на истории их покупок и анализе поведения.

Даже на государственном уровне уже есть предложения использовать нейросеть в политике и социальных проектах.

Data Science и мифы

Если высокие технологии и машинное обучение настолько перспективны, почему еще не все предприниматели ими пользуются? Потому что верят вредным мифам:

Миф №1:

Искусственный интеллект (ИИ) непредсказуем, ему нельзя доверять.

На самом деле:

Программы действуют в заданных рамках, они лишь предлагают решения, а анализируют и применяют их живые люди. При этом факторы, которые влияют на решение, обычно можно определить и интерпретировать. Таким образом, решение ИИ предсказуемо, ему можно доверять.


Миф №2:

Алгоритмы ничего не могут дать бизнесу.

На самом деле:

Конечно, могут, и выше мы это показали на конкретных кейсах.


Миф №3:

Машинный подход и Data Science – это дорого.

На самом деле:

Не дороже, чем оплата работы штата профессиональных аналитиков. При этом алгоритмы будут работать 24/7, а не 8 часов в день.


Миф №4:

Если всю работу будет выполнять ИИ, люди станут не нужны.

На самом деле:

Да, некоторые профессии могут полностью исчезнуть (например, оператор техподдержки). Но появятся новые, связанные с созданием, обработкой и улучшением алгоритмов, а также масса сопутствующих профессий.


Миф №5:

Для работы Искусственного интеллекта нужны данные (datum), а их неоткуда взять.

На самом деле:

Качественная CRM предоставляет все необходимые данные, особенно, если ее вести хотя бы 2-3 года.

Биг Дата и бизнес

Приведенные выше примеры показывают: самое простое, что может дать применение Data Science – это, как минимум, создание персонализированных рекомендаций. Даже эта малость ведет к увеличению прибыли, ведь:

  • Клиент получает полезную информацию, а не раздражающую рекламу, у него повышается мотивация и уровень лояльности.

  • При этом повышаются шансы, что покупатель воспользуется рекомендациями.

  • Компания может эффективнее управлять складом, контролировать остатки и планировать закупки.

И это только верхушка айсберга.

Пример

В SimbirSoft мы разрабатываем решения на основе Big Data для разных сфер бизнеса. Один из последних кейсов – разработка системы, рассчитывающей вероятность и частоту обращения за медицинской помощью клиента страховой компании.

Мы принимали в расчет возраст и пол пациента, а также поставленные ему ранее диагнозы, назначенные процедуры и историю обращений. Кроме этих статистических данных нам требовался также перечень эпизодов, возникающих для каждого отдельного клиента, с указанием времени, типа услуги, вида лечения и т.д. То есть мы подошли к проблеме сразу с двух сторон, чтобы получить точный прогноз. При этом важно понимать, что некоторые эпизоды происходили раньше, чем пациент стал клиентом страховой, часть информации не попала в базу, поскольку человек не обращался к врачу (обращался в частном порядке или в государственную поликлинику). Это нужно учитывать при цензурировании данных.

Для работы с таким массивом подходит метод «анализа выживаемости», созданный специально для обработки цензурированных данных. С его помощью мы смогли точнее прогнозировать для каждого пациента наступление следующего эпизода, с определением его типа и времени.

Подводя итоги

Внедрение искусственного интеллекта и работы с Big Data во всех отраслях бизнеса – это только вопрос времени. Крупные компании уже занимаются обработкой данных и созданием алгоритмов. Например, банкам и страховым организациям жизненно важно адекватно оценивать риски и прогнозировать события, не говоря уже о самом простом использовании Data Science – создании персонализированных рекомендательных систем и повышении лояльности клиентов.

Познакомьтесь с нашими решениями Data Science и другими кейсами в портфолио.

Почувствуйте наш подход и повторите
успех наших клиентов

Напишите нам
МАКСИМ БЕЛЯКОВ
МАКСИМ БЕЛЯКОВ
СЕРГЕЙ ИСАКОВ
СЕРГЕЙ ИСАКОВ