SlideShare una empresa de Scribd logo
1 de 18
Descargar para leer sin conexión
Предсказание увольнения
сотрудников с помощью
больших данных
Case Study
Реальный сектор
Основы бизнеса Яндекса
Дата
центры
Большие
данные
Машинное
обучение
Школа анализа
данных
4
Наша экспертиза
5
Будущее
Описательная
аналитика
Диагностическая
аналитика
Предсказательная
аналитика
Предписывающая
аналитика
Business Intelligence
Прошлое
Партнеры и клиенты в первый год работы
6
Прогнозирование
намерений сотрудников
уволиться
Завершенный проект
Описание проекта
Входные данные
▌  Анонимные данные о более чем
1000 сотрудниках из внутренней БД
за период с 2008 по 2012 год:
›  Общие данные о сотрудниках (пол, возраст, дата выхода на
работу, должность, уровень дохода и т. д.)
›  Отпуска, больничные, отгулы, сверхурочные
›  Образование, тренинги, аттестации
›  Проектная деятельность (проекты, задачи, ошибки и т. д.)
Цель – оценить пригодность технологий и методик компании «Яндекс» в области Big Data и Machine Learning
для решения задач инженерной компании для снижения расходов на поиск и привлечение новых сотрудников.
8
Задача
▌  Построить модель прогнозирования
вероятности увольнения сотрудников и оценить
качество модели
▌  Оценить «вес» различных факторов в связи с
намерением уволиться
Входные данные от заказчика
Основные данные о сотрудниках
▌  Пол, год рождения, дата выхода на работу
▌  Гражданство
▌  Дата увольнения, код причины увольнения
▌  Должность, изменения должности,
форма занятости
▌  Относительный уровень ЗП
▌  Образование, тренинги, уровень знания иностранного языка
▌  Отпуска, больничные, отгулы, сверхурочные
▌  Командировки
▌  Аттестации, квалификация
9
Проектная команда
▌  ID проекта, проектная команда
▌  Структура проектной команды,
проектное направление,
административное подчинение
Задачи, итерации и ошибки
▌  ID задачи, дата задачи, сложность задачи и т. д.
▌  ID ошибки, внешняя/внутренняя ошибка,
ID проверяющего
▌  Итерация, дата начала и дата окончания итерации
Входы в систему
▌  Здание, размер офиса
▌  Время входа, время выхода
Описание модели
▌  Увольнения прогнозировались на 2012 год отдельно для каждого квартала
▌  Использовался буферный период – 1 месяц
▌  Обучающая выборка строилась за период с 2008 года до начала
соответствующего буферного периода
▌  Тип используемой модели – MatrixNet, более 250 факторов
10
Прогнозируемый период
Кол-во
увольнений
за период
Обучающая выборка Буферный период
01.01.2012 – 31.03.2012 ~20 01.01.2008 – 30.11.2011 01.12.2011 – 31.12.2011
Качество модели
▌  Точность прогноза модели
превзошла первоначальные
ожидания заказчика в 5 раз.
▌  Модель устойчива к переобучению
и чувствительна к изменению
поведения сотрудников, т. е.
применима на данных за другие
периоды.
11
Ожидания заказчика
5 из топ-50 за год
Результаты
26 из топ-50 за год
Возможный способ расчета экономического
эффекта
Затраты на поиск сотрудника
▌  Оплата услуг HR-агентства (15% от ЗП)
▌  Снижение производительности в первые 3
месяца. Коэффициент 0,5
▌  Снижение объемов работ на период поиска (3
месяца). Коэффициент 0,5
▌  Оплата тренингов и повышение квалификации
Затраты на удержание сотрудника
▌  Повышение зарплаты на 15-20%
▌  Оплата тренингов и повышение квалификации
сотрудника
▌  Изменение должности
12
Стоимость поиска нового сотрудника
= (3*0,5 + 3*0,5)*ставка + 0,15*12*ЗП
Стоимость удержания сотрудника
= (0.2*12)*ЗП
Пример расчета экономического эффекта
13
Предложение по удержанию	
   +15% ЗП	
  
Отношение ставки к ЗП	
   3,5	
  
ЗП специалиста в месяц, USD	
   2 000,00$	
  
Ставка специалиста, USD в месяц	
   7 000,00$	
  
Стоимость поиска нового сотрудника, USD	
   24 600,00$	
  
Стоимость удержания сотрудника, USD	
   3 600,00$	
  
Текущие затраты	
   Кол-во уволившихся*Стоимость поиска нового сотрудника	
  
Затраты с использованием прогноза	
  
(Кол-во уволившихся-TP)*Стоимость поиска нового сотрудника+(ТP
+FP)*Стоимость удержания	
  
2012 год	
   Кол-во уволившихся	
  
Top-60	
  
Текущие затраты	
   Затраты с использованием прогноза	
   Экономия	
  TP	
   FP	
  
1-й квартал	
   20	
   12	
   48	
   492 000,00$ 	
   412 800,00$ 	
   79 200,00$ 	
  
2-й квартал	
   22	
   7	
   53	
   541 200,00$ 	
   585 000,00$ 	
   -43 800,00$ 	
  
3-й квартал	
   24	
   14	
   46	
   590 400,00$ 	
   462 000,00$ 	
   128 400,00$ 	
  
4-й квартал	
   23	
   14	
   46	
   565 800,00$ 	
   437 400,00$ 	
   128 400,00$ 	
  
Итого:	
    	
    	
    	
   2 189 400,00$ 	
   1 897 200,00$ 	
   292 200,00$ 	
  
Наиболее полезные данные
▌  Изменение роли в проекте
▌  Количество посещенных тренингов,
продолжительность тренингов
▌  Количество отгулов
▌  Больничные
▌  Переработки
▌  Изменение проектного направления
14
Что еще умеет Yandex Data Factory?
▌  Поведенческая аналитика
›  Данные: профили клиентов, транзакции, заказы, история покупок, данные биллинга, click-
stream и т. д.
›  Решения: сегментация, поведенческие паттерны, персонализированные предложения, “next
best offer”, и т. д.
▌  Временные ряды и аномалии
›  Данные: телеметрия, счетчики потребления, исторические данные о событиях
›  Решения: выявление мошенничества, оптимизация технического обслуживания,
предсказание спроса и т. д.
▌  Пространственная (geospatial) аналитика
›  Данные: геолокационные данные, данные о движении транспорта, маршруты и т. д.
›  Решения: оптимизация логистики, управление дорожной сетью, прогнозирование
проходимости магазинов
▌  Распознавание речи, компьютерное зрение
15
Тел: +7 495 739-70-00
Факс: +7 495 739-70-70
yandexdatafactory.com
ydf-customer@yandex-team.ru
119021, Москва
ул. Льва Толстого, 16
Россия
16
Другие применения в
управлении персоналом
Скрининг персонала
Проблема: у заказчика большая филиальная сеть со
значительным количеством линейного персонала,
выполняющего рутинные операции. Для поддержания
эффективности и снижения потерь, вызванных
«человеческим фактором», необходим постоянный
мониторинг.
Данные заказчика
▌  Данные систем контроля доступа
▌  Логи операций (телефонные звонки, чеки, отметки
электронной очереди и т. п.)
▌  Аудиозаписи (для колл-центров)
▌  Данные геолокации для «полевого» персонала
18
Наши технологии
›  Сегментация и микросегментация
›  Выявление поведенческих паттернов
›  Обнаружение аномалий
›  Распознавание речи
Результаты
›  Автоматизированный мониторинг деятельности
линейного персонала
›  Выявление аномалий, данные для оценки
производительности и рисков
Повышение эффективности колл-центра
Проблема: в ходе работы колл-центра накапливаются
терабайты аудиозаписей, которые хранятся, но
используются лишь для разбора конфликтных ситуаций,
менее 1% записей анализируется вручную для контроля
качества обслуживания.
Данные заказчика
▌  Записи разговоров
▌  Скрипты, инструкции, регламенты для операторов
19
Наши технологии
›  Распознавание речи (ограниченный словарь)
›  Распознавание эмоциональной окраски
›  Анализ текстов
Результаты
›  Автоматическая оценка качества работы оператора,
соответствия инструкциям и скриптам, динамики
эмоций звонившего клиента.
Поиск по ключевым словам в разговорах

Más contenido relacionado

La actualidad más candente

Big Data с точки зрения конечного пользователя
Big Data с точки зрения конечного пользователяBig Data с точки зрения конечного пользователя
Big Data с точки зрения конечного пользователяСобака Павлова
 
Применение Big Data в маркетинге
Применение Big Data в маркетингеПрименение Big Data в маркетинге
Применение Big Data в маркетингеEvgeniy Pavlovskiy
 
HR_Scoring_CleverDATA
HR_Scoring_CleverDATAHR_Scoring_CleverDATA
HR_Scoring_CleverDATACleverDATA
 
Big Data в маркетинге. Просто о непонятном: задачи, возможности, реальность
Big Data в маркетинге. Просто о непонятном: задачи, возможности, реальностьBig Data в маркетинге. Просто о непонятном: задачи, возможности, реальность
Big Data в маркетинге. Просто о непонятном: задачи, возможности, реальностьTechart Marketing Group
 
Konstantin Obukhov - Customer Experience Technologies
Konstantin Obukhov - Customer Experience TechnologiesKonstantin Obukhov - Customer Experience Technologies
Konstantin Obukhov - Customer Experience TechnologiesAIST
 
CleverDATA (Denis Reymer) presentation for CNews Forum 2015 (Banking Section)
CleverDATA (Denis Reymer) presentation for CNews Forum 2015 (Banking Section)CleverDATA (Denis Reymer) presentation for CNews Forum 2015 (Banking Section)
CleverDATA (Denis Reymer) presentation for CNews Forum 2015 (Banking Section)CleverDATA
 
Big Data: Как принести пользу Бизнесу
Big Data: Как принести пользу БизнесуBig Data: Как принести пользу Бизнесу
Big Data: Как принести пользу БизнесуDen Reymer
 
Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...
Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...
Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...CleverDATA
 
Давид Вачадзе – BrandMobile – ICBDA 2016
Давид Вачадзе – BrandMobile – ICBDA 2016Давид Вачадзе – BrandMobile – ICBDA 2016
Давид Вачадзе – BrandMobile – ICBDA 2016rusbase
 
Roman styatugin clever_data_cxp_predictive marketing
Roman styatugin clever_data_cxp_predictive marketingRoman styatugin clever_data_cxp_predictive marketing
Roman styatugin clever_data_cxp_predictive marketingCleverDATA
 
Customers segmentation_responce prediction
Customers segmentation_responce predictionCustomers segmentation_responce prediction
Customers segmentation_responce predictionCleverDATA
 
Назначение ставок в контекстной рекламе и "Яндекс.Маркете" в зависимости от к...
Назначение ставок в контекстной рекламе и "Яндекс.Маркете" в зависимости от к...Назначение ставок в контекстной рекламе и "Яндекс.Маркете" в зависимости от к...
Назначение ставок в контекстной рекламе и "Яндекс.Маркете" в зависимости от к...elenae00
 
Machine Learning for Recruitment
Machine Learning for RecruitmentMachine Learning for Recruitment
Machine Learning for RecruitmentDen Reymer
 
Ulmart big data valiotti 25mar
Ulmart big data valiotti 25marUlmart big data valiotti 25mar
Ulmart big data valiotti 25marNikolay Valiotti
 
Big data. Тренды и технологии. Использование в работе с клиентами.
Big data. Тренды и технологии. Использование в работе с клиентами.Big data. Тренды и технологии. Использование в работе с клиентами.
Big data. Тренды и технологии. Использование в работе с клиентами.CleverDATA
 
Oracle big data for finance
Oracle big data for financeOracle big data for finance
Oracle big data for financeCleverDATA
 
Аналитика клиентской базы отдела B2B-продаж: основные понятия
Аналитика клиентской базы отдела B2B-продаж: основные понятияАналитика клиентской базы отдела B2B-продаж: основные понятия
Аналитика клиентской базы отдела B2B-продаж: основные понятияЕвгений Лазо
 
Big Data: О чем думают ваши клиенты?
Big Data: О чем думают ваши клиенты?Big Data: О чем думают ваши клиенты?
Big Data: О чем думают ваши клиенты?Den Reymer
 

La actualidad más candente (20)

Big Data с точки зрения конечного пользователя
Big Data с точки зрения конечного пользователяBig Data с точки зрения конечного пользователя
Big Data с точки зрения конечного пользователя
 
Применение Big Data в маркетинге
Применение Big Data в маркетингеПрименение Big Data в маркетинге
Применение Big Data в маркетинге
 
HR_Scoring_CleverDATA
HR_Scoring_CleverDATAHR_Scoring_CleverDATA
HR_Scoring_CleverDATA
 
Big Data в маркетинге. Просто о непонятном: задачи, возможности, реальность
Big Data в маркетинге. Просто о непонятном: задачи, возможности, реальностьBig Data в маркетинге. Просто о непонятном: задачи, возможности, реальность
Big Data в маркетинге. Просто о непонятном: задачи, возможности, реальность
 
Konstantin Obukhov - Customer Experience Technologies
Konstantin Obukhov - Customer Experience TechnologiesKonstantin Obukhov - Customer Experience Technologies
Konstantin Obukhov - Customer Experience Technologies
 
CleverDATA (Denis Reymer) presentation for CNews Forum 2015 (Banking Section)
CleverDATA (Denis Reymer) presentation for CNews Forum 2015 (Banking Section)CleverDATA (Denis Reymer) presentation for CNews Forum 2015 (Banking Section)
CleverDATA (Denis Reymer) presentation for CNews Forum 2015 (Banking Section)
 
Big Data: Как принести пользу Бизнесу
Big Data: Как принести пользу БизнесуBig Data: Как принести пользу Бизнесу
Big Data: Как принести пользу Бизнесу
 
Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...
Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...
Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...
 
Давид Вачадзе – BrandMobile – ICBDA 2016
Давид Вачадзе – BrandMobile – ICBDA 2016Давид Вачадзе – BrandMobile – ICBDA 2016
Давид Вачадзе – BrandMobile – ICBDA 2016
 
Roman styatugin clever_data_cxp_predictive marketing
Roman styatugin clever_data_cxp_predictive marketingRoman styatugin clever_data_cxp_predictive marketing
Roman styatugin clever_data_cxp_predictive marketing
 
Customers segmentation_responce prediction
Customers segmentation_responce predictionCustomers segmentation_responce prediction
Customers segmentation_responce prediction
 
Назначение ставок в контекстной рекламе и "Яндекс.Маркете" в зависимости от к...
Назначение ставок в контекстной рекламе и "Яндекс.Маркете" в зависимости от к...Назначение ставок в контекстной рекламе и "Яндекс.Маркете" в зависимости от к...
Назначение ставок в контекстной рекламе и "Яндекс.Маркете" в зависимости от к...
 
Machine Learning for Recruitment
Machine Learning for RecruitmentMachine Learning for Recruitment
Machine Learning for Recruitment
 
Ulmart big data valiotti 25mar
Ulmart big data valiotti 25marUlmart big data valiotti 25mar
Ulmart big data valiotti 25mar
 
Big data. Тренды и технологии. Использование в работе с клиентами.
Big data. Тренды и технологии. Использование в работе с клиентами.Big data. Тренды и технологии. Использование в работе с клиентами.
Big data. Тренды и технологии. Использование в работе с клиентами.
 
Ulmart big data v5
Ulmart big data v5Ulmart big data v5
Ulmart big data v5
 
Oracle big data for finance
Oracle big data for financeOracle big data for finance
Oracle big data for finance
 
Аналитика клиентской базы отдела B2B-продаж: основные понятия
Аналитика клиентской базы отдела B2B-продаж: основные понятияАналитика клиентской базы отдела B2B-продаж: основные понятия
Аналитика клиентской базы отдела B2B-продаж: основные понятия
 
Big data must ife
Big data must ifeBig data must ife
Big data must ife
 
Big Data: О чем думают ваши клиенты?
Big Data: О чем думают ваши клиенты?Big Data: О чем думают ваши клиенты?
Big Data: О чем думают ваши клиенты?
 

Destacado

Михаил Кечинов — REES46 — ICBDA 2015
Михаил Кечинов — REES46 — ICBDA 2015Михаил Кечинов — REES46 — ICBDA 2015
Михаил Кечинов — REES46 — ICBDA 2015rusbase
 
Тимур Кузеев — Meta System — ICBDA 2015
Тимур Кузеев — Meta System — ICBDA 2015Тимур Кузеев — Meta System — ICBDA 2015
Тимур Кузеев — Meta System — ICBDA 2015rusbase
 
Кирилл Чистов — Data-Centric Alliance — ICBDA 2015
Кирилл Чистов — Data-Centric Alliance — ICBDA 2015Кирилл Чистов — Data-Centric Alliance — ICBDA 2015
Кирилл Чистов — Data-Centric Alliance — ICBDA 2015rusbase
 
Роман Постников — «Мегафон» — ICBDA 2015
Роман Постников — «Мегафон» — ICBDA 2015Роман Постников — «Мегафон» — ICBDA 2015
Роман Постников — «Мегафон» — ICBDA 2015rusbase
 
Николай Птицын — Synesis — ICBDA 2015
Николай Птицын — Synesis — ICBDA 2015Николай Птицын — Synesis — ICBDA 2015
Николай Птицын — Synesis — ICBDA 2015rusbase
 
Александр Фонарев — Rubbles — ICBDA 2015
Александр Фонарев — Rubbles — ICBDA 2015Александр Фонарев — Rubbles — ICBDA 2015
Александр Фонарев — Rubbles — ICBDA 2015rusbase
 
Александр Мигаловский — ГНИВЦ ФНС России — ICBDA 2015
Александр Мигаловский — ГНИВЦ ФНС России — ICBDA 2015Александр Мигаловский — ГНИВЦ ФНС России — ICBDA 2015
Александр Мигаловский — ГНИВЦ ФНС России — ICBDA 2015rusbase
 

Destacado (7)

Михаил Кечинов — REES46 — ICBDA 2015
Михаил Кечинов — REES46 — ICBDA 2015Михаил Кечинов — REES46 — ICBDA 2015
Михаил Кечинов — REES46 — ICBDA 2015
 
Тимур Кузеев — Meta System — ICBDA 2015
Тимур Кузеев — Meta System — ICBDA 2015Тимур Кузеев — Meta System — ICBDA 2015
Тимур Кузеев — Meta System — ICBDA 2015
 
Кирилл Чистов — Data-Centric Alliance — ICBDA 2015
Кирилл Чистов — Data-Centric Alliance — ICBDA 2015Кирилл Чистов — Data-Centric Alliance — ICBDA 2015
Кирилл Чистов — Data-Centric Alliance — ICBDA 2015
 
Роман Постников — «Мегафон» — ICBDA 2015
Роман Постников — «Мегафон» — ICBDA 2015Роман Постников — «Мегафон» — ICBDA 2015
Роман Постников — «Мегафон» — ICBDA 2015
 
Николай Птицын — Synesis — ICBDA 2015
Николай Птицын — Synesis — ICBDA 2015Николай Птицын — Synesis — ICBDA 2015
Николай Птицын — Synesis — ICBDA 2015
 
Александр Фонарев — Rubbles — ICBDA 2015
Александр Фонарев — Rubbles — ICBDA 2015Александр Фонарев — Rubbles — ICBDA 2015
Александр Фонарев — Rubbles — ICBDA 2015
 
Александр Мигаловский — ГНИВЦ ФНС России — ICBDA 2015
Александр Мигаловский — ГНИВЦ ФНС России — ICBDA 2015Александр Мигаловский — ГНИВЦ ФНС России — ICBDA 2015
Александр Мигаловский — ГНИВЦ ФНС России — ICBDA 2015
 

Similar a Сергей Чернов — Yandex Data Factory — ICBDA 2015

Александр Крот “Аналитические ошибки в анализе данных”
Александр Крот “Аналитические ошибки в анализе данных”Александр Крот “Аналитические ошибки в анализе данных”
Александр Крот “Аналитические ошибки в анализе данных”Dakiry
 
Мотивация персонала с применением метода грейдирования
Мотивация персонала с применением метода грейдированияМотивация персонала с применением метода грейдирования
Мотивация персонала с применением метода грейдированияHRedu.ru
 
Glasford (Moscow) presentation (in Russian)
Glasford (Moscow) presentation (in Russian)Glasford (Moscow) presentation (in Russian)
Glasford (Moscow) presentation (in Russian)Lidiya Ferapontova
 
презентация натальи даниной
презентация натальи данинойпрезентация натальи даниной
презентация натальи данинойAXES Management
 
Citilink - IT Function_Rus
Citilink - IT Function_RusCitilink - IT Function_Rus
Citilink - IT Function_RusSergei Biryukov
 
Что такое вовлеченность персонала и зачем она нужна организации?
Что такое вовлеченность персонала и зачем она нужна организации?Что такое вовлеченность персонала и зачем она нужна организации?
Что такое вовлеченность персонала и зачем она нужна организации?Natasha Grishakova
 
Data Governance projects audit. ROI return analysis
Data Governance projects audit. ROI return analysisData Governance projects audit. ROI return analysis
Data Governance projects audit. ROI return analysisSergey Kuznetsov
 
Технологии набора, обучения и адаптации персонала. HR-фишки и секреты. Курочк...
Технологии набора, обучения и адаптации персонала. HR-фишки и секреты. Курочк...Технологии набора, обучения и адаптации персонала. HR-фишки и секреты. Курочк...
Технологии набора, обучения и адаптации персонала. HR-фишки и секреты. Курочк...metrosphera
 
Dsml for business.full version
Dsml for business.full versionDsml for business.full version
Dsml for business.full versionDmitry Guzenko
 
Мониторинг и контроль рекла
Мониторинг и контроль реклаМониторинг и контроль рекла
Мониторинг и контроль реклаПавел Казачков
 
презентация обзоры рынка труда и заработных плат
презентация обзоры рынка труда и заработных плат презентация обзоры рынка труда и заработных плат
презентация обзоры рынка труда и заработных плат Алина Самарская
 
HR-IT'2013. Мокровольская Инна. Доклад "Пересмотр зарплаты – за что платим (М...
HR-IT'2013. Мокровольская Инна. Доклад "Пересмотр зарплаты – за что платим (М...HR-IT'2013. Мокровольская Инна. Доклад "Пересмотр зарплаты – за что платим (М...
HR-IT'2013. Мокровольская Инна. Доклад "Пересмотр зарплаты – за что платим (М...RTC
 
Малобюджетные инструменты развития мсб
Малобюджетные инструменты развития мсбМалобюджетные инструменты развития мсб
Малобюджетные инструменты развития мсбEvgeniy Krivov
 
Обзоры рынка труда и заработных плат ав
Обзоры рынка труда и заработных плат авОбзоры рынка труда и заработных плат ав
Обзоры рынка труда и заработных плат авАлина Самарская
 
Conference Software People 2011. Business goal through Improvements and Measu...
Conference Software People 2011. Business goal through Improvements and Measu...Conference Software People 2011. Business goal through Improvements and Measu...
Conference Software People 2011. Business goal through Improvements and Measu...Sergiy Povolyashko
 

Similar a Сергей Чернов — Yandex Data Factory — ICBDA 2015 (20)

Александр Крот “Аналитические ошибки в анализе данных”
Александр Крот “Аналитические ошибки в анализе данных”Александр Крот “Аналитические ошибки в анализе данных”
Александр Крот “Аналитические ошибки в анализе данных”
 
Мотивация персонала с применением метода грейдирования
Мотивация персонала с применением метода грейдированияМотивация персонала с применением метода грейдирования
Мотивация персонала с применением метода грейдирования
 
Glasford (Moscow) presentation (in Russian)
Glasford (Moscow) presentation (in Russian)Glasford (Moscow) presentation (in Russian)
Glasford (Moscow) presentation (in Russian)
 
презентация натальи даниной
презентация натальи данинойпрезентация натальи даниной
презентация натальи даниной
 
Citilink - IT Function_Rus
Citilink - IT Function_RusCitilink - IT Function_Rus
Citilink - IT Function_Rus
 
IT-Доминанта
IT-ДоминантаIT-Доминанта
IT-Доминанта
 
Что такое вовлеченность персонала и зачем она нужна организации?
Что такое вовлеченность персонала и зачем она нужна организации?Что такое вовлеченность персонала и зачем она нужна организации?
Что такое вовлеченность персонала и зачем она нужна организации?
 
Data Governance projects audit. ROI return analysis
Data Governance projects audit. ROI return analysisData Governance projects audit. ROI return analysis
Data Governance projects audit. ROI return analysis
 
Anna Egorova, Case, itovtet
Anna Egorova, Case, itovtetAnna Egorova, Case, itovtet
Anna Egorova, Case, itovtet
 
Технологии набора, обучения и адаптации персонала. HR-фишки и секреты. Курочк...
Технологии набора, обучения и адаптации персонала. HR-фишки и секреты. Курочк...Технологии набора, обучения и адаптации персонала. HR-фишки и секреты. Курочк...
Технологии набора, обучения и адаптации персонала. HR-фишки и секреты. Курочк...
 
Dsml for business.full version
Dsml for business.full versionDsml for business.full version
Dsml for business.full version
 
Мониторинг и контроль рекла
Мониторинг и контроль реклаМониторинг и контроль рекла
Мониторинг и контроль рекла
 
презентация обзоры рынка труда и заработных плат
презентация обзоры рынка труда и заработных плат презентация обзоры рынка труда и заработных плат
презентация обзоры рынка труда и заработных плат
 
Presentation ss 2013 (1)
Presentation ss  2013 (1)Presentation ss  2013 (1)
Presentation ss 2013 (1)
 
HR-IT'2013. Мокровольская Инна. Доклад "Пересмотр зарплаты – за что платим (М...
HR-IT'2013. Мокровольская Инна. Доклад "Пересмотр зарплаты – за что платим (М...HR-IT'2013. Мокровольская Инна. Доклад "Пересмотр зарплаты – за что платим (М...
HR-IT'2013. Мокровольская Инна. Доклад "Пересмотр зарплаты – за что платим (М...
 
AlgoMost: about
AlgoMost: aboutAlgoMost: about
AlgoMost: about
 
Малобюджетные инструменты развития мсб
Малобюджетные инструменты развития мсбМалобюджетные инструменты развития мсб
Малобюджетные инструменты развития мсб
 
Обзоры рынка труда и заработных плат ав
Обзоры рынка труда и заработных плат авОбзоры рынка труда и заработных плат ав
Обзоры рынка труда и заработных плат ав
 
Conference Software People 2011. Business goal through Improvements and Measu...
Conference Software People 2011. Business goal through Improvements and Measu...Conference Software People 2011. Business goal through Improvements and Measu...
Conference Software People 2011. Business goal through Improvements and Measu...
 
ABIT
ABITABIT
ABIT
 

Más de rusbase

Робоэдвайзинг
РобоэдвайзингРобоэдвайзинг
Робоэдвайзингrusbase
 
Как чат-боты меняют банковское обслуживание
Как чат-боты меняют банковское обслуживание Как чат-боты меняют банковское обслуживание
Как чат-боты меняют банковское обслуживание rusbase
 
Как удаленная идентификация повлияет на бизнес модели в финансовой сфере
Как удаленная идентификация повлияет на бизнес модели в финансовой сфере Как удаленная идентификация повлияет на бизнес модели в финансовой сфере
Как удаленная идентификация повлияет на бизнес модели в финансовой сфере rusbase
 
Как социальные сети влияют на скоринг
Как социальные сети влияют на скоринг Как социальные сети влияют на скоринг
Как социальные сети влияют на скоринг rusbase
 
Искусственный интеллект в кредитном скоринге
Искусственный интеллект в кредитном скорингеИскусственный интеллект в кредитном скоринге
Искусственный интеллект в кредитном скорингеrusbase
 
P2P кредитование и народное поручительство
P2P кредитование и народное поручительство P2P кредитование и народное поручительство
P2P кредитование и народное поручительство rusbase
 
Francis Bakos, Vitality - FinTech Russia
Francis Bakos, Vitality - FinTech RussiaFrancis Bakos, Vitality - FinTech Russia
Francis Bakos, Vitality - FinTech Russiarusbase
 
Руслан Юсуфов, Страхование от кибер-атак - FinTech Russia
Руслан Юсуфов, Страхование от кибер-атак - FinTech RussiaРуслан Юсуфов, Страхование от кибер-атак - FinTech Russia
Руслан Юсуфов, Страхование от кибер-атак - FinTech Russiarusbase
 
Алексей Краснопольский, Онлайн-кассы - FinTech Russia
Алексей Краснопольский, Онлайн-кассы - FinTech RussiaАлексей Краснопольский, Онлайн-кассы - FinTech Russia
Алексей Краснопольский, Онлайн-кассы - FinTech Russiarusbase
 
Иван Беров, Digital Identity - FinTech Russia
Иван Беров, Digital Identity - FinTech RussiaИван Беров, Digital Identity - FinTech Russia
Иван Беров, Digital Identity - FinTech Russiarusbase
 
Алексей Катрич, IoT в InsurTech - FinTech Russia
Алексей Катрич, IoT в InsurTech - FinTech RussiaАлексей Катрич, IoT в InsurTech - FinTech Russia
Алексей Катрич, IoT в InsurTech - FinTech Russiarusbase
 
Алексей Архипов, Мастерчейн - FinTech Russia
Алексей Архипов, Мастерчейн  - FinTech RussiaАлексей Архипов, Мастерчейн  - FinTech Russia
Алексей Архипов, Мастерчейн - FinTech Russiarusbase
 
Максим Григорьев, Удаленная идентификация - FinTech Russia
Максим Григорьев, Удаленная идентификация - FinTech RussiaМаксим Григорьев, Удаленная идентификация - FinTech Russia
Максим Григорьев, Удаленная идентификация - FinTech Russiarusbase
 
Александр Кузьмин, PSD2 - FinTech Russia
Александр Кузьмин, PSD2 - FinTech RussiaАлександр Кузьмин, PSD2 - FinTech Russia
Александр Кузьмин, PSD2 - FinTech Russiarusbase
 
Алексей Благирев, "Открытие" — FinTech Russia 2017
Алексей Благирев, "Открытие" — FinTech Russia 2017Алексей Благирев, "Открытие" — FinTech Russia 2017
Алексей Благирев, "Открытие" — FinTech Russia 2017rusbase
 
Ханнес Чопра (Hannes Chopra) - FinTech Russia 2017
Ханнес Чопра (Hannes Chopra) - FinTech Russia 2017Ханнес Чопра (Hannes Chopra) - FinTech Russia 2017
Ханнес Чопра (Hannes Chopra) - FinTech Russia 2017rusbase
 
Владислав Лисицкий — Rubbles — ICBDA2016
Владислав Лисицкий — Rubbles — ICBDA2016Владислав Лисицкий — Rubbles — ICBDA2016
Владислав Лисицкий — Rubbles — ICBDA2016rusbase
 
Андрей Созыкин — ИММ УрО РАН — ICDBA2016
Андрей Созыкин — ИММ УрО РАН — ICDBA2016Андрей Созыкин — ИММ УрО РАН — ICDBA2016
Андрей Созыкин — ИММ УрО РАН — ICDBA2016rusbase
 
Александр Яшкин – FANUC Russia – ICBDA2016
Александр Яшкин – FANUC Russia – ICBDA2016Александр Яшкин – FANUC Russia – ICBDA2016
Александр Яшкин – FANUC Russia – ICBDA2016rusbase
 
Евгений Быков – Телум – ICBDA2016
Евгений Быков – Телум – ICBDA2016Евгений Быков – Телум – ICBDA2016
Евгений Быков – Телум – ICBDA2016rusbase
 

Más de rusbase (20)

Робоэдвайзинг
РобоэдвайзингРобоэдвайзинг
Робоэдвайзинг
 
Как чат-боты меняют банковское обслуживание
Как чат-боты меняют банковское обслуживание Как чат-боты меняют банковское обслуживание
Как чат-боты меняют банковское обслуживание
 
Как удаленная идентификация повлияет на бизнес модели в финансовой сфере
Как удаленная идентификация повлияет на бизнес модели в финансовой сфере Как удаленная идентификация повлияет на бизнес модели в финансовой сфере
Как удаленная идентификация повлияет на бизнес модели в финансовой сфере
 
Как социальные сети влияют на скоринг
Как социальные сети влияют на скоринг Как социальные сети влияют на скоринг
Как социальные сети влияют на скоринг
 
Искусственный интеллект в кредитном скоринге
Искусственный интеллект в кредитном скорингеИскусственный интеллект в кредитном скоринге
Искусственный интеллект в кредитном скоринге
 
P2P кредитование и народное поручительство
P2P кредитование и народное поручительство P2P кредитование и народное поручительство
P2P кредитование и народное поручительство
 
Francis Bakos, Vitality - FinTech Russia
Francis Bakos, Vitality - FinTech RussiaFrancis Bakos, Vitality - FinTech Russia
Francis Bakos, Vitality - FinTech Russia
 
Руслан Юсуфов, Страхование от кибер-атак - FinTech Russia
Руслан Юсуфов, Страхование от кибер-атак - FinTech RussiaРуслан Юсуфов, Страхование от кибер-атак - FinTech Russia
Руслан Юсуфов, Страхование от кибер-атак - FinTech Russia
 
Алексей Краснопольский, Онлайн-кассы - FinTech Russia
Алексей Краснопольский, Онлайн-кассы - FinTech RussiaАлексей Краснопольский, Онлайн-кассы - FinTech Russia
Алексей Краснопольский, Онлайн-кассы - FinTech Russia
 
Иван Беров, Digital Identity - FinTech Russia
Иван Беров, Digital Identity - FinTech RussiaИван Беров, Digital Identity - FinTech Russia
Иван Беров, Digital Identity - FinTech Russia
 
Алексей Катрич, IoT в InsurTech - FinTech Russia
Алексей Катрич, IoT в InsurTech - FinTech RussiaАлексей Катрич, IoT в InsurTech - FinTech Russia
Алексей Катрич, IoT в InsurTech - FinTech Russia
 
Алексей Архипов, Мастерчейн - FinTech Russia
Алексей Архипов, Мастерчейн  - FinTech RussiaАлексей Архипов, Мастерчейн  - FinTech Russia
Алексей Архипов, Мастерчейн - FinTech Russia
 
Максим Григорьев, Удаленная идентификация - FinTech Russia
Максим Григорьев, Удаленная идентификация - FinTech RussiaМаксим Григорьев, Удаленная идентификация - FinTech Russia
Максим Григорьев, Удаленная идентификация - FinTech Russia
 
Александр Кузьмин, PSD2 - FinTech Russia
Александр Кузьмин, PSD2 - FinTech RussiaАлександр Кузьмин, PSD2 - FinTech Russia
Александр Кузьмин, PSD2 - FinTech Russia
 
Алексей Благирев, "Открытие" — FinTech Russia 2017
Алексей Благирев, "Открытие" — FinTech Russia 2017Алексей Благирев, "Открытие" — FinTech Russia 2017
Алексей Благирев, "Открытие" — FinTech Russia 2017
 
Ханнес Чопра (Hannes Chopra) - FinTech Russia 2017
Ханнес Чопра (Hannes Chopra) - FinTech Russia 2017Ханнес Чопра (Hannes Chopra) - FinTech Russia 2017
Ханнес Чопра (Hannes Chopra) - FinTech Russia 2017
 
Владислав Лисицкий — Rubbles — ICBDA2016
Владислав Лисицкий — Rubbles — ICBDA2016Владислав Лисицкий — Rubbles — ICBDA2016
Владислав Лисицкий — Rubbles — ICBDA2016
 
Андрей Созыкин — ИММ УрО РАН — ICDBA2016
Андрей Созыкин — ИММ УрО РАН — ICDBA2016Андрей Созыкин — ИММ УрО РАН — ICDBA2016
Андрей Созыкин — ИММ УрО РАН — ICDBA2016
 
Александр Яшкин – FANUC Russia – ICBDA2016
Александр Яшкин – FANUC Russia – ICBDA2016Александр Яшкин – FANUC Russia – ICBDA2016
Александр Яшкин – FANUC Russia – ICBDA2016
 
Евгений Быков – Телум – ICBDA2016
Евгений Быков – Телум – ICBDA2016Евгений Быков – Телум – ICBDA2016
Евгений Быков – Телум – ICBDA2016
 

Сергей Чернов — Yandex Data Factory — ICBDA 2015

  • 1.
  • 2. Предсказание увольнения сотрудников с помощью больших данных Case Study Реальный сектор
  • 5. Партнеры и клиенты в первый год работы 6
  • 7. Описание проекта Входные данные ▌  Анонимные данные о более чем 1000 сотрудниках из внутренней БД за период с 2008 по 2012 год: ›  Общие данные о сотрудниках (пол, возраст, дата выхода на работу, должность, уровень дохода и т. д.) ›  Отпуска, больничные, отгулы, сверхурочные ›  Образование, тренинги, аттестации ›  Проектная деятельность (проекты, задачи, ошибки и т. д.) Цель – оценить пригодность технологий и методик компании «Яндекс» в области Big Data и Machine Learning для решения задач инженерной компании для снижения расходов на поиск и привлечение новых сотрудников. 8 Задача ▌  Построить модель прогнозирования вероятности увольнения сотрудников и оценить качество модели ▌  Оценить «вес» различных факторов в связи с намерением уволиться
  • 8. Входные данные от заказчика Основные данные о сотрудниках ▌  Пол, год рождения, дата выхода на работу ▌  Гражданство ▌  Дата увольнения, код причины увольнения ▌  Должность, изменения должности, форма занятости ▌  Относительный уровень ЗП ▌  Образование, тренинги, уровень знания иностранного языка ▌  Отпуска, больничные, отгулы, сверхурочные ▌  Командировки ▌  Аттестации, квалификация 9 Проектная команда ▌  ID проекта, проектная команда ▌  Структура проектной команды, проектное направление, административное подчинение Задачи, итерации и ошибки ▌  ID задачи, дата задачи, сложность задачи и т. д. ▌  ID ошибки, внешняя/внутренняя ошибка, ID проверяющего ▌  Итерация, дата начала и дата окончания итерации Входы в систему ▌  Здание, размер офиса ▌  Время входа, время выхода
  • 9. Описание модели ▌  Увольнения прогнозировались на 2012 год отдельно для каждого квартала ▌  Использовался буферный период – 1 месяц ▌  Обучающая выборка строилась за период с 2008 года до начала соответствующего буферного периода ▌  Тип используемой модели – MatrixNet, более 250 факторов 10 Прогнозируемый период Кол-во увольнений за период Обучающая выборка Буферный период 01.01.2012 – 31.03.2012 ~20 01.01.2008 – 30.11.2011 01.12.2011 – 31.12.2011
  • 10. Качество модели ▌  Точность прогноза модели превзошла первоначальные ожидания заказчика в 5 раз. ▌  Модель устойчива к переобучению и чувствительна к изменению поведения сотрудников, т. е. применима на данных за другие периоды. 11 Ожидания заказчика 5 из топ-50 за год Результаты 26 из топ-50 за год
  • 11. Возможный способ расчета экономического эффекта Затраты на поиск сотрудника ▌  Оплата услуг HR-агентства (15% от ЗП) ▌  Снижение производительности в первые 3 месяца. Коэффициент 0,5 ▌  Снижение объемов работ на период поиска (3 месяца). Коэффициент 0,5 ▌  Оплата тренингов и повышение квалификации Затраты на удержание сотрудника ▌  Повышение зарплаты на 15-20% ▌  Оплата тренингов и повышение квалификации сотрудника ▌  Изменение должности 12 Стоимость поиска нового сотрудника = (3*0,5 + 3*0,5)*ставка + 0,15*12*ЗП Стоимость удержания сотрудника = (0.2*12)*ЗП
  • 12. Пример расчета экономического эффекта 13 Предложение по удержанию   +15% ЗП   Отношение ставки к ЗП   3,5   ЗП специалиста в месяц, USD   2 000,00$   Ставка специалиста, USD в месяц   7 000,00$   Стоимость поиска нового сотрудника, USD   24 600,00$   Стоимость удержания сотрудника, USD   3 600,00$   Текущие затраты   Кол-во уволившихся*Стоимость поиска нового сотрудника   Затраты с использованием прогноза   (Кол-во уволившихся-TP)*Стоимость поиска нового сотрудника+(ТP +FP)*Стоимость удержания   2012 год   Кол-во уволившихся   Top-60   Текущие затраты   Затраты с использованием прогноза   Экономия  TP   FP   1-й квартал   20   12   48   492 000,00$   412 800,00$   79 200,00$   2-й квартал   22   7   53   541 200,00$   585 000,00$   -43 800,00$   3-й квартал   24   14   46   590 400,00$   462 000,00$   128 400,00$   4-й квартал   23   14   46   565 800,00$   437 400,00$   128 400,00$   Итого:               2 189 400,00$   1 897 200,00$   292 200,00$  
  • 13. Наиболее полезные данные ▌  Изменение роли в проекте ▌  Количество посещенных тренингов, продолжительность тренингов ▌  Количество отгулов ▌  Больничные ▌  Переработки ▌  Изменение проектного направления 14
  • 14. Что еще умеет Yandex Data Factory? ▌  Поведенческая аналитика ›  Данные: профили клиентов, транзакции, заказы, история покупок, данные биллинга, click- stream и т. д. ›  Решения: сегментация, поведенческие паттерны, персонализированные предложения, “next best offer”, и т. д. ▌  Временные ряды и аномалии ›  Данные: телеметрия, счетчики потребления, исторические данные о событиях ›  Решения: выявление мошенничества, оптимизация технического обслуживания, предсказание спроса и т. д. ▌  Пространственная (geospatial) аналитика ›  Данные: геолокационные данные, данные о движении транспорта, маршруты и т. д. ›  Решения: оптимизация логистики, управление дорожной сетью, прогнозирование проходимости магазинов ▌  Распознавание речи, компьютерное зрение 15
  • 15. Тел: +7 495 739-70-00 Факс: +7 495 739-70-70 yandexdatafactory.com ydf-customer@yandex-team.ru 119021, Москва ул. Льва Толстого, 16 Россия 16
  • 17. Скрининг персонала Проблема: у заказчика большая филиальная сеть со значительным количеством линейного персонала, выполняющего рутинные операции. Для поддержания эффективности и снижения потерь, вызванных «человеческим фактором», необходим постоянный мониторинг. Данные заказчика ▌  Данные систем контроля доступа ▌  Логи операций (телефонные звонки, чеки, отметки электронной очереди и т. п.) ▌  Аудиозаписи (для колл-центров) ▌  Данные геолокации для «полевого» персонала 18 Наши технологии ›  Сегментация и микросегментация ›  Выявление поведенческих паттернов ›  Обнаружение аномалий ›  Распознавание речи Результаты ›  Автоматизированный мониторинг деятельности линейного персонала ›  Выявление аномалий, данные для оценки производительности и рисков
  • 18. Повышение эффективности колл-центра Проблема: в ходе работы колл-центра накапливаются терабайты аудиозаписей, которые хранятся, но используются лишь для разбора конфликтных ситуаций, менее 1% записей анализируется вручную для контроля качества обслуживания. Данные заказчика ▌  Записи разговоров ▌  Скрипты, инструкции, регламенты для операторов 19 Наши технологии ›  Распознавание речи (ограниченный словарь) ›  Распознавание эмоциональной окраски ›  Анализ текстов Результаты ›  Автоматическая оценка качества работы оператора, соответствия инструкциям и скриптам, динамики эмоций звонившего клиента. Поиск по ключевым словам в разговорах