SlideShare una empresa de Scribd logo
1 de 19
Использование практик бизнес-анализа в
проектах big data и data science
Сергей Кадомский
Director of Research and Data Science
Wargaming.net
2
Давайте познакомимся
3
Немного о нашей команде Player Research and Data Science в WG
 Wargaming.net сейчас оперирует несколько free2Play игр: World of
Tanks, World of Warplanes, World of Tanks Blitz, на подходе ещё ряд
проектов
 Некоторые задачи, которые нами решаются либо не решались в
индустрии, либо информация об их решении отсутствует
 Наша команда представляет собой сервисное подразделение,
работающее с внутренними заказчиками, сейчас нас 12 человек
 Офисы WG расположены в 14 локациях по всему миру
4
История из жизни
5
О чем мой рассказ
 Big Data, Data Science, Machine Learning это новые области не
только для игровой индустрии, но и для большинства индустрий на
постсоветском пространстве
 Специалисты, решающие задачи data science – в подавляющем
большинстве приходят из технических специальностей, а не из
бизнеса, маркетинга или продуктового управления
6
О чем мой рассказ
 Непонимание подходов Big Data и Data Science заказчиками
 Завышенные ожидания и естественный scope creep
 Непредсказуемость результатов моделирования
 Конфликт результатов с мнением экспертов
7
Практика #1: глоссарий бизнес-определений
 Первый этап, с которого необходимо начинать работу
 Базис, без которого невозможна эффективная коммуникация
8
Практика #2: словари данных
 Описание структур используемых БД
 Описание значений данных в используемых БД
 Описание Business Intelligence систем, с которыми нужно будет
интегрироваться
Решает проблему качества данных и упрощает поиск ошибок
9
Проблема: завышенные ожидания и scope creep
10
Решение проблемы завышенных ожиданий
 Фиксация vision&scope перед стартом проекта
 Формализация бизнес-целей
 Фиксация гипотез с вовлечением экспертов
11
Решение проблемы завышенных ожиданий –
в работе с нефункциональными требованиями
 Скорость работы моделей
 Качество моделирования
 Reusability: это ad-hoc или будем внедрять?
12
Проблема: непредсказуемость результатов
 Моделирование это приблизительное описание реального мира –
100% точных моделей не бывает, т.к. все данные собрать
невозможно
 Результата может не быть – вообще!
 Полученные результаты иногда сложно, а при выборе некоторых
методов невозможно объяснить
13
Решение - непредсказуемость результатов
 Итеративное решение задачи возможно только тогда, когда
исполнителю понятны бизнес-цели (а не «посчитайте мне это») и
метрики успешности проекта
 Повышение точности достигается в результате оптимизации
моделей: через усложнение алгоритмов, поиск и добавление
новых данных – для выбора направления оптимизации нужно
понимать ожидания и бизнес-задачи
14
Проблема: конфликт результатов с мнением экспертов
 Для моей команды успешный проект это не тот, который
подтвердил ожидания, а тот, который принёс новые и
неожиданные знания
 Зачастую такие результаты сильно отличаются от ожиданий
заказчиков и экспертов и вызывают недоверие
15
Решение - конфликт результатов с мнением экспертов
 Выявление на старте проекта не только стейкхолдеров и SME, но
и неформальных лидеров мнений
 План коммуникаций должен вовлекать заказчиков и экспертов не
только на этапе постановки, но и при выполнении проекта – так
создаётся доверие к результатам
16
Решение - конфликта результатов с мнением экспертов
 Сбор гипотез и информации по проблеме у SME
 Погружение в предметную область аналитика
 В идеальном мире – с физическим перемещением его в команду
SME
 Выявление того, как задача решается сейчас или решалась
ранее?
17
Успешная аналитика
 Любые технические задачи можно решить
 Успех аналитического проекта лежит в плоскости коммуникаций
 Учите ваших data scientist’ов эффективной коммуникации и
оказывайте им достаточную аналитическую поддержку
 Управляйте ожиданиями и чётко определяйте бизнес-цели
проекта
18
Рекомендуемая литература
How to Measure Anything:
Finding the Value of Intangibles in Business
by Douglas W. Hubbard
http://amzn.to/1DMTyxf
Secrets of Analytical Leaders:
Insights from Information Insiders
by Wayne Eckerson
http://amzn.to/1EcGR4L
Спасибо за
внимание
Ваши вопросы?
Email: sergey@kadomsky.com
Skype: sergey.kadomsky
DataTalks: http://linkd.in/1EVdkLT

Más contenido relacionado

Más de SQALab

Нагрузочное тестирование нестандартных протоколов с использованием Citrix и J...
Нагрузочное тестирование нестандартных протоколов с использованием Citrix и J...Нагрузочное тестирование нестандартных протоколов с использованием Citrix и J...
Нагрузочное тестирование нестандартных протоколов с использованием Citrix и J...SQALab
 
Continuous performance testing
Continuous performance testingContinuous performance testing
Continuous performance testingSQALab
 
Конфиги вместо костылей. Pytestconfig и зачем он нужен
Конфиги вместо костылей. Pytestconfig и зачем он нуженКонфиги вместо костылей. Pytestconfig и зачем он нужен
Конфиги вместо костылей. Pytestconfig и зачем он нуженSQALab
 
Команда чемпионов в ИТ стихии
Команда чемпионов в ИТ стихииКоманда чемпионов в ИТ стихии
Команда чемпионов в ИТ стихииSQALab
 
API. Серебряная пуля в магазине советов
API. Серебряная пуля в магазине советовAPI. Серебряная пуля в магазине советов
API. Серебряная пуля в магазине советовSQALab
 
Добиваемся эффективности каждого из 9000+ UI-тестов
Добиваемся эффективности каждого из 9000+ UI-тестовДобиваемся эффективности каждого из 9000+ UI-тестов
Добиваемся эффективности каждого из 9000+ UI-тестовSQALab
 
Делаем автоматизацию проектных KPIs
Делаем автоматизацию проектных KPIsДелаем автоматизацию проектных KPIs
Делаем автоматизацию проектных KPIsSQALab
 
Вредные привычки в тест-менеджменте
Вредные привычки в тест-менеджментеВредные привычки в тест-менеджменте
Вредные привычки в тест-менеджментеSQALab
 
Мощь переполняет с JDI 2.0 - новая эра UI автоматизации
Мощь переполняет с JDI 2.0 - новая эра UI автоматизацииМощь переполняет с JDI 2.0 - новая эра UI автоматизации
Мощь переполняет с JDI 2.0 - новая эра UI автоматизацииSQALab
 
Как hh.ru дошли до 500 релизов в квартал без потери в качестве
Как hh.ru дошли до 500 релизов в квартал без потери в качествеКак hh.ru дошли до 500 релизов в квартал без потери в качестве
Как hh.ru дошли до 500 релизов в квартал без потери в качествеSQALab
 
Стили лидерства и тестирование
Стили лидерства и тестированиеСтили лидерства и тестирование
Стили лидерства и тестированиеSQALab
 
"Давайте не будем про качество"
"Давайте не будем про качество""Давайте не будем про качество"
"Давайте не будем про качество"SQALab
 
Apache.JMeter для .NET-проектов
Apache.JMeter для .NET-проектовApache.JMeter для .NET-проектов
Apache.JMeter для .NET-проектовSQALab
 
Тестирование геолокационных систем
Тестирование геолокационных системТестирование геолокационных систем
Тестирование геолокационных системSQALab
 
Лидер или босс? Вот в чем вопрос
Лидер или босс? Вот в чем вопросЛидер или босс? Вот в чем вопрос
Лидер или босс? Вот в чем вопросSQALab
 
От Зефира в коробке к Structure Zephyr или как тест-менеджеру перекроить внут...
От Зефира в коробке к Structure Zephyr или как тест-менеджеру перекроить внут...От Зефира в коробке к Structure Zephyr или как тест-менеджеру перекроить внут...
От Зефира в коробке к Structure Zephyr или как тест-менеджеру перекроить внут...SQALab
 
Истинная сила тестировщика - информация
Истинная сила тестировщика - информацияИстинная сила тестировщика - информация
Истинная сила тестировщика - информацияSQALab
 
Автоматизация тестирования встроенного ПО
Автоматизация тестирования встроенного ПОАвтоматизация тестирования встроенного ПО
Автоматизация тестирования встроенного ПОSQALab
 
Правильный подход к составлению профиля нагрузочного тестирования
Правильный подход к составлению профиля нагрузочного тестированияПравильный подход к составлению профиля нагрузочного тестирования
Правильный подход к составлению профиля нагрузочного тестированияSQALab
 
Sustainable Test Automation: Collaborate within Team
Sustainable Test Automation: Collaborate within TeamSustainable Test Automation: Collaborate within Team
Sustainable Test Automation: Collaborate within TeamSQALab
 

Más de SQALab (20)

Нагрузочное тестирование нестандартных протоколов с использованием Citrix и J...
Нагрузочное тестирование нестандартных протоколов с использованием Citrix и J...Нагрузочное тестирование нестандартных протоколов с использованием Citrix и J...
Нагрузочное тестирование нестандартных протоколов с использованием Citrix и J...
 
Continuous performance testing
Continuous performance testingContinuous performance testing
Continuous performance testing
 
Конфиги вместо костылей. Pytestconfig и зачем он нужен
Конфиги вместо костылей. Pytestconfig и зачем он нуженКонфиги вместо костылей. Pytestconfig и зачем он нужен
Конфиги вместо костылей. Pytestconfig и зачем он нужен
 
Команда чемпионов в ИТ стихии
Команда чемпионов в ИТ стихииКоманда чемпионов в ИТ стихии
Команда чемпионов в ИТ стихии
 
API. Серебряная пуля в магазине советов
API. Серебряная пуля в магазине советовAPI. Серебряная пуля в магазине советов
API. Серебряная пуля в магазине советов
 
Добиваемся эффективности каждого из 9000+ UI-тестов
Добиваемся эффективности каждого из 9000+ UI-тестовДобиваемся эффективности каждого из 9000+ UI-тестов
Добиваемся эффективности каждого из 9000+ UI-тестов
 
Делаем автоматизацию проектных KPIs
Делаем автоматизацию проектных KPIsДелаем автоматизацию проектных KPIs
Делаем автоматизацию проектных KPIs
 
Вредные привычки в тест-менеджменте
Вредные привычки в тест-менеджментеВредные привычки в тест-менеджменте
Вредные привычки в тест-менеджменте
 
Мощь переполняет с JDI 2.0 - новая эра UI автоматизации
Мощь переполняет с JDI 2.0 - новая эра UI автоматизацииМощь переполняет с JDI 2.0 - новая эра UI автоматизации
Мощь переполняет с JDI 2.0 - новая эра UI автоматизации
 
Как hh.ru дошли до 500 релизов в квартал без потери в качестве
Как hh.ru дошли до 500 релизов в квартал без потери в качествеКак hh.ru дошли до 500 релизов в квартал без потери в качестве
Как hh.ru дошли до 500 релизов в квартал без потери в качестве
 
Стили лидерства и тестирование
Стили лидерства и тестированиеСтили лидерства и тестирование
Стили лидерства и тестирование
 
"Давайте не будем про качество"
"Давайте не будем про качество""Давайте не будем про качество"
"Давайте не будем про качество"
 
Apache.JMeter для .NET-проектов
Apache.JMeter для .NET-проектовApache.JMeter для .NET-проектов
Apache.JMeter для .NET-проектов
 
Тестирование геолокационных систем
Тестирование геолокационных системТестирование геолокационных систем
Тестирование геолокационных систем
 
Лидер или босс? Вот в чем вопрос
Лидер или босс? Вот в чем вопросЛидер или босс? Вот в чем вопрос
Лидер или босс? Вот в чем вопрос
 
От Зефира в коробке к Structure Zephyr или как тест-менеджеру перекроить внут...
От Зефира в коробке к Structure Zephyr или как тест-менеджеру перекроить внут...От Зефира в коробке к Structure Zephyr или как тест-менеджеру перекроить внут...
От Зефира в коробке к Structure Zephyr или как тест-менеджеру перекроить внут...
 
Истинная сила тестировщика - информация
Истинная сила тестировщика - информацияИстинная сила тестировщика - информация
Истинная сила тестировщика - информация
 
Автоматизация тестирования встроенного ПО
Автоматизация тестирования встроенного ПОАвтоматизация тестирования встроенного ПО
Автоматизация тестирования встроенного ПО
 
Правильный подход к составлению профиля нагрузочного тестирования
Правильный подход к составлению профиля нагрузочного тестированияПравильный подход к составлению профиля нагрузочного тестирования
Правильный подход к составлению профиля нагрузочного тестирования
 
Sustainable Test Automation: Collaborate within Team
Sustainable Test Automation: Collaborate within TeamSustainable Test Automation: Collaborate within Team
Sustainable Test Automation: Collaborate within Team
 

Использование практик бизнес-анализа в проектах big data и data science

  • 1. Использование практик бизнес-анализа в проектах big data и data science Сергей Кадомский Director of Research and Data Science Wargaming.net
  • 3. 3 Немного о нашей команде Player Research and Data Science в WG  Wargaming.net сейчас оперирует несколько free2Play игр: World of Tanks, World of Warplanes, World of Tanks Blitz, на подходе ещё ряд проектов  Некоторые задачи, которые нами решаются либо не решались в индустрии, либо информация об их решении отсутствует  Наша команда представляет собой сервисное подразделение, работающее с внутренними заказчиками, сейчас нас 12 человек  Офисы WG расположены в 14 локациях по всему миру
  • 5. 5 О чем мой рассказ  Big Data, Data Science, Machine Learning это новые области не только для игровой индустрии, но и для большинства индустрий на постсоветском пространстве  Специалисты, решающие задачи data science – в подавляющем большинстве приходят из технических специальностей, а не из бизнеса, маркетинга или продуктового управления
  • 6. 6 О чем мой рассказ  Непонимание подходов Big Data и Data Science заказчиками  Завышенные ожидания и естественный scope creep  Непредсказуемость результатов моделирования  Конфликт результатов с мнением экспертов
  • 7. 7 Практика #1: глоссарий бизнес-определений  Первый этап, с которого необходимо начинать работу  Базис, без которого невозможна эффективная коммуникация
  • 8. 8 Практика #2: словари данных  Описание структур используемых БД  Описание значений данных в используемых БД  Описание Business Intelligence систем, с которыми нужно будет интегрироваться Решает проблему качества данных и упрощает поиск ошибок
  • 10. 10 Решение проблемы завышенных ожиданий  Фиксация vision&scope перед стартом проекта  Формализация бизнес-целей  Фиксация гипотез с вовлечением экспертов
  • 11. 11 Решение проблемы завышенных ожиданий – в работе с нефункциональными требованиями  Скорость работы моделей  Качество моделирования  Reusability: это ad-hoc или будем внедрять?
  • 12. 12 Проблема: непредсказуемость результатов  Моделирование это приблизительное описание реального мира – 100% точных моделей не бывает, т.к. все данные собрать невозможно  Результата может не быть – вообще!  Полученные результаты иногда сложно, а при выборе некоторых методов невозможно объяснить
  • 13. 13 Решение - непредсказуемость результатов  Итеративное решение задачи возможно только тогда, когда исполнителю понятны бизнес-цели (а не «посчитайте мне это») и метрики успешности проекта  Повышение точности достигается в результате оптимизации моделей: через усложнение алгоритмов, поиск и добавление новых данных – для выбора направления оптимизации нужно понимать ожидания и бизнес-задачи
  • 14. 14 Проблема: конфликт результатов с мнением экспертов  Для моей команды успешный проект это не тот, который подтвердил ожидания, а тот, который принёс новые и неожиданные знания  Зачастую такие результаты сильно отличаются от ожиданий заказчиков и экспертов и вызывают недоверие
  • 15. 15 Решение - конфликт результатов с мнением экспертов  Выявление на старте проекта не только стейкхолдеров и SME, но и неформальных лидеров мнений  План коммуникаций должен вовлекать заказчиков и экспертов не только на этапе постановки, но и при выполнении проекта – так создаётся доверие к результатам
  • 16. 16 Решение - конфликта результатов с мнением экспертов  Сбор гипотез и информации по проблеме у SME  Погружение в предметную область аналитика  В идеальном мире – с физическим перемещением его в команду SME  Выявление того, как задача решается сейчас или решалась ранее?
  • 17. 17 Успешная аналитика  Любые технические задачи можно решить  Успех аналитического проекта лежит в плоскости коммуникаций  Учите ваших data scientist’ов эффективной коммуникации и оказывайте им достаточную аналитическую поддержку  Управляйте ожиданиями и чётко определяйте бизнес-цели проекта
  • 18. 18 Рекомендуемая литература How to Measure Anything: Finding the Value of Intangibles in Business by Douglas W. Hubbard http://amzn.to/1DMTyxf Secrets of Analytical Leaders: Insights from Information Insiders by Wayne Eckerson http://amzn.to/1EcGR4L
  • 19. Спасибо за внимание Ваши вопросы? Email: sergey@kadomsky.com Skype: sergey.kadomsky DataTalks: http://linkd.in/1EVdkLT