SlideShare una empresa de Scribd logo
1 de 29
Прокачиваем информационные системы с помощью
data science
Зачем это нужно знать аналитику?
Глоссарий
Информационная система - совокупность технического, программного и
организационного обеспечения, а также персонала, предназначенная для того,
чтобы своевременно обеспечивать надлежащих людей надлежащей информацией
[William S].
Информационная система - это взаимосвязанная совокупность информационных,
технических, программных, математических, организационных, правовых,
эргономических, лингвистических, технологических и других средств, а также
персонала, предназначенная для сбора, обработки, хранения и выдачи
экономической информации и принятия управленческих решений [М.Р.
Когаловский].
Наука о данных (data science) = Big data + Data Mining + Machine Learning.
Дешевый вход в область data science
• Open source over 3K
• Научные статьи, блоги, лучшие практики over 100K
Узнали опыт коллег
Добавили эвристик
Взяли что-то готовое
Тут уже сложно
Где мы находимся по отношению к уровню развития бизнеса?
В этой области нет
места инновациям
Здесь появляется
Где мы находимся по отношению к данным?
Процессы
Уровни – заказная разработка, o
utsource, интегратор, консалтинг
Данные
Уровни – бизнес,
in-house, 100 лет
сопровождения
Экспертиза в data
science
Уровень – внешняя
команда
Обработка данных – драйвер роста бизнеса
• Контур
• 1C Битрикс
• Yandex, Rambler, Mail.ru
• Операторы связи
• Банки
• Ритейл
Что такое данные ?
• Цифры
• Тексты
• Логи
• БД в конец концов
• Внешние источники
О некоторых аспектах бизнеса заказчика вы можете узнать
больше заказчика
Основные точки применения
• Интеграция в процессы принятия решений
• Поиск
• Интеллектуальные подсказчики
• Контроль работы персонала
• Актуальные задачи предметной области
Центральная задача – принятие решений. Любое решение
стоит дорого, особенно если он неверно.
Задачи Минобрнауки
• Как сформировать приоритетные направления?
• Кому выделить финансирование? Сколько?
• Как проложить мост между промышленностью и наукой?
• Кого оставить на плаву в условиях кризиса?
• Кто эксперт в узкой области?
• Как найти ценные разработки в десятках миллионов документов?
Поехали! Получаем все слова документов
Обрабатываем коллекцию документов
Пространство слов
Обработка в общих чертах
Переходим в векторное пространство
Ближайшая параллель
Модель коллекции. Модель слов.
Специфика задач data science
• Множество ложных гипотез
• Нет промышленного кода долгое
время
• Предобработка данных – 70%
времени
• Обоснование ROI для каждой
задачи
Траектория решения задач data science
1. Гипотезы -> Верификация
2. Получение выборки данных
3. Эксперименты
4. Обоснование ROI
5. Инфраструктура Big data
6. Внедрение в реальные бизнес-
процессы
Семантический поиск
Компетенции, лидеры, эксперты – 3 клика
Смысловой антиплагиат
Учитываем предметную область
Агрегация данных и анализ
Что есть организация/персона
Графы связей организаций
• Поиск явных связей
• Выявление
конкурентов
• Выявление
возможных
партнеров
НТИ
• Отчеты по организациям
• Отчеты по персона
• Отчеты по научно-техническим разработкам
• Полный отчет по АэроНэт – 2033 страницы
Факторы успеха
1. Вовлеченный заказчик
2. Вникнуть в бизнес
3. Мониторинг новинок
4. Академические связи
5. Обмен опытом
6. Быстрые эксперименты
7. Люди с компетенциями
Рекомендуемые инструменты и алгоритмы
• Word2Vec
• SVD
• Mystem
• Breeze NLP
• Snappy
• Akka
• Apache Solr
• Apache Spark
• REDSVD
• BLAS
• CBC
• HAC
• Scala NLP
• LDA + GS
• DBscan
• Optics
• Boilerpipe
• Scala/MongoDB/Postgress
В 21 веке информационные системы должны быть
интеллектуальными
Шашев Сергей, sshashev@naumen.ru
• Не нужно быть гуру математики для внедрения элементов data science
• Открытых знаний и рецептов – море
• Объем Open Source и продуктов – тысячи систем
• Аналитик – драйвер прокачки информационных систем

Más contenido relacionado

La actualidad más candente

Моделирование бизнес-процессов: методы и инструменты
Моделирование бизнес-процессов: методы и инструментыМоделирование бизнес-процессов: методы и инструменты
Моделирование бизнес-процессов: методы и инструментыSQALab
 
Путь Jama для управления требованиями
Путь Jama для управления требованиямиПуть Jama для управления требованиями
Путь Jama для управления требованиямиSQALab
 
Как аналитик может помочь в планировании выпуска версий
Как аналитик может помочь в планировании выпуска версийКак аналитик может помочь в планировании выпуска версий
Как аналитик может помочь в планировании выпуска версийSQALab
 
Как не потерять Продукт на завершающем этапе.
Как не потерять Продукт на завершающем этапе.Как не потерять Продукт на завершающем этапе.
Как не потерять Продукт на завершающем этапе.SQALab
 
Как выбрать для проекта практики проектирования и работы с требованиями
Как выбрать для проекта практики проектирования и работы с требованиямиКак выбрать для проекта практики проектирования и работы с требованиями
Как выбрать для проекта практики проектирования и работы с требованиямиSQALab
 
UX дизайн в Бизнес Анализе
UX дизайн в Бизнес АнализеUX дизайн в Бизнес Анализе
UX дизайн в Бизнес АнализеSQALab
 
Взаимодействие бизнес-аналитика с командой проекта и Заказчиком, Людмила Гули...
Взаимодействие бизнес-аналитика с командой проекта и Заказчиком, Людмила Гули...Взаимодействие бизнес-аналитика с командой проекта и Заказчиком, Людмила Гули...
Взаимодействие бизнес-аналитика с командой проекта и Заказчиком, Людмила Гули...DataArt
 
Человек со стокгольмским синдромом
Человек со стокгольмским синдромомЧеловек со стокгольмским синдромом
Человек со стокгольмским синдромомSQALab
 
Секрет фирмы: как устроен отдел системного бизнес-анализа в одной большой e-c...
Секрет фирмы: как устроен отдел системного бизнес-анализа в одной большой e-c...Секрет фирмы: как устроен отдел системного бизнес-анализа в одной большой e-c...
Секрет фирмы: как устроен отдел системного бизнес-анализа в одной большой e-c...SQALab
 
Аналитик 2.0. Расширенная версия
Аналитик 2.0. Расширенная версияАналитик 2.0. Расширенная версия
Аналитик 2.0. Расширенная версияSQALab
 
Нужные требования в нужное время
Нужные требования в нужное времяНужные требования в нужное время
Нужные требования в нужное времяSQALab
 
UML. Взгляд со стороны
UML. Взгляд со стороныUML. Взгляд со стороны
UML. Взгляд со стороныSQALab
 
Больше чем документ
Больше чем документБольше чем документ
Больше чем документSQALab
 
Идеальный аналитик и почему его не может быть
Идеальный аналитик и почему его не может бытьИдеальный аналитик и почему его не может быть
Идеальный аналитик и почему его не может бытьSQALab
 
1504 ad- бизнес аналитик - решение проблем и внедрение изменений
1504 ad- бизнес аналитик - решение проблем и внедрение изменений1504 ad- бизнес аналитик - решение проблем и внедрение изменений
1504 ad- бизнес аналитик - решение проблем и внедрение измененийDmitry Bezuglyy
 
требования к кандидату
требования к кандидатутребования к кандидату
требования к кандидатуNatalia Zhelnova
 
Специфика работы бизнес-аналитика в зависимости от типов проектов и методологий
Специфика работы бизнес-аналитика в зависимости от типов проектов и методологийСпецифика работы бизнес-аналитика в зависимости от типов проектов и методологий
Специфика работы бизнес-аналитика в зависимости от типов проектов и методологийSQALab
 
Обучение аналитиков - методы и программы
Обучение аналитиков - методы и программыОбучение аналитиков - методы и программы
Обучение аналитиков - методы и программыSQALab
 
Постоянные переключения контекста в жизни аналитика
Постоянные переключения контекста в жизни аналитикаПостоянные переключения контекста в жизни аналитика
Постоянные переключения контекста в жизни аналитикаSQALab
 

La actualidad más candente (20)

Моделирование бизнес-процессов: методы и инструменты
Моделирование бизнес-процессов: методы и инструментыМоделирование бизнес-процессов: методы и инструменты
Моделирование бизнес-процессов: методы и инструменты
 
Путь Jama для управления требованиями
Путь Jama для управления требованиямиПуть Jama для управления требованиями
Путь Jama для управления требованиями
 
Как аналитик может помочь в планировании выпуска версий
Как аналитик может помочь в планировании выпуска версийКак аналитик может помочь в планировании выпуска версий
Как аналитик может помочь в планировании выпуска версий
 
Как не потерять Продукт на завершающем этапе.
Как не потерять Продукт на завершающем этапе.Как не потерять Продукт на завершающем этапе.
Как не потерять Продукт на завершающем этапе.
 
Как выбрать для проекта практики проектирования и работы с требованиями
Как выбрать для проекта практики проектирования и работы с требованиямиКак выбрать для проекта практики проектирования и работы с требованиями
Как выбрать для проекта практики проектирования и работы с требованиями
 
UX дизайн в Бизнес Анализе
UX дизайн в Бизнес АнализеUX дизайн в Бизнес Анализе
UX дизайн в Бизнес Анализе
 
Взаимодействие бизнес-аналитика с командой проекта и Заказчиком, Людмила Гули...
Взаимодействие бизнес-аналитика с командой проекта и Заказчиком, Людмила Гули...Взаимодействие бизнес-аналитика с командой проекта и Заказчиком, Людмила Гули...
Взаимодействие бизнес-аналитика с командой проекта и Заказчиком, Людмила Гули...
 
Человек со стокгольмским синдромом
Человек со стокгольмским синдромомЧеловек со стокгольмским синдромом
Человек со стокгольмским синдромом
 
Секрет фирмы: как устроен отдел системного бизнес-анализа в одной большой e-c...
Секрет фирмы: как устроен отдел системного бизнес-анализа в одной большой e-c...Секрет фирмы: как устроен отдел системного бизнес-анализа в одной большой e-c...
Секрет фирмы: как устроен отдел системного бизнес-анализа в одной большой e-c...
 
Аналитик 2.0. Расширенная версия
Аналитик 2.0. Расширенная версияАналитик 2.0. Расширенная версия
Аналитик 2.0. Расширенная версия
 
Нужные требования в нужное время
Нужные требования в нужное времяНужные требования в нужное время
Нужные требования в нужное время
 
UML. Взгляд со стороны
UML. Взгляд со стороныUML. Взгляд со стороны
UML. Взгляд со стороны
 
Больше чем документ
Больше чем документБольше чем документ
Больше чем документ
 
Идеальный аналитик и почему его не может быть
Идеальный аналитик и почему его не может бытьИдеальный аналитик и почему его не может быть
Идеальный аналитик и почему его не может быть
 
1504 ad- бизнес аналитик - решение проблем и внедрение изменений
1504 ad- бизнес аналитик - решение проблем и внедрение изменений1504 ad- бизнес аналитик - решение проблем и внедрение изменений
1504 ad- бизнес аналитик - решение проблем и внедрение изменений
 
требования к кандидату
требования к кандидатутребования к кандидату
требования к кандидату
 
Analyst Days 2014
Analyst Days 2014Analyst Days 2014
Analyst Days 2014
 
Специфика работы бизнес-аналитика в зависимости от типов проектов и методологий
Специфика работы бизнес-аналитика в зависимости от типов проектов и методологийСпецифика работы бизнес-аналитика в зависимости от типов проектов и методологий
Специфика работы бизнес-аналитика в зависимости от типов проектов и методологий
 
Обучение аналитиков - методы и программы
Обучение аналитиков - методы и программыОбучение аналитиков - методы и программы
Обучение аналитиков - методы и программы
 
Постоянные переключения контекста в жизни аналитика
Постоянные переключения контекста в жизни аналитикаПостоянные переключения контекста в жизни аналитика
Постоянные переключения контекста в жизни аналитика
 

Destacado

Ревью проектных документов – борьба за качество
Ревью проектных документов – борьба за качествоРевью проектных документов – борьба за качество
Ревью проектных документов – борьба за качествоSQALab
 
Региональный мастер-индекс пациентов
Региональный мастер-индекс пациентовРегиональный мастер-индекс пациентов
Региональный мастер-индекс пациентовSQALab
 
Открытая наука в России: практические шаги
Открытая наука в России: практические шагиОткрытая наука в России: практические шаги
Открытая наука в России: практические шагиDmitry Semyachkin
 
Прыжок веры. От настоящего к будущему
Прыжок веры. От настоящего к будущемуПрыжок веры. От настоящего к будущему
Прыжок веры. От настоящего к будущемуSQALab
 
Gap-анализ требований к внедряемым системам
Gap-анализ требований к внедряемым системамGap-анализ требований к внедряемым системам
Gap-анализ требований к внедряемым системамSPbCoA
 
Предложения по развитию университетов в рамках Национальной технологической и...
Предложения по развитию университетов в рамках Национальной технологической и...Предложения по развитию университетов в рамках Национальной технологической и...
Предложения по развитию университетов в рамках Национальной технологической и...Dmitry Semyachkin
 
Подходы к спецификации изменений
Подходы к спецификации измененийПодходы к спецификации изменений
Подходы к спецификации измененийSQALab
 
Особенности разработки требований в интеграционном проекте
Особенности разработки требований в интеграционном проектеОсобенности разработки требований в интеграционном проекте
Особенности разработки требований в интеграционном проектеSQALab
 
To requirements and beyond...
To requirements and beyond...To requirements and beyond...
To requirements and beyond...SQALab
 
Системный аналитик в Agile команде
Системный аналитик в Agile командеСистемный аналитик в Agile команде
Системный аналитик в Agile командеSQALab
 
Одна голова - плохо
Одна голова - плохоОдна голова - плохо
Одна голова - плохоSQALab
 

Destacado (12)

xPir
xPirxPir
xPir
 
Ревью проектных документов – борьба за качество
Ревью проектных документов – борьба за качествоРевью проектных документов – борьба за качество
Ревью проектных документов – борьба за качество
 
Региональный мастер-индекс пациентов
Региональный мастер-индекс пациентовРегиональный мастер-индекс пациентов
Региональный мастер-индекс пациентов
 
Открытая наука в России: практические шаги
Открытая наука в России: практические шагиОткрытая наука в России: практические шаги
Открытая наука в России: практические шаги
 
Прыжок веры. От настоящего к будущему
Прыжок веры. От настоящего к будущемуПрыжок веры. От настоящего к будущему
Прыжок веры. От настоящего к будущему
 
Gap-анализ требований к внедряемым системам
Gap-анализ требований к внедряемым системамGap-анализ требований к внедряемым системам
Gap-анализ требований к внедряемым системам
 
Предложения по развитию университетов в рамках Национальной технологической и...
Предложения по развитию университетов в рамках Национальной технологической и...Предложения по развитию университетов в рамках Национальной технологической и...
Предложения по развитию университетов в рамках Национальной технологической и...
 
Подходы к спецификации изменений
Подходы к спецификации измененийПодходы к спецификации изменений
Подходы к спецификации изменений
 
Особенности разработки требований в интеграционном проекте
Особенности разработки требований в интеграционном проектеОсобенности разработки требований в интеграционном проекте
Особенности разработки требований в интеграционном проекте
 
To requirements and beyond...
To requirements and beyond...To requirements and beyond...
To requirements and beyond...
 
Системный аналитик в Agile команде
Системный аналитик в Agile командеСистемный аналитик в Agile команде
Системный аналитик в Agile команде
 
Одна голова - плохо
Одна голова - плохоОдна голова - плохо
Одна голова - плохо
 

Similar a Прокачиваем информационные системы с помощью data science

Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии Evgeniy Pavlovskiy
 
Dsml for business.full version
Dsml for business.full versionDsml for business.full version
Dsml for business.full versionDmitry Guzenko
 
Современные методы анализа данных
Современные методы анализа данныхСовременные методы анализа данных
Современные методы анализа данныхDEVTYPE
 
Решения HPE Software для Больших данных
Решения HPE Software для Больших данныхРешения HPE Software для Больших данных
Решения HPE Software для Больших данныхYuri Yashkin
 
Business Intelligence. Современный взгляд
Business Intelligence. Современный взглядBusiness Intelligence. Современный взгляд
Business Intelligence. Современный взглядAndrey Korshikov
 
Искусственный интеллект и Big Data в бизнесе
Искусственный интеллект и Big Data в бизнесеИскусственный интеллект и Big Data в бизнесе
Искусственный интеллект и Big Data в бизнесеExpasoft
 
Query hunter презентация для КОНКУРСА РУССКИХ ИННОВАЦИЙ
Query hunter  презентация для КОНКУРСА РУССКИХ ИННОВАЦИЙQuery hunter  презентация для КОНКУРСА РУССКИХ ИННОВАЦИЙ
Query hunter презентация для КОНКУРСА РУССКИХ ИННОВАЦИЙqueryhunter
 
Логическая витрина для доступа к большим данным
Логическая витрина для доступа к большим даннымЛогическая витрина для доступа к большим данным
Логическая витрина для доступа к большим даннымSergey Gorshkov
 
Современные технологии автоматизации документооборота. Практический опыт повы...
Современные технологии автоматизации документооборота. Практический опыт повы...Современные технологии автоматизации документооборота. Практический опыт повы...
Современные технологии автоматизации документооборота. Практический опыт повы...Андрей Кучеров
 
Восемь подводных камней на пути к внедрению аналитики Больших данных
Восемь подводных камней на пути к внедрению аналитики Больших данныхВосемь подводных камней на пути к внедрению аналитики Больших данных
Восемь подводных камней на пути к внедрению аналитики Больших данныхElizaveta Alekseeva
 
Konstantin Obukhov - Customer Experience Technologies
Konstantin Obukhov - Customer Experience TechnologiesKonstantin Obukhov - Customer Experience Technologies
Konstantin Obukhov - Customer Experience TechnologiesAIST
 
Подготовка специалистов по анализу больших данных: все аспекты
Подготовка специалистов по анализу больших данных: все аспектыПодготовка специалистов по анализу больших данных: все аспекты
Подготовка специалистов по анализу больших данных: все аспектыEvgeniy Pavlovskiy
 
Профессия Data Scientist
 Профессия Data Scientist Профессия Data Scientist
Профессия Data ScientistLeonid Zhukov
 
QueryHunter project overview for lenovo
QueryHunter   project overview  for lenovoQueryHunter   project overview  for lenovo
QueryHunter project overview for lenovoqueryhunter
 
IT Network BACon agile spring. Дмитрий Гузенко - BA for Data Science & Machin...
IT Network BACon agile spring. Дмитрий Гузенко - BA for Data Science & Machin...IT Network BACon agile spring. Дмитрий Гузенко - BA for Data Science & Machin...
IT Network BACon agile spring. Дмитрий Гузенко - BA for Data Science & Machin...it-network
 
Bacon.2018.it pro network.ba for dsml
Bacon.2018.it pro network.ba for dsmlBacon.2018.it pro network.ba for dsml
Bacon.2018.it pro network.ba for dsmlDmitry Guzenko
 
Умное хранение — выжмите максимум из бизнес-данных!
Умное хранение — выжмите максимум из бизнес-данных!Умное хранение — выжмите максимум из бизнес-данных!
Умное хранение — выжмите максимум из бизнес-данных!КРОК
 
OSPconf Big Data Forum 2014 Ilya Gershanov
OSPconf Big Data Forum 2014 Ilya GershanovOSPconf Big Data Forum 2014 Ilya Gershanov
OSPconf Big Data Forum 2014 Ilya GershanovIlya Gershanov
 

Similar a Прокачиваем информационные системы с помощью data science (20)

Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии
 
Dsml for business.full version
Dsml for business.full versionDsml for business.full version
Dsml for business.full version
 
Современные методы анализа данных
Современные методы анализа данныхСовременные методы анализа данных
Современные методы анализа данных
 
Решения HPE Software для Больших данных
Решения HPE Software для Больших данныхРешения HPE Software для Больших данных
Решения HPE Software для Больших данных
 
Business Intelligence. Современный взгляд
Business Intelligence. Современный взглядBusiness Intelligence. Современный взгляд
Business Intelligence. Современный взгляд
 
Искусственный интеллект и Big Data в бизнесе
Искусственный интеллект и Big Data в бизнесеИскусственный интеллект и Big Data в бизнесе
Искусственный интеллект и Big Data в бизнесе
 
Query hunter презентация для КОНКУРСА РУССКИХ ИННОВАЦИЙ
Query hunter  презентация для КОНКУРСА РУССКИХ ИННОВАЦИЙQuery hunter  презентация для КОНКУРСА РУССКИХ ИННОВАЦИЙ
Query hunter презентация для КОНКУРСА РУССКИХ ИННОВАЦИЙ
 
Логическая витрина для доступа к большим данным
Логическая витрина для доступа к большим даннымЛогическая витрина для доступа к большим данным
Логическая витрина для доступа к большим данным
 
Современные технологии автоматизации документооборота. Практический опыт повы...
Современные технологии автоматизации документооборота. Практический опыт повы...Современные технологии автоматизации документооборота. Практический опыт повы...
Современные технологии автоматизации документооборота. Практический опыт повы...
 
Восемь подводных камней на пути к внедрению аналитики Больших данных
Восемь подводных камней на пути к внедрению аналитики Больших данныхВосемь подводных камней на пути к внедрению аналитики Больших данных
Восемь подводных камней на пути к внедрению аналитики Больших данных
 
Байдалина472(2)
Байдалина472(2)Байдалина472(2)
Байдалина472(2)
 
Konstantin Obukhov - Customer Experience Technologies
Konstantin Obukhov - Customer Experience TechnologiesKonstantin Obukhov - Customer Experience Technologies
Konstantin Obukhov - Customer Experience Technologies
 
Подготовка специалистов по анализу больших данных: все аспекты
Подготовка специалистов по анализу больших данных: все аспектыПодготовка специалистов по анализу больших данных: все аспекты
Подготовка специалистов по анализу больших данных: все аспекты
 
Взгляд на Data Science
Взгляд на Data ScienceВзгляд на Data Science
Взгляд на Data Science
 
Профессия Data Scientist
 Профессия Data Scientist Профессия Data Scientist
Профессия Data Scientist
 
QueryHunter project overview for lenovo
QueryHunter   project overview  for lenovoQueryHunter   project overview  for lenovo
QueryHunter project overview for lenovo
 
IT Network BACon agile spring. Дмитрий Гузенко - BA for Data Science & Machin...
IT Network BACon agile spring. Дмитрий Гузенко - BA for Data Science & Machin...IT Network BACon agile spring. Дмитрий Гузенко - BA for Data Science & Machin...
IT Network BACon agile spring. Дмитрий Гузенко - BA for Data Science & Machin...
 
Bacon.2018.it pro network.ba for dsml
Bacon.2018.it pro network.ba for dsmlBacon.2018.it pro network.ba for dsml
Bacon.2018.it pro network.ba for dsml
 
Умное хранение — выжмите максимум из бизнес-данных!
Умное хранение — выжмите максимум из бизнес-данных!Умное хранение — выжмите максимум из бизнес-данных!
Умное хранение — выжмите максимум из бизнес-данных!
 
OSPconf Big Data Forum 2014 Ilya Gershanov
OSPconf Big Data Forum 2014 Ilya GershanovOSPconf Big Data Forum 2014 Ilya Gershanov
OSPconf Big Data Forum 2014 Ilya Gershanov
 

Más de SQALab

Готовим стажировку
Готовим стажировкуГотовим стажировку
Готовим стажировкуSQALab
 
Куда приводят мечты? или Искусство развития тестировщика
Куда приводят мечты? или Искусство развития тестировщикаКуда приводят мечты? или Искусство развития тестировщика
Куда приводят мечты? или Искусство развития тестировщикаSQALab
 
Оптимизация Selenium тестов и ускорение их поддержки
Оптимизация Selenium тестов и ускорение их поддержкиОптимизация Selenium тестов и ускорение их поддержки
Оптимизация Selenium тестов и ускорение их поддержкиSQALab
 
Автоматизация 0.0: 0 - бюджет, 0 - опыт программирования
Автоматизация 0.0: 0 - бюджет, 0 - опыт программированияАвтоматизация 0.0: 0 - бюджет, 0 - опыт программирования
Автоматизация 0.0: 0 - бюджет, 0 - опыт программированияSQALab
 
Нагрузочное тестирование нестандартных протоколов с использованием Citrix и J...
Нагрузочное тестирование нестандартных протоколов с использованием Citrix и J...Нагрузочное тестирование нестандартных протоколов с использованием Citrix и J...
Нагрузочное тестирование нестандартных протоколов с использованием Citrix и J...SQALab
 
Continuous performance testing
Continuous performance testingContinuous performance testing
Continuous performance testingSQALab
 
Конфиги вместо костылей. Pytestconfig и зачем он нужен
Конфиги вместо костылей. Pytestconfig и зачем он нуженКонфиги вместо костылей. Pytestconfig и зачем он нужен
Конфиги вместо костылей. Pytestconfig и зачем он нуженSQALab
 
Команда чемпионов в ИТ стихии
Команда чемпионов в ИТ стихииКоманда чемпионов в ИТ стихии
Команда чемпионов в ИТ стихииSQALab
 
API. Серебряная пуля в магазине советов
API. Серебряная пуля в магазине советовAPI. Серебряная пуля в магазине советов
API. Серебряная пуля в магазине советовSQALab
 
Добиваемся эффективности каждого из 9000+ UI-тестов
Добиваемся эффективности каждого из 9000+ UI-тестовДобиваемся эффективности каждого из 9000+ UI-тестов
Добиваемся эффективности каждого из 9000+ UI-тестовSQALab
 
Делаем автоматизацию проектных KPIs
Делаем автоматизацию проектных KPIsДелаем автоматизацию проектных KPIs
Делаем автоматизацию проектных KPIsSQALab
 
Вредные привычки в тест-менеджменте
Вредные привычки в тест-менеджментеВредные привычки в тест-менеджменте
Вредные привычки в тест-менеджментеSQALab
 
Мощь переполняет с JDI 2.0 - новая эра UI автоматизации
Мощь переполняет с JDI 2.0 - новая эра UI автоматизацииМощь переполняет с JDI 2.0 - новая эра UI автоматизации
Мощь переполняет с JDI 2.0 - новая эра UI автоматизацииSQALab
 
Как hh.ru дошли до 500 релизов в квартал без потери в качестве
Как hh.ru дошли до 500 релизов в квартал без потери в качествеКак hh.ru дошли до 500 релизов в квартал без потери в качестве
Как hh.ru дошли до 500 релизов в квартал без потери в качествеSQALab
 
Стили лидерства и тестирование
Стили лидерства и тестированиеСтили лидерства и тестирование
Стили лидерства и тестированиеSQALab
 
"Давайте не будем про качество"
"Давайте не будем про качество""Давайте не будем про качество"
"Давайте не будем про качество"SQALab
 
Apache.JMeter для .NET-проектов
Apache.JMeter для .NET-проектовApache.JMeter для .NET-проектов
Apache.JMeter для .NET-проектовSQALab
 
Тестирование геолокационных систем
Тестирование геолокационных системТестирование геолокационных систем
Тестирование геолокационных системSQALab
 
Лидер или босс? Вот в чем вопрос
Лидер или босс? Вот в чем вопросЛидер или босс? Вот в чем вопрос
Лидер или босс? Вот в чем вопросSQALab
 
От Зефира в коробке к Structure Zephyr или как тест-менеджеру перекроить внут...
От Зефира в коробке к Structure Zephyr или как тест-менеджеру перекроить внут...От Зефира в коробке к Structure Zephyr или как тест-менеджеру перекроить внут...
От Зефира в коробке к Structure Zephyr или как тест-менеджеру перекроить внут...SQALab
 

Más de SQALab (20)

Готовим стажировку
Готовим стажировкуГотовим стажировку
Готовим стажировку
 
Куда приводят мечты? или Искусство развития тестировщика
Куда приводят мечты? или Искусство развития тестировщикаКуда приводят мечты? или Искусство развития тестировщика
Куда приводят мечты? или Искусство развития тестировщика
 
Оптимизация Selenium тестов и ускорение их поддержки
Оптимизация Selenium тестов и ускорение их поддержкиОптимизация Selenium тестов и ускорение их поддержки
Оптимизация Selenium тестов и ускорение их поддержки
 
Автоматизация 0.0: 0 - бюджет, 0 - опыт программирования
Автоматизация 0.0: 0 - бюджет, 0 - опыт программированияАвтоматизация 0.0: 0 - бюджет, 0 - опыт программирования
Автоматизация 0.0: 0 - бюджет, 0 - опыт программирования
 
Нагрузочное тестирование нестандартных протоколов с использованием Citrix и J...
Нагрузочное тестирование нестандартных протоколов с использованием Citrix и J...Нагрузочное тестирование нестандартных протоколов с использованием Citrix и J...
Нагрузочное тестирование нестандартных протоколов с использованием Citrix и J...
 
Continuous performance testing
Continuous performance testingContinuous performance testing
Continuous performance testing
 
Конфиги вместо костылей. Pytestconfig и зачем он нужен
Конфиги вместо костылей. Pytestconfig и зачем он нуженКонфиги вместо костылей. Pytestconfig и зачем он нужен
Конфиги вместо костылей. Pytestconfig и зачем он нужен
 
Команда чемпионов в ИТ стихии
Команда чемпионов в ИТ стихииКоманда чемпионов в ИТ стихии
Команда чемпионов в ИТ стихии
 
API. Серебряная пуля в магазине советов
API. Серебряная пуля в магазине советовAPI. Серебряная пуля в магазине советов
API. Серебряная пуля в магазине советов
 
Добиваемся эффективности каждого из 9000+ UI-тестов
Добиваемся эффективности каждого из 9000+ UI-тестовДобиваемся эффективности каждого из 9000+ UI-тестов
Добиваемся эффективности каждого из 9000+ UI-тестов
 
Делаем автоматизацию проектных KPIs
Делаем автоматизацию проектных KPIsДелаем автоматизацию проектных KPIs
Делаем автоматизацию проектных KPIs
 
Вредные привычки в тест-менеджменте
Вредные привычки в тест-менеджментеВредные привычки в тест-менеджменте
Вредные привычки в тест-менеджменте
 
Мощь переполняет с JDI 2.0 - новая эра UI автоматизации
Мощь переполняет с JDI 2.0 - новая эра UI автоматизацииМощь переполняет с JDI 2.0 - новая эра UI автоматизации
Мощь переполняет с JDI 2.0 - новая эра UI автоматизации
 
Как hh.ru дошли до 500 релизов в квартал без потери в качестве
Как hh.ru дошли до 500 релизов в квартал без потери в качествеКак hh.ru дошли до 500 релизов в квартал без потери в качестве
Как hh.ru дошли до 500 релизов в квартал без потери в качестве
 
Стили лидерства и тестирование
Стили лидерства и тестированиеСтили лидерства и тестирование
Стили лидерства и тестирование
 
"Давайте не будем про качество"
"Давайте не будем про качество""Давайте не будем про качество"
"Давайте не будем про качество"
 
Apache.JMeter для .NET-проектов
Apache.JMeter для .NET-проектовApache.JMeter для .NET-проектов
Apache.JMeter для .NET-проектов
 
Тестирование геолокационных систем
Тестирование геолокационных системТестирование геолокационных систем
Тестирование геолокационных систем
 
Лидер или босс? Вот в чем вопрос
Лидер или босс? Вот в чем вопросЛидер или босс? Вот в чем вопрос
Лидер или босс? Вот в чем вопрос
 
От Зефира в коробке к Structure Zephyr или как тест-менеджеру перекроить внут...
От Зефира в коробке к Structure Zephyr или как тест-менеджеру перекроить внут...От Зефира в коробке к Structure Zephyr или как тест-менеджеру перекроить внут...
От Зефира в коробке к Structure Zephyr или как тест-менеджеру перекроить внут...
 

Прокачиваем информационные системы с помощью data science

  • 2. Зачем это нужно знать аналитику?
  • 3. Глоссарий Информационная система - совокупность технического, программного и организационного обеспечения, а также персонала, предназначенная для того, чтобы своевременно обеспечивать надлежащих людей надлежащей информацией [William S]. Информационная система - это взаимосвязанная совокупность информационных, технических, программных, математических, организационных, правовых, эргономических, лингвистических, технологических и других средств, а также персонала, предназначенная для сбора, обработки, хранения и выдачи экономической информации и принятия управленческих решений [М.Р. Когаловский]. Наука о данных (data science) = Big data + Data Mining + Machine Learning.
  • 4. Дешевый вход в область data science • Open source over 3K • Научные статьи, блоги, лучшие практики over 100K Узнали опыт коллег Добавили эвристик Взяли что-то готовое Тут уже сложно
  • 5. Где мы находимся по отношению к уровню развития бизнеса? В этой области нет места инновациям Здесь появляется
  • 6. Где мы находимся по отношению к данным? Процессы Уровни – заказная разработка, o utsource, интегратор, консалтинг Данные Уровни – бизнес, in-house, 100 лет сопровождения Экспертиза в data science Уровень – внешняя команда
  • 7. Обработка данных – драйвер роста бизнеса • Контур • 1C Битрикс • Yandex, Rambler, Mail.ru • Операторы связи • Банки • Ритейл
  • 8. Что такое данные ? • Цифры • Тексты • Логи • БД в конец концов • Внешние источники О некоторых аспектах бизнеса заказчика вы можете узнать больше заказчика
  • 9. Основные точки применения • Интеграция в процессы принятия решений • Поиск • Интеллектуальные подсказчики • Контроль работы персонала • Актуальные задачи предметной области Центральная задача – принятие решений. Любое решение стоит дорого, особенно если он неверно.
  • 10. Задачи Минобрнауки • Как сформировать приоритетные направления? • Кому выделить финансирование? Сколько? • Как проложить мост между промышленностью и наукой? • Кого оставить на плаву в условиях кризиса? • Кто эксперт в узкой области? • Как найти ценные разработки в десятках миллионов документов?
  • 11. Поехали! Получаем все слова документов
  • 15. Переходим в векторное пространство
  • 18. Специфика задач data science • Множество ложных гипотез • Нет промышленного кода долгое время • Предобработка данных – 70% времени • Обоснование ROI для каждой задачи
  • 19. Траектория решения задач data science 1. Гипотезы -> Верификация 2. Получение выборки данных 3. Эксперименты 4. Обоснование ROI 5. Инфраструктура Big data 6. Внедрение в реальные бизнес- процессы
  • 25. Графы связей организаций • Поиск явных связей • Выявление конкурентов • Выявление возможных партнеров
  • 26. НТИ • Отчеты по организациям • Отчеты по персона • Отчеты по научно-техническим разработкам • Полный отчет по АэроНэт – 2033 страницы
  • 27. Факторы успеха 1. Вовлеченный заказчик 2. Вникнуть в бизнес 3. Мониторинг новинок 4. Академические связи 5. Обмен опытом 6. Быстрые эксперименты 7. Люди с компетенциями
  • 28. Рекомендуемые инструменты и алгоритмы • Word2Vec • SVD • Mystem • Breeze NLP • Snappy • Akka • Apache Solr • Apache Spark • REDSVD • BLAS • CBC • HAC • Scala NLP • LDA + GS • DBscan • Optics • Boilerpipe • Scala/MongoDB/Postgress
  • 29. В 21 веке информационные системы должны быть интеллектуальными Шашев Сергей, sshashev@naumen.ru • Не нужно быть гуру математики для внедрения элементов data science • Открытых знаний и рецептов – море • Объем Open Source и продуктов – тысячи систем • Аналитик – драйвер прокачки информационных систем