SlideShare una empresa de Scribd logo
1 de 32
Магия
или
Наука?
5%
23%
в год – так
увеличивался объем
цифровых данных
в 1986-2007 годах
2,5 экзабайта
данных создается каждый день.
это объем данных хранимый в
7,5 тысячах библиотек конгресса
США
90%
данных в мире
созданы за
последние два года,
если верить
экспертам
в 2002
году цифровые
носители обогнали
аналоговые по объему
хранения данных
3 млрд
Онлайн
В 2000 только 738 миллионов
человек использовали
интернет, к 2015 это число
увеличилось до 3,2
милиардов
204
Миллиона писем
посылается каждую
минуту
40 зетабайт
К 2020 году
BW/4
HANA
ASE
IQ
HANA
Math-Statistics
Databases
1970
Knowledge
Discovery in
Databases 1989
Artificial Intelligence 1950
Machine learning
1959
Artificial
Neural
Networks
1943
Deep
Learning
1965
Классификация моделей машинного обучения
I N N O V A T I O N F A
K S V S P S X G T M L I
H Y S T A N D A R D E Z
S P E E D R T G B N X S
G X C O S T D I S O I W
S S U S J H S L R P B D
A C R K O S N E S Q L Y
W E E L A S T I C U E S
Поиск закономерностей
∑ ϕ
Стоимость
Погода
Работа
Еда
Искусственный нейронНейрон
5
4
2
1
1
0
0
1
≥6
6
0
0
1
1
3
Биологическая нейронная
сеть
Искусственная нейронная
сеть
Могу творить, могу и натворить!
У меня два недостатка: плохая память и
что-то еще.
Никто не знает столько, сколько не знаю
я.
ОРПорыав аоырОрпаыор
ОрОРАыдцуцзущгкгеуб
ыватьыивдцулвдлоадузцщ
Йцхяь длваополц ыадолцлопиолым
бамдлотдламда
Нормальный текст Белиберда
Еще одна задача
ат 1 мо 2 ри 2
во 2 на 1 тв 2
гу 2 ог 2 ть 2
ит 2 ор 2
Нормальный текст
Нормальный текст
ат 1 мо 2 ри 2
во 2 на 1 тв 2
гу 2 ог 2 ть 2
ит 2 ор 2
Война и мир
то 8411 на 6236 на 6236
ст 6591 не 5199 оу 31
на 6236 по 5174 мб 2
оу 31 ен 4211 тж 1
Могу творить, могу и натворить! — 1805
У меня два недостатка: плохая память и
что-то еще. — 1535
Никто не знает столько, сколько не знаю я.
— 2274
ОРПорыав аоырОрпаыор
ОрОРАыдцуцзущгкгеуб
ыватьыивдцулвдлоадузцщ - 44
Йцхяь длваополц ыадолцлопиолым
бамдлотдламда - 149
Нормальный текст Белиберда
1. Выделили признаки чистых строк, а именно пары символов
2. На основании выделенных признаков построили
математическую модель и обучили ее на примерах
3. На основе математической модели посчитали рейтинг
«правдоподобности»
4. Высокий рейтинг «правдоподобности» указывает на
нормальный текст
Давайте порисуем!
Можно ли увидеть как учится нейронная сеть?
SAP‘s Digital Transformation Platform
ML
4INTERNAL© 2017 SAP SE or an SAP affiliate company. All rights reserved. ǀ
Инновационный набор, который включает в себя
подход, набор программных продуктов и
акселераторов для цифровой трансформации
5INTERNAL© 2017 SAP SE or an SAP affiliate company. All rights reserved. ǀ
7INTERNAL© 2017 SAP SE or an SAP affiliate company. All rights reserved. ǀ
Systems of Record
SAP Leonardo Подход к Цифровой Трансформации
Обзор платформы SAP Leonardo ML
21
User
Profile Matching
Service Analytics
Invoice Processing
...
Image / Video
Advanced Numerical
Text
...
Data
Scientist
Developer
ML Business Services ML Technical Services
Provisioning Infrastructure
Resource Manager
Training Orchestrator
ML Libraries
Training Infrastructure
SAP Leonardo ML Applications
API Business Hub
Language Bindings
Data Science Interface
SAP Leonardo ML on SAP Cloud Platform
Сервисы SAP ML по работе с данными
Tabular Image Text Audio/ Video
General
availability*
 Time series change point
detection
 Time series forecasting
(AA algorithm)
 Clustering
 Key influencer analysis
 Outlier detection
 Recommendation
 What-if analysis
 Image classification
 Image feature extraction
 Earth observation analysis
 Topic detection/keyword
extraction
Alpha  Time series forecasting
(R algorithms)
 Similarity scoring
 Product image classification  Machine translation
 Document feature extraction
 Language detection
 Product text classification
Road map  Time-to-failure forecasting
 Association rule learning
 Image segmentation
 Face detection
 Document optical character
recognition
 Image text extraction
 Image NER/extraction
 Apparel detection
 Sentiment analysis
 Named entity recognition
 Text classification
 Hate speech detection
 File-to-text conversion
 Speech-to-text
 Text-to-speech
 Voice recognition
(speaker identification)
 Video object segmentation
 Video classification
 Video human action recognition
* Prioritized for SAPPHIRE NOW delivery
Бизнес-решения SAP с элементами ИИ
SAP
Resume
matching
SAP Cash
application
SAP
Service
Ticket
intelligence
SAP Brand
Impact
© 2017 SAP SE or an SAP affiliate company. All rights reserved.
Проблемы бухгалтера при соотнесении счетов и платежей
Бухгалтер
Платежи
Детали
счета
Платеж Счета
Платеж
£
Счет
€
Платеж
$1,200
Счет
$1,300
Платежи
Клиент
Номер платежа10003,
сумма $2000.
Наверное это за счета
F5132 + Invoice F2672 + …
= $2000?
Добрый день! Мы
получили платеж
10003.
Он оплачивает счета
F5132 + F2672
+ … ... ?
2 часа спустя…
• Простых правил автоматизации недостаточно, ведь платеж может не содержать ссылок
• Бухгалтеру приходится держать в голове большое число исключений
• Процесс требует большого количества времени
© 2017 SAP SE or an SAP affiliate company. All rights reserved.
Service Ticket Intelligence
Потери времени при первичной обработке обращений
Бизнес проблема
o Теряется большое количество
времени на определение категории
обращения и правильной сервисной
команды
o Негативное влияние на уровень
сервиса Сложное ведение Базы
знаний для ответы на похожие
запросы
От: XXXXXX
Обычные атрибуты обращения в
поддержку
Тема:
Текст (вопрос):
Сервисная категория:
Категория проблемы:
Решение (ответ):
“текст”
“метка”
“ответ”
© 2017 SAP SE or an SAP affiliate company. All rights reserved.
From: XXXXXX
Subject:
Message
(question):
Service category:
Incident category:
Solution provided
(answer):
Исторические данные с
сообщениями, метками и ответами
Подготовка данных
Обучение
Сохранение модели
From: XXXXXX
Subject:
Message
(question):
Service category:
Incident category:
Solution provided
(answer):
Новое обращение через
e-mail, соцсети или CRM
Предиктивный сервис
From: XXXXXX
Subject:
Message
(question):
Service category:
Incident category:
Solution provided
(answer):
Предсказание категории и
предложение ответов сотруднику
поддержки
Обратная связь
до-обучения
“сообщение”
“метки”
“ответ”
Service Ticket Intelligence
Схема решения
Ключевые пункты решения
o Модель приложения обучается на
исторических данных
o Запросы распределяются
автоматически
o Модель сама предлагает ответ
Итог
o Сокращается время обработки
o Сокращается время ответа на
типовые запросы
o Улучшается уровень сервиса
Национальная Жандармерия Франции
Прогнозирование уровня
преступности используется:
• Для расстановки
патрульных сил и
предотвращения
преступлений
• Объективной оценки и
оптимизация работы
местных отделений
полиции
Прогноз
Факт
Прогноз
Факт
Фактический уровень
преступности ниже прогноза
– эффективная работа
полиции
Фактический уровень
преступности выше
прогноза – неэффективная
работа полиции или не
выявленные факторы
Национальная Жандармерия Франции
Прогнозирование уровня
преступности.
Используется:
• Для расстановки
патрульных сил и
предотвращения
преступлений
• Объективной оценки и
оптимизация работы
местных отделений
полиции
Allociné: Сайт база данных кинофильмов
• Снижение доходов от рекламы
• Требовалось повысить количество просмотров страниц
• Повысить добавленную стоимость персональных
рекомендаций по фильмам
• Персонализация 220 миллионов страниц в месяц
• Рекомендации для неавторизованных пользователей на
основании «схожести» фильмов
• Рекомендации для идентифицированных пользователей
на основании «схожести» рейтингов
• Увеличение доходов от рекламы на 9% за счёт
повышения количества просмотров на визит
Bigpoint – индустрия онлайн игр
Бизнес задачи
 Увеличить уровень конверсии бесплатных пользователей, в
платящих
 Увеличить среднюю прибыль на игрока
 Снизить отток игроков
Технические задачи
 Использовать возможности SAP HANA для обработки данных в
режиме реального времени и алгоритмы классификации для
разработки персонализированных рекомендаций по каждому
игроку
 Анализировать огромное количество данных для прогноза
пользовательского поведения
Выгоды
 Обработка 5000 событий в секунду
 10-30% увеличение выручки в год
 Интерактивный инструмент для анализа и принятия
управленческих решений
SAP _ presentation about Machine learning
SAP _ presentation about Machine learning

Más contenido relacionado

Similar a SAP _ presentation about Machine learning

Dsml for business.full version
Dsml for business.full versionDsml for business.full version
Dsml for business.full versionDmitry Guzenko
 
Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии Evgeniy Pavlovskiy
 
Отделение компьютерных наук
Отделение компьютерных наукОтделение компьютерных наук
Отделение компьютерных наукInussic
 
Ya marketer
Ya marketerYa marketer
Ya marketerYandex
 
Обзор современного состояния области алгоритмов и структур данных
Обзор современного состояния области алгоритмов и структур данныхОбзор современного состояния области алгоритмов и структур данных
Обзор современного состояния области алгоритмов и структур данныхmaxkalachev
 
Обзор современного состояния области алгоритмов и структур данных
Обзор современного состояния области алгоритмов и структур данныхОбзор современного состояния области алгоритмов и структур данных
Обзор современного состояния области алгоритмов и структур данныхSoftline
 
2013 05 phd масалович
2013 05 phd масалович2013 05 phd масалович
2013 05 phd масаловичPositive Hack Days
 
Aндрей Mасалович. Конкурентная разведка в Интернете.
Aндрей Mасалович. Конкурентная разведка в Интернете.Aндрей Mасалович. Конкурентная разведка в Интернете.
Aндрей Mасалович. Конкурентная разведка в Интернете.Positive Hack Days
 
Cognitive Forms - описание технологий
Cognitive Forms - описание технологийCognitive Forms - описание технологий
Cognitive Forms - описание технологийAnton Nazarkin
 
Поисковая аналитика DDS-2 (2016)
Поисковая аналитика DDS-2 (2016)Поисковая аналитика DDS-2 (2016)
Поисковая аналитика DDS-2 (2016)Стас Поломарь
 
Project Management 2.0: AI Transformation
Project Management 2.0: AI TransformationProject Management 2.0: AI Transformation
Project Management 2.0: AI TransformationEduard Tyantov
 
BigData в онлайн-маркетинге для малого и среднего бизнеса
BigData в онлайн-маркетинге для малого и среднего бизнесаBigData в онлайн-маркетинге для малого и среднего бизнеса
BigData в онлайн-маркетинге для малого и среднего бизнесаBranchMarketing
 
Предотвращение утечки конфиденциальной информации в электронном документообороте
Предотвращение утечки конфиденциальной информации в электронном документооборотеПредотвращение утечки конфиденциальной информации в электронном документообороте
Предотвращение утечки конфиденциальной информации в электронном документооборотеDocsvision
 
Распознавание лиц в реальном времени по базам фотографий глобального масштаба...
Распознавание лиц в реальном времени по базам фотографий глобального масштаба...Распознавание лиц в реальном времени по базам фотографий глобального масштаба...
Распознавание лиц в реальном времени по базам фотографий глобального масштаба...Ontico
 
когнитивные технологии, Ibm
когнитивные технологии, Ibmкогнитивные технологии, Ibm
когнитивные технологии, IbmSkolkovo Robotics Center
 
Инсайдеры: стороны взаимодействия - Сергей Кавун
Инсайдеры: стороны взаимодействия - Сергей КавунИнсайдеры: стороны взаимодействия - Сергей Кавун
Инсайдеры: стороны взаимодействия - Сергей КавунHackIT Ukraine
 
Искусственный интеллект. Революция в машинном обучении.
Искусственный интеллект. Революция в машинном обучении.Искусственный интеллект. Революция в машинном обучении.
Искусственный интеллект. Революция в машинном обучении.Molinos
 
Несовершенство компьютерных технологий - почему так много до сих пор зависит ...
Несовершенство компьютерных технологий - почему так много до сих пор зависит ...Несовершенство компьютерных технологий - почему так много до сих пор зависит ...
Несовершенство компьютерных технологий - почему так много до сих пор зависит ...Pavel Cherkashin
 

Similar a SAP _ presentation about Machine learning (20)

Dsml for business.full version
Dsml for business.full versionDsml for business.full version
Dsml for business.full version
 
Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии
 
Отделение компьютерных наук
Отделение компьютерных наукОтделение компьютерных наук
Отделение компьютерных наук
 
Ya marketer
Ya marketerYa marketer
Ya marketer
 
SECON'2014 - Андрей Устюжанин - Маленькие секреты больших данных
SECON'2014 - Андрей Устюжанин - Маленькие секреты больших данныхSECON'2014 - Андрей Устюжанин - Маленькие секреты больших данных
SECON'2014 - Андрей Устюжанин - Маленькие секреты больших данных
 
Обзор современного состояния области алгоритмов и структур данных
Обзор современного состояния области алгоритмов и структур данныхОбзор современного состояния области алгоритмов и структур данных
Обзор современного состояния области алгоритмов и структур данных
 
Обзор современного состояния области алгоритмов и структур данных
Обзор современного состояния области алгоритмов и структур данныхОбзор современного состояния области алгоритмов и структур данных
Обзор современного состояния области алгоритмов и структур данных
 
2013 05 phd масалович
2013 05 phd масалович2013 05 phd масалович
2013 05 phd масалович
 
Aндрей Mасалович. Конкурентная разведка в Интернете.
Aндрей Mасалович. Конкурентная разведка в Интернете.Aндрей Mасалович. Конкурентная разведка в Интернете.
Aндрей Mасалович. Конкурентная разведка в Интернете.
 
Cognitive Forms - описание технологий
Cognitive Forms - описание технологийCognitive Forms - описание технологий
Cognitive Forms - описание технологий
 
Поисковая аналитика DDS-2 (2016)
Поисковая аналитика DDS-2 (2016)Поисковая аналитика DDS-2 (2016)
Поисковая аналитика DDS-2 (2016)
 
Project Management 2.0: AI Transformation
Project Management 2.0: AI TransformationProject Management 2.0: AI Transformation
Project Management 2.0: AI Transformation
 
BigData в онлайн-маркетинге для малого и среднего бизнеса
BigData в онлайн-маркетинге для малого и среднего бизнесаBigData в онлайн-маркетинге для малого и среднего бизнеса
BigData в онлайн-маркетинге для малого и среднего бизнеса
 
Предотвращение утечки конфиденциальной информации в электронном документообороте
Предотвращение утечки конфиденциальной информации в электронном документооборотеПредотвращение утечки конфиденциальной информации в электронном документообороте
Предотвращение утечки конфиденциальной информации в электронном документообороте
 
Распознавание лиц в реальном времени по базам фотографий глобального масштаба...
Распознавание лиц в реальном времени по базам фотографий глобального масштаба...Распознавание лиц в реальном времени по базам фотографий глобального масштаба...
Распознавание лиц в реальном времени по базам фотографий глобального масштаба...
 
Про DLP (Баку) 2014 11
Про DLP (Баку) 2014 11Про DLP (Баку) 2014 11
Про DLP (Баку) 2014 11
 
когнитивные технологии, Ibm
когнитивные технологии, Ibmкогнитивные технологии, Ibm
когнитивные технологии, Ibm
 
Инсайдеры: стороны взаимодействия - Сергей Кавун
Инсайдеры: стороны взаимодействия - Сергей КавунИнсайдеры: стороны взаимодействия - Сергей Кавун
Инсайдеры: стороны взаимодействия - Сергей Кавун
 
Искусственный интеллект. Революция в машинном обучении.
Искусственный интеллект. Революция в машинном обучении.Искусственный интеллект. Революция в машинном обучении.
Искусственный интеллект. Революция в машинном обучении.
 
Несовершенство компьютерных технологий - почему так много до сих пор зависит ...
Несовершенство компьютерных технологий - почему так много до сих пор зависит ...Несовершенство компьютерных технологий - почему так много до сих пор зависит ...
Несовершенство компьютерных технологий - почему так много до сих пор зависит ...
 

SAP _ presentation about Machine learning

  • 2. 5% 23% в год – так увеличивался объем цифровых данных в 1986-2007 годах 2,5 экзабайта данных создается каждый день. это объем данных хранимый в 7,5 тысячах библиотек конгресса США 90% данных в мире созданы за последние два года, если верить экспертам в 2002 году цифровые носители обогнали аналоговые по объему хранения данных 3 млрд Онлайн В 2000 только 738 миллионов человек использовали интернет, к 2015 это число увеличилось до 3,2 милиардов 204 Миллиона писем посылается каждую минуту 40 зетабайт К 2020 году BW/4 HANA ASE IQ HANA
  • 3. Math-Statistics Databases 1970 Knowledge Discovery in Databases 1989 Artificial Intelligence 1950 Machine learning 1959 Artificial Neural Networks 1943 Deep Learning 1965
  • 5.
  • 6.
  • 7.
  • 8. I N N O V A T I O N F A K S V S P S X G T M L I H Y S T A N D A R D E Z S P E E D R T G B N X S G X C O S T D I S O I W S S U S J H S L R P B D A C R K O S N E S Q L Y W E E L A S T I C U E S Поиск закономерностей
  • 11. Могу творить, могу и натворить! У меня два недостатка: плохая память и что-то еще. Никто не знает столько, сколько не знаю я. ОРПорыав аоырОрпаыор ОрОРАыдцуцзущгкгеуб ыватьыивдцулвдлоадузцщ Йцхяь длваополц ыадолцлопиолым бамдлотдламда Нормальный текст Белиберда Еще одна задача
  • 12. ат 1 мо 2 ри 2 во 2 на 1 тв 2 гу 2 ог 2 ть 2 ит 2 ор 2 Нормальный текст
  • 13. Нормальный текст ат 1 мо 2 ри 2 во 2 на 1 тв 2 гу 2 ог 2 ть 2 ит 2 ор 2 Война и мир то 8411 на 6236 на 6236 ст 6591 не 5199 оу 31 на 6236 по 5174 мб 2 оу 31 ен 4211 тж 1
  • 14. Могу творить, могу и натворить! — 1805 У меня два недостатка: плохая память и что-то еще. — 1535 Никто не знает столько, сколько не знаю я. — 2274 ОРПорыав аоырОрпаыор ОрОРАыдцуцзущгкгеуб ыватьыивдцулвдлоадузцщ - 44 Йцхяь длваополц ыадолцлопиолым бамдлотдламда - 149 Нормальный текст Белиберда
  • 15. 1. Выделили признаки чистых строк, а именно пары символов 2. На основании выделенных признаков построили математическую модель и обучили ее на примерах 3. На основе математической модели посчитали рейтинг «правдоподобности» 4. Высокий рейтинг «правдоподобности» указывает на нормальный текст
  • 17. Можно ли увидеть как учится нейронная сеть?
  • 18. SAP‘s Digital Transformation Platform ML 4INTERNAL© 2017 SAP SE or an SAP affiliate company. All rights reserved. ǀ Инновационный набор, который включает в себя подход, набор программных продуктов и акселераторов для цифровой трансформации
  • 19. 5INTERNAL© 2017 SAP SE or an SAP affiliate company. All rights reserved. ǀ
  • 20. 7INTERNAL© 2017 SAP SE or an SAP affiliate company. All rights reserved. ǀ Systems of Record SAP Leonardo Подход к Цифровой Трансформации
  • 21. Обзор платформы SAP Leonardo ML 21 User Profile Matching Service Analytics Invoice Processing ... Image / Video Advanced Numerical Text ... Data Scientist Developer ML Business Services ML Technical Services Provisioning Infrastructure Resource Manager Training Orchestrator ML Libraries Training Infrastructure SAP Leonardo ML Applications API Business Hub Language Bindings Data Science Interface SAP Leonardo ML on SAP Cloud Platform
  • 22. Сервисы SAP ML по работе с данными Tabular Image Text Audio/ Video General availability*  Time series change point detection  Time series forecasting (AA algorithm)  Clustering  Key influencer analysis  Outlier detection  Recommendation  What-if analysis  Image classification  Image feature extraction  Earth observation analysis  Topic detection/keyword extraction Alpha  Time series forecasting (R algorithms)  Similarity scoring  Product image classification  Machine translation  Document feature extraction  Language detection  Product text classification Road map  Time-to-failure forecasting  Association rule learning  Image segmentation  Face detection  Document optical character recognition  Image text extraction  Image NER/extraction  Apparel detection  Sentiment analysis  Named entity recognition  Text classification  Hate speech detection  File-to-text conversion  Speech-to-text  Text-to-speech  Voice recognition (speaker identification)  Video object segmentation  Video classification  Video human action recognition * Prioritized for SAPPHIRE NOW delivery
  • 23. Бизнес-решения SAP с элементами ИИ SAP Resume matching SAP Cash application SAP Service Ticket intelligence SAP Brand Impact
  • 24. © 2017 SAP SE or an SAP affiliate company. All rights reserved. Проблемы бухгалтера при соотнесении счетов и платежей Бухгалтер Платежи Детали счета Платеж Счета Платеж £ Счет € Платеж $1,200 Счет $1,300 Платежи Клиент Номер платежа10003, сумма $2000. Наверное это за счета F5132 + Invoice F2672 + … = $2000? Добрый день! Мы получили платеж 10003. Он оплачивает счета F5132 + F2672 + … ... ? 2 часа спустя… • Простых правил автоматизации недостаточно, ведь платеж может не содержать ссылок • Бухгалтеру приходится держать в голове большое число исключений • Процесс требует большого количества времени
  • 25. © 2017 SAP SE or an SAP affiliate company. All rights reserved. Service Ticket Intelligence Потери времени при первичной обработке обращений Бизнес проблема o Теряется большое количество времени на определение категории обращения и правильной сервисной команды o Негативное влияние на уровень сервиса Сложное ведение Базы знаний для ответы на похожие запросы От: XXXXXX Обычные атрибуты обращения в поддержку Тема: Текст (вопрос): Сервисная категория: Категория проблемы: Решение (ответ): “текст” “метка” “ответ”
  • 26. © 2017 SAP SE or an SAP affiliate company. All rights reserved. From: XXXXXX Subject: Message (question): Service category: Incident category: Solution provided (answer): Исторические данные с сообщениями, метками и ответами Подготовка данных Обучение Сохранение модели From: XXXXXX Subject: Message (question): Service category: Incident category: Solution provided (answer): Новое обращение через e-mail, соцсети или CRM Предиктивный сервис From: XXXXXX Subject: Message (question): Service category: Incident category: Solution provided (answer): Предсказание категории и предложение ответов сотруднику поддержки Обратная связь до-обучения “сообщение” “метки” “ответ” Service Ticket Intelligence Схема решения Ключевые пункты решения o Модель приложения обучается на исторических данных o Запросы распределяются автоматически o Модель сама предлагает ответ Итог o Сокращается время обработки o Сокращается время ответа на типовые запросы o Улучшается уровень сервиса
  • 27. Национальная Жандармерия Франции Прогнозирование уровня преступности используется: • Для расстановки патрульных сил и предотвращения преступлений • Объективной оценки и оптимизация работы местных отделений полиции Прогноз Факт
  • 28. Прогноз Факт Фактический уровень преступности ниже прогноза – эффективная работа полиции Фактический уровень преступности выше прогноза – неэффективная работа полиции или не выявленные факторы Национальная Жандармерия Франции Прогнозирование уровня преступности. Используется: • Для расстановки патрульных сил и предотвращения преступлений • Объективной оценки и оптимизация работы местных отделений полиции
  • 29. Allociné: Сайт база данных кинофильмов • Снижение доходов от рекламы • Требовалось повысить количество просмотров страниц • Повысить добавленную стоимость персональных рекомендаций по фильмам • Персонализация 220 миллионов страниц в месяц • Рекомендации для неавторизованных пользователей на основании «схожести» фильмов • Рекомендации для идентифицированных пользователей на основании «схожести» рейтингов • Увеличение доходов от рекламы на 9% за счёт повышения количества просмотров на визит
  • 30. Bigpoint – индустрия онлайн игр Бизнес задачи  Увеличить уровень конверсии бесплатных пользователей, в платящих  Увеличить среднюю прибыль на игрока  Снизить отток игроков Технические задачи  Использовать возможности SAP HANA для обработки данных в режиме реального времени и алгоритмы классификации для разработки персонализированных рекомендаций по каждому игроку  Анализировать огромное количество данных для прогноза пользовательского поведения Выгоды  Обработка 5000 событий в секунду  10-30% увеличение выручки в год  Интерактивный инструмент для анализа и принятия управленческих решений

Notas del editor

  1. Задача: отличить осмысленный текст от белиберды Текст, который пишут настоящие люди, выглядит так: Могу творить, могу и натворить! У меня два недостатка: плохая память и что-то еще. Никто не знает столько, сколько не знаю я. Белиберда выглядит так: ОРПорыав аоырОрпаыор ОрОРАыдцуцзущгкгеуб ыватьыивдцулвдлоадузцщ Йцхяь длваополц ыадолцлопиолым бамдлотдламда Наша задача — разработать алгоритм машинного обучения, который бы отличал одно от другого. А поскольку мы говорим об этом применительно к антивирусной тематике, то будем называть осмысленный текст «чистым», а белиберду — «зловредной». Это не просто какой-то мысленный эксперимент, похожая задача на самом деле решается при анализе реальных файлов в реальном антивирусе.
  2. Наш алгоритм будет считать, как часто в нормальном тексте одна конкретная буква следует за другой конкретной буквой. И так для каждой пары букв. Например, для первой чистой фразы — «Могу творить, могу и натворить!» — распределение получится такое:
  3. На этом этапе мы понимаем, что для обучения нашей модели одной фразы мало: и сочетаний недостаточное количество, и разница между частотой появления разных сочетаний не так велика. Поэтому надо взять какой-то существенно больший объем данных. Например, давайте посчитаем, какие сочетания букв встречаются в первом томе «Войны и мира»: Разумеется, это не вся таблица сочетаний, а лишь ее малая часть. Оказывается, вероятность встретить «то» в два раза выше, чем «ен». А чтобы за буквой т следовало ж — такое встречается лишь один раз, в слове «отжившим».
  4. Теперь мы можем делать выводы: чем больше полученное число — тем правдоподобнее исследуемая строка ложится в нашу модель. Стало быть, тем больше вероятность, что ее писал человек, то есть она чистая. Если же исследуемая строка содержит подозрительно большое количество крайне редких сочетаний букв (например, ёё, тж, ъь и так далее), то, скорее всего, она искусственная — зловредная. Для строчек выше правдоподобность получилась следующая: Как видите, чистые строки правдоподобны на 1000-2000 баллов, а зловредные не дотягивают и до 150. То есть все работает, как задумано. Чтобы не гадать, что такое «много», а что — «мало», лучше доверить определение порогового значения самой машине (пусть обучается). Для этого скормим ей некоторое количество чистых строк и посчитаем их правдоподобность, а потом скормим немного зловредных строк — и тоже посчитаем. И вычислим некоторое значение посередине, которое будет лучше всего отделять одни от других. В нашем случае получится что-то в районе 500.
  5. https://quickdraw.withgoogle.com/#
  6. https://quickdraw.withgoogle.com/#
  7. A significant volume of payments still needs to be processed manually, for example if payment contain no or incomplete invoice references, master data is not up-to-date, customers pay multiple invoice at once etc. AR accountants have to investigate such issues Tailored rules were required in the past for achieving higher automation, reflecting customer and country specifics. This carries high implementation costs
  8. 26
  9. May need to change the pictures
  10. Allocine Group управляет глобальной сетью веб-сайтов развлечений, в число которых входят Screenrush в Великобритании, Sensacine в Бразилии и Allocine во Франции. Задачи ▪ Компания Allocine Group столкнулась с проблемой утраченных возможностей для прибыли вследствие регулярной распродажи свободного рекламного пространства на своем веб-сайте. ▪ Хотя во Франции у Allocine 35 миллионов отдельных посетителей, 2 миллиона зарегистрированных пользователей и 100 000 кинофильмов, ей было необходимо повысить просмотры страниц, что напрямую связано с расширением пространства для рекламы. ▪ Чтобы поднять привлекательность сайта, компания Allocine хотела делать рекомендации кинофильмов для посетителей. Результаты ▪ Развертывание рекомендаций кинофильмов на своем веб-сайте в течение всего двух месяцев без предыдущего опыта в прогнозной аналитике. ▪ Увеличение просмотра страниц и, как результат, доходов от рекламы на 9 %,а также прогнозы по дальнейшему увеличению просмотра страниц и доходов от рекламы на 15 %. ▪ Возможность быстрой адаптации к изменяющемуся поведению благодаря тому, что базовые социальные сети, информация которых используется для персонализированных рекомендаций на веб-сайте, обновляются автоматически и могут быть точно настроены с помощью быстрых и несложных итераций. Но самое важное, что мы можем понять, как адаптировать контент (как учит нас конвергенция), а к аудитории. И в этом отношении крупных и надежных решений, способных заменить или удержать рекламные деньги и читательскую плату нет.