3. Немного истории
(классический BI)
1998 2000 2005 2008 2010 2011 2012 2014
SQL Server 7
OLAP Services
SQL Server 2005
SSAS, SSIS, SSRS
SQL Server 2008 R2
SSAS, SSIS, SSRS
SQL Server 2000
OLAP Services
Data Transformation Services
Reporting Services
SQL Server 2008
SSAS, SSIS, SSRS
SQL Server 2012
SSAS: Multidimensional & Tabular
SSIS, SSRS
SQL Server 2014
SSAS, SSIS, SSRS
4. • Что продано
• Где продано
• Когда продано
• Кем продано
• Кому продано
• Сколько продано
• По какой цене
Многомерный анализ данных
9. Характеристика баз данных OLAP
• Схема оптимизирована для быстрых запросов
• «Движок» (engine) оптимизирован для быстрого
числового анализа
• Интуитивная модель данных
• Многоразмерное представление данных
• Свёртка и развертка
• Сводное представление данных
20. 1. Создать проект
2. Импортировать данные, создав таблицы
3. Задать связи между таблицами
4. Расширить модель с помощью вычислимых колонок, иерархий,
мер, KPIs и перспектив
5. Скрыть таблицы, колонки и меры от клиентских приложений
6. Задать секционирование для таблиц
7. Задать роли
8. Развернуть проект на сервере SSAS
Процесс разработки
22
21. • Tabular databases управляются в SQL Server Management Studio (SSMS)
• Возможности включают:
• Восстановление из рабочей книги PowerPivot
• Управление строками соединения (connection strings)
• Добавление и управление секциями таблиц
• Добавление и управление ролями
• Обработка (Processing) баз данных, таблиц и секций таблиц
• Создание скриптов для баз данных, объектов и команд
Сопровождение готового решения
25
24. • Масштабируемость (Scalability)
• Производительность (Performance)
• Время разработки (Time to Develop)
• Обучение (Learning)
Параметры сравнения
25. • Объем данных (Amount of Data)
• Ресурсы сервера (Server Resources)
• Дисковая подсистема (Disk Space)
Масштабируемость
26. Масштабируемость
Tabular Multidimensional
Технология In-Memory (x-Velocity) Пре-агрегирует данные
Может хранить большой объем данных Может хранить очень большой объем
данных
Нет агрегаций, хранение на основе
колонок
Используются агрегации для ускорения
запросов
Сжатие данных порядка 10x Сжатие данных порядка 3x
28. Как быстро возвращается результат?
• Агрегированные данные (Aggregate Data)
• Детализированные данные (Detail Data)
• «Кэшированный» результат (Cache Results)
Производительность
29. Производительность
Tabular Multidimensional
Быстрее Пре-агрегирует данные
Не требуется настройка
производительности
Может хранить очень большой объем
данных
Лучше возвращает данные низкой
гранулированности
Использование агрегатов увеличивает
производительность запросов
Значительно быстрее Tabular когда
использует «разогретый кэш» (Warm
Cache)
30. • Дизайн измерений (Dimension Design)
• Создание вычислений (Calculation Creation)
• Ключевые показатели эффективности (Key Performance Indicators)
Время разработки
31. Время разработки
Tabular Multidimensional
Быстрая разработка Длинный цикл планирования и разработки
Можно создать на основе модели Power
Pivot
Требует модель измерений
Не требует модели измерений
Более простой интерфейс для создания
модели
33. Как быстро кто-то сможет освоить новую технологию?
• Требуются тренинги (обучение)
• Используются существующие знания
Обучение
34. Обучение
Tabular Multidimensional
Используется DAX (Data Analysis Expressions)
для запросов
Используется MDX (Multi-Dimensional
Expressions) для запросов
Легко изучить если знаете формулы Excel Сложно изучить
36. выберитеTabular, если…
• у вас короткий процесс разработки
• ваша модель данных проста
• у вас много различных источников данных
• пользователю надо делать запросы к большому количеству детальных данных
выберите Multidimensional, если…
• вы используете SQL Server 2008 R2 или более раннюю версию
• вы имеете много-терабайтный источник данных
• вы имеете сложную модель данных (Complex Data Model)
• вам нужны возможности доступные только в Multidimensional (Actions, Data Mining,
Writeback, Translations)
Итого
37. Сравнение возможностей
Multidimensional Tabular Power Pivot
Actions Yes No No
Aggregations Yes No No
Calculated Measures Yes Yes Yes
Custom Assemblies Yes No No
Custom Rollups Yes No No
Distinct Count Yes Yes (via DAX) Yes (via DAX)
Drillthrough Yes Yes Yes
Hierarchies Yes Yes Yes
KPIs Yes Yes Yes
Linked objects Yes No Yes (linked tables)
Many-to-many relationships Yes No No
Parent-child Hierarchies Yes Yes (via DAX) Yes (via DAX)
Partitions Yes Yes No
Perspectives Yes Yes Yes
Semi-additive Measures Yes Yes Yes
Translations Yes No No
User-defined Hierarchies Yes Yes Yes
Writeback Yes No No
38. Матрица принятия решения
9 8 8 3 2 4 34
26% 24% 24% 9% 6% 12% 100%
Масштабируемость Безопасность
Производитель
ность
"Гибкость"
источников
данных
Простота языка
запросов
Время
разработки
Очки
Multidimensional 80 70 80 20 40 20 63
Tabular 60 70 50 70 80 70 63
PowerPivot for SharePoint 40 20 40 70 80 80 45
PowerPivot 20 10 20 70 80 80 33
39. «Место под солнцем» для BISM
MOLAP
PowerPivot
BISM
масштабируемость*
удобство использования
2 GB
100 GB
5 TB
источник: Thomas Kejser, SQLCAT
ROLAP
50 TB
масштабируемость=
- хорошая поддержка для конкурентных запросов
- независимость от доступной памяти
- хорошая «ремонтопригодность»
40. • Microsoft SQL Server 2012 Analysis Services: The BISM Tabular Model
• SSAS Team Blog
• Books Online for SQL Server – Analysis Services
• PowerPivotPro
• PowerPivot BI Semantic Model
• http://www.sqlbi.com/books/
Ресурсы
44