SlideShare una empresa de Scribd logo
1 de 20
1
Big Data и экстренные
вычисления: поддержка
принятия решений в
критических ситуациях
А.В. Бухановский
BDBM-2014, 30 июня 2014 г.
2
Системы поддержки принятия решений
на основе Big Data: Data Driven Approach
1. Неоднородность и
распределенность
источников данных
2. Использование
данных как основы
для
моделирования
3. Интерактивность
процесса изучения
данных
4. Ограничение
времени решения
3
Экстренные вычисления (1/2):
«сложности перевода»
Экстренные вычисления (Urgent Computing, UС) – раздел eScience,
связанный с применением технологий высокопроизводительных
вычислений для поддержки принятия решений в критических
ситуациях
1. Поддержка принятия решений на основе ресурсоемкого компьютерного
моделирования сценариев развития ситуации
2. Наличие ограничений на время получения результата (принятия решений) вне
зависимости от сложности задачи и объема вычислений
3. Неопределенность поступления вычислительных задач от пользователей –
«игровой» характер построения сценариев («а что будет, если так…»)
4. Коллаборативность: большое количество участников, отвечающих за получение
результата и выработку решений для каждого из сценариев
5. Доступ к внешними источникам данных в оперативном режиме(DDA – Data
Driven Approach)
Бухановский А.В. BDBM-2014, 30 июня 2014 г.
4
Экстренные вычисления (2/2):
«Технологическое» определение
Экстренные вычисления – это технология организации
распределенных сред компьютерного моделирования и
прогнозирования с повышенными требованиями к надежности и
реактивности для поддержки принятия решений в критических
ситуациях
1.Использование уже существующих ресурсов и источников данных в
распределенных средах (так как экстремальные события бывают редко)
2.Возможность организации композитных приложений - связанных между собой задач,
определяющих тот или иной сценарий анализа данных и моделирования
3.Динамическое выделение ресурсов, потребных для выполнения того или иного
сценария в заданный срок
4.Управление приоритетами, обеспечение восстановления при сбоях и миграции
заданий (с перепланированием ресурсов)
5.Интерактивность работы с пользователем на всех уровнях выработки, согласования и
принятия решений
Бухановский А.В. BDBM-2014, 30 июня 2014 г.
5
Облачные технологии для организации
экстренных вычислений: платформа
CLAVIRE
Композитное
приложение
Ресурсы и
сервисы
Проект в рамках реализации
Постановления Правительства РФ
№218 (2010-2012 г.)
ИНИЦИАТОР: ЗАО «Фирма «АйТи».
Информационные технологии» -
многопрофильный ИТ-холдинг,
предоставляющий весь спектр
услуг и решений
для создания, модернизации и
сопровождения корпоративных
информационных систем
СLAVIRE =
CLoud
Applications
VIRtual
Environment
Бухановский А.В. BDBM-2014, 30 июня 2014 г.
http://clavire.ru
6
Вычислительная инфраструктура:
ориентация на неоднородные вычислительные среды и
хранилища данных
• Интегрируемые архитектуры: рабочие станции,
суперкомпьютеры, Грид (ГридННС, EGI), облачные
инфраструктуры (SARA, Amazon EC2*, OpenStack*)
• Доступ к ресурсам: прямой доступ (SSH),
клиентское ПО, web-сервисы, системы управления
задачами (PBS), PsExec*
• Операционные системы: Windows - на ядре NT
5.2 (XP) и выше, *nix (Linux)
• Системы управления задачами: Torque, Windows
HPC 2008, Sun Grid Engine, Condor*
• Виртуальные машины: VirtualBox, KVM, VMWare*
• Cистемы обработки больших данных: Hadoop
* - функционал ограничен
Бухановский А.В. BDBM-2014, 30 июня 2014 г.
7
Композитные приложения в CLAVIRE:
абстрактное описание workflow
Пример: задача моделирования конформационно-зависимых свойств белков
(от конформационной подвижности – до докинга)
Бухановский А.В. BDBM-2014, 30 июня 2014 г.
8
Механизмы поддержки Big Data
в CLAVIRE
Бухановский А.В. BDBM-2014, 30 июня 2014 г.
1. «Обертка» над
существующими
средами работы c Big
Data (Hadoop, PanDA)
2. Распределенное
хранилище данных
CLAVIRE
3. Интеллектуальное
управление данными
на отдельных
вычислительных узлах
9
Поддержка экстренных вычислений:
«горячее» выделение ресурсов из облака
Бухановский А.В.
1. Определение
конфигурации
ВМ
2. Оценка
количества ВМ
и физических
ресурсов для их
размещения
3. Развертывание
ВМ из образов
3. «Горячая»
регистрация в
CLAVIRE
10
Пример исполнения «экстренных»
заданий в CLAVIRE
Бухановский А.В. Ларнака, 13 мая 2013 г.
Принцип выбора ресурса –
«чтобы было в срок»
Принцип выбора ресурса –
«как можно быстрее»
11
Задачи, требующие динамических ресурсов (1/2):
мониторинг социальных медиа
Бухановский А.В. BDBM-2014, 30 июня 2014 г.
12
Задачи, требующие динамических ресурсов (1/2):
моделирование социальной мобильности
Бухановский А.В. BDBM-2014, 30 июня 2014 г.
13
Моделирование распространения
высококонтагиозных инфекций
14
Структура контактной
эпидемиологической сети
(динамические связи)
15
Структура контактной
эпидемиологической сети
(устойчивые связи)
16
Сопряжение среды UC с системой виртуальной
реальности: анализ структуры сети контактов
Краулинг и расчет
параметров сети
выполняются в
«облаке»
Бухановский А.В. BDBM-2014, 30 июня 2014 г.
17
Данные социальных медиа как инструмент
валидации модельных расчетов
Бухановский А.В. BDBM-2014, 30 июня 2014 г.
Плотность населения (час-пик) и
данные Instagram
Расчетная невязка между оценкой
плотности и ее «отражением» в СМ
18
Вместо заключения:
«куда копать в Big Data»?
1. Масштабируемые алгоритмы для работы с Big Data
2. Эффективная интеграция технологий Big Data и вычислительных
приложений (C2D – D2C)
3. Высокоуровневые средства работы с Big Data – языки, конструкторы,
интерфейсы (Big Data для предметников)
4. Гибкие технологии для работы с динамическими потоками данных в
рамках парадигмы Big Data (размер и скорость поступления данных
меняются во времени)
5. Средства унификации разнородных данных
6. Механизмы контроля пропусков и засорений в Big Data
7. Интерактивная визуализация Big Data и использование для
поддержки принятия решений
Бухановский А.В. BDBM-2014, 30 июня 2014 г.
19
Магистерская программа в области Big Data:
«Экстренные вычисления и обработка
сверхбольших объемов данных»
Бухановский А.В. ИМТ-2013, 4 июля 2013 г.
20
БЛАГОДАРЮ ЗА ВНИМАНИЕ
www.ifmo.ru
http://hpc-magistr.ru
http://escience.ifmo.ru
Бухановский А.В. BDBM-2014, 30 июня 2014 г.

Más contenido relacionado

Destacado

основные направления деятельности АО KAZNEX INVEST
основные направления деятельности АО KAZNEX INVESTосновные направления деятельности АО KAZNEX INVEST
основные направления деятельности АО KAZNEX INVESTБакытжан Рахимов
 
Фокин А. Анализ и визуализация генных сетей
Фокин А. Анализ и визуализация генных сетейФокин А. Анализ и визуализация генных сетей
Фокин А. Анализ и визуализация генных сетейbigdatabm
 
Coursera 2015 - Введение в биоинформатику
Coursera 2015 - Введение в биоинформатикуCoursera 2015 - Введение в биоинформатику
Coursera 2015 - Введение в биоинформатикуAndrey Zhelankin
 
282 инструмента и сервиса мониторинга социальных медиа
282 инструмента и сервиса мониторинга социальных медиа282 инструмента и сервиса мониторинга социальных медиа
282 инструмента и сервиса мониторинга социальных медиаBuzzware
 
Песков К. Разработка лекарственных средств: Клинические испытания и математич...
Песков К. Разработка лекарственных средств: Клинические испытания и математич...Песков К. Разработка лекарственных средств: Клинические испытания и математич...
Песков К. Разработка лекарственных средств: Клинические испытания и математич...bigdatabm
 
Выступление на Life sciences invest (без звука)
Выступление на Life sciences invest (без звука)Выступление на Life sciences invest (без звука)
Выступление на Life sciences invest (без звука)Ivan Selikhovkin
 
Карачунский А.И., Старичкова Ю.В. Развитие медицинских информационных техноло...
Карачунский А.И., Старичкова Ю.В. Развитие медицинских информационных техноло...Карачунский А.И., Старичкова Ю.В. Развитие медицинских информационных техноло...
Карачунский А.И., Старичкова Ю.В. Развитие медицинских информационных техноло...bigdatabm
 
Эффективность рекламных кампаний. Контроль работы сотрудников. Ефимова Дарья
Эффективность рекламных кампаний. Контроль работы сотрудников. Ефимова ДарьяЭффективность рекламных кампаний. Контроль работы сотрудников. Ефимова Дарья
Эффективность рекламных кампаний. Контроль работы сотрудников. Ефимова Дарьяmetrosphera
 
It meet up 2015 biology bioinformatics
It meet up 2015   biology bioinformaticsIt meet up 2015   biology bioinformatics
It meet up 2015 biology bioinformaticsVictoria Astapenko
 
Иванова М.Е. Организация молекулярной диагностики наследственных глазных забо...
Иванова М.Е. Организация молекулярной диагностики наследственных глазных забо...Иванова М.Е. Организация молекулярной диагностики наследственных глазных забо...
Иванова М.Е. Организация молекулярной диагностики наследственных глазных забо...bigdatabm
 
Как автоматизировать аналитику рекламных кампаний
Как автоматизировать аналитику рекламных кампанийКак автоматизировать аналитику рекламных кампаний
Как автоматизировать аналитику рекламных кампанийNetpeak
 
It meet up 1 0 лебедева, лоханов
It meet up 1 0 лебедева, лохановIt meet up 1 0 лебедева, лоханов
It meet up 1 0 лебедева, лохановVictoria Astapenko
 
Осадчий А.Е. Анализ многомерных магнито- и электроэнцефалографических данных ...
Осадчий А.Е. Анализ многомерных магнито- и электроэнцефалографических данных ...Осадчий А.Е. Анализ многомерных магнито- и электроэнцефалографических данных ...
Осадчий А.Е. Анализ многомерных магнито- и электроэнцефалографических данных ...bigdatabm
 
Will the Russian Bear Fall: How Protests and Rising Middle Class Affect Corru...
Will the Russian Bear Fall: How Protests and Rising Middle Class Affect Corru...Will the Russian Bear Fall: How Protests and Rising Middle Class Affect Corru...
Will the Russian Bear Fall: How Protests and Rising Middle Class Affect Corru...Alexander Abolmasov
 

Destacado (20)

Доступность банковских телефонных служб
Доступность банковских телефонных службДоступность банковских телефонных служб
Доступность банковских телефонных служб
 
Codename one epam
Codename one epamCodename one epam
Codename one epam
 
основные направления деятельности АО KAZNEX INVEST
основные направления деятельности АО KAZNEX INVESTосновные направления деятельности АО KAZNEX INVEST
основные направления деятельности АО KAZNEX INVEST
 
Фокин А. Анализ и визуализация генных сетей
Фокин А. Анализ и визуализация генных сетейФокин А. Анализ и визуализация генных сетей
Фокин А. Анализ и визуализация генных сетей
 
Coursera 2015 - Введение в биоинформатику
Coursera 2015 - Введение в биоинформатикуCoursera 2015 - Введение в биоинформатику
Coursera 2015 - Введение в биоинформатику
 
282 инструмента и сервиса мониторинга социальных медиа
282 инструмента и сервиса мониторинга социальных медиа282 инструмента и сервиса мониторинга социальных медиа
282 инструмента и сервиса мониторинга социальных медиа
 
Песков К. Разработка лекарственных средств: Клинические испытания и математич...
Песков К. Разработка лекарственных средств: Клинические испытания и математич...Песков К. Разработка лекарственных средств: Клинические испытания и математич...
Песков К. Разработка лекарственных средств: Клинические испытания и математич...
 
«Как автоматизировать аналитику рекламных кампаний». Вебинар WebPromoExperts ...
«Как автоматизировать аналитику рекламных кампаний». Вебинар WebPromoExperts ...«Как автоматизировать аналитику рекламных кампаний». Вебинар WebPromoExperts ...
«Как автоматизировать аналитику рекламных кампаний». Вебинар WebPromoExperts ...
 
Выступление на Life sciences invest (без звука)
Выступление на Life sciences invest (без звука)Выступление на Life sciences invest (без звука)
Выступление на Life sciences invest (без звука)
 
Карачунский А.И., Старичкова Ю.В. Развитие медицинских информационных техноло...
Карачунский А.И., Старичкова Ю.В. Развитие медицинских информационных техноло...Карачунский А.И., Старичкова Ю.В. Развитие медицинских информационных техноло...
Карачунский А.И., Старичкова Ю.В. Развитие медицинских информационных техноло...
 
Эффективность рекламных кампаний. Контроль работы сотрудников. Ефимова Дарья
Эффективность рекламных кампаний. Контроль работы сотрудников. Ефимова ДарьяЭффективность рекламных кампаний. Контроль работы сотрудников. Ефимова Дарья
Эффективность рекламных кампаний. Контроль работы сотрудников. Ефимова Дарья
 
It meet up 2015 biology bioinformatics
It meet up 2015   biology bioinformaticsIt meet up 2015   biology bioinformatics
It meet up 2015 biology bioinformatics
 
Иванова М.Е. Организация молекулярной диагностики наследственных глазных забо...
Иванова М.Е. Организация молекулярной диагностики наследственных глазных забо...Иванова М.Е. Организация молекулярной диагностики наследственных глазных забо...
Иванова М.Е. Организация молекулярной диагностики наследственных глазных забо...
 
Как автоматизировать аналитику рекламных кампаний
Как автоматизировать аналитику рекламных кампанийКак автоматизировать аналитику рекламных кампаний
Как автоматизировать аналитику рекламных кампаний
 
presentation01_internet
presentation01_internetpresentation01_internet
presentation01_internet
 
It meet up 1 0 лебедева, лоханов
It meet up 1 0 лебедева, лохановIt meet up 1 0 лебедева, лоханов
It meet up 1 0 лебедева, лоханов
 
Осадчий А.Е. Анализ многомерных магнито- и электроэнцефалографических данных ...
Осадчий А.Е. Анализ многомерных магнито- и электроэнцефалографических данных ...Осадчий А.Е. Анализ многомерных магнито- и электроэнцефалографических данных ...
Осадчий А.Е. Анализ многомерных магнито- и электроэнцефалографических данных ...
 
Will the Russian Bear Fall: How Protests and Rising Middle Class Affect Corru...
Will the Russian Bear Fall: How Protests and Rising Middle Class Affect Corru...Will the Russian Bear Fall: How Protests and Rising Middle Class Affect Corru...
Will the Russian Bear Fall: How Protests and Rising Middle Class Affect Corru...
 
Roadshow results it cluster 15 11 2011
Roadshow results it cluster 15 11 2011Roadshow results it cluster 15 11 2011
Roadshow results it cluster 15 11 2011
 
Roadmap бессмертие final
Roadmap бессмертие finalRoadmap бессмертие final
Roadmap бессмертие final
 

Similar a Бухановский А.В. Big Data и экстренные вычисления: поддержка принятия решений в критических ситуациях

Профессия Data Scientist
 Профессия Data Scientist Профессия Data Scientist
Профессия Data ScientistLeonid Zhukov
 
Игорь Котенко. Моделирование атак, вычисление метрик защищенности и визуализа...
Игорь Котенко. Моделирование атак, вычисление метрик защищенности и визуализа...Игорь Котенко. Моделирование атак, вычисление метрик защищенности и визуализа...
Игорь Котенко. Моделирование атак, вычисление метрик защищенности и визуализа...Positive Hack Days
 
расширенный доклад по вкц
расширенный доклад по вкцрасширенный доклад по вкц
расширенный доклад по вкцEkaterina Morozova
 
зао «эвентос»
зао «эвентос»зао «эвентос»
зао «эвентос»ontosminerapi
 
У.М.Н.И.К-2013: Информационная система моделирования динамики пластических де...
У.М.Н.И.К-2013: Информационная система моделирования динамики пластических де...У.М.Н.И.К-2013: Информационная система моделирования динамики пластических де...
У.М.Н.И.К-2013: Информационная система моделирования динамики пластических де...Ivan Novikov
 
Опыт применения инструментов гибкого образования в ИТ
Опыт применения инструментов гибкого образования в ИТОпыт применения инструментов гибкого образования в ИТ
Опыт применения инструментов гибкого образования в ИТCEE-SEC(R)
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data ScienceProvectus
 
ПО ситуационного центра
ПО ситуационного центраПО ситуационного центра
ПО ситуационного центраSergey Gorshkov
 
Problems with Big Data Analysis in the Social Sciences
Problems with Big Data Analysis in the Social SciencesProblems with Big Data Analysis in the Social Sciences
Problems with Big Data Analysis in the Social SciencesAnna Shirokanova
 
Программа семинара
Программа семинараПрограмма семинара
Программа семинараWitology
 
Платформа и решения НРЕ для больших данных
Платформа и решения НРЕ для больших данныхПлатформа и решения НРЕ для больших данных
Платформа и решения НРЕ для больших данныхAndrey Karpov
 
мультиагентные системы для управления ресурсами предприятий в реальном времени
мультиагентные системы для управления ресурсами предприятий в реальном временимультиагентные системы для управления ресурсами предприятий в реальном времени
мультиагентные системы для управления ресурсами предприятий в реальном времениMasha Rudnichenko
 
Обработка данных для построения цифровой истории в журналистике данных
Обработка данных для построения цифровой истории в журналистике данныхОбработка данных для построения цифровой истории в журналистике данных
Обработка данных для построения цифровой истории в журналистике данныхIrina Radchenko
 
ДЗ-МиОНИ-Talo.pptx
ДЗ-МиОНИ-Talo.pptxДЗ-МиОНИ-Talo.pptx
ДЗ-МиОНИ-Talo.pptxCNSHacking
 
большие данные в образовании
большие данные в образованиибольшие данные в образовании
большие данные в образованииЕлена Петряева
 
нил тбд нтс_10-13
нил тбд нтс_10-13нил тбд нтс_10-13
нил тбд нтс_10-13Vladimir Krylov
 
GIZ Knowledge Hub
GIZ Knowledge Hub GIZ Knowledge Hub
GIZ Knowledge Hub ICARDA
 
КВО ТЭК - Обоснованные требования регулятора
КВО ТЭК - Обоснованные требования регулятораКВО ТЭК - Обоснованные требования регулятора
КВО ТЭК - Обоснованные требования регулятораAlexey Kachalin
 

Similar a Бухановский А.В. Big Data и экстренные вычисления: поддержка принятия решений в критических ситуациях (20)

Профессия Data Scientist
 Профессия Data Scientist Профессия Data Scientist
Профессия Data Scientist
 
Игорь Котенко. Моделирование атак, вычисление метрик защищенности и визуализа...
Игорь Котенко. Моделирование атак, вычисление метрик защищенности и визуализа...Игорь Котенко. Моделирование атак, вычисление метрик защищенности и визуализа...
Игорь Котенко. Моделирование атак, вычисление метрик защищенности и визуализа...
 
Phd13 kotenko
Phd13 kotenkoPhd13 kotenko
Phd13 kotenko
 
расширенный доклад по вкц
расширенный доклад по вкцрасширенный доклад по вкц
расширенный доклад по вкц
 
зао «эвентос»
зао «эвентос»зао «эвентос»
зао «эвентос»
 
У.М.Н.И.К-2013: Информационная система моделирования динамики пластических де...
У.М.Н.И.К-2013: Информационная система моделирования динамики пластических де...У.М.Н.И.К-2013: Информационная система моделирования динамики пластических де...
У.М.Н.И.К-2013: Информационная система моделирования динамики пластических де...
 
Опыт применения инструментов гибкого образования в ИТ
Опыт применения инструментов гибкого образования в ИТОпыт применения инструментов гибкого образования в ИТ
Опыт применения инструментов гибкого образования в ИТ
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
ПО ситуационного центра
ПО ситуационного центраПО ситуационного центра
ПО ситуационного центра
 
Problems with Big Data Analysis in the Social Sciences
Problems with Big Data Analysis in the Social SciencesProblems with Big Data Analysis in the Social Sciences
Problems with Big Data Analysis in the Social Sciences
 
Программа семинара
Программа семинараПрограмма семинара
Программа семинара
 
Платформа и решения НРЕ для больших данных
Платформа и решения НРЕ для больших данныхПлатформа и решения НРЕ для больших данных
Платформа и решения НРЕ для больших данных
 
мультиагентные системы для управления ресурсами предприятий в реальном времени
мультиагентные системы для управления ресурсами предприятий в реальном временимультиагентные системы для управления ресурсами предприятий в реальном времени
мультиагентные системы для управления ресурсами предприятий в реальном времени
 
Обработка данных для построения цифровой истории в журналистике данных
Обработка данных для построения цифровой истории в журналистике данныхОбработка данных для построения цифровой истории в журналистике данных
Обработка данных для построения цифровой истории в журналистике данных
 
ДЗ-МиОНИ-Talo.pptx
ДЗ-МиОНИ-Talo.pptxДЗ-МиОНИ-Talo.pptx
ДЗ-МиОНИ-Talo.pptx
 
Big datatech by-vkrylov
Big datatech by-vkrylovBig datatech by-vkrylov
Big datatech by-vkrylov
 
большие данные в образовании
большие данные в образованиибольшие данные в образовании
большие данные в образовании
 
нил тбд нтс_10-13
нил тбд нтс_10-13нил тбд нтс_10-13
нил тбд нтс_10-13
 
GIZ Knowledge Hub
GIZ Knowledge Hub GIZ Knowledge Hub
GIZ Knowledge Hub
 
КВО ТЭК - Обоснованные требования регулятора
КВО ТЭК - Обоснованные требования регулятораКВО ТЭК - Обоснованные требования регулятора
КВО ТЭК - Обоснованные требования регулятора
 

Más de bigdatabm

Лисица А.В. Обработка данных об использовании научных публикаций в области би...
Лисица А.В. Обработка данных об использовании научных публикаций в области би...Лисица А.В. Обработка данных об использовании научных публикаций в области би...
Лисица А.В. Обработка данных об использовании научных публикаций в области би...bigdatabm
 
Вяххи Н. Обучение биоинформатике. Форматы и опыт
Вяххи Н. Обучение биоинформатике. Форматы и опытВяххи Н. Обучение биоинформатике. Форматы и опыт
Вяххи Н. Обучение биоинформатике. Форматы и опытbigdatabm
 
Пьяных О.С., Баданин Ю.Ю. Сегментация медицинских изображений с помощью геоде...
Пьяных О.С., Баданин Ю.Ю. Сегментация медицинских изображений с помощью геоде...Пьяных О.С., Баданин Ю.Ю. Сегментация медицинских изображений с помощью геоде...
Пьяных О.С., Баданин Ю.Ю. Сегментация медицинских изображений с помощью геоде...bigdatabm
 
Афанасьев А. iBinom - Облачный сервис для медицинского анализа геномных данных
Афанасьев А. iBinom - Облачный сервис для медицинского анализа геномных данныхАфанасьев А. iBinom - Облачный сервис для медицинского анализа геномных данных
Афанасьев А. iBinom - Облачный сервис для медицинского анализа геномных данныхbigdatabm
 
Пятницкий М.А. Подбор персонализированной противоопухолевой терапии путем сис...
Пятницкий М.А. Подбор персонализированной противоопухолевой терапии путем сис...Пятницкий М.А. Подбор персонализированной противоопухолевой терапии путем сис...
Пятницкий М.А. Подбор персонализированной противоопухолевой терапии путем сис...bigdatabm
 
Кузнецов С.О., Корепанова Н.В. Методы обнаружения знаний в задаче сравнения э...
Кузнецов С.О., Корепанова Н.В. Методы обнаружения знаний в задаче сравнения э...Кузнецов С.О., Корепанова Н.В. Методы обнаружения знаний в задаче сравнения э...
Кузнецов С.О., Корепанова Н.В. Методы обнаружения знаний в задаче сравнения э...bigdatabm
 
Левкович-Маслюк Л.И. Задачи и проекты центра исследований и разработок ЕМС Ск...
Левкович-Маслюк Л.И. Задачи и проекты центра исследований и разработок ЕМС Ск...Левкович-Маслюк Л.И. Задачи и проекты центра исследований и разработок ЕМС Ск...
Левкович-Маслюк Л.И. Задачи и проекты центра исследований и разработок ЕМС Ск...bigdatabm
 
Колкер Е. An introduction to MOPED: Multi-Omics Profiling Expression Database
Колкер Е. An introduction to MOPED: Multi-Omics Profiling Expression DatabaseКолкер Е. An introduction to MOPED: Multi-Omics Profiling Expression Database
Колкер Е. An introduction to MOPED: Multi-Omics Profiling Expression Databasebigdatabm
 

Más de bigdatabm (8)

Лисица А.В. Обработка данных об использовании научных публикаций в области би...
Лисица А.В. Обработка данных об использовании научных публикаций в области би...Лисица А.В. Обработка данных об использовании научных публикаций в области би...
Лисица А.В. Обработка данных об использовании научных публикаций в области би...
 
Вяххи Н. Обучение биоинформатике. Форматы и опыт
Вяххи Н. Обучение биоинформатике. Форматы и опытВяххи Н. Обучение биоинформатике. Форматы и опыт
Вяххи Н. Обучение биоинформатике. Форматы и опыт
 
Пьяных О.С., Баданин Ю.Ю. Сегментация медицинских изображений с помощью геоде...
Пьяных О.С., Баданин Ю.Ю. Сегментация медицинских изображений с помощью геоде...Пьяных О.С., Баданин Ю.Ю. Сегментация медицинских изображений с помощью геоде...
Пьяных О.С., Баданин Ю.Ю. Сегментация медицинских изображений с помощью геоде...
 
Афанасьев А. iBinom - Облачный сервис для медицинского анализа геномных данных
Афанасьев А. iBinom - Облачный сервис для медицинского анализа геномных данныхАфанасьев А. iBinom - Облачный сервис для медицинского анализа геномных данных
Афанасьев А. iBinom - Облачный сервис для медицинского анализа геномных данных
 
Пятницкий М.А. Подбор персонализированной противоопухолевой терапии путем сис...
Пятницкий М.А. Подбор персонализированной противоопухолевой терапии путем сис...Пятницкий М.А. Подбор персонализированной противоопухолевой терапии путем сис...
Пятницкий М.А. Подбор персонализированной противоопухолевой терапии путем сис...
 
Кузнецов С.О., Корепанова Н.В. Методы обнаружения знаний в задаче сравнения э...
Кузнецов С.О., Корепанова Н.В. Методы обнаружения знаний в задаче сравнения э...Кузнецов С.О., Корепанова Н.В. Методы обнаружения знаний в задаче сравнения э...
Кузнецов С.О., Корепанова Н.В. Методы обнаружения знаний в задаче сравнения э...
 
Левкович-Маслюк Л.И. Задачи и проекты центра исследований и разработок ЕМС Ск...
Левкович-Маслюк Л.И. Задачи и проекты центра исследований и разработок ЕМС Ск...Левкович-Маслюк Л.И. Задачи и проекты центра исследований и разработок ЕМС Ск...
Левкович-Маслюк Л.И. Задачи и проекты центра исследований и разработок ЕМС Ск...
 
Колкер Е. An introduction to MOPED: Multi-Omics Profiling Expression Database
Колкер Е. An introduction to MOPED: Multi-Omics Profiling Expression DatabaseКолкер Е. An introduction to MOPED: Multi-Omics Profiling Expression Database
Колкер Е. An introduction to MOPED: Multi-Omics Profiling Expression Database
 

Бухановский А.В. Big Data и экстренные вычисления: поддержка принятия решений в критических ситуациях

  • 1. 1 Big Data и экстренные вычисления: поддержка принятия решений в критических ситуациях А.В. Бухановский BDBM-2014, 30 июня 2014 г.
  • 2. 2 Системы поддержки принятия решений на основе Big Data: Data Driven Approach 1. Неоднородность и распределенность источников данных 2. Использование данных как основы для моделирования 3. Интерактивность процесса изучения данных 4. Ограничение времени решения
  • 3. 3 Экстренные вычисления (1/2): «сложности перевода» Экстренные вычисления (Urgent Computing, UС) – раздел eScience, связанный с применением технологий высокопроизводительных вычислений для поддержки принятия решений в критических ситуациях 1. Поддержка принятия решений на основе ресурсоемкого компьютерного моделирования сценариев развития ситуации 2. Наличие ограничений на время получения результата (принятия решений) вне зависимости от сложности задачи и объема вычислений 3. Неопределенность поступления вычислительных задач от пользователей – «игровой» характер построения сценариев («а что будет, если так…») 4. Коллаборативность: большое количество участников, отвечающих за получение результата и выработку решений для каждого из сценариев 5. Доступ к внешними источникам данных в оперативном режиме(DDA – Data Driven Approach) Бухановский А.В. BDBM-2014, 30 июня 2014 г.
  • 4. 4 Экстренные вычисления (2/2): «Технологическое» определение Экстренные вычисления – это технология организации распределенных сред компьютерного моделирования и прогнозирования с повышенными требованиями к надежности и реактивности для поддержки принятия решений в критических ситуациях 1.Использование уже существующих ресурсов и источников данных в распределенных средах (так как экстремальные события бывают редко) 2.Возможность организации композитных приложений - связанных между собой задач, определяющих тот или иной сценарий анализа данных и моделирования 3.Динамическое выделение ресурсов, потребных для выполнения того или иного сценария в заданный срок 4.Управление приоритетами, обеспечение восстановления при сбоях и миграции заданий (с перепланированием ресурсов) 5.Интерактивность работы с пользователем на всех уровнях выработки, согласования и принятия решений Бухановский А.В. BDBM-2014, 30 июня 2014 г.
  • 5. 5 Облачные технологии для организации экстренных вычислений: платформа CLAVIRE Композитное приложение Ресурсы и сервисы Проект в рамках реализации Постановления Правительства РФ №218 (2010-2012 г.) ИНИЦИАТОР: ЗАО «Фирма «АйТи». Информационные технологии» - многопрофильный ИТ-холдинг, предоставляющий весь спектр услуг и решений для создания, модернизации и сопровождения корпоративных информационных систем СLAVIRE = CLoud Applications VIRtual Environment Бухановский А.В. BDBM-2014, 30 июня 2014 г. http://clavire.ru
  • 6. 6 Вычислительная инфраструктура: ориентация на неоднородные вычислительные среды и хранилища данных • Интегрируемые архитектуры: рабочие станции, суперкомпьютеры, Грид (ГридННС, EGI), облачные инфраструктуры (SARA, Amazon EC2*, OpenStack*) • Доступ к ресурсам: прямой доступ (SSH), клиентское ПО, web-сервисы, системы управления задачами (PBS), PsExec* • Операционные системы: Windows - на ядре NT 5.2 (XP) и выше, *nix (Linux) • Системы управления задачами: Torque, Windows HPC 2008, Sun Grid Engine, Condor* • Виртуальные машины: VirtualBox, KVM, VMWare* • Cистемы обработки больших данных: Hadoop * - функционал ограничен Бухановский А.В. BDBM-2014, 30 июня 2014 г.
  • 7. 7 Композитные приложения в CLAVIRE: абстрактное описание workflow Пример: задача моделирования конформационно-зависимых свойств белков (от конформационной подвижности – до докинга) Бухановский А.В. BDBM-2014, 30 июня 2014 г.
  • 8. 8 Механизмы поддержки Big Data в CLAVIRE Бухановский А.В. BDBM-2014, 30 июня 2014 г. 1. «Обертка» над существующими средами работы c Big Data (Hadoop, PanDA) 2. Распределенное хранилище данных CLAVIRE 3. Интеллектуальное управление данными на отдельных вычислительных узлах
  • 9. 9 Поддержка экстренных вычислений: «горячее» выделение ресурсов из облака Бухановский А.В. 1. Определение конфигурации ВМ 2. Оценка количества ВМ и физических ресурсов для их размещения 3. Развертывание ВМ из образов 3. «Горячая» регистрация в CLAVIRE
  • 10. 10 Пример исполнения «экстренных» заданий в CLAVIRE Бухановский А.В. Ларнака, 13 мая 2013 г. Принцип выбора ресурса – «чтобы было в срок» Принцип выбора ресурса – «как можно быстрее»
  • 11. 11 Задачи, требующие динамических ресурсов (1/2): мониторинг социальных медиа Бухановский А.В. BDBM-2014, 30 июня 2014 г.
  • 12. 12 Задачи, требующие динамических ресурсов (1/2): моделирование социальной мобильности Бухановский А.В. BDBM-2014, 30 июня 2014 г.
  • 16. 16 Сопряжение среды UC с системой виртуальной реальности: анализ структуры сети контактов Краулинг и расчет параметров сети выполняются в «облаке» Бухановский А.В. BDBM-2014, 30 июня 2014 г.
  • 17. 17 Данные социальных медиа как инструмент валидации модельных расчетов Бухановский А.В. BDBM-2014, 30 июня 2014 г. Плотность населения (час-пик) и данные Instagram Расчетная невязка между оценкой плотности и ее «отражением» в СМ
  • 18. 18 Вместо заключения: «куда копать в Big Data»? 1. Масштабируемые алгоритмы для работы с Big Data 2. Эффективная интеграция технологий Big Data и вычислительных приложений (C2D – D2C) 3. Высокоуровневые средства работы с Big Data – языки, конструкторы, интерфейсы (Big Data для предметников) 4. Гибкие технологии для работы с динамическими потоками данных в рамках парадигмы Big Data (размер и скорость поступления данных меняются во времени) 5. Средства унификации разнородных данных 6. Механизмы контроля пропусков и засорений в Big Data 7. Интерактивная визуализация Big Data и использование для поддержки принятия решений Бухановский А.В. BDBM-2014, 30 июня 2014 г.
  • 19. 19 Магистерская программа в области Big Data: «Экстренные вычисления и обработка сверхбольших объемов данных» Бухановский А.В. ИМТ-2013, 4 июля 2013 г.