More Related Content Similar to Левкович-Маслюк Л.И. Задачи и проекты центра исследований и разработок ЕМС Сколково (20) Левкович-Маслюк Л.И. Задачи и проекты центра исследований и разработок ЕМС Сколково1. 1© Copyright 2014 EMC Corporation. All rights reserved.© Copyright 2014 EMC Corporation. All rights reserved.
«Большие данные в биологии и медицине»
30 июня – 1 июля 2014, Москва
Задачи и проекты центра
исследований и разработок ЕМС
Сколково
Л.И.Левкович-Маслюк
Центр исследований и разработок ЕМС Сколково
2. 2© Copyright 2014 EMC Corporation. All rights reserved.© Copyright 2014 EMC Corporation. All rights reserved.
Содержание
• О ЕМС
• О нашем Центре
• Задачи и проекты
• Работа с партнерами из науки и бизнеса
3. 3© Copyright 2014 EMC Corporation. All rights reserved.© Copyright 2014 EMC Corporation. All rights reserved.
Федерация ЕМС: 60 тыс. сотрудников, 86 стран.
Капитализация ~ $50 млрд., выручка в 2013 ~ $23 млрд.
• Хранение данных: ЕМС II
• Виртуализация, облачные решения: vmware
• Программные средства для работы с большими данными,
аналитика: Pivotal
• Безопасность: RSA
Кроме того:
• Документооборот, интеграция документов, изображений и др. –
IIG (Documentum)
• Архивирование (в частности, для геномики): Isilon
• Ряд других компаний, продуктов и технологий
4. 4© Copyright 2014 EMC Corporation. All rights reserved.© Copyright 2014 EMC Corporation. All rights reserved.
Облачная СХД
Платформа
как услуга
Гибкая
разработка
приложений
Виртуализация
Надежность
Данные
и анализ
Фабрика
данных
Облачная
фабрика
Фабрика
приложений
Pivotal AnalyticsXD
XL
Платформа Pivotal One
5. 5© Copyright 2014 EMC Corporation. All rights reserved.© Copyright 2014 EMC Corporation. All rights reserved.
Некоторые продукты и технологии ЕМС c высоким
потенциалом в науках о жизни и трансляционной
медицине («биомедицинская вертикаль»)
- Гибридный облачный сервис vCHS (vmware)
- Бета-тестирование в сентябре, запуск в декабре
- Сочетание частного и публичного облака
- Платформа Pivotal One
- Основа для решений по обработке, хранению, доступу и совместной
работе с большими данными
- Системы хранения на основе Isilon
- Используются в крупнейших центрах биоинформатики
- Совместные продажи с секвенаторами Illumina
6. 6© Copyright 2014 EMC Corporation. All rights reserved.© Copyright 2014 EMC Corporation. All rights reserved.
Центр исследований и разработок ЕМС Сколково
• Создан в середине 2013 года
• Первые проекты запущены в марте 2014 года
• Сейчас – 10 сотрудников (5 программистов)
• К началу 2015 – 19 сотрудников
• В 2016 году планируется переезд в Сколково
(сейчас – бизнес-центр «Nordstar Tower», Москва)
7. 7© Copyright 2014 EMC Corporation. All rights reserved.© Copyright 2014 EMC Corporation. All rights reserved.
Задачи Центра
• Поддержка и развитие стратегии ЕМС в
биомедицинской вертикали
– Создание новых рынков для технологий ЕМС
• Превращение ЕМС в ведущего игрока в области
информационных технологий для наук о жизни и
медицины будущего
– Разработка технологий для важнейших задач в этих
областях
– Вовлечение в эту работу российских интеллектуальных
ресурсов
8. 8© Copyright 2014 EMC Corporation. All rights reserved.© Copyright 2014 EMC Corporation. All rights reserved.
• Работа с производителями и потребителями
больших объемов биомедицинских данных
– Наука
– Клиническая практика
– Инновационные компании
• Разработки на основе технологий ЕМС для
поддержки важнейших процессов использования
и анализа таких данных
– Выявление новых перспективных задач
Направления работы
9. 9© Copyright 2014 EMC Corporation. All rights reserved.© Copyright 2014 EMC Corporation. All rights reserved.
Тематика проектов
• Расширения программного стека ЕМС,
привлекательные для игроков рынка
– Демонстрационные решения для поддержки сложных
процессов получения и анализа биомедицинских
данных
• Разработки для крупных инициатив ЕМС
– Распределенные системы хранения (data grid) в целевой
вертикали
– Интеграция клинических и геномных данных
• Исследовательские проекты, создание ИС
10. 10© Copyright 2014 EMC Corporation. All rights reserved.© Copyright 2014 EMC Corporation. All rights reserved.
- Платформа для поддержки востребованных в медицине процессов тестирования и
анализа
Примеры проектов. 1. Платформа для неонатального скрининга (с
компанией Parseq Lab)
• Parseq Lab:
– Неонатальный NGS-скрининг (ряд
наследственных болезней)
– ~ 300 хорошо изученных мутаций
– Сертификат для клинического
использования в России и Европе
– Подготовка к развертыванию в
региональных клиниках
Масштабируемый облачный сервис для хранения и обработки данных
Развертывание на платформе Pivotal
Реализация: конец 2014 г.
11. 11© Copyright 2014 EMC Corporation. All rights reserved.© Copyright 2014 EMC Corporation. All rights reserved.
- Эффективная реализация
нового сложного процесса
анализа (workflow) в
гибридном облаке
- Совместный анализ РНК и масс-
спектров белков для выявления
гибридных генов
- Альфа-версия – начало
2015 г.
Примеры проектов. 2. Облачное решение для выявления гибридных генов
(fusion genes). Партнеры: Академический университет (СПб), UCSD
(California)
12. 12© Copyright 2014 EMC Corporation. All rights reserved.© Copyright 2014 EMC Corporation. All rights reserved.
Примеры проектов: 3 Пересоздание iRODS для Isilon
- iRODS – распределенная система
обмена данными (OSS data grid)
- Используется с серверами Isilon в
Sanger, Broad institute, RENCI
Глубокая переработка ряда ключевых компонентов:
децентрализация сервера метаданных, новый интерфейс
пользователя и др.
4 квартал 2014: тестовая установка в одном из
геномных центров США
13. 13© Copyright 2014 EMC Corporation. All rights reserved.© Copyright 2014 EMC Corporation. All rights reserved.
Выводы
• Наш Центр работает с центральными игроками
целевой вертикали, от научных коллективов до
клинических организаций
• Нас интересуют проекты, расширяющие рынок
технологий ЕМС в науках о жизни и медицине
• Мы готовы сотрудничать в развитии российских
проектов и разработок
Editor's Notes Data Fabric
Relational Database: Greenplum
Row, column, and unstructured tables
Multi-temperature partitioning
Advanced compression, a column-oriented table can have different compression algorithms for each column
Integrated Hadoop and MapReduce
HAWQ (Hadoop With Queries)
Greenplum MPP planner and engine on Hadoop
ANSI SQL access
High-speed Greenplum parallel loader
Pivotal HD
Enterprise grade Hadoop distributon
No single point of failure, redundant name nodes and job trackers
Apache compliant
HBase, Sqoop, Flume, Pig, Hive, Zookeeper, Mahout, and other tools
In-memory data grids
Also MPP shared-nothing, linear scalability
SQLFire supports row/column/table structures
Gemfire supports key-value structures
Pivotal Analytics: Management and Collaboration Become the technology leader in enabling data access
Become the technology leader in enabling data access
Become the technology leader in enabling data access
Become the technology leader in enabling data access