Проблематика создания высокодоступной сетевой операционной системы для SDN-сетей

ARCCN
HA-платформа управления для
программно-конфигурируемых сетей
Пашков Василий,
программист-разработчик ЦПИКС
Высокая доступность (High Availability, HA)
23.09.2015 vpashkov@arccn.ru 2
• Сеть работает в режиме 365/24/7.
• Платформа управления ПКС должна работать непрерывно.
• Цель обеспечения высокой готовности – поддержание
непрерывной работоспособности платформы управления,
сетевых приложений.
• Причины простоя: обслуживание, программные и
аппаратные ошибки, отказы оборудования, атаки,
отключение электроэнергии, аварии.
Коэффициент готовности, % Время простоя за год
99,999 5 минут
99,99 52 минуты
99,9 8,7 часов
99 3,7 дней
Угрозы
23.09.2015 vpashkov@arccn.ru 3
Отказ контроллера
Перегрузка контроллера
Потеря соединения
коммутатора с контроллером
Стратегии резервирования /1
23.09.2015 vpashkov@arccn.ru 4
Active/Standby
(Passive) стратегии:
• Холодное
[без синхронизации]
• Теплое
[периодическая
синхронизация]
• Горячее
[постоянная
синхронизация]
Восстановление после отказа контроллера для
случая горячего резервирования RUNOS
23.09.2015 vpashkov@arccn.ru 5
Особенности решения:
• OpenFlow ≥ 1.0
• Корпоративные сети.
• Не масштабируется
• Не полная утилизация
вычислительных
ресурсов
Одиночный отказ контроллера+
- Потеря соединения коммутатора с контроллером
- Перегрузка контроллера
Стратегии резервирования /2
23.09.2015 vpashkov@arccn.ru 6
• Стратегии резервирования Active/Active
– Ассиметричная
– Симметричная
• Высокая сложность [Требуется координация контроллеров,
поддержка глобального состояния]
• Высокая доступность [минимальное время простоя]
• Высокая утилизация вычислительных ресурсов
Возможности протокола OpenFlow
23.09.2015 vpashkov@arccn.ru 7
• Протокол OpenFlow 1.2:
– Множество контроллеров
– Механизм ролей
– Роли: Master, Slave, Equal
– По умолчанию:
контроллер находится в
роли Equal для
коммутаторов.
– Смена роли:
OFPT_ROLE_REQUEST
– Распределение ролей:
возложено на
контроллеры.
OpenFlow 1.0, 1.1
OpenFlow 1.2 – 1.5
Модель платформы управления
23.09.2015 vpashkov@arccn.ru 8
Задачи:
1. Как синхронизовать
контроллеры?
2. Как определить начальное
распределение
коммутаторов по
контроллерам?
3. Как перераспределить
управление коммутаторами
при одиночном отказе
контроллера?
4. Как восстановить
управление коммутатором
при потере соединения с
контроллером?
5. Как предотвратить
перегрузку контроллера в
платформе управления?
Предположения модели
Предположения:
• Все контроллеры имеют одинаковую производительность.
• Контроллер устанавливает правила только на те
коммутаторы, для которых он является Master
контроллером.
• Инфраструктура доступа обеспечивает связь
коммутаторов с каждым контроллером.
Условие корректности решения:
• В каждый момент времени для каждого коммутатора в
сети должен быть определен только один Master
контроллер.
23.09.2015 vpashkov@arccn.ru 9
Задача 1: Синхронизация контроллеров
• На основе Multi-Paxos
• Обеспечивает одновременное одинаковое выполнение команд
контроллеров
• Команды: изменение Network View, установление новых потоков (чтение
NV), изменение ролей контроллеров.
23.09.2015 vpashkov@arccn.ru 10
Add NodeAdd Flow...
Журнал событий
In-memory
хранилище
ДКА
Контроллер
[MASTER]
Сервис синхронизации
Событие
Add NodeAdd Flow...
Журнал событий
ДКА
Контроллер
[SLAVE]
Сервис синхронизации
Add NodeAdd Flow...
Журнал событий
ДКА
Контроллер
[SLAVE]
Сервис синхронизации
Сегмент
Network 1
Сегмент
Network 2
Сегмент
Network 3
Состояние
Network View 1
In-memory
хранилище
Состояние
Network View 1
In-memory
хранилище
Состояние
Network View 1
Proposer Acceptor Acceptor Acceptor
Задача 2: Начальное распределение
коммутаторов по контроллерам
23.09.2015 vpashkov@arccn.ru 11
• Критерий определения Master-контроллера:
– Задержка от коммутатора до контроллера, как мера
близости.
• Ограничение:
на количество
коммутаторов в сегменте
контроллера.
• Решение:
Жадный алгоритм по
значению задержки от
коммутатора до
контроллеров.
Задача 3: Выработка и представление
сценариев восстановления
23.09.2015 vpashkov@arccn.ru 12
• Проактивная разработка
сценариев восстановления
• Критерий выбора нового
распределения: задержка
от коммутатора до
контроллера
• Алгоритм Балаша.
• Результат: перечень
сценариев для каждого
контроллера платформы
управления.
Задача 3: Использование сценария для
восстановления ПУ после отказа контроллера
23.09.2015 vpashkov@arccn.ru 13
1. Оставшимися
контроллерами
фиксируется факт отказа
контроллера и CID.
2. Каждый контроллер
выбирает сценарий
восстановления,
соответствующий отказу
контроллера CID.
3. В соответствии со
сценарием каждый
контроллер изменяет
свою роль на
коммутаторах.
4. Каждый контроллера
информирует остальные
контроллеры о
завершении выполнения
сценария
восстановления.
Задача 4: Восстановление при потере
соединения коммутатора с контроллером
23.09.2015 vpashkov@arccn.ru 14
1. Фиксируется отключение
коммутатора Master-
контроллером.
2. Инициируется проверка
присутствия коммутатора
в сети.
3. Осуществляется
измерении задержки
контроллерами,
поддерживающими связь
с коммутатором.
4. Master-контроллером
становится контроллер с
минимальной задержкой
до коммутатора.
5. Новый Master-контроллер
устанавливает свою роль
на коммутаторе.
Отказ
коммутатора
или потеря
соединения?
??
Задача 5: Предотвращение перегрузки
контроллера платформы управления
23.09.2015 vpashkov@arccn.ru 15
Для обнаружения перегрузки:
• Устанавливаются пороговые значения
параметров загрузки контроллеров.
• Осуществляется постоянный мониторинг
загрузки контроллеров
[количество коммутаторов, количество packet-
in запросов в секунду, CPU, память]
• Факт перегрузки фиксируется при
обнаружении превышения порогового
значения.
Задача перераспределения коммутаторов по контроллерам: Необходимо
перераспределить коммутаторы так, чтобы:
1. Нагрузка на каждый из контроллеров не превышала его производительности
2. Использовалось минимальное количество контроллеров.
3. При перестроении управления сетью было проведено минимальное
количество передач управления коммутаторами.
Задача 5: Передача управления
коммутатором
23.09.2015 vpashkov@arccn.ru 16
• Свойство живучести: В любой
момент времени для
коммутатора существует
контроллер, работающий в
режиме Master. Для любой
асинхронной команды,
контроллер, который ее
отправил, остается активным до
тех пор, пока коммутатор не
закончит ее обработку.
• Свойство безопасности: Ровно
один контроллер обрабатывает
каждое асинхронное
сообщение от коммутатора.
Задача 5: Распределение
коммутаторов по группам
23.09.2015 vpashkov@arccn.ru 17
• Входные данные:
– Топология сети
– Количество новых потоков с каждого коммутатора
– Максимально допустимая нагрузка на контроллер P
• Алгоритм разбиения графа на компоненты
связности, чтобы суммарная нагрузка компоненты
связности не превышала P.
• Выходные данные:
– Матрица, определяющая Master-контроллеры для
коммутаторов и сегменты управления для каждого
контроллера.
Задача 5: Распределение
групп коммутаторов по контроллерам
23.09.2015 vpashkov@arccn.ru 18
• Входные данные:
– Текущая матрица распределения управления
коммутаторами по контроллерам.
– Желаемая матрица распределения управления
коммутаторами.
• Алгоритм: жадный алгоритм, минимизирующий
количество передач управления коммутаторами
между контроллерами платформы управления.
• Выходные данные:
– Список операций по передаче управления отдельными
коммутаторами.
Выводы
23.09.2015 vpashkov@arccn.ru 19
• Проект RUNOS (C++, OF 1.3)
https://github.com/ARCCN/runos
• RUNOS с поддержкой Active/Standby стратегии
горячего резервирования для небольших сетей
[в открытый доступ]
• RUNOS с поддержкой стратегии Active/Active
 Оптимизация разработанных алгоритмов
 Разработка распределенных приложений
Спасибо за внимание!
vpashkov@arccn.ru
23.09.2015 vpashkov@arccn.ru 20
1 de 20

Recomendados

Создание и развитие отечественной платформы с открытым программным кодом для ... por
Создание и развитие отечественной платформы с открытым программным кодом для ...Создание и развитие отечественной платформы с открытым программным кодом для ...
Создание и развитие отечественной платформы с открытым программным кодом для ...ARCCN
812 vistas33 diapositivas
SDN: возможности и реалии por
SDN: возможности и реалииSDN: возможности и реалии
SDN: возможности и реалииARCCN
2.6K vistas44 diapositivas
Отечественные решения на базе SDN и NFV для телеком-операторов por
Отечественные решения на базе SDN и NFV для телеком-операторовОтечественные решения на базе SDN и NFV для телеком-операторов
Отечественные решения на базе SDN и NFV для телеком-операторовARCCN
14.2K vistas15 diapositivas
Отчет «Центра прикладных исследований компьютерных сетей» на Совете фонда "Ск... por
Отчет «Центра прикладных исследований компьютерных сетей» на Совете фонда "Ск...Отчет «Центра прикладных исследований компьютерных сетей» на Совете фонда "Ск...
Отчет «Центра прикладных исследований компьютерных сетей» на Совете фонда "Ск...ARCCN
389 vistas24 diapositivas
Универсальный контроллер для сетей WiFI высокой плотности и его интеграция с ... por
Универсальный контроллер для сетей WiFI высокой плотности и его интеграция с ...Универсальный контроллер для сетей WiFI высокой плотности и его интеграция с ...
Универсальный контроллер для сетей WiFI высокой плотности и его интеграция с ...ARCCN
3.7K vistas22 diapositivas
Возможности импортозамещения коммутационного оборудования в сетях нового пок... por
Возможности импортозамещения коммутационного оборудования  в сетях нового пок...Возможности импортозамещения коммутационного оборудования  в сетях нового пок...
Возможности импортозамещения коммутационного оборудования в сетях нового пок...ARCCN
297 vistas13 diapositivas

Más contenido relacionado

La actualidad más candente

Внедрение SDN в сети телеком-оператора por
Внедрение SDN в сети телеком-оператораВнедрение SDN в сети телеком-оператора
Внедрение SDN в сети телеком-оператораARCCN
325 vistas10 diapositivas
Импортозамещение. Отечественное ПО на основе сетей нового поколения: SDN&NFV por
Импортозамещение. Отечественное ПО на основе сетей нового поколения:  SDN&NFV Импортозамещение. Отечественное ПО на основе сетей нового поколения:  SDN&NFV
Импортозамещение. Отечественное ПО на основе сетей нового поколения: SDN&NFV ARCCN
7.3K vistas15 diapositivas
RUNOS OpenFlow controller (ru) por
RUNOS OpenFlow controller (ru)RUNOS OpenFlow controller (ru)
RUNOS OpenFlow controller (ru)Alexander Shalimov
7.4K vistas24 diapositivas
SDN & NFV: от абонента до Internet eXchange por
SDN & NFV: от абонента до Internet eXchangeSDN & NFV: от абонента до Internet eXchange
SDN & NFV: от абонента до Internet eXchangeARCCN
774 vistas16 diapositivas
Управление корпоративной сетью на основе SDN-технологий por
Управление корпоративной сетью на основе SDN-технологий Управление корпоративной сетью на основе SDN-технологий
Управление корпоративной сетью на основе SDN-технологий ARCCN
1.5K vistas42 diapositivas
Технологии Программно-Конфигурируемых Сетей и Виртуализации Сетевых Функций (... por
Технологии Программно-Конфигурируемых Сетей и Виртуализации Сетевых Функций (...Технологии Программно-Конфигурируемых Сетей и Виртуализации Сетевых Функций (...
Технологии Программно-Конфигурируемых Сетей и Виртуализации Сетевых Функций (...ARCCN
603 vistas9 diapositivas

La actualidad más candente(20)

Внедрение SDN в сети телеком-оператора por ARCCN
Внедрение SDN в сети телеком-оператораВнедрение SDN в сети телеком-оператора
Внедрение SDN в сети телеком-оператора
ARCCN325 vistas
Импортозамещение. Отечественное ПО на основе сетей нового поколения: SDN&NFV por ARCCN
Импортозамещение. Отечественное ПО на основе сетей нового поколения:  SDN&NFV Импортозамещение. Отечественное ПО на основе сетей нового поколения:  SDN&NFV
Импортозамещение. Отечественное ПО на основе сетей нового поколения: SDN&NFV
ARCCN7.3K vistas
SDN & NFV: от абонента до Internet eXchange por ARCCN
SDN & NFV: от абонента до Internet eXchangeSDN & NFV: от абонента до Internet eXchange
SDN & NFV: от абонента до Internet eXchange
ARCCN774 vistas
Управление корпоративной сетью на основе SDN-технологий por ARCCN
Управление корпоративной сетью на основе SDN-технологий Управление корпоративной сетью на основе SDN-технологий
Управление корпоративной сетью на основе SDN-технологий
ARCCN1.5K vistas
Технологии Программно-Конфигурируемых Сетей и Виртуализации Сетевых Функций (... por ARCCN
Технологии Программно-Конфигурируемых Сетей и Виртуализации Сетевых Функций (...Технологии Программно-Конфигурируемых Сетей и Виртуализации Сетевых Функций (...
Технологии Программно-Конфигурируемых Сетей и Виртуализации Сетевых Функций (...
ARCCN603 vistas
Об одном подходе переноса функциональности CPE устройств в ЦОД телеком оператора por ARCCN
Об одном подходе переноса функциональности CPE устройств в ЦОД телеком оператораОб одном подходе переноса функциональности CPE устройств в ЦОД телеком оператора
Об одном подходе переноса функциональности CPE устройств в ЦОД телеком оператора
ARCCN220 vistas
Методика стратегического управления развитием SDN&NFV-сети оператора связи и ... por ARCCN
Методика стратегического управления развитием SDN&NFV-сети оператора связи и ...Методика стратегического управления развитием SDN&NFV-сети оператора связи и ...
Методика стратегического управления развитием SDN&NFV-сети оператора связи и ...
ARCCN249 vistas
Пилотные зоны для тестирования и апробирования SDN&NFV разработок и решений в... por ARCCN
Пилотные зоны для тестирования и апробирования SDN&NFV разработок и решений в...Пилотные зоны для тестирования и апробирования SDN&NFV разработок и решений в...
Пилотные зоны для тестирования и апробирования SDN&NFV разработок и решений в...
ARCCN339 vistas
Практическое применение SDN/NFV в современных сетях: от CPE до Internet eXchange por ARCCN
Практическое применение SDN/NFV в современных сетях: от CPE до Internet eXchangeПрактическое применение SDN/NFV в современных сетях: от CPE до Internet eXchange
Практическое применение SDN/NFV в современных сетях: от CPE до Internet eXchange
ARCCN3K vistas
SDN and NFV в банковской сфере por Victoria Kalinina
SDN and NFV в банковской сфереSDN and NFV в банковской сфере
SDN and NFV в банковской сфере
Victoria Kalinina318 vistas
Mininet CE por ARCCN
Mininet CEMininet CE
Mininet CE
ARCCN2.5K vistas
Разработки ЦПИКС в области SDN и NFV por ARCCN
Разработки ЦПИКС в области SDN и NFV Разработки ЦПИКС в области SDN и NFV
Разработки ЦПИКС в области SDN и NFV
ARCCN706 vistas
SDN&NFV: новые горизонты por ARCCN
SDN&NFV: новые горизонтыSDN&NFV: новые горизонты
SDN&NFV: новые горизонты
ARCCN1.2K vistas
Проблематика создания OpenFlow контроллеров для SDN por ARCCN
Проблематика создания OpenFlow контроллеров для SDNПроблематика создания OpenFlow контроллеров для SDN
Проблематика создания OpenFlow контроллеров для SDN
ARCCN2.7K vistas
Построение сетевых сервисов из виртуальных сетевых функций por ARCCN
Построение сетевых сервисов из виртуальных сетевых функцийПостроение сетевых сервисов из виртуальных сетевых функций
Построение сетевых сервисов из виртуальных сетевых функций
ARCCN566 vistas
Решения Brocade для построения IP сетей будущего por ARCCN
Решения Brocade для построения IP сетей будущегоРешения Brocade для построения IP сетей будущего
Решения Brocade для построения IP сетей будущего
ARCCN988 vistas
GRANIT — Global Russian Advanced Network Initiative por ARCCN
GRANIT — Global Russian Advanced Network InitiativeGRANIT — Global Russian Advanced Network Initiative
GRANIT — Global Russian Advanced Network Initiative
ARCCN614 vistas
Развитие технологий построения распределенных ЦОД por Cisco Russia
Развитие технологий построения распределенных ЦОДРазвитие технологий построения распределенных ЦОД
Развитие технологий построения распределенных ЦОД
Cisco Russia 876 vistas
EZchip Open Flow switch by ARCCN por ARCCN
EZchip Open Flow switch by ARCCN  EZchip Open Flow switch by ARCCN
EZchip Open Flow switch by ARCCN
ARCCN4.2K vistas

Destacado

Chipset por
ChipsetChipset
ChipsetArtur Repo
485 vistas11 diapositivas
блок 2 por
блок 2блок 2
блок 2Alexander Babich
409 vistas52 diapositivas
5 i2c spi por
5 i2c spi5 i2c spi
5 i2c spiSergey Savkin
432 vistas19 diapositivas
Solaris 11 новые возможности. а. павленко. зал 2 por
Solaris 11   новые возможности. а. павленко. зал 2Solaris 11   новые возможности. а. павленко. зал 2
Solaris 11 новые возможности. а. павленко. зал 2rit2011
332 vistas16 diapositivas
VMware VSphere 5.0 por
VMware VSphere 5.0VMware VSphere 5.0
VMware VSphere 5.0Armen Gazarov
605 vistas24 diapositivas
Materinskie_platy por
Materinskie_platyMaterinskie_platy
Materinskie_platyAndrey_Ivanilov
319 vistas8 diapositivas

Destacado(9)

Solaris 11 новые возможности. а. павленко. зал 2 por rit2011
Solaris 11   новые возможности. а. павленко. зал 2Solaris 11   новые возможности. а. павленко. зал 2
Solaris 11 новые возможности. а. павленко. зал 2
rit2011332 vistas
Илья Щербак, Eltex por Ontico
Илья Щербак, EltexИлья Щербак, Eltex
Илья Щербак, Eltex
Ontico1.5K vistas
Тюним память и сетевой стек в Linux: история перевода высоконагруженных сер... por Dmitry Samsonov
Тюним память  и сетевой стек в Linux: история перевода высоконагруженных  сер...Тюним память  и сетевой стек в Linux: история перевода высоконагруженных  сер...
Тюним память и сетевой стек в Linux: история перевода высоконагруженных сер...
Dmitry Samsonov458 vistas
презентация7 por student_kai
презентация7презентация7
презентация7
student_kai143 vistas

Similar a Проблематика создания высокодоступной сетевой операционной системы для SDN-сетей

Treukhov mclags por
Treukhov mclagsTreukhov mclags
Treukhov mclagskuchinskaya
775 vistas26 diapositivas
Надежность World of Tanks Server por
Надежность World of Tanks ServerНадежность World of Tanks Server
Надежность World of Tanks ServerLevon Avakyan
579 vistas31 diapositivas
(1 часть) 1С-Битрикс. Как настроить двухуровневую конфигурацию веб-приложения... por
(1 часть) 1С-Битрикс. Как настроить двухуровневую конфигурацию веб-приложения...(1 часть) 1С-Битрикс. Как настроить двухуровневую конфигурацию веб-приложения...
(1 часть) 1С-Битрикс. Как настроить двухуровневую конфигурацию веб-приложения...ForkConf
264 vistas39 diapositivas
"Кластеры баз данных: делаем сложные вещи просто" Андрей Тихонов (Avito) por
"Кластеры баз данных: делаем сложные вещи просто" Андрей Тихонов (Avito)"Кластеры баз данных: делаем сложные вещи просто" Андрей Тихонов (Avito)
"Кластеры баз данных: делаем сложные вещи просто" Андрей Тихонов (Avito)AvitoTech
1.5K vistas47 diapositivas
Другая виртуализация por
Другая виртуализацияДругая виртуализация
Другая виртуализацияYandex
1.6K vistas35 diapositivas
Дмитрий Меньшиков "Топ-10 фейлов на реальном highload проекте" por
Дмитрий Меньшиков "Топ-10 фейлов на реальном highload проекте"Дмитрий Меньшиков "Топ-10 фейлов на реальном highload проекте"
Дмитрий Меньшиков "Топ-10 фейлов на реальном highload проекте"Fwdays
1.8K vistas93 diapositivas

Similar a Проблематика создания высокодоступной сетевой операционной системы для SDN-сетей(20)

Treukhov mclags por kuchinskaya
Treukhov mclagsTreukhov mclags
Treukhov mclags
kuchinskaya775 vistas
Надежность World of Tanks Server por Levon Avakyan
Надежность World of Tanks ServerНадежность World of Tanks Server
Надежность World of Tanks Server
Levon Avakyan579 vistas
(1 часть) 1С-Битрикс. Как настроить двухуровневую конфигурацию веб-приложения... por ForkConf
(1 часть) 1С-Битрикс. Как настроить двухуровневую конфигурацию веб-приложения...(1 часть) 1С-Битрикс. Как настроить двухуровневую конфигурацию веб-приложения...
(1 часть) 1С-Битрикс. Как настроить двухуровневую конфигурацию веб-приложения...
ForkConf264 vistas
"Кластеры баз данных: делаем сложные вещи просто" Андрей Тихонов (Avito) por AvitoTech
"Кластеры баз данных: делаем сложные вещи просто" Андрей Тихонов (Avito)"Кластеры баз данных: делаем сложные вещи просто" Андрей Тихонов (Avito)
"Кластеры баз данных: делаем сложные вещи просто" Андрей Тихонов (Avito)
AvitoTech1.5K vistas
Другая виртуализация por Yandex
Другая виртуализацияДругая виртуализация
Другая виртуализация
Yandex1.6K vistas
Дмитрий Меньшиков "Топ-10 фейлов на реальном highload проекте" por Fwdays
Дмитрий Меньшиков "Топ-10 фейлов на реальном highload проекте"Дмитрий Меньшиков "Топ-10 фейлов на реальном highload проекте"
Дмитрий Меньшиков "Топ-10 фейлов на реальном highload проекте"
Fwdays1.8K vistas
Веб-сервер Phantom por yaevents
Веб-сервер PhantomВеб-сервер Phantom
Веб-сервер Phantom
yaevents3.9K vistas
владивосток форум производительность_ha por Elena Ometova
владивосток форум производительность_haвладивосток форум производительность_ha
владивосток форум производительность_ha
Elena Ometova360 vistas
«Механизмы обновления платформы и окружений пользователей в Jelastic» por Nata_Churda
«Механизмы обновления платформы и окружений пользователей в Jelastic»«Механизмы обновления платформы и окружений пользователей в Jelastic»
«Механизмы обновления платформы и окружений пользователей в Jelastic»
Nata_Churda375 vistas
Средства обеспечения высокой доступности сервисов в RHEL por Andrey Markelov
Средства обеспечения высокой доступности сервисов в RHELСредства обеспечения высокой доступности сервисов в RHEL
Средства обеспечения высокой доступности сервисов в RHEL
Andrey Markelov703 vistas
Building deployment pipeline - DevOps way por Andrey Rebrov
Building deployment pipeline - DevOps wayBuilding deployment pipeline - DevOps way
Building deployment pipeline - DevOps way
Andrey Rebrov964 vistas
Кластеры баз данных делаем сложные вещи просто / Андрей Тихонов (Avito) por Ontico
Кластеры баз данных делаем сложные вещи просто / Андрей Тихонов (Avito)Кластеры баз данных делаем сложные вещи просто / Андрей Тихонов (Avito)
Кластеры баз данных делаем сложные вещи просто / Андрей Тихонов (Avito)
Ontico2.4K vistas
Объединенная вычислительная система Cisco UCS. Часть 1. por Cisco Russia
Объединенная вычислительная система Cisco UCS. Часть 1.Объединенная вычислительная система Cisco UCS. Часть 1.
Объединенная вычислительная система Cisco UCS. Часть 1.
Cisco Russia 676 vistas
Оптимизация сервера потокового видеовещания (Дмитрий Шатров) por Ontico
Оптимизация сервера потокового видеовещания (Дмитрий Шатров)Оптимизация сервера потокового видеовещания (Дмитрий Шатров)
Оптимизация сервера потокового видеовещания (Дмитрий Шатров)
Ontico699 vistas
Nutanix Acropolis - облако на базе KVM под ключ, Максим Шапошников (Nutanix) por Ontico
Nutanix Acropolis - облако на базе KVM под ключ, Максим Шапошников (Nutanix)Nutanix Acropolis - облако на базе KVM под ключ, Максим Шапошников (Nutanix)
Nutanix Acropolis - облако на базе KVM под ключ, Максим Шапошников (Nutanix)
Ontico11.5K vistas
Практика внедрения виртуализированной сетевой инфраструктуры por Cisco Russia
Практика внедрения виртуализированной сетевой инфраструктуры Практика внедрения виртуализированной сетевой инфраструктуры
Практика внедрения виртуализированной сетевой инфраструктуры
Cisco Russia 992 vistas
Пакетное ядро мобильного оператора: ASR5k, поиски устранение неисправностей por Cisco Russia
Пакетное ядро мобильного оператора: ASR5k, поиски устранение неисправностейПакетное ядро мобильного оператора: ASR5k, поиски устранение неисправностей
Пакетное ядро мобильного оператора: ASR5k, поиски устранение неисправностей
Cisco Russia 468 vistas
Распределенная система тестирования машинного перевода por yaevents
Распределенная система тестирования машинного переводаРаспределенная система тестирования машинного перевода
Распределенная система тестирования машинного перевода
yaevents487 vistas
Модификации KVM для работы в кластере, Андрей Шетухин por Ontico
Модификации KVM для работы в кластере, Андрей ШетухинМодификации KVM для работы в кластере, Андрей Шетухин
Модификации KVM для работы в кластере, Андрей Шетухин
Ontico2K vistas

Más de ARCCN

Построение транспортных SDN сетей для операторов связи por
Построение транспортных SDN сетей для операторов связиПостроение транспортных SDN сетей для операторов связи
Построение транспортных SDN сетей для операторов связиARCCN
410 vistas24 diapositivas
Магистерская программа «Распределённые системы и компьютерные сети» por
Магистерская программа «Распределённые системы и компьютерные сети»Магистерская программа «Распределённые системы и компьютерные сети»
Магистерская программа «Распределённые системы и компьютерные сети»ARCCN
377 vistas18 diapositivas
Особенности интеграции сторонних сервисов в облачную MANO платформу por
Особенности интеграции сторонних сервисов в облачную MANO платформуОсобенности интеграции сторонних сервисов в облачную MANO платформу
Особенности интеграции сторонних сервисов в облачную MANO платформуARCCN
274 vistas28 diapositivas
Основные направления развития ФГБОУ ВО «РГРТУ» в области программно-конфигури... por
Основные направления развития ФГБОУ ВО «РГРТУ» в области программно-конфигури...Основные направления развития ФГБОУ ВО «РГРТУ» в области программно-конфигури...
Основные направления развития ФГБОУ ВО «РГРТУ» в области программно-конфигури...ARCCN
254 vistas22 diapositivas
Перспективы развития SDN  в МИЭТ на базе кафедры ТКС por
Перспективы развития SDN  в МИЭТ на базе кафедры ТКСПерспективы развития SDN  в МИЭТ на базе кафедры ТКС
Перспективы развития SDN  в МИЭТ на базе кафедры ТКСARCCN
282 vistas11 diapositivas
MetaCloud Computing Environment por
MetaCloud Computing EnvironmentMetaCloud Computing Environment
MetaCloud Computing EnvironmentARCCN
261 vistas10 diapositivas

Más de ARCCN(17)

Построение транспортных SDN сетей для операторов связи por ARCCN
Построение транспортных SDN сетей для операторов связиПостроение транспортных SDN сетей для операторов связи
Построение транспортных SDN сетей для операторов связи
ARCCN410 vistas
Магистерская программа «Распределённые системы и компьютерные сети» por ARCCN
Магистерская программа «Распределённые системы и компьютерные сети»Магистерская программа «Распределённые системы и компьютерные сети»
Магистерская программа «Распределённые системы и компьютерные сети»
ARCCN377 vistas
Особенности интеграции сторонних сервисов в облачную MANO платформу por ARCCN
Особенности интеграции сторонних сервисов в облачную MANO платформуОсобенности интеграции сторонних сервисов в облачную MANO платформу
Особенности интеграции сторонних сервисов в облачную MANO платформу
ARCCN274 vistas
Основные направления развития ФГБОУ ВО «РГРТУ» в области программно-конфигури... por ARCCN
Основные направления развития ФГБОУ ВО «РГРТУ» в области программно-конфигури...Основные направления развития ФГБОУ ВО «РГРТУ» в области программно-конфигури...
Основные направления развития ФГБОУ ВО «РГРТУ» в области программно-конфигури...
ARCCN254 vistas
Перспективы развития SDN  в МИЭТ на базе кафедры ТКС por ARCCN
Перспективы развития SDN  в МИЭТ на базе кафедры ТКСПерспективы развития SDN  в МИЭТ на базе кафедры ТКС
Перспективы развития SDN  в МИЭТ на базе кафедры ТКС
ARCCN282 vistas
MetaCloud Computing Environment por ARCCN
MetaCloud Computing EnvironmentMetaCloud Computing Environment
MetaCloud Computing Environment
ARCCN261 vistas
A Perspective on the Future of Computer Architecture por ARCCN
A Perspective on the  Future of Computer ArchitectureA Perspective on the  Future of Computer Architecture
A Perspective on the Future of Computer Architecture
ARCCN2K vistas
Radical step in computer architecture por ARCCN
Radical step in computer architectureRadical step in computer architecture
Radical step in computer architecture
ARCCN1.8K vistas
Типовые сервисы региональной сети передачи данных por ARCCN
Типовые сервисы региональной сети передачи данныхТиповые сервисы региональной сети передачи данных
Типовые сервисы региональной сети передачи данных
ARCCN391 vistas
Разработка OpenFlow-коммутатора на базе сетевого процессора EZchip por ARCCN
Разработка OpenFlow-коммутатора на базе сетевого процессора EZchipРазработка OpenFlow-коммутатора на базе сетевого процессора EZchip
Разработка OpenFlow-коммутатора на базе сетевого процессора EZchip
ARCCN577 vistas
Исследования SDN в Оренбургском государственном университете: сетевая безопас... por ARCCN
Исследования SDN в Оренбургском государственном университете: сетевая безопас...Исследования SDN в Оренбургском государственном университете: сетевая безопас...
Исследования SDN в Оренбургском государственном университете: сетевая безопас...
ARCCN672 vistas
Цели и задачи МИЭТ, как участника Консорциума на примере кафедры "Телекоммуни... por ARCCN
Цели и задачи МИЭТ, как участника Консорциума на примере кафедры "Телекоммуни...Цели и задачи МИЭТ, как участника Консорциума на примере кафедры "Телекоммуни...
Цели и задачи МИЭТ, как участника Консорциума на примере кафедры "Телекоммуни...
ARCCN398 vistas
SDN и защищенные квантовые коммуникации por ARCCN
SDN и защищенные квантовые коммуникацииSDN и защищенные квантовые коммуникации
SDN и защищенные квантовые коммуникации
ARCCN417 vistas
Отчет по проектах ЦПИКС por ARCCN
Отчет по проектах ЦПИКСОтчет по проектах ЦПИКС
Отчет по проектах ЦПИКС
ARCCN468 vistas
Учебно-методическая работа по тематике ПКС и ВСС por ARCCN
Учебно-методическая работа по тематике ПКС и ВССУчебно-методическая работа по тематике ПКС и ВСС
Учебно-методическая работа по тематике ПКС и ВСС
ARCCN526 vistas
Сети доставки контента и их место в архитектуре SDN/NFV por ARCCN
Сети доставки контента и их место в архитектуре SDN/NFVСети доставки контента и их место в архитектуре SDN/NFV
Сети доставки контента и их место в архитектуре SDN/NFV
ARCCN642 vistas
Текущее состояние рынка SDN/NFV и Huawei на нём. Взгляд с трех основных напра... por ARCCN
Текущее состояние рынка SDN/NFV и Huawei на нём. Взгляд с трех основных напра...Текущее состояние рынка SDN/NFV и Huawei на нём. Взгляд с трех основных напра...
Текущее состояние рынка SDN/NFV и Huawei на нём. Взгляд с трех основных напра...
ARCCN2.3K vistas

Проблематика создания высокодоступной сетевой операционной системы для SDN-сетей

  • 1. HA-платформа управления для программно-конфигурируемых сетей Пашков Василий, программист-разработчик ЦПИКС
  • 2. Высокая доступность (High Availability, HA) 23.09.2015 vpashkov@arccn.ru 2 • Сеть работает в режиме 365/24/7. • Платформа управления ПКС должна работать непрерывно. • Цель обеспечения высокой готовности – поддержание непрерывной работоспособности платформы управления, сетевых приложений. • Причины простоя: обслуживание, программные и аппаратные ошибки, отказы оборудования, атаки, отключение электроэнергии, аварии. Коэффициент готовности, % Время простоя за год 99,999 5 минут 99,99 52 минуты 99,9 8,7 часов 99 3,7 дней
  • 3. Угрозы 23.09.2015 vpashkov@arccn.ru 3 Отказ контроллера Перегрузка контроллера Потеря соединения коммутатора с контроллером
  • 4. Стратегии резервирования /1 23.09.2015 vpashkov@arccn.ru 4 Active/Standby (Passive) стратегии: • Холодное [без синхронизации] • Теплое [периодическая синхронизация] • Горячее [постоянная синхронизация]
  • 5. Восстановление после отказа контроллера для случая горячего резервирования RUNOS 23.09.2015 vpashkov@arccn.ru 5 Особенности решения: • OpenFlow ≥ 1.0 • Корпоративные сети. • Не масштабируется • Не полная утилизация вычислительных ресурсов Одиночный отказ контроллера+ - Потеря соединения коммутатора с контроллером - Перегрузка контроллера
  • 6. Стратегии резервирования /2 23.09.2015 vpashkov@arccn.ru 6 • Стратегии резервирования Active/Active – Ассиметричная – Симметричная • Высокая сложность [Требуется координация контроллеров, поддержка глобального состояния] • Высокая доступность [минимальное время простоя] • Высокая утилизация вычислительных ресурсов
  • 7. Возможности протокола OpenFlow 23.09.2015 vpashkov@arccn.ru 7 • Протокол OpenFlow 1.2: – Множество контроллеров – Механизм ролей – Роли: Master, Slave, Equal – По умолчанию: контроллер находится в роли Equal для коммутаторов. – Смена роли: OFPT_ROLE_REQUEST – Распределение ролей: возложено на контроллеры. OpenFlow 1.0, 1.1 OpenFlow 1.2 – 1.5
  • 8. Модель платформы управления 23.09.2015 vpashkov@arccn.ru 8 Задачи: 1. Как синхронизовать контроллеры? 2. Как определить начальное распределение коммутаторов по контроллерам? 3. Как перераспределить управление коммутаторами при одиночном отказе контроллера? 4. Как восстановить управление коммутатором при потере соединения с контроллером? 5. Как предотвратить перегрузку контроллера в платформе управления?
  • 9. Предположения модели Предположения: • Все контроллеры имеют одинаковую производительность. • Контроллер устанавливает правила только на те коммутаторы, для которых он является Master контроллером. • Инфраструктура доступа обеспечивает связь коммутаторов с каждым контроллером. Условие корректности решения: • В каждый момент времени для каждого коммутатора в сети должен быть определен только один Master контроллер. 23.09.2015 vpashkov@arccn.ru 9
  • 10. Задача 1: Синхронизация контроллеров • На основе Multi-Paxos • Обеспечивает одновременное одинаковое выполнение команд контроллеров • Команды: изменение Network View, установление новых потоков (чтение NV), изменение ролей контроллеров. 23.09.2015 vpashkov@arccn.ru 10 Add NodeAdd Flow... Журнал событий In-memory хранилище ДКА Контроллер [MASTER] Сервис синхронизации Событие Add NodeAdd Flow... Журнал событий ДКА Контроллер [SLAVE] Сервис синхронизации Add NodeAdd Flow... Журнал событий ДКА Контроллер [SLAVE] Сервис синхронизации Сегмент Network 1 Сегмент Network 2 Сегмент Network 3 Состояние Network View 1 In-memory хранилище Состояние Network View 1 In-memory хранилище Состояние Network View 1 Proposer Acceptor Acceptor Acceptor
  • 11. Задача 2: Начальное распределение коммутаторов по контроллерам 23.09.2015 vpashkov@arccn.ru 11 • Критерий определения Master-контроллера: – Задержка от коммутатора до контроллера, как мера близости. • Ограничение: на количество коммутаторов в сегменте контроллера. • Решение: Жадный алгоритм по значению задержки от коммутатора до контроллеров.
  • 12. Задача 3: Выработка и представление сценариев восстановления 23.09.2015 vpashkov@arccn.ru 12 • Проактивная разработка сценариев восстановления • Критерий выбора нового распределения: задержка от коммутатора до контроллера • Алгоритм Балаша. • Результат: перечень сценариев для каждого контроллера платформы управления.
  • 13. Задача 3: Использование сценария для восстановления ПУ после отказа контроллера 23.09.2015 vpashkov@arccn.ru 13 1. Оставшимися контроллерами фиксируется факт отказа контроллера и CID. 2. Каждый контроллер выбирает сценарий восстановления, соответствующий отказу контроллера CID. 3. В соответствии со сценарием каждый контроллер изменяет свою роль на коммутаторах. 4. Каждый контроллера информирует остальные контроллеры о завершении выполнения сценария восстановления.
  • 14. Задача 4: Восстановление при потере соединения коммутатора с контроллером 23.09.2015 vpashkov@arccn.ru 14 1. Фиксируется отключение коммутатора Master- контроллером. 2. Инициируется проверка присутствия коммутатора в сети. 3. Осуществляется измерении задержки контроллерами, поддерживающими связь с коммутатором. 4. Master-контроллером становится контроллер с минимальной задержкой до коммутатора. 5. Новый Master-контроллер устанавливает свою роль на коммутаторе. Отказ коммутатора или потеря соединения? ??
  • 15. Задача 5: Предотвращение перегрузки контроллера платформы управления 23.09.2015 vpashkov@arccn.ru 15 Для обнаружения перегрузки: • Устанавливаются пороговые значения параметров загрузки контроллеров. • Осуществляется постоянный мониторинг загрузки контроллеров [количество коммутаторов, количество packet- in запросов в секунду, CPU, память] • Факт перегрузки фиксируется при обнаружении превышения порогового значения. Задача перераспределения коммутаторов по контроллерам: Необходимо перераспределить коммутаторы так, чтобы: 1. Нагрузка на каждый из контроллеров не превышала его производительности 2. Использовалось минимальное количество контроллеров. 3. При перестроении управления сетью было проведено минимальное количество передач управления коммутаторами.
  • 16. Задача 5: Передача управления коммутатором 23.09.2015 vpashkov@arccn.ru 16 • Свойство живучести: В любой момент времени для коммутатора существует контроллер, работающий в режиме Master. Для любой асинхронной команды, контроллер, который ее отправил, остается активным до тех пор, пока коммутатор не закончит ее обработку. • Свойство безопасности: Ровно один контроллер обрабатывает каждое асинхронное сообщение от коммутатора.
  • 17. Задача 5: Распределение коммутаторов по группам 23.09.2015 vpashkov@arccn.ru 17 • Входные данные: – Топология сети – Количество новых потоков с каждого коммутатора – Максимально допустимая нагрузка на контроллер P • Алгоритм разбиения графа на компоненты связности, чтобы суммарная нагрузка компоненты связности не превышала P. • Выходные данные: – Матрица, определяющая Master-контроллеры для коммутаторов и сегменты управления для каждого контроллера.
  • 18. Задача 5: Распределение групп коммутаторов по контроллерам 23.09.2015 vpashkov@arccn.ru 18 • Входные данные: – Текущая матрица распределения управления коммутаторами по контроллерам. – Желаемая матрица распределения управления коммутаторами. • Алгоритм: жадный алгоритм, минимизирующий количество передач управления коммутаторами между контроллерами платформы управления. • Выходные данные: – Список операций по передаче управления отдельными коммутаторами.
  • 19. Выводы 23.09.2015 vpashkov@arccn.ru 19 • Проект RUNOS (C++, OF 1.3) https://github.com/ARCCN/runos • RUNOS с поддержкой Active/Standby стратегии горячего резервирования для небольших сетей [в открытый доступ] • RUNOS с поддержкой стратегии Active/Active  Оптимизация разработанных алгоритмов  Разработка распределенных приложений

Notas del editor

  1. Решение с горячим резервированием не масштабируется, Можно использовать для небольших корпоративных сетей, сетей предприятий
  2. Почему не масштабируется Решение с горячим резервированием не масштабируется, Можно использовать для небольших корпоративных сетей, сетей предприятий В реальных проектах мы используем эту схему резервирования для небольших сетей.