Más contenido relacionado
La actualidad más candente (20)
Similar a Milano ops-meetup報告会 (20)
Milano ops-meetup報告会
- 1. © 2017 NTT Software Innovation Center
Milano Ops Meetup 報告会
サンパト プリヤンカラ
市原 裕史
室井 雅仁
水野 伸太郎
NTTソフトウェアイノベーションセンタ
2017年3月24日
- 2. 2Copyright©2017 NTT corp. All Rights Reserved.
OPS meetup 概要
• Operators Meetup Milano
• OpenStack のオペレータ (not ユーザ) が集まり、現状の
OpenStack の問題点や解決策を議論し、開発者にフィー
ドバックする場
• 日程: 2017/3/15, 16 の 2 日間
• 参加人数: 95 人 (チケット 100 枚は売り切れ)
• 会場: enter 社
• https://etherpad.openstack.org/p/MIL-ops-meetup
- 3. 3Copyright©2017 NTT corp. All Rights Reserved.
セッション一覧
1. OpenStack on Containers(2枠)
2. Containers on OpenStack (2枠)
3. Logging and Monitoring (2枠)
4. Ceph and CephFS
5. Bare metal
6. Upgrades, patches, packaging
7. Config Management
8. Keystone and all things auth
9. Inventory and fleet mgmt including
hardware
10.Live Migration
11.Security
12.Scaling and tuning
13.Deployment methods
14.RabbitMQ pitfalls, HA, etc
15.DBaas with Trove
16.Do not do ... under any circumstances
17.OSOps
18.Fault injection and Remediation
19.Migration, onboarding, handling end
users experience
20.UX - horizon, CLI's inconsitencies etc
21.Cellsv2
22.Neutron pain points
23.Cinder Upgrade tutorial
24.Overview of AUC
WGセッション
• UC
• Ops Telco/NFV
事前投票人気順
24の一般セッション、2つのWGセッションがそれぞれ40分枠で行われた。
ただし、人気投票上位3つは2枠
各セッションのetherpadはこちら
https://etherpad.openstack.org/p/MIL-ops-meetup
- 4. 4Copyright©2017 NTT corp. All Rights Reserved.
Container セッション
• コンテナにまつわるセッションは 2 つ開催
1. コンテナ on OpenStack
2. OpenStack on コンテナ
• オペレータの集まりという会議の性質上、こちらのセッションの方が活発な議論を実施
• OpenStack on コンテナを商用運用している人は 0 人
• 会場でのアンケート: 商用利用中 0 人、QA 中 2 人
• コンテナを利用したインストーラプロジェクトが、現状では新規構築のみ
を対象としている事が一因
• 構築済み(運用中)の OpenStack をコンテナに入れ替える事ができない
• Kolla プロジェクト、OpenStack-Helm、OpenStack Ansible など
• 各種コンテナ化によるメリット・デメリットやツールに関する情報が出
揃っておらず、各社が見合わせている状況
• 管理系プロセスのみコンテナ化?、実行系も含めてコンテナ化?
• 既存プロセスをコンテナに切り替えるだけ?、kubernetes などのオーケストレーショ
ンツールを使った方が良い?
• Work Items
• OSIC による各種コンテナ化の方法の検証とドキュメントのとりまとめ
• 各種コンテナ化の方法に対するメリット・デメリットを整理していく
• Kolla、OpenStack-helm などのドキュメントの整備
- 5. 5Copyright©2017 NTT corp. All Rights Reserved.
• Pain point
• テナントを超えてVMのconntrackが影響をおよぼすので
nf_conntrack_maxをどのように設定すべきか難しい
• ネットワークノードをリブートするのはまだリスクが高い
• スケール問題
• ML2-OVS(Liberty)のProviderNWのDHCP agentを移動させる
と数千ポートに対してsecurity groupの更新がはしり死ぬ
• DVRは使い物にならない→理由①: IPv6に対応してない。
理由②: L3 fabricなDCだとDVRが使えない
• 実際どれぐらいスケールする?
• 250〜500コンピュートノードのどこかで問題が起こり始める
• 20000ノード(China)ではrabbitmqがネック。MQの無駄なメッ
セージはカットしている。特にFWaaSのMessageが原因と推定
• ベンダーアップデート
• NuageとCalicoのコンテナ推し。MidonetはMQ不使用でスケール
Neutronセッション コメント: Conntrack周り
はバグが色々ある。VM削
除時にゴミが残る問題が
Newtonで修正された等
コメント: Server-Agent間のメッセー
ジ問題は改善する機能がPikeで入る予定
コメント: これ系のバグはLibertyとMitakaで
かなり直ったはずだが、詳細は不明
- 6. 6Copyright©2017 NTT corp. All Rights Reserved.
Fault Genes Working Groupの取り組み
Openstackで故障を発生した際の故障原因と復旧パターンに関する既存データを利
用し機械学習を行うことで,
1.Openstackでのフォルトマネージメントポリシを定義
2.MTTRの短縮
3.故障と復旧方法のナレッジデータベースを作成
故障原因と復旧パターンに関する既存データの収集方法
コミュニティでの調査 <-今回のセッションの目的
データマイニングによってlaunchpad, stackoverflowから
本取り組みの現状:
• データ収集
• 故障分類やフォーマット化など集めたデータの前処理
• 機械学習アルゴリズムの開発
関連:
Failure Analysis Under a Multi-Components Public Cloud Environment
Noriko Yokoyama and Hirotaka Kojima @Barcelona Summit
毎週ミーティング行っている.詳細はopenstack-ops MLに流れています.
例:http://lists.openstack.org/pipermail/openstack-operators/2017-March/012837.html
Ops meetup Etherpad: https://etherpad.openstack.org/p/MIL-ops-fault-injection-and-remediation
Fault injection and remediationセッション
NTT Confidential
- 7. 7Copyright©2017 NTT corp. All Rights Reserved.
故障分類やフォーマット化(例)
Source: OpenStack Fault Management Framework by Nemat Bidokhti から抜粋
本資料はOps meetupの本セッションに参加した人宛に送られてきたものです.
資料必要な方がsampath.priyankara@lab.ntt.co.jpまでご連絡ください.