2015/4/24に開催された wakamonog x ssmjp x BIGLOBE = wasabi イベントで発表した資料です。http://ssmjp.connpass.com/event/13173/
This is lightning talk presentation for study event in Tokyo.
2. Introduction
• 土屋 太二(Taiji Tsuchiya)
– 28 years old
– Twitter:@taijijiji
• お仕事 Responsibility
– ネットワークエンジニア
Network Engineer
– ISPコアネットワークの運用
Network operation of ISP backbone
3. ネットワーク運用のお仕事
Work of network operation
• ルータの設定 Configuring routers
• 設定手順書の作成 Creating operation manuals
• トラフィック制御 Controlling traffic
• ネットワーク資源や構成情報の管理
Managing network topology and resources
• 機器の増強、廃止、リプレイスRenovating equipment
• 回線やDCラックの調達 Provisioning circuits and racks
4. ネットワークの自動化事情
Current issues surrounding network automation
• サーバインフラと比べて
自動化が進んでない
Compare to servers, there has not been as much
advancement in automation
• Immutable Infrastructureや
Infrastructure as codeとは別世界
Underlying problems differ from the above concepts
9. Manufacturer
OS
API
Cisco
IOS
(IOS-‐XE)
• OnePK(*)
• NETCONF
IOS-‐XR
• OnePK(*)
• NETCONF
NX-‐OS
• OnePK(*)
• NX-‐API(*)
• NETCONF
Juniper
JUNOS
• JUNOS
XML
Protocol(*)
• REST
API
• NETCONF
Brocade
NetIron
• NETCONF
• REST
API
Network
OS
Arista
EOS
• eAPI(REST
API
)
(*) メーカ独自API
manufacturer-‐specific
API
※1 最新OSの対応状況ですが、Versionによって大きく異なります。
※2 ネットワーク装置の場合「バグの枯れ」を重視するため
最新OS versionを導入するケースはほとんどありません。
Industry prefers low risk vs. improving on old OS versions
10. さくらインターネット 湯澤 民浩さん資料より引用
Internet Week 2014 ようこそ、ネットワーク運用自動化の世界へ!
https://www.nic.ad.jp/ja/materials/iw/2014/proceedings/s4/
結果的にこうなりがち
Ultimately, need to develop specific program per device.
12. 失敗時の影響
Scope of risk
• サーバ : 数サービス 通信断
Server : Handful of services may go down
• DC系スイッチ : 数十サービス 通信断
DC swtichs : Limited numbers of services may go down
• コア系ルータ : エリア 全断
Core router : ALL DOWN
5/17/15
_人人人人人人人人人人_
> 失敗したら総務省 <
 ̄Y^Y^Y^Y^Y^Y^Y^Y^Y ̄
Must report to government
18. 作業量
Quantity of work
• サーバ: Servers
– 数千〜数万台 Several tens of thousands
– 1台あたりの作業: 週に1-2回
A few times a week per device
• ネットワーク機器: Network devices
– コア: 10−100台
Core devices: A several dozen
– データセンタ 数百〜数千台
Data Center devices: A several thousands
– 1台あたりの作業: 数ヶ月に1回
Once several months per device
※個人的な感覚で書いてます
20. ネットワーク屋の働く環境
Environment of network engineers
• 運用要員は必要最低限
The number of engineers is minimum
• 開発にまとまった時間がさけない
Cannot keep enough time for development
• 1件の障害で1週間の予定が吹き飛ぶ
Time is robbed by incidents
• 学習コストを乗り超えるのに決死の覚悟
Learning cost is large
22. 自動化をやれる理由
Points in favor of automation
• ルータの自動操作は厳しいが、
状態取得は比較的容易
– みんな大好きSNMP
Automating router configuration may difficult, but automating the
retrieval of router status is easy using SNMP.
• ルータ操作以外の運用業務もたくさん
– ルータを設定
– 設定を入れるための手順書を作成
– トラフィック制御
– ネットワーク資源や構成情報を管理
– 機器の増強、廃止、リプレイス
– 回線やDCラックの調達
There are many important things
other than router configuration
Automating configuration manuals
Managing network resources and
topology information
28. 環境が揃ったら、あとやるしかない
Once the environment is set, just get it done!
• エンジニアのスキルが試される時代
Network engineers need a variety of skills
• 泣きながら一歩ずつ山登るしかない
try, try, try
• ひと山登れたら、情報共有しましょう!
Let’s share our own findings and achievements!