Inicio
Explorar
Enviar búsqueda
Cargar
Iniciar sesión
Registrarse
Publicidad
Check these out next
202110 AWS Black Belt Online Seminar AWS Site-to-Site VPN
Amazon Web Services Japan
20190828 AWS Black Belt Online Seminar Amazon Aurora with PostgreSQL Compatib...
Amazon Web Services Japan
20190514 AWS Black Belt Online Seminar Amazon API Gateway
Amazon Web Services Japan
20190821 AWS Black Belt Online Seminar AWS AppSync
Amazon Web Services Japan
20200212 AWS Black Belt Online Seminar AWS Systems Manager
Amazon Web Services Japan
20180425 AWS Black Belt Online Seminar Amazon Relational Database Service (Am...
Amazon Web Services Japan
Infrastructure as Code (IaC) 談義 2022
Amazon Web Services Japan
Amazon Athena 初心者向けハンズオン
Amazon Web Services Japan
1
de
57
Top clipped slide
AWSのログ管理ベストプラクティス
6 de Jul de 2017
•
0 recomendaciones
80 recomendaciones
×
Sé el primero en que te guste
ver más
•
75,291 vistas
vistas
×
Total de vistas
0
En Slideshare
0
De embebidos
0
Número de embebidos
0
Descargar ahora
Descargar para leer sin conexión
Denunciar
Tecnología
Justtechtalk #9でお話した資料になります!
Akihiro Kuwano
Seguir
Experienced server engineer, Solution Architect of cloud computing
Publicidad
Publicidad
Publicidad
Recomendados
AWS Black Belt Online Seminar AWS Direct Connect
Amazon Web Services Japan
215.8K vistas
•
77 diapositivas
Kinesis + Elasticsearchでつくるさいきょうのログ分析基盤
Amazon Web Services Japan
4.4K vistas
•
42 diapositivas
AWS Black Belt Online Seminar 2018 Amazon DynamoDB Advanced Design Pattern
Amazon Web Services Japan
56K vistas
•
73 diapositivas
AWSとオンプレミスを繋ぐときに知っておきたいルーティングの基礎知識(CCSI監修!)
Trainocate Japan, Ltd.
11.4K vistas
•
22 diapositivas
20200630 AWS Black Belt Online Seminar Amazon Cognito
Amazon Web Services Japan
15.4K vistas
•
81 diapositivas
202205 AWS Black Belt Online Seminar Amazon VPC IP Address Manager (IPAM)
Amazon Web Services Japan
6.9K vistas
•
62 diapositivas
Más contenido relacionado
Presentaciones para ti
(20)
202110 AWS Black Belt Online Seminar AWS Site-to-Site VPN
Amazon Web Services Japan
•
7.3K vistas
20190828 AWS Black Belt Online Seminar Amazon Aurora with PostgreSQL Compatib...
Amazon Web Services Japan
•
16.9K vistas
20190514 AWS Black Belt Online Seminar Amazon API Gateway
Amazon Web Services Japan
•
19.2K vistas
20190821 AWS Black Belt Online Seminar AWS AppSync
Amazon Web Services Japan
•
33.8K vistas
20200212 AWS Black Belt Online Seminar AWS Systems Manager
Amazon Web Services Japan
•
25.4K vistas
20180425 AWS Black Belt Online Seminar Amazon Relational Database Service (Am...
Amazon Web Services Japan
•
51.9K vistas
Infrastructure as Code (IaC) 談義 2022
Amazon Web Services Japan
•
3.1K vistas
Amazon Athena 初心者向けハンズオン
Amazon Web Services Japan
•
24.9K vistas
マルチテナント化で知っておきたいデータベースのこと
Amazon Web Services Japan
•
6.6K vistas
AWS Black Belt Online Seminar 2017 Amazon Kinesis
Amazon Web Services Japan
•
147.5K vistas
DevOps with Database on AWS
Amazon Web Services Japan
•
39.1K vistas
20210526 AWS Expert Online マルチアカウント管理の基本
Amazon Web Services Japan
•
12.2K vistas
20210216 AWS Black Belt Online Seminar AWS Database Migration Service
Amazon Web Services Japan
•
5.5K vistas
20200422 AWS Black Belt Online Seminar Amazon Elastic Container Service (Amaz...
Amazon Web Services Japan
•
39.9K vistas
AWSで作る分析基盤
Yu Otsubo
•
7K vistas
[AWS EXpert Online for JAWS-UG 18] 見せてやるよ、Step Functions の本気ってやつをな
Amazon Web Services Japan
•
5.3K vistas
AWS Black Belt Online Seminar Amazon Aurora
Amazon Web Services Japan
•
54.2K vistas
20190521 AWS Black Belt Online Seminar Amazon Simple Email Service (Amazon SES)
Amazon Web Services Japan
•
45.4K vistas
20190911 AWS Black Belt Online Seminar AWS Batch
Amazon Web Services Japan
•
22.5K vistas
AWS Black Belt Online Seminar 2017 Amazon DynamoDB
Amazon Web Services Japan
•
144.1K vistas
Similar a AWSのログ管理ベストプラクティス
(20)
[Black Belt Online Seminar] AWS上でのログ管理
Amazon Web Services Japan
•
15.5K vistas
ログ管理のベストプラクティス
Akihiro Kuwano
•
23.1K vistas
Azure Monitor Logで実現するモダンな管理手法
Takeshi Fukuhara
•
3.4K vistas
AWS Blackbelt 2015シリーズ Amazon CloudWatch & Amazon CloudWatch Logs
Amazon Web Services Japan
•
127.9K vistas
Rails3+devise,nginx,fluent,S3構成でのアクセスログ収集と蓄積
Takeshi Mikami
•
5.3K vistas
WindowsAzureの長所を活かすクラウド アプリ開発(PDF版)
Shinichiro Isago
•
1.4K vistas
JAWS-UG アーキテクチャ専門支部 re:Invent Management Tools ダイジェスト
Yukitaka Ohmura
•
419 vistas
LambdaとMobileの美味しいかもしれない関係
Hiraku Komuro
•
1K vistas
やりたいことから考えるMicrosoft Azure 上の データストアの選び方とデータサイエンティスト向け活用法。KVSからDWHまで
Daisuke Masubuchi
•
2.3K vistas
IBM Cloudant の細かすぎて伝わりにくい機能(その2) データの変更履歴が自動管理できるらしい
K Kimura
•
2.3K vistas
PHP on Cloud
Akio Katayama
•
2.3K vistas
Flume cassandra real time log processing (日本語)
CLOUDIAN KK
•
1.9K vistas
20180508 AWS Black Belt Online Seminar AWS Greengrassで実現するエッジコンピューティング
Amazon Web Services Japan
•
12.3K vistas
スマートニュースの世界展開を支えるログ解析基盤
Takumi Sakamoto
•
2.1K vistas
[Sumo Logic x AWS 共催セミナー_20190829] Sumo Logic on AWS -AWS を活用したログ分析とセキュリティモニ...
Takanori Ohba
•
377 vistas
今明かす、Windows Azure の全貌 - Virtualization Summit
fumios
•
1K vistas
Programming AWS with Perl at YAPC::Asia 2013
Yasuhiro Horiuchi
•
7.1K vistas
JAWS-UG Meets Windows (JAWS Days 2017)
Amazon Web Services Japan
•
3.8K vistas
サーバー管理よ、サヨウナラ。サーバーレス アーキテクチャの意義と実践
真吾 吉田
•
434 vistas
ソーシャルゲームログ解析基盤のMongoDB活用事例
知教 本間
•
4.8K vistas
Publicidad
Más de Akihiro Kuwano
(20)
今日はMongoDBの話はしない
Akihiro Kuwano
•
1.8K vistas
銀河レベルのLT(とは)
Akihiro Kuwano
•
6K vistas
AWSのNoSQL入門
Akihiro Kuwano
•
13K vistas
ビックデータ最適解とAWSにおける新しい武器
Akihiro Kuwano
•
4.8K vistas
MongoDBの可能性の話
Akihiro Kuwano
•
2.9K vistas
実環境にTerraform導入したら驚いた
Akihiro Kuwano
•
28.2K vistas
インフラエンジニアってなんでしたっけ(仮)
Akihiro Kuwano
•
102.3K vistas
WiredTigerストレージエンジン楽しい
Akihiro Kuwano
•
11.1K vistas
NVMFS 使ってみたとか 言っちゃって マジカジュアルな奴
Akihiro Kuwano
•
13.1K vistas
Chef環境の闇
Akihiro Kuwano
•
6.6K vistas
アメーバピグにおける自作サーバ運用それからどうなった
Akihiro Kuwano
•
11.1K vistas
CyberAgentにおけるMongoDB
Akihiro Kuwano
•
17.7K vistas
後悔しないもんごもんごの使い方 〜サーバ編〜
Akihiro Kuwano
•
8.2K vistas
勉強会コミュニティがぼくの エンジニア人生にもたらした事。 あと、NoSQLとの付き合い方。
Akihiro Kuwano
•
2.6K vistas
MongoDBのはじめての運用テキスト
Akihiro Kuwano
•
8.3K vistas
AmebaのMongoDB活用事例
Akihiro Kuwano
•
7.6K vistas
MongoDBのアレをアレする
Akihiro Kuwano
•
14.5K vistas
やさぐれギンガさんのアーキテクチャ入門(ためしてガッテン)(仮)
Akihiro Kuwano
•
2K vistas
大規模化するピグライフを支えるインフラ ~MongoDBとChefについて~ (前編)
Akihiro Kuwano
•
16K vistas
オンプレエンジニアがクラウドエンジニアを夢見て。じっと手を見る。
Akihiro Kuwano
•
2.8K vistas
Último
(20)
《杨百翰大学毕业证|学位证书校内仿真版本》
d520dasw12
•
2 vistas
コードレビュー改善のためにJenkinsとIntelliJ IDEAのプラグインを自作してみた話
Rakuten Group, Inc.
•
40 vistas
20230601_Visual_IoTLT_vol14_kitazaki_v1.pdf
Ayachika Kitazaki
•
73 vistas
Wandb LLM Webinar May 30 2023 (配布用).pdf
Yuya Yamamoto
•
140 vistas
量子論.pdf
hiro150493
•
9 vistas
ChatGPT触ってみた
infinite_loop
•
64 vistas
統計学の攻略_正規分布ファミリーの全体像.pdf
akipii Oga
•
304 vistas
SoftwareControl.pdf
ssusercd9928
•
15 vistas
JSONEncoderで詰まった話
とん とんぼ
•
144 vistas
モバイル・クラウド・コンピューティング-データを如何に格納し、組み合わせ、情報として引き出すか
Masahiko Funaki
•
2 vistas
GitHub と Azure でアプリケーションとインフラストラクチャの守りを固めるDevSecOps
Kazumi IWANAGA
•
6 vistas
【DL輪読会】Poisoning Language Models During Instruction Tuning Instruction Tuning...
Deep Learning JP
•
156 vistas
MC-800DMT intrusion detector manual
Vedard Security Alarm System Store
•
3 vistas
JSAI2023_企画セッション(仕掛学)資料
Matsushita Laboratory
•
39 vistas
統計学の攻略_統計的仮説検定の9パターン.pdf
akipii Oga
•
300 vistas
Üslup ve tercüme.pdf
1Hmmtks
•
2 vistas
Transformerについて解説!!
Yosuke Horio
•
7 vistas
TestSIP (1).pdf
DeependraSingh712859
•
2 vistas
GitHub最新情報キャッチアップ 2023年6月
Kazumi IWANAGA
•
7 vistas
【DL輪読会】TrOCR: Transformer-based Optical Character Recognition with Pre-traine...
Deep Learning JP
•
7 vistas
Publicidad
AWSのログ管理ベストプラクティス
© 2017, Amazon
Web Services, Inc. or its Affiliates. All rights reserved. AWSのログ管理 ベストプラクティス アマゾン ウェブ サービス ジャパン株式会社 ソリューション アーキテクト 桑野 章弘
自己紹介 桑野 章弘(くわの あきひろ) ソリューションアーキテクト 主にメディア系のお客様を担当しております 渋谷のインフラエンジニア(仮)でした 好きなAWSのサービス:ElastiCache、 Route53 好きなデータストア:MongoDB
アジェンダ ログとは ログの収集/保存 ログの活用 まとめ
ログとは
ログとはなんだ みんなログ、ログっていうけどログってなんなんだ?
ログとは その名の通り痕跡を残す、ということ(そのまま ログはサーバ、サービス、そしてユーザの状況を確認する ための大事な要素
ログとは 要するにログといっても全部同じではなく種類によって用 途、目的が異なる • アプリケーションログ • アクティビティログ •
セキュリティログ • センサーログ • アクセスログ • その他その他その他 ログは宝 • サービスを改善するためには現状の把握と分析が絶対的に必要
クラウド上のログ管理と活用 ログの管理手法には様々な物がある 特にクラウド上ではインスタンス改廃が多く行われたり、 マネージドサービスがあり、ログの管理はオンプレよりも ダイナミックになる 管理する方法さえわかればログ分析基盤としてのクラウド を非常に便利に使うことができる
収集 処理 分析 保存 データ収集と 保存 データ処理イベント処理
データ分析 データ 答え 分析前の前処理等、 いわゆるETL (抽出、変換、挿 入 )的な処理 各サーバや、サー ビスからのログを 収集する ログに対して各種 分析をかける 収集したログを サーバやデータス トアに保存する
Amazon S3 Amazon Kinesis (Streams,
Firehose) Amazon DynamoDB Amazon RDS (Aurora) AWS Lambda KCL Apps Amazon EMR Amazon Redshift Amazon Machine Learning 収集 処理 分析 保存 データ収集と 保存 データ処理イベント処理 データ分析 データ 答え Amazon Athena
ログの収集
取得するログ 取得する必要があるログとしてはこのようなものたち • AWSのサービスログ • 各環境固有のログ
取得するログ:AWSのサービスログ • 各サービスで出力されるログはCloudWatch Logs経由や 直接S3にアップロードする場合が多い
取得するログ:環境固有のログ • OSやアプリケーション、アプリケーションログ等環境 に必要なログ • 基本的にはセルフサービスで運用 •
かと言ってマネージドサービスが使えないわけではない
AWSのサービスログ
AWSのサービスから出力されるログ 主要なログ • CloudWatch logs •
CloudTrail • ELB • VPCフローログ • S3のバケットログ • CloudFrontのアクセスログ
CloudWatch Logs Amazon Linux
Ubuntu Windows Red Hat Linux CloudWatch Logs 通知: CloudWatch Alarm Log Agent Log Agent Log Agent Log Agent VPC Flow Log 可視化: Amazon Elasticsearh Service (Kibana) エクスポート: Amazon Kinesis Firehose CloudTrail Lambda RDS
ログモニタリングイメージ ログ内容はタイムスタンプとログメッセージ(UTF-8)で 構成
AWS CloudTrail AWSアカウントの操作をロギングするサービス 管理コンソール、コマンドライン、3rd party等APIコール される全てのイベントが対象 S3にロギングデータをJSONで保存 AWS
CloudTrail自体の料金は無料 AWS上のAPI操作を記録するサービス AWS CloudTrail サポートサービス一覧 http://docs.aws.amazon.com/ja_jp/awscloudtrail/latest/userguide/w hat_is_cloud_trail_supported_services.html
S3バケットログ バケットに対するアクセスログの出力設定が可能(バケッ ト単位で設定) 出力先としてS3バケットを指定 ログフォーマット • 主要な項目としては「Remote IP」「HTTP
Status」「Request- URI」等様々 • 詳しくは下記を参照 http://docs.aws.amazon.com/ja_jp/AmazonS3/latest/dev/LogFo rmat.html
S3バケットログの項目 項目 説明 Bucket Owner
ソースバケット所有者の正規ユーザー ID バケット リクエストの処理対象のバケット名 時間 リクエストを受け取った時刻 Remote IP リクエストしてきたインターネットアドレス リクエスタ IAMユーザ等のID リクエスト ID 各リクエストを一意に識別するための文字列 オペレーション 実行したオペレーション内容 キー リクエストの URL エンコードされた「key」 部分 Request-URI HTTP リクエストメッセージの Request-URI 部分 HTTP status レスポンスの HTTP ステータス 項目 説明 エラーコード Amazon S3 エラーコード Bytes Sent 送信されたレスポンスのバイト数 Object Size 該当するオブジェクトの合計サイズ Total Time サーバーから見た、リクエストの転送中の時間数(ミリ秒) Turn-Around Time Amazon S3 でリクエストの処理に要した時間数(ミリ秒) Referrer リファラ User-Agent ユーザーエージェント Version Id リクエストのバージョン ID
ELBのアクセスログの項目 ELBのアクセスログを指定したS3に自動保管 簡単にログのS3保管が実現できる アクセスの傾向を探ることが可能 参照 http://docs.aws.amazon.com/ja_jp/ElasticLoadBalancing/latest/DeveloperGuide/access- log-collection.html S3
ELBのアクセスログの項目 ロードバランサのアクセスログをS3へ保存 項目 説明 timestamp クライアントからリクエストを受け取った時 刻 elb
ロードバランサー名 client:port リクエストを送信したクライアントの IP ア ドレスとポート backend:port このリクエストを処理した登録済みインスタ ンスの IP アドレスとポート request_processing_t ime ロードバランサーがリクエストを受け取った 時点から登録済みインスタンスに送信するま での合計経過時間(秒) backend_processing_ time ロードバランサーが登録済みインスタンスに リクエストを送信した時点から、そのインス タンスが応答ヘッダーの送信を開始した時点 までの合計経過時間(秒) 項目 説明 response_processing_ time ロードバランサーが登録済みインスタンスから応答ヘッダーを受 け取った時点から、クライアントへの応答の送信を開始した時点 までの合計経過時間(秒) elb_status_code ロードバランサーからの応答のステータスコード backend_status_code 登録済みインスタンスからの応答のステータスコード received_bytes クライアントから受け取ったリクエストのサイズ(バイト) sent_bytes クライアント(リクエスタ)に返される応答のサイズ(バイト) user_agent ユーザーエージェント ssl_cipher SSL 暗号。正常なネゴシエーションの後に受信 SSL/TLS 接続が 確立した場合にのみ、この値が記録されます ssl_protocol SSL プロトコル。正常なネゴシエーションの後に受信 SSL/TLS 接続が確立した場合にのみ、この値が記録されます
CloudFrontログ & レポート CloudFront クライアント S3 Management
Console アクセスログ アクセスや利用状況傾向の 確認及び分析 Cache Statistics Popular Objects Top Referrers Usage Viewers Cloudwatch Monitoring and Alarming 障害/異常検知や現状の利用確認 Access Log 複雑なアクセスや利用傾向分析 データの可視化と詳細な障害分析 リアルタイム モニター レポーティング Redshift ElasticSearch
CloudFrontアクセスログの項目 任意のS3 Bucketに出力可能 項目 説明 date
アクセス日(UTC) time アクセス時間(UTC) x-edge-location エッジロケーションID sc-bytes 配信Byte数(ヘッダー含む) c-ip クライアントIPアドレス cs-method HTTPアクセスMethod cs(Host) CloudFront Distributinドメイン名 cs-uri-stem リクエストURI sc-status レスポンスコード cs(Referer) リファラ cs(User-Agent) クライアントユーザエージェント cs-uri-query リクエストQuery Strings cs(Cookie) リクエストCookieヘッダー 項目 説明 x-edge-result-type Hit:キャッシュヒット RefreshHit:キャッシュがExpireされていた Miss:キャッシュミス LimitExceeded: CloudFrontのリミットオーバ CapacityExceeeded: エッジのキャパシティ不足 Error:クライアントもしくはオリジンによるエラー x-edge-request-id CloudFrontのリクエストID x-host-header リクエストHost Header cs-protocol リクエストプロトコル(http / https) cs-bytes リクエストByte数(ヘッダー含む) time-taken CloudFrontエッジがリクエストを受けて、オリジンからLastByte を取得するまでにかかった秒数 x-forwarded-for ViewerがHTTPプロキシなどを利用した場合の元Viewr IP ssl-protocol クライアントとHTTPS通信をした際の利用したプロトコル ssl-cipher クライアントとHTTPS通信した際の利用した暗号化方式 x-edge-response- result-type Viewerにレスポンスを返す直前の処理分類 ※分類はx-edge-result-typeと同様
VPC Flow Log VPC内のネットワークのログが取得可能 •
Network ACLとSecurity Groupでの許可と禁止についてのトラ フィックログをCloudWatch Logsへ出力する • ネットワークインタフェース(ENI)ごとに取得(ENIがログス トリーム)
Flow Log レコードの項目 フィールド
説明 version VPC flow logsのバージョン account-id flow logを取得したAWSアカウント interface-id ログストリームが適用されているネットワークインタフェースのID srcaddr 送信元アドレス(※) dsraddr 送信先アドレス(※) srcport 送信元ポート dsrport 送信先ポート protocol IANAで定義されたプロトコル番号 packets キャプチャウインドウの中で取得したパケット数 bytes キャプチャウインドウの中で取得したバイト数 start キャプチャウインドウ開始時のUNIX時間 end キャプチャウインドウ終了時のUNIX時間 action トラフィックのアクション(ACCEPT/REJECT) log-status ログステータス(OK/NODATA/SKIPDATA) Flow Log レコード: http://docs.aws.amazon.com/AmazonVPC/latest/UserGuide/flow-logs.html#flow-log-records
各環境固有のログ
環境固有のログ 各サービスで必要な情報のこと • アプリケーションログ • アクティビティログ •
セキュリティログ • センサーログ • アクセスログ • その他その他その他
ログの取得の仕方 アプリケーションの種別により必要なリードタイムがある 例えば、、、 • リアルタイムな処理をしなくてもいいならバッチ取得 • 受け取ったログを元にリアルタイム処理を行う必要があるの であればストリーム取得 取得の仕方まとめましょう
トラディショナルなログファイル転送 トラディショナルな運用 • 各サーバからログをscp等で送信 • rsyslog,
syslog-ngなどのエージェントを使用 • 保存先をS3にすることでログ収集サーバのストレージ容量を削 減可能 APP ログ収集サーバ scp等で収集 APP ログ収集サーバ rsyslog/syslog-ng等 でログ送信 S3に アップロード Amazon S3
トラディショナルなログファイル転送 基本的には非推奨 • スケールしない • 収集速度の限界 •
SPOFがあり、運用負荷が高い APP ログ収集サーバ スケールアウ トできない/ しにくい APP ログ収集サーバ スケールアウ トできない/ しにくい Amazon S3
ミドルウェアアプリケーションの利用 Push型を推し進める方向性 ログ送信のためのミドルウェアを使用することで柔軟な運 用が可能
Fluentd Treasure Data 社がOSS
として開発 • ログ収集管理ツール • Rubyで柔軟性の高い入出力プラグイン • バッファリング機能をデフォルトで持つ • File Buffer • Memory Buffer • ログのルーティング/フィルタリングが容易 • S3に投げつつ一部はローカル保存のみとか。
Fluentdのリファレンス構成 Fluentdの多段構成 • 途中にAggregate Serverを経由し安定性向上/運用コスト削減 •
Aggregate Serverのリソース確保と冗長性に考慮が必要 APP Aggregate Serverから各 サービスに 転送 細かい設定変更は Aggregate server上で 行う aggregate server Amazon S3 Amazon DynamoDB
ここで満を持してマネージドサービスが登場
マネージドサービスの利用 ログを効率よく取得するためのサービス達 • Kinesis Streams •
Kinesis Firehose • CloudWatch Logs
Kinesis Streams • 生成されるデータをリアルタイムに近い状況でデータ処理部に 伝送 •
AWSのサービスとの簡単インテグレーション • 目的に応じた処理を並列処理することが可能 フルマネージド型リアルタイム大規模ストリーミング処理 KinesisStreams エ ン ド ポ イ ン ト シャード 0 シャード 1 シャード ..N ストリーム データ送信側 データ処理側 Amazon S DynamoD Amazon Red Amazon EM データ レコード Lambda EC2
Kinesis Firehose • 管理不要 •
アプリケーション実装やインフラ管理を一切行わずに Amazon S3 / Amazon Redshift / Amazon ES にデータを配信可能 • データストアとダイレクトに統合 • ストリーミングデータのバッチ化・圧縮・暗号化が可能 • シームレスにスケール ストリーミングデータを Amazon S3, Amazon ES などへ簡単にロード
Fluent plugin for
Amazon Kinesis FluentdからKinesisにログを 直接送信するためのプラグイ ン 3つのoutputサポート • Kinesis Streams用 • kinesis_streams • kinesis_producer(KPL対応) • Kinesis Firehose用 • kinesis_firehose https://github.com/awslabs/aws-fluent-plugin-kinesis # Kinesis Streams用設定例 <match your_tag> @type kinesis_producer region us-east-1 stream_name your_stream partition_key key </match> # Kinesis firehose用設定例 <match your_tag> @type kinesis_firehose region us-east-1 delivery_stream_name your_stream </match>
Kinesis Streams を使った構成 Fluentd
AggregateサーバをKinesis Streamsへ • スケールアウトの構成を簡単に組める • ログを取得して各サービスと連携するためにLambdaやEC2が必 要(Lambdaがかんたん) APP Kinesis Streamsから LambdaやEC2アプ リケーションでロ グを取得してS3等 に格納 APPサーバのfluentdは fluent-plugin-kinesisを使 用してKinesis Streamsへ 転送 Amazon S3 Amazon DynamoDB Kinesis Streams AWS Lambda ログ収集サーバ (KCL動作) OR
Kinesis firehose を使った構成 Kinesis
firehoseを使用 • 他サービスへの連携にEC2やLambdaを使う必要がなくなる • スケールアウトも自動 • AWS Summit Tokyo2017であと2ヶ月が東京リージョンでリ リース予定(予定は未定です)と発表!!! APP Amazon S3 Amazon DynamoDB Kinesis Firehose 各アプリケー ションはKinesis Streams と同様に fluentd経由でロ グ送信 Kinesis Firehoseを使用 することでアプリ ケーションを介在す ること無く他サービ スと連携可能
CloudWatch Logs EC2のログ転送もCloudWatch Logsで行う ログの転送時に複雑なことをしたい場合には向かないが、 単純にログを転送したい場合は簡単にログ送信が可能 APP Amazon S3 Amazon CloudWatch
Logs 各インスタンスに インストールした CloudWatch Logs エージェント経由 でログ送信 Batch処理的にS3に送 信する事も可能
CloudWatch Logs :
ServerLess(AWS Lambda) サーバレスアーキテクチャを実現する場合もLambdaは実 行時のログをCloudWatch Logsに出力 Amazon S3 Amazon CloudWatch Logs Lambdaの実行結果 をCloudWatch Logs に出力 AWS Lambda
CloudWatch Logs :
Container Docker 1.9以降でawslogsログドライバが取り込まれて入 りログ転送をCloudWatch Logsで行うことが可能 Docker App Amazon S3 Amazon CloudWatch Logs awslogsログドライ バを使用して CloudWatch Logsに ログ出力
おわかりいただけただろうか、、、
全てのログをS3へ貯め続ける S3はAWSのデータのハブ(データレイク)として非常に 重要な役割を担っている あとから自由に分析処理(ETL)を変更可能 S3の耐久性で安全に保存可能 消したログは二度と帰ってこない 非常に安価にデータを保存できる(Glacierや、低頻度アク セスストレージも併用可能)
データレイク on AWS あらゆるデータが集まるス トレージ •
構造化データも非構造 化データも 様々なデータを跨いで分析 Amazon S3が最適 • Athena/EMR/Redshift 等を活用 • IA/GlacierでTiered DB 各種クライアント メディア ファイル 多様な データベース サーバ Amazon Kinesis Amazon S3 Amazon Glacier Amazon EMR Amazon Redshift Amazon Machine Learning Amazon Athena
ログの活用
Amazon Athena を活用 •
Amazon S3に置いたデータに直接SQL実行可 • AthenaはPrestoで提供するSQL Engineが利用で き、JSON, CSV, ログファイル, 区切り文字のある テキストファイル, Apache Parquet, Apache ORCなど対してクエリが可能 • ペタバイトクラスのデータに対するクエリをサ ポートJDBC、CLI、API経由で実行可能 • バージニア、オレゴンをはじめ東京でも利用可能 • スキャンしたデータ1TBあたり$5の料金
プリプロセスの簡略化 EMRなどを使う必要もないのでHadoopの知識も必要無い Amazon RedshiftAmazon Athena •
非構造化データの構造化・整形 • 構造化データのフィルタリング • S3へ変形済データを出力 サマリー テーブル ファクト テーブル マート・サマ リー表の更新を SQLで実行 Amazon S3 全データ 変形済データ
CloudTrail + Amazon
Athena Athena はCloudTrailのログ形 式をデフォルトでサポートし ている 「○○時にS3のAPIを叩いや つを全部出せ」 「認証エラーしているやつを 全部出せ」 かんたんかつ自由自在 CloudTrail Amazon Athena Amazon S3 Backet ① ②
Athena の主なユースケース ユースケース データ
ユーザ 新しく取得したデータに対して, DWに入れる価値があるか探索的に検証 新しく取得したデータ アナリスト 利用頻度の低い過去のデータに対する, BIツール経由のアドホックな分析 コールドデータ アナリスト Webサーバで障害が発生したときに, ログを漁って原因追求 アクセスログ サーバ運用 大規模でないデータに対しての, 低頻度で実施するETL処理 生データ 開発者
システム構成例 APP AWS Lambda バッチサーバ Kinesis Firehose Elasticsearch Service RedShift クラスタ Amazon S3 Amazon S3 ETL Amazon Athena Kinesis Analytics CloudWatch Logs ログ監視 Slack ユーザ Aurora アプリ側から使う 集計バッチ DynamoDB Kinesis Firehose EMR
クラスタ DL/MLなど DWH リアルタイムのサマ リデータ取得
まとめ ログの取得や集約はクラウド上でも既存環境と同等、更に AWSのサービスを使用する事で堅牢かつ便利にそしてス ケーラブルにできる S3はデータレイクとして非常に優れたアーキテクチャに なっている、Athenaを始めとしたログを解析する手段は非 常に数多く用意されており、データレイクとしてのS3を上 手く活用することでビジネスの精度を上げるための道具と する
Q&A 56
Publicidad