Enviar búsqueda
Cargar
Amebaにおけるログ解析基盤Patriotの活用事例
•
18 recomendaciones
•
18,813 vistas
cyberagent
Seguir
2013年11月7日開催 「Cloudera World Tokyo 2013」 セッション発表資料 (株式会社サイバーエージェント)
Leer menos
Leer más
Tecnología
Denunciar
Compartir
Denunciar
Compartir
1 de 46
Descargar ahora
Descargar para leer sin conexión
Recomendados
こわくない Git
こわくない Git
Kota Saito
Kinesis + Elasticsearchでつくるさいきょうのログ分析基盤
Kinesis + Elasticsearchでつくるさいきょうのログ分析基盤
Amazon Web Services Japan
Micrometer/Prometheusによる大規模システムモニタリング #jsug #sf_26
Micrometer/Prometheusによる大規模システムモニタリング #jsug #sf_26
Yahoo!デベロッパーネットワーク
入門 Kubeflow ~Kubernetesで機械学習をはじめるために~ (NTT Tech Conference #4 講演資料)
入門 Kubeflow ~Kubernetesで機械学習をはじめるために~ (NTT Tech Conference #4 講演資料)
NTT DATA Technology & Innovation
ログ解析基盤におけるストリーム処理パイプラインについて
ログ解析基盤におけるストリーム処理パイプラインについて
cyberagent
PPL 2022 招待講演: 静的型つき函数型組版処理システムSATySFiの紹介
PPL 2022 招待講演: 静的型つき函数型組版処理システムSATySFiの紹介
T. Suwa
AWS Elemental MediaConvert で動画変換
AWS Elemental MediaConvert で動画変換
虎の穴 開発室
BuildKitによる高速でセキュアなイメージビルド
BuildKitによる高速でセキュアなイメージビルド
Akihiro Suda
Recomendados
こわくない Git
こわくない Git
Kota Saito
Kinesis + Elasticsearchでつくるさいきょうのログ分析基盤
Kinesis + Elasticsearchでつくるさいきょうのログ分析基盤
Amazon Web Services Japan
Micrometer/Prometheusによる大規模システムモニタリング #jsug #sf_26
Micrometer/Prometheusによる大規模システムモニタリング #jsug #sf_26
Yahoo!デベロッパーネットワーク
入門 Kubeflow ~Kubernetesで機械学習をはじめるために~ (NTT Tech Conference #4 講演資料)
入門 Kubeflow ~Kubernetesで機械学習をはじめるために~ (NTT Tech Conference #4 講演資料)
NTT DATA Technology & Innovation
ログ解析基盤におけるストリーム処理パイプラインについて
ログ解析基盤におけるストリーム処理パイプラインについて
cyberagent
PPL 2022 招待講演: 静的型つき函数型組版処理システムSATySFiの紹介
PPL 2022 招待講演: 静的型つき函数型組版処理システムSATySFiの紹介
T. Suwa
AWS Elemental MediaConvert で動画変換
AWS Elemental MediaConvert で動画変換
虎の穴 開発室
BuildKitによる高速でセキュアなイメージビルド
BuildKitによる高速でセキュアなイメージビルド
Akihiro Suda
Dockerからcontainerdへの移行
Dockerからcontainerdへの移行
Kohei Tokunaga
データレイクを基盤としたAWS上での機械学習サービス構築
データレイクを基盤としたAWS上での機械学習サービス構築
Amazon Web Services Japan
本当は恐ろしい分散システムの話
本当は恐ろしい分散システムの話
Kumazaki Hiroki
[社内勉強会]ELBとALBと数万スパイク負荷テスト
[社内勉強会]ELBとALBと数万スパイク負荷テスト
Takahiro Moteki
実運用して分かったRabbit MQの良いところ・気をつけること #jjug
実運用して分かったRabbit MQの良いところ・気をつけること #jjug
Yahoo!デベロッパーネットワーク
ゲームアーキテクチャパターン (Aurora Serverless / DynamoDB)
ゲームアーキテクチャパターン (Aurora Serverless / DynamoDB)
Amazon Web Services Japan
Python 3.9からの新定番zoneinfoを使いこなそう
Python 3.9からの新定番zoneinfoを使いこなそう
Ryuji Tsutsui
CI/CDツール比較してみた
CI/CDツール比較してみた
Shoya Kai
[CEDEC 2021] 運用中タイトルでも怖くない! 『メルクストーリア』におけるハイパフォーマンス・ローコストなリアルタイム通信技術の導入事例
[CEDEC 2021] 運用中タイトルでも怖くない! 『メルクストーリア』におけるハイパフォーマンス・ローコストなリアルタイム通信技術の導入事例
Naoya Kishimoto
イマドキ!ユースケース別に見るAWS IoT への接続パターン
イマドキ!ユースケース別に見るAWS IoT への接続パターン
seiichi arai
Iocコンテナについて
Iocコンテナについて
Akio Terayama
Git Flowを運用するために
Git Flowを運用するために
Shun Tsunoda
デプロイメントパイプラインって何?
デプロイメントパイプラインって何?
ke-m kamekoopa
Mercari JPのモノリスサービスをKubernetesに移行した話 PHP Conference 2022 9/24
Mercari JPのモノリスサービスをKubernetesに移行した話 PHP Conference 2022 9/24
Shin Ohno
MAASで管理するBaremetal server
MAASで管理するBaremetal server
Yuki Yamashita
マイクロにしすぎた結果がこれだよ!
マイクロにしすぎた結果がこれだよ!
mosa siru
ホットペッパービューティーにおけるモバイルアプリ向けAPIのBFF/Backend分割
ホットペッパービューティーにおけるモバイルアプリ向けAPIのBFF/Backend分割
Recruit Lifestyle Co., Ltd.
Spring Boot × Vue.jsでSPAを作る
Spring Boot × Vue.jsでSPAを作る
Go Miyasaka
AWSのログ管理ベストプラクティス
AWSのログ管理ベストプラクティス
Akihiro Kuwano
HTTP/2 入門
HTTP/2 入門
Yahoo!デベロッパーネットワーク
Flumeを活用したAmebaにおける大規模ログ収集システム
Flumeを活用したAmebaにおける大規模ログ収集システム
Satoshi Iijima
変わる!? リクルートグループのデータ解析基盤
変わる!? リクルートグループのデータ解析基盤
Recruit Technologies
Más contenido relacionado
La actualidad más candente
Dockerからcontainerdへの移行
Dockerからcontainerdへの移行
Kohei Tokunaga
データレイクを基盤としたAWS上での機械学習サービス構築
データレイクを基盤としたAWS上での機械学習サービス構築
Amazon Web Services Japan
本当は恐ろしい分散システムの話
本当は恐ろしい分散システムの話
Kumazaki Hiroki
[社内勉強会]ELBとALBと数万スパイク負荷テスト
[社内勉強会]ELBとALBと数万スパイク負荷テスト
Takahiro Moteki
実運用して分かったRabbit MQの良いところ・気をつけること #jjug
実運用して分かったRabbit MQの良いところ・気をつけること #jjug
Yahoo!デベロッパーネットワーク
ゲームアーキテクチャパターン (Aurora Serverless / DynamoDB)
ゲームアーキテクチャパターン (Aurora Serverless / DynamoDB)
Amazon Web Services Japan
Python 3.9からの新定番zoneinfoを使いこなそう
Python 3.9からの新定番zoneinfoを使いこなそう
Ryuji Tsutsui
CI/CDツール比較してみた
CI/CDツール比較してみた
Shoya Kai
[CEDEC 2021] 運用中タイトルでも怖くない! 『メルクストーリア』におけるハイパフォーマンス・ローコストなリアルタイム通信技術の導入事例
[CEDEC 2021] 運用中タイトルでも怖くない! 『メルクストーリア』におけるハイパフォーマンス・ローコストなリアルタイム通信技術の導入事例
Naoya Kishimoto
イマドキ!ユースケース別に見るAWS IoT への接続パターン
イマドキ!ユースケース別に見るAWS IoT への接続パターン
seiichi arai
Iocコンテナについて
Iocコンテナについて
Akio Terayama
Git Flowを運用するために
Git Flowを運用するために
Shun Tsunoda
デプロイメントパイプラインって何?
デプロイメントパイプラインって何?
ke-m kamekoopa
Mercari JPのモノリスサービスをKubernetesに移行した話 PHP Conference 2022 9/24
Mercari JPのモノリスサービスをKubernetesに移行した話 PHP Conference 2022 9/24
Shin Ohno
MAASで管理するBaremetal server
MAASで管理するBaremetal server
Yuki Yamashita
マイクロにしすぎた結果がこれだよ!
マイクロにしすぎた結果がこれだよ!
mosa siru
ホットペッパービューティーにおけるモバイルアプリ向けAPIのBFF/Backend分割
ホットペッパービューティーにおけるモバイルアプリ向けAPIのBFF/Backend分割
Recruit Lifestyle Co., Ltd.
Spring Boot × Vue.jsでSPAを作る
Spring Boot × Vue.jsでSPAを作る
Go Miyasaka
AWSのログ管理ベストプラクティス
AWSのログ管理ベストプラクティス
Akihiro Kuwano
HTTP/2 入門
HTTP/2 入門
Yahoo!デベロッパーネットワーク
La actualidad más candente
(20)
Dockerからcontainerdへの移行
Dockerからcontainerdへの移行
データレイクを基盤としたAWS上での機械学習サービス構築
データレイクを基盤としたAWS上での機械学習サービス構築
本当は恐ろしい分散システムの話
本当は恐ろしい分散システムの話
[社内勉強会]ELBとALBと数万スパイク負荷テスト
[社内勉強会]ELBとALBと数万スパイク負荷テスト
実運用して分かったRabbit MQの良いところ・気をつけること #jjug
実運用して分かったRabbit MQの良いところ・気をつけること #jjug
ゲームアーキテクチャパターン (Aurora Serverless / DynamoDB)
ゲームアーキテクチャパターン (Aurora Serverless / DynamoDB)
Python 3.9からの新定番zoneinfoを使いこなそう
Python 3.9からの新定番zoneinfoを使いこなそう
CI/CDツール比較してみた
CI/CDツール比較してみた
[CEDEC 2021] 運用中タイトルでも怖くない! 『メルクストーリア』におけるハイパフォーマンス・ローコストなリアルタイム通信技術の導入事例
[CEDEC 2021] 運用中タイトルでも怖くない! 『メルクストーリア』におけるハイパフォーマンス・ローコストなリアルタイム通信技術の導入事例
イマドキ!ユースケース別に見るAWS IoT への接続パターン
イマドキ!ユースケース別に見るAWS IoT への接続パターン
Iocコンテナについて
Iocコンテナについて
Git Flowを運用するために
Git Flowを運用するために
デプロイメントパイプラインって何?
デプロイメントパイプラインって何?
Mercari JPのモノリスサービスをKubernetesに移行した話 PHP Conference 2022 9/24
Mercari JPのモノリスサービスをKubernetesに移行した話 PHP Conference 2022 9/24
MAASで管理するBaremetal server
MAASで管理するBaremetal server
マイクロにしすぎた結果がこれだよ!
マイクロにしすぎた結果がこれだよ!
ホットペッパービューティーにおけるモバイルアプリ向けAPIのBFF/Backend分割
ホットペッパービューティーにおけるモバイルアプリ向けAPIのBFF/Backend分割
Spring Boot × Vue.jsでSPAを作る
Spring Boot × Vue.jsでSPAを作る
AWSのログ管理ベストプラクティス
AWSのログ管理ベストプラクティス
HTTP/2 入門
HTTP/2 入門
Destacado
Flumeを活用したAmebaにおける大規模ログ収集システム
Flumeを活用したAmebaにおける大規模ログ収集システム
Satoshi Iijima
変わる!? リクルートグループのデータ解析基盤
変わる!? リクルートグループのデータ解析基盤
Recruit Technologies
【14-B-2】グリーを支えるデータ分析基盤の過去と現在(橋本泰一〔グリー〕)
【14-B-2】グリーを支えるデータ分析基盤の過去と現在(橋本泰一〔グリー〕)
Developers Summit
爆速クエリエンジン”Presto”を使いたくなる話
爆速クエリエンジン”Presto”を使いたくなる話
Kentaro Yoshida
リアルタイム分析サービス『たべみる』を支える高可用性アーキテクチャ
リアルタイム分析サービス『たべみる』を支える高可用性アーキテクチャ
Hiroyuki Inoue
何故DeNAがverticaを選んだか?
何故DeNAがverticaを選んだか?
Kenshin Yamada
DeNAの分析を支える分析基盤
DeNAの分析を支える分析基盤
Kenshin Yamada
Apache Flume 1.5を活⽤したAmebaにおけるログのシステム連携
Apache Flume 1.5を活⽤したAmebaにおけるログのシステム連携
cyberagent
Presto in my_use_case
Presto in my_use_case
wyukawa
データファースト開発
データファースト開発
Katsunori Kanda
Presto As A Service - Treasure DataでのPresto運用事例
Presto As A Service - Treasure DataでのPresto運用事例
Taro L. Saito
サイバーエージェントにおけるデータの品質管理について #cwt2016
サイバーエージェントにおけるデータの品質管理について #cwt2016
cyberagent
Amazon Redshiftによるリアルタイム分析サービスの構築
Amazon Redshiftによるリアルタイム分析サービスの構築
Minero Aoki
データドリブン企業におけるHadoop基盤とETL -niconicoでの実践例-
データドリブン企業におけるHadoop基盤とETL -niconicoでの実践例-
Makoto SHIMURA
Amebaにおけるレコメンデーションシステムの紹介
Amebaにおけるレコメンデーションシステムの紹介
cyberagent
Classmethod awsstudy ec2rds20160114
Classmethod awsstudy ec2rds20160114
Satoru Ishikawa
STF20131030chrome
STF20131030chrome
cyberagent
20141106_cwt-zenmyo-naito
20141106_cwt-zenmyo-naito
cyberagent
front_server20131218
front_server20131218
cyberagent
Dot_fes2013
Dot_fes2013
cyberagent
Destacado
(20)
Flumeを活用したAmebaにおける大規模ログ収集システム
Flumeを活用したAmebaにおける大規模ログ収集システム
変わる!? リクルートグループのデータ解析基盤
変わる!? リクルートグループのデータ解析基盤
【14-B-2】グリーを支えるデータ分析基盤の過去と現在(橋本泰一〔グリー〕)
【14-B-2】グリーを支えるデータ分析基盤の過去と現在(橋本泰一〔グリー〕)
爆速クエリエンジン”Presto”を使いたくなる話
爆速クエリエンジン”Presto”を使いたくなる話
リアルタイム分析サービス『たべみる』を支える高可用性アーキテクチャ
リアルタイム分析サービス『たべみる』を支える高可用性アーキテクチャ
何故DeNAがverticaを選んだか?
何故DeNAがverticaを選んだか?
DeNAの分析を支える分析基盤
DeNAの分析を支える分析基盤
Apache Flume 1.5を活⽤したAmebaにおけるログのシステム連携
Apache Flume 1.5を活⽤したAmebaにおけるログのシステム連携
Presto in my_use_case
Presto in my_use_case
データファースト開発
データファースト開発
Presto As A Service - Treasure DataでのPresto運用事例
Presto As A Service - Treasure DataでのPresto運用事例
サイバーエージェントにおけるデータの品質管理について #cwt2016
サイバーエージェントにおけるデータの品質管理について #cwt2016
Amazon Redshiftによるリアルタイム分析サービスの構築
Amazon Redshiftによるリアルタイム分析サービスの構築
データドリブン企業におけるHadoop基盤とETL -niconicoでの実践例-
データドリブン企業におけるHadoop基盤とETL -niconicoでの実践例-
Amebaにおけるレコメンデーションシステムの紹介
Amebaにおけるレコメンデーションシステムの紹介
Classmethod awsstudy ec2rds20160114
Classmethod awsstudy ec2rds20160114
STF20131030chrome
STF20131030chrome
20141106_cwt-zenmyo-naito
20141106_cwt-zenmyo-naito
front_server20131218
front_server20131218
Dot_fes2013
Dot_fes2013
Similar a Amebaにおけるログ解析基盤Patriotの活用事例
Wowzaを用いた配信基盤 Takusuta tech conf01
Wowzaを用いた配信基盤 Takusuta tech conf01
Kazuhiro Ota
Atc15_reading_networking_session
Atc15_reading_networking_session
紘也 金子
HBaseを用いたグラフDB「Hornet」の設計と運用
HBaseを用いたグラフDB「Hornet」の設計と運用
Toshihiro Suzuki
Java Clientで入門する Apache Kafka #jjug_ccc #ccc_e2
Java Clientで入門する Apache Kafka #jjug_ccc #ccc_e2
Yahoo!デベロッパーネットワーク
ABEMA を次のフェーズへ進化させる技術への取り組み
ABEMA を次のフェーズへ進化させる技術への取り組み
Yusuke Goto
ストリーム処理プラットフォームにおけるKafka導入事例 #kafkajp
ストリーム処理プラットフォームにおけるKafka導入事例 #kafkajp
Yahoo!デベロッパーネットワーク
solr勉強会資料
solr勉強会資料
Atsushi Takayasu
PostgreSQLアーキテクチャ入門
PostgreSQLアーキテクチャ入門
Uptime Technologies LLC (JP)
ログ収集フレームワークの新バージョン「FlumeNG」
ログ収集フレームワークの新バージョン「FlumeNG」
AdvancedTechNight
Apache Kuduを使った分析システムの裏側
Apache Kuduを使った分析システムの裏側
Cloudera Japan
恐るべきApache, Web勉強会@福岡
恐るべきApache, Web勉強会@福岡
Aya Komuro
クラウド運用のためのストリームマイニング
クラウド運用のためのストリームマイニング
Shin Matsumoto
Mvp road show_0830_rev1
Mvp road show_0830_rev1
Takano Masaru
LTO/オートローダー/仮想テープライブラリの基礎知識
LTO/オートローダー/仮想テープライブラリの基礎知識
MKT International Inc.
PostgreSQLのトラブルシューティング@第5回中国地方DB勉強会
PostgreSQLのトラブルシューティング@第5回中国地方DB勉強会
Shigeru Hanada
Flume
Flume
あしたのオープンソース研究所
20191120 AWS Black Belt Online Seminar Amazon Managed Streaming for Apache Ka...
20191120 AWS Black Belt Online Seminar Amazon Managed Streaming for Apache Ka...
Amazon Web Services Japan
ポータブルコンポーネントマネージャの実装
ポータブルコンポーネントマネージャの実装
Yosuke Matsusaka
さくらのDockerコンテナホスティング-Arukasの解説とインフラを支える技術(July Tech Festa 2016 『IoTxAIxインフラ時代...
さくらのDockerコンテナホスティング-Arukasの解説とインフラを支える技術(July Tech Festa 2016 『IoTxAIxインフラ時代...
さくらインターネット株式会社
PHPデプロイツールの世界
PHPデプロイツールの世界
Yuuki Takezawa
Similar a Amebaにおけるログ解析基盤Patriotの活用事例
(20)
Wowzaを用いた配信基盤 Takusuta tech conf01
Wowzaを用いた配信基盤 Takusuta tech conf01
Atc15_reading_networking_session
Atc15_reading_networking_session
HBaseを用いたグラフDB「Hornet」の設計と運用
HBaseを用いたグラフDB「Hornet」の設計と運用
Java Clientで入門する Apache Kafka #jjug_ccc #ccc_e2
Java Clientで入門する Apache Kafka #jjug_ccc #ccc_e2
ABEMA を次のフェーズへ進化させる技術への取り組み
ABEMA を次のフェーズへ進化させる技術への取り組み
ストリーム処理プラットフォームにおけるKafka導入事例 #kafkajp
ストリーム処理プラットフォームにおけるKafka導入事例 #kafkajp
solr勉強会資料
solr勉強会資料
PostgreSQLアーキテクチャ入門
PostgreSQLアーキテクチャ入門
ログ収集フレームワークの新バージョン「FlumeNG」
ログ収集フレームワークの新バージョン「FlumeNG」
Apache Kuduを使った分析システムの裏側
Apache Kuduを使った分析システムの裏側
恐るべきApache, Web勉強会@福岡
恐るべきApache, Web勉強会@福岡
クラウド運用のためのストリームマイニング
クラウド運用のためのストリームマイニング
Mvp road show_0830_rev1
Mvp road show_0830_rev1
LTO/オートローダー/仮想テープライブラリの基礎知識
LTO/オートローダー/仮想テープライブラリの基礎知識
PostgreSQLのトラブルシューティング@第5回中国地方DB勉強会
PostgreSQLのトラブルシューティング@第5回中国地方DB勉強会
Flume
Flume
20191120 AWS Black Belt Online Seminar Amazon Managed Streaming for Apache Ka...
20191120 AWS Black Belt Online Seminar Amazon Managed Streaming for Apache Ka...
ポータブルコンポーネントマネージャの実装
ポータブルコンポーネントマネージャの実装
さくらのDockerコンテナホスティング-Arukasの解説とインフラを支える技術(July Tech Festa 2016 『IoTxAIxインフラ時代...
さくらのDockerコンテナホスティング-Arukasの解説とインフラを支える技術(July Tech Festa 2016 『IoTxAIxインフラ時代...
PHPデプロイツールの世界
PHPデプロイツールの世界
Más de cyberagent
WWW2019で見るモバイルコンピューティングの技術と動向 山本悠ニ
WWW2019で見るモバイルコンピューティングの技術と動向 山本悠ニ
cyberagent
Web フィルタリング最前線: 「「検閲回避」回避」 角田孝昭
Web フィルタリング最前線: 「「検閲回避」回避」 角田孝昭
cyberagent
WebにおけるHuman Dynamics 武内慎
WebにおけるHuman Dynamics 武内慎
cyberagent
Webと経済学 數見拓朗
Webと経済学 數見拓朗
cyberagent
Data Engineering Meetup #1 持続可能なデータ基盤のためのデータの多様性に対する取り組み
Data Engineering Meetup #1 持続可能なデータ基盤のためのデータの多様性に対する取り組み
cyberagent
継続的な開発スタイル AbemaTVのiOSアプリを週1でリリースしている話
継続的な開発スタイル AbemaTVのiOSアプリを週1でリリースしている話
cyberagent
AbemaTVにおける推薦システム
AbemaTVにおける推薦システム
cyberagent
AbemaTV レコメンド開発エンジニアによる RecSys 2018 参加レポート
AbemaTV レコメンド開発エンジニアによる RecSys 2018 参加レポート
cyberagent
機械学習エンジニアを見せたAWSの再:発明とは? 〜re:Invent 2018 参加レポート〜
機械学習エンジニアを見せたAWSの再:発明とは? 〜re:Invent 2018 参加レポート〜
cyberagent
インターネットテレビ局「AbemaTV」プロダクトの変遷
インターネットテレビ局「AbemaTV」プロダクトの変遷
cyberagent
番組宣伝に関するAbemaTV分析事例の紹介
番組宣伝に関するAbemaTV分析事例の紹介
cyberagent
WWW2018 論文読み会 Webと経済学
WWW2018 論文読み会 Webと経済学
cyberagent
WWW2018 論文読み会 WebにおけるHuman Dynamics
WWW2018 論文読み会 WebにおけるHuman Dynamics
cyberagent
WWW2018 論文読み会 Web Search and Mining
WWW2018 論文読み会 Web Search and Mining
cyberagent
サイバーエージェントの機械学習エンジニアが体験したGoogle I/O 2018
サイバーエージェントの機械学習エンジニアが体験したGoogle I/O 2018
cyberagent
Orion an integrated multimedia content moderation system for web services
Orion an integrated multimedia content moderation system for web services
cyberagent
Orion an integrated multimedia content moderation system for web services
Orion an integrated multimedia content moderation system for web services
cyberagent
「これ危ない設定じゃないでしょうか」とヒアリングするための仕組み @AWS Summit Tokyo 2018
「これ危ない設定じゃないでしょうか」とヒアリングするための仕組み @AWS Summit Tokyo 2018
cyberagent
"マルチメディア機械学習" の取り組み
"マルチメディア機械学習" の取り組み
cyberagent
推薦アルゴリズムの今までとこれから
推薦アルゴリズムの今までとこれから
cyberagent
Más de cyberagent
(20)
WWW2019で見るモバイルコンピューティングの技術と動向 山本悠ニ
WWW2019で見るモバイルコンピューティングの技術と動向 山本悠ニ
Web フィルタリング最前線: 「「検閲回避」回避」 角田孝昭
Web フィルタリング最前線: 「「検閲回避」回避」 角田孝昭
WebにおけるHuman Dynamics 武内慎
WebにおけるHuman Dynamics 武内慎
Webと経済学 數見拓朗
Webと経済学 數見拓朗
Data Engineering Meetup #1 持続可能なデータ基盤のためのデータの多様性に対する取り組み
Data Engineering Meetup #1 持続可能なデータ基盤のためのデータの多様性に対する取り組み
継続的な開発スタイル AbemaTVのiOSアプリを週1でリリースしている話
継続的な開発スタイル AbemaTVのiOSアプリを週1でリリースしている話
AbemaTVにおける推薦システム
AbemaTVにおける推薦システム
AbemaTV レコメンド開発エンジニアによる RecSys 2018 参加レポート
AbemaTV レコメンド開発エンジニアによる RecSys 2018 参加レポート
機械学習エンジニアを見せたAWSの再:発明とは? 〜re:Invent 2018 参加レポート〜
機械学習エンジニアを見せたAWSの再:発明とは? 〜re:Invent 2018 参加レポート〜
インターネットテレビ局「AbemaTV」プロダクトの変遷
インターネットテレビ局「AbemaTV」プロダクトの変遷
番組宣伝に関するAbemaTV分析事例の紹介
番組宣伝に関するAbemaTV分析事例の紹介
WWW2018 論文読み会 Webと経済学
WWW2018 論文読み会 Webと経済学
WWW2018 論文読み会 WebにおけるHuman Dynamics
WWW2018 論文読み会 WebにおけるHuman Dynamics
WWW2018 論文読み会 Web Search and Mining
WWW2018 論文読み会 Web Search and Mining
サイバーエージェントの機械学習エンジニアが体験したGoogle I/O 2018
サイバーエージェントの機械学習エンジニアが体験したGoogle I/O 2018
Orion an integrated multimedia content moderation system for web services
Orion an integrated multimedia content moderation system for web services
Orion an integrated multimedia content moderation system for web services
Orion an integrated multimedia content moderation system for web services
「これ危ない設定じゃないでしょうか」とヒアリングするための仕組み @AWS Summit Tokyo 2018
「これ危ない設定じゃないでしょうか」とヒアリングするための仕組み @AWS Summit Tokyo 2018
"マルチメディア機械学習" の取り組み
"マルチメディア機械学習" の取り組み
推薦アルゴリズムの今までとこれから
推薦アルゴリズムの今までとこれから
Último
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NTT DATA Technology & Innovation
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
CRI Japan, Inc.
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
CRI Japan, Inc.
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
Hiroshi Tomioka
Último
(7)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
Amebaにおけるログ解析基盤Patriotの活用事例
1.
Amebaにおけるログ解析基盤Patriotの活用事例 株式会社サイバーエージェント アメーバ事業本部 Ameba Technology Laboratory 善明晃由、飯島賢志
2.
株式会社サイバーエージェント 本日の内容 • • • • AmebaサービスとAmeba Technology Laboratoryについて ログ解析基盤Patriotの概要 データ分析のためのPatriotの活用体制 ログ転送システムとApache
Flume 2
3.
Amebaサービスと Ameba Technology Laboratory について
4.
株式会社サイバーエージェント Ameba事業 ー PC向けサービス 4
5.
株式会社サイバーエージェント Ameba事業 - スマートフォンプラットフォーム 約40個のコミュニティサービスと約80個のソーシャルゲームを 抱えるプラットフォーム 5
6.
株式会社サイバーエージェント Ameba Technology Laboratoryについて •
Amebaの大規模データを集約的に扱う組織 • 2011年4月に開設、現在約20名が所属 ログ解析 検索 データマイニング 大規模 分散処理 (ログ解析基盤) 推薦 フィルタリング 6
7.
ログ解析基盤Patriotの概要
8.
8 Amebaのログ解析基盤:Patriot • Amebaのサービス共通のログ解析基盤 • Ameba
Technology Laboratoryで開発・運用 • サービスのユーザ行動の分析 • レコメンド等の大規模データ活用による機能の提供 • Hadoopクラスタ上に構築 • • • • HDFSにログデータを集約 Hive/MapReduceを用いた集計 HBaseを用いて処理結果を活用 Flumeを用いたデータ収集
9.
株式会社サイバーエージェント 【Logサーバ】 ログの一時集約 ログ転送(SCP) MySQLレプリ システム構成 ログ整形 Hiveインポート Ameba サービス ログのリアルタイム転送 (Flume) HiveJobをキック 【Batchサーバ】 ワークフロー スケジューラ Hadoop クラスタ サマリView、 アドホックHiveクエリ (自作WebUI) 【外部連携サーバ】 サマリーデータ取得 Hiveクエリ実行 ジョブステータス取得 各部門の レポーティングツール 9
10.
株式会社サイバーエージェント これまでの経緯 • 2010年 7月: 初期リリース
(CDH3b系) • 2011年 3月: CDH3u0にアップグレード 9月: 独自開発のワークフロースケジューラ、サマリDBとしてHBaseを導入 • 2012年 5月: スマートフォンプラットフォーム向けPatriotの構築 (CDH3u3) 10月: ログ収集にFlumeを導入(Apache Flume1.3) • 2013年 3月: 外部連携サーバ(Patriot Bridge)の導入 7月: PatriotのDC移設、CDHアップグレード(CDH4.3) GHE、Jenkinsを用いた運用フローの見直し 8月: スマートフォンプラットフォーム向けPatriotを統合 10
11.
株式会社サイバーエージェント ジョブ数の推移 14000 12000 10000 2012年4月 3154ジョブ クラスタ統合 8000 6000 4000 2000 0 2013年11月 11639ジョブ 11
12.
株式会社サイバーエージェント ジョブの内訳 (2013年11月1日時点) 1443 レコメンドバッチ バックアップ、など 290 集計クエリ 767 データ取り込みクエリ 445 その他Hiveクエリ ログ転送 その他 8694 中間テーブル作成 マスターデータ更新 ADD PARTITION、など 約75%が集計クエリ (SELECT COUNT(1)
など) 12
13.
株式会社サイバーエージェント ワークフロースケジューラ • MySQLでジョブと依存関係を管理 • 設定ファイル一つでジョブ追加可能 ジョブ管理DB (MySQL) ジョブ登録 (cron) ワーカー (ruby
daemon) Hiveクエリ (*.pbc バッチ設定 (*.pbc (rubyDSL)) (rubyDSL)) (*.pbc (rubyDSL)) ログ取り 込み ワーカー (ruby daemon) ログ転送 レコメンド バッチ 13
14.
株式会社サイバーエージェント ジョブ設定DSL • 柔軟なジョブのグループ化により細粒度の依存関係を簡潔に記述 • プラグインとしてコマンドを追加可能 ジョブをグループ化し job_group{ 依存関係を設定 require
['base_tbl_#{$dt}'] Hiveクエリを hivequery{ 実行するコマンド require ['tmp_tbl_#{date_sub($dt,1)}'] produce ['tmp_tbl_#{$dt}'] 日を跨ぐ hiveql 'INSERT OVERWRITE ...' 依存関係 } hive2hbase{ Hiveの結果を require ['tmp_tbl_#{$dt}'] HBaseにPutする hiveql 'SELECT count(distinct id) FROM ..' コマンド } } 14
15.
データ分析のためのPatriotの活用体制
16.
株式会社サイバーエージェント 16 運用、活用体制 データ分析部門 マーケティング部門 ゲームコンサル プロデューサ マーケティング データマイニング エンジニア 担当エンジニア 担当エンジニア GitHub Enterprise マーケティング 部門 リポジトリ Pull Request バッチ設定 リポジトリ Jenkins Pull Request データ分析 部門 リポジトリ 構文チェックなど
17.
株式会社サイバーエージェント バッチ設定のレビュー •可能な部分はJenkinsで自動化 • 構文チェック • キーの重複検査 •テンプレートを用いた効率化 •
バッチ設定はERBテンプレートが利用可能 • 共通指標はテンプレート化しレビューを省略 •現在さらなる自動化を検討中 • クエリをパース・分析するライブラリを開発 • パーティションの選択の有無などレビュー時に必要な確認を自動化 • 最適化、リファクタリング • クエリの複雑さを計測 など 17
18.
株式会社サイバーエージェント テンプレート化の例:アクセスログ解析 PV, レイテンシなど約20項目の集計を1つのテンプレートで設定 job_group{ # ログ取り込み設定、前処理など } import_erb_config
'accesslog_analysis_daily.erb', {'service'=>'blog', 'dev'=>'pc', 'paths' => { # 集計対象URL ... } } • PV • • • 日別、時間別 デバイス、OS別 レスポンスタイム • 中央値 • 最小、最大 • 上位、下位5%値 など 18
19.
株式会社サイバーエージェント Jenkinsを用いたレビューの自動化 入力パーティション数 非効率なJOIN など 19
20.
株式会社サイバーエージェント Jenkinsを用いたバッチ処理の分析の例 利用頻度の高いサブクエリ → 中間テーブル化、View、UDF、etc 20
21.
株式会社サイバーエージェント 活用例1:データマイニング用中間データ データマイニング用 中間データ生成ジョブ (INSERT OVERWRITE) 分析 結果 担当エンジニア GitHub Enterprise データ分析 部門 リポジトリ バッチ設定 リポジトリ データマイニング エンジニア 中間データ更新 Jenkins Hive Warehouse 21
22.
株式会社サイバーエージェント 活用例2:レポーティングツール連携 集計クエリ (SELECT文) 通知スクリプト 担当エンジニア レポーティングツール GitHub Enterprise データ分析 部門 リポジトリ バッチ設定 リポジトリ Jenkins 集計結果取得 外部連携 API 集計完了通知 22
23.
ログ転送システムと Apache Flume
24.
24 Patriotへのログ転送 • 2012.05以前 SCPでログ転送 •
2012.05 Scribeを使ったリアルタイムなログ転送を一部で開始 • 2012.10 ScribeをFlumeに置き換え、Amebaサービスに導入開始 • 2013.01 Patriot以外のシステムへの転送も開始 • 2013.09 主要AmebaサービスにほぼFlume導入完了 • 2013.11 Ameba SAP(CAグループ)のログ収集を計画中
25.
25 Patriotへのログ転送 • Flume導入サービス : 80
service (導入拡大中) • ログの種類 : 160 log type (service×log type) • 導入ホスト数 : 1,000 host • ピーク時 : 90,000 lines / sec • サイズ(Raw) : 1.0 TByte / day
26.
株式会社サイバーエージェント ログ転送システム構成 • Flumeで分岐・統合など柔軟にルーティングを構築 Ameba サービス Aggre gator ストリーム処理 (HBase sink) HBase クラスタ ストリーム処理 (Onix) Ameba サービス Hadoop クラスタ Aggregator Recommend システム Ameba サービス Aggre gator ログ監視 システム Trend システム 26
27.
27 Flume Collector • 収集対象ファイルが出力されるホストで起動するFlume
Agent。 • 収集したログはAggregatorに転送する。 • Flumeの設定 • • • 秒間1000linesほどのログでもヒープは128Mで十分。 監視としてMBeansの各種メトリクスをGangliaに送信。 アラート監視にはJolokiaを使ってhttp経由でMBeansを参照。 http://www.jolokia.org/ ※リアルタイムにMBeansを見るときはVisualVMなどを使用。 Collector Intermediate Aggregator Collector Intermediate Aggregator Collector Final Aggregator
28.
28 Flume Aggregator • Intermediate
Aggregator • • • Final Aggregatorにログ転送するFlume Agent。 ルーティングの中継としてDC毎に設置。 スペック : 物理×2 / 4Core / Mem8G / RAID1 × 2 VM×3 / 4Core / Mem8G • Final Aggregator • • • 転送されたログを最終的に集約するFlume Agent。 HDFSなどへの書込み、他システムへのルーティングをする役割。 スペック : 物理サーバ×5 / 4Core / Mem24G / RAID1 × 2 Collector Intermediate Aggregator Collector Intermediate Aggregator Collector Final Aggregator
29.
29 ログ転送で使っている機能 • Channel Selector :
他システムへの振り分け、Multiplexing • TimeStamp Bucket : 日時などでBucketingしてHDFSに書込み • Reset Connection : LoadBalancer経由のログ転送 • Deflate Compression : 圧縮転送 • HBase sink : HBaseに書込み • File Channel : ロストを許さないログで使用(集計 / 監視) • Memory Channel : 若干のロストを許容するログで使用 (Recommend / Trend)
30.
30 Channel Selector • Flume Agent
(JVM) 機能 • Sourceで受け取ったログを指定したChannelに流し込む。 Source • 複数のChannelに同じログを同時に転送も可能 (Multiplexing)。 この機能で他システムへの振り分けをしている。 Selector • • これで同じログを他システムで重複して取得 する必要がなくなった。 • optional channels(FLUME-1768, 1769)が実装された CDH4.2.0以降のものが使い勝手がよい。 Channel Channel Channel Sink Sink Sink • optional channelsはもしChannelへのputを失敗してもリトライしない設定。 • リトライしないことで他の重要なChannelに影響を及ぼさない。 • Memory Channelのようなロストを許容できる場合との組合せに適している。
31.
31 TimeStamp Bucket (HDFS
Sinkの機能) • 機能 • HDFSに書込みむとき、ログのHeaderのTimeStampを元に日付や時間で 正確にBucketingできる。 hdfs://namenode/flume/%{header1}/%{header2}/%Y-%m-%d/%H/ • TimeStampをsetするInterceptorについて • • Flumeの TimestampInterceptor では転送時の現在時刻をTimeStampとするが ログの日時をパースするように自社でInterceptorを独自実装。 JSON、TSV、Syslogなど多様なログに対応。
32.
32 Reset Connection • 機能 • • Collectorで転送先をLoadBalancerにするときに使用。 指定した間隔でLBに再接続するので、LBに登録した host:port
に分散して転送ができる。 agent.sinks.avro.reset-connection-interval = 60 • 使用経緯 • • • Flumeの設定で元々LoadBalance機能はあるが、100近いサービスを 横断した設定ファイル変更はChefを使っているとはいえ手間。 設定ファイルでは宛先をLBのIPにして、LBの設定を変えるだけで 転送先の増設などに対応できる。 弊社FlumeコミッターのJuhaniが作ったパッチで稼働中。 (FLUME-2154, CDH5.0.0 beta1で適用) Collector Load Balancer Aggregator Aggregator Aggregator
33.
33 Deflate Compression • 機能 • Avroを使った転送で圧縮した転送ができる。 agent.sinks.avro.compression-type
= deflate • ZlibEncoder と ZlibDecoder を用いて通信を圧縮している。 • ネットワーク負荷を数分の一に低減できる。 • CDH4.3.0以降のもので利用可(FLUME-1915)。
34.
34 HBase Sink • 機能 • • • • • 転送したログなどをHBaseに保存できる。 HBase
SinkとAsync HBase sinkの2タイプがある。 Async HBase sinkの方が高速。ただしHBase Sinkにあるケルベロス認証は 非サポート。 Async HBase sinkを使うにはHBaseのvalueをLong型にする必要あり。 HBase SinkのSerializerをフォークして作りこみ、ストリーム処理した結果を Patriotのデータ構造に変換してHBaseにリアルタイム反映するのに利用している。 処理結果を Serializerで変換 Aggregator HBase クラスタ
35.
35 コンポーネントのカスタマイズ • カスタマイズしたコンポーネントをFlumeに簡単に組み込める。 • Jarファイルにして
/usr/lib/flume/lib などに配布して 下記のように指定する。 • このようにしてFlume自体に実装されてない機能、独自システムとの 連携などに対応できる。 # example agent.xxx.custom.type = [カスタマイズしたClass名やMethod名など] agent.xxx.custom.channel = ch1 agent.xxx.custom.port = 12345 ※ xxx : sources, channels, sinks などのコンポーネント
36.
36 コンポーネントのカスタマイズ - HBase
Sink • typeには自分で作ったClass名を指定。 ※ type = hbase と指定した場合はデフォルトのHBase Sinkになる。 • serializerのみClass指定することもできる。 • 設定項目もカスタマイズできる。 agent.sinks.hbase.type = jp.co.cyberagent.flume.sink.hbase.PatriotHBaseSink agent.sinks.hbase.serializer = jp.co.cyberagent.flume.sink.hbase.PatriotSerializer agent.sinks.hbase.channel = ch1 agent.sinks.hbase.table = table_name agent.sinks.hbase.columnFamily = data agent.sinks.hbase.custom = custom 処理結果を Serializerで変換 Aggregator HBase クラスタ
37.
37 コンポーネントのカスタマイズ - Channel
Selector Flume Agent (JVM) • デフォルトのSelectorは1headerでのみの判別になるが、 複数headerをみてChannelに流し込むようにカスタマイズ。 Source Selector • 設定例 • applog で、サービス名が「girlfriend」、行動タイプが spend のログは hdfs-ch と spend-ch の両方に流し込み、 • applog.girlfriend.spend default trend-log は trend-ch に流し込み、 • trend-log それ以外のログはデフォルトで hdfs-ch だけに流し込む設定。 trend-ch hdfs-ch spend-ch Sink Sink Sink agent.sources.avro.selector.type = jp.co.cyberagent.flume.selector.MultiHeaderSelector agent.sources.avro.selector.headers = category,service,type agent.sources.avro.selector.required.trend-log = trend-ch agent.sources.avro.selector.required.applog.girlfriend.spend = hdfs-ch spend-ch agent.sources.avro.selector.default = hdfs-ch
38.
38 スケールアウトについて Channel • Final Aggregator
- HDFS Sink • • HDFSへの書込みは最初は1Channel : 1HDFS Sinkで十分。 基本的にはホスト追加でスケールアウトできる。 • もし転送量が大きくなり(秒間数万とか)リソースが余ってるのに スループットが出なくなったら、hdfs.batch-sizeを上げるより 1Channelに対してHDFS Sinkを並列化する方がスケールする。 http://blogs.apache.org/flume/ • • 1ホストにおいてもChannelを複数に分けた方がスケールする。 Channel HDFS Sink 1Channel : 2HDFS Sink (2並列) より並列数を増やしても スケールはあまりしない。 ※同時書込みファイル数が1万近い場合 Performance Test by Cloudera HDFS Sink Channel HDFS Sink HDFS Sink HDFS Sink Channel HDFS Sink HDFS Sink https://cwiki.apache.org/confluence/display/FLUME/Flume+NG+Syslog+Performance+Test+2012-04-30
39.
39 スケールアウトについて • Intermediate Aggregator • • • 他のホストに転送するだけなら大きなサーバリソースは不要。 Collectorが100台ほどでもホスト2,3台の冗長化構成で十分。 もし負荷が高くなってもホストを追加すればスケールできる。 •
Aggregator共通 • File Channel より Memory Channel の方が低レイテンシでスケールしやすい。 • File Channelを使っていてログ量が大きければ物理サーバ、 そうでなけばVMで基本問題なし。 • File Channel で物理サーバの場合、I/O負荷低減のためディスクを2つ用意し 下記のようにPartitionを分けるとよい。 /data1 : checkpointDir用のパーティション /data2 : dataDirs用のパーティション
40.
40 HDFSに保存したログの重複について • HDFS Client にはトランザクションの仕組みがなく、HDFSとの通信で タイムアウトなどが起こると、成功したか分からないものは処理を やり直すため若干の重複が起こりえる。 • HDFSに書き込む
batch-size が大きいほど重複は起こりやすい。 • 重複率は0%〜0.005%程度。 ※秒間1000linesほどのWebサーバのログ、batch-size=100の設定で調べた結果。 • 重複を許容できなければMapReduceでユニークにするなどで対応する。 • 逆にデータのロストは File Channel を使えば発生しない。 ※Memory Channelは停止前にChannelにデータがあれば、 その分は失われるしまう。その代わり、パフォーマンスが高い。
41.
41 過去のトラブル解決 • HDFSへの同時書込みファイル数のlimitに達した • • Flume Aggr側
: ulimitの上限を65536に変更。 DataNode側 : Xceiverの上限引き上げ。 • 起動時のReplayに時間がかかる場合 • • ChannelSizeが数千万以上溜まったときに稀に発生。 use-fast-replayをtrueにするなど他のReplay方式を試すと速く終わることも。 • File ChannelのCheckPointでファイルのlock取得でタイムアウト • • • I/O負荷が高いホストで発生。 I/O負荷の原因となっている元を解消する。 もしくはFile Channelの設定で write-timeout の値を引き上げ(default:3秒)。
42.
42 今後の展望 • Flume導入範囲の拡大 • SSL通信機能(FLUME-997,
CDH4.4.0で実装)の検証 • Final Aggregatorの負荷軽減 • HDFS上に作るファイル単位ごとに担当するAggregatorを振り分ければ より少ないサーバリソースでHDFSへ書込みできそう。
43.
43 まとめ • Amebaのログ解析基盤Patriotについて • GithubEnterpriseとJenkinsを用いて他部門が利用できる体制 •
データマイニングエンジニアやレポーティングツールとの連携 • FlumeでHadoopクラスタへリアルタイムに大規模なログ転送を実現 • HDFSへの書込みだけでなく、一度のログ転送で同時に他システムへ ログを流し込み、ネットワーク負荷を軽減
44.
44 最後に • 以前の発表 • Patriot
(Hadoop Conference 2011 winter) http://www.slideshare.net/toutouzone/hadoop-conferencejapan2011 • Flume (Hadoop Conference 2013 winter) http://www.slideshare.net/iijiji0314/flumeameba • Onix (Data Stream Processing and Analysis with Akka @ Scala Conference 2013) http://www.slideshare.net/romanshtykh/data-stream-processing-and-analysis-with-akka
45.
45 最後に • Ameba Technology
Lab ではエンジニアを 募集しています! http://www.cyberagent.co.jp/recruit/career/ • Hadoop / データマイニング / 機械学習/ 検索 などに 興味がある人はお声がけください。
46.
ご清聴ありがとうございました。
Descargar ahora