SlideShare una empresa de Scribd logo
1 de 9
Descargar para leer sin conexión
空気になったKafkaと
本番導入が進むNiFiと
凄すぎたUberと
「DataWorks Summit 2017 San Jose」で見たデータストリーミングのトレンド
GOMI Akiko@g3akk
自己紹介 – 五味明子/GOMI Akiko
• IT系出版社の編集者→2011年からフリーランスライ
ター
• クラウドwatch、IT Leaders、gihyo.jp、
EnterpriseZine、ASCII Techなどテック系Web媒体中
心に執筆
• 取材分野はクラウド、ネットワーク、セキュリティ、
データアナリティクス、AI、IoT、IT企業動向など
• 海外カンファレンス取材多め、1年の1/3はどこかに出
張中
• サンノゼのDataWorks Summit(旧Hadoop Summit)
は2015年、2016年につづき3回目の参加
DataWorks Summit 2017 Sun Jose
• HortonworksとYahoo!が主催するHadoopエンジニ
ア/ユーザを対象にした年次カンファレンス。世界各
地で開催されているが、毎年6月にサンノゼで行われ
るこのイベントがもっとも規模が大きい
• 今回(正確には3月のベルリン開催)から「Hadoop
Summit」→「DataWorks Summit」に名称変更。ゾ
ウさん色がうすめに→レポート※書きました!
• 人気の話題はTensorFlowやSparkRなどAI/データサイ
エンス関連。今年中にリリース予定のHadoop 3.0お
よびYARNにも注目があつまる
• データストリーミング関連も人気。Sparkがメジャー
になってきた2015年ごろからHadoop + リアルタイ
ム処理系のキーノートやセッションが増えはじめた。
さらにHortonworksがApache NiFiをベースにした
「Hortonworks DataFlow(HDF)」をHDPと並ぶコア
製品に位置づけたことで、NiFi関連のセッションが急
増中
※過渡期を迎えるHadoopとデータビジネス - ゾウが消えた「DataWorks Summit
2017 San Jose」/ gihyo.jp
そもそもストリーミングデータとは…
• 膨大な数のデータソースから継続的に生成される
• IoTセンサー、モバイルアプリ、ソーシャルネットワーク、ログファイル、…
• ひとつひとつのデータサイズは小さい
• たいていはキロバイト単位
• 絶えずどこかに向かって流れている
• Hortonworksはこれを”Data-in-Motion”と呼んでいる
• 時間の経過とともにデータの性質や価値が変化するので“いま”の状態の分析&可視化=リア
ルタイム処理が重要
• 直近のデータに対する低レイテンシ(ミリ秒単位)な処理
• 向いている分野は、リアルタイムレスポンス、モニタリング、クイック集計など
• 金融やeコマースにおける取引での不正/異常検知
• 移動中/輸送中の車両のリアルタイム追跡
• 産業機器の部品交換アラート
• ソーシャルゲームのイベントでの順位集計
• オンラインメディアにおける読者ごとのコンテンツ最適化
• ソーシャルメディアでの炎上チェック
DWS 2017 SJで見かけたデータストリーミング関連技術
メジャーどころ
• Apache Kafka / Kafka Streams
• Apache NiFi
• Apache Spark Streaming
• Apache Storm
その他
• Apache Metron
• Apache Beam
• Apache Apex
• Bullet by Yahoo! ←スケーラブル&リアル
タイムなデータクエリエンジン、他のデー
タストリーミング技術とプラがぶるな連携
が可能
The Best Session by ChatWork & NTT DATA
Worldwide Scalable and Resilient Messaging
Services by CQRS and Event Sourcing Using Akka,
Kafka Streams and HBase
レポート書きました→スケールするメッセージングシステムを構
築せよ ―チャットワークとNTTデータが挑んだKafkaベースの"土
管"づくり/gihyo.jp
Pick Up – Kafka / Kafka Streams
Kafkaは我々にとって頭で考えて使うものじゃない。Kafkaはもう空気みたいな存在で,なければ
息ができなくなってしまう – Josh Wills, CTO, Slack / Structure Data 2016
Kafkaは空気
• 2017年はKafkaのデフォ化がさらに加速。DWS17SJのデータストリーミング系のほとんどの
セッションでは、Kafkaを使うことがあたりまえすぎるので、タイトルにわざわざKafkaを入れ
ていない。逆にデータストリーミング処理にKafkaを使わないorまったく検討しない、という
ケースはほぼ皆無
• シンプルなアーキテクチャ、パブサブ型、低レイテンシ/高スループット、他のストリーミング
技術との連携のしやすさ、etc.などからメッセージングシステムのデファクトに
• Ex.) GoProの事例: コンシューマデバイスから吸い上げた多種多様なストリーミングデータを
Kafka + Spark StreamingベースのダイナミックDDLシステムに流し込み、データサイエンスの
ための分析基盤を提供→Kafkaをストリーミングデータの土管として機能させることで、どんな
システムでも雛形をつくりやすい
Pick Up – NiFi
• 2015年にHortonworksがApache NiFiを開発するOnyaraを買収、プロジェクトリーダーのJoe
Wittも移籍→NiFiをコアとするデータストリーミング製品「HDF」が登場、DWS17SJとほぼ同時
期にHDF 3.0にアップデート。データオーケストレーションの“コーディングレス化”が加速
• DWS17SJではNiFi関連のセッションが急増、技術セッションだけでなくIoTやマシンラーニング
などと組み合わせたエンタープライズアダプションの事例も豊富に
• Ex.) Rogers Communicationsの事例: カスタマーエクスペリエンス向上をはかるため、NiFiの
ほかHadoop、Sparkをベースに、自然言語処理を取り入れた”360度のカスタマービュー”シス
テムを構築。ソーシャルネットワークやオンラインチャットなど非構造化データの流れもNiFIで
コントロール
NSAで開発をはじめて、目の前のオフィスからNiagara Fallが見え
た。なんとなく語呂が良いように感じて”NiFi”という名前にしたん
だ – Joe Witt, Senior Director, Engineering, Hortonworks /
Hadoop Summit 2015
Pick Up – Uber
Uberが1日あたりに処理するメッセージの件数は1兆を超える。そんなUberにとってKafkaは欠かせ
ないデータハブ – Ankur Bansal, Senior Software Engineer, Streaming Team, Uber / DataWorks
Summit 2017 San Jose
• ホライゾンタリなスケーラビリティ
• 5ミリ秒以下のレイテンシ
• 99.99%の可用性
• 99.99%の耐障害性
• 複数のデータセンターをまたいだレプリ
ケーション
• 複数の言語のサポート(Java / Go /
Node.js / C++)
→ これらの要件を満たす世界最大級の
Kafkaクラスタを構築
新しいワインは新しい革袋に、古いワインは古い革袋に
↓
新しいイノベーションは新しい技術で!
• データストリーミング技術を駆使して新しいイノベーションを!
• ビジネス部門との連携もう少し強化して、新しい技術で実装されたシステムをなるはやでビジネ
スの現場に!
• 勉強や視察だけでなく、みずから情報発信&共有を!

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

SORACOM UG 九州 #6 & JAWS-UG 共同開催ハンズオンまつり | IoT 向け通信プラットフォーム「SORACOM」ご紹介
SORACOM UG 九州 #6 & JAWS-UG 共同開催ハンズオンまつり | IoT 向け通信プラットフォーム「SORACOM」ご紹介SORACOM UG 九州 #6 & JAWS-UG 共同開催ハンズオンまつり | IoT 向け通信プラットフォーム「SORACOM」ご紹介
SORACOM UG 九州 #6 & JAWS-UG 共同開催ハンズオンまつり | IoT 向け通信プラットフォーム「SORACOM」ご紹介
 
2020 - The New IPへの旅
2020 - The New IPへの旅2020 - The New IPへの旅
2020 - The New IPへの旅
 
SORACOM LTE-M Buttonで「かえるボタン」を作ったら家族が使ってくれている話
SORACOM LTE-M Buttonで「かえるボタン」を作ったら家族が使ってくれている話SORACOM LTE-M Buttonで「かえるボタン」を作ったら家族が使ってくれている話
SORACOM LTE-M Buttonで「かえるボタン」を作ったら家族が使ってくれている話
 
FIWARE 概要 - FIWARE WednesdayWebinars
FIWARE 概要 - FIWARE WednesdayWebinarsFIWARE 概要 - FIWARE WednesdayWebinars
FIWARE 概要 - FIWARE WednesdayWebinars
 
FIWARE for Smart Cities
FIWARE for Smart CitiesFIWARE for Smart Cities
FIWARE for Smart Cities
 
20181019CEATEC Keynote Future | イノベーションを加速する IoTの‟Democratization” (民主化)
20181019CEATEC Keynote Future | イノベーションを加速する  IoTの‟Democratization” (民主化)20181019CEATEC Keynote Future | イノベーションを加速する  IoTの‟Democratization” (民主化)
20181019CEATEC Keynote Future | イノベーションを加速する IoTの‟Democratization” (民主化)
 
誰でもできるスマートシティ向けOSS : FIWAREのはじめかた
誰でもできるスマートシティ向けOSS : FIWAREのはじめかた誰でもできるスマートシティ向けOSS : FIWAREのはじめかた
誰でもできるスマートシティ向けOSS : FIWAREのはじめかた
 
UGxUG 3時間 IoT 実践ハンズオン | IoT 向け通信プラットフォーム「SORACOM」ご紹介
UGxUG 3時間 IoT 実践ハンズオン | IoT 向け通信プラットフォーム「SORACOM」ご紹介UGxUG 3時間 IoT 実践ハンズオン | IoT 向け通信プラットフォーム「SORACOM」ご紹介
UGxUG 3時間 IoT 実践ハンズオン | IoT 向け通信プラットフォーム「SORACOM」ご紹介
 
Japan IT Week 春 IoT/M2M展 ソラコムブース | IoT プロジェクトを成功させるために必要なものとは?ーSORACOMパートナーブー...
Japan IT Week 春 IoT/M2M展 ソラコムブース | IoT プロジェクトを成功させるために必要なものとは?ーSORACOMパートナーブー...Japan IT Week 春 IoT/M2M展 ソラコムブース | IoT プロジェクトを成功させるために必要なものとは?ーSORACOMパートナーブー...
Japan IT Week 春 IoT/M2M展 ソラコムブース | IoT プロジェクトを成功させるために必要なものとは?ーSORACOMパートナーブー...
 
Io tビジネスモデルに関する考察20161119
Io tビジネスモデルに関する考察20161119Io tビジネスモデルに関する考察20161119
Io tビジネスモデルに関する考察20161119
 
20181017日経xTECH EXPO基調講演 | IoT活用の羅針盤 ~IoT通信の進化と実践事例にみるIoT活用戦略~  
20181017日経xTECH EXPO基調講演 | IoT活用の羅針盤~IoT通信の進化と実践事例にみるIoT活用戦略~ 20181017日経xTECH EXPO基調講演 | IoT活用の羅針盤~IoT通信の進化と実践事例にみるIoT活用戦略~ 
20181017日経xTECH EXPO基調講演 | IoT活用の羅針盤 ~IoT通信の進化と実践事例にみるIoT活用戦略~  
 
Sakura IoT Platform
Sakura IoT PlatformSakura IoT Platform
Sakura IoT Platform
 
NEW WORLD. NEW NETWORK.: 3ステップで考えるNew IPへの進化
NEW WORLD. NEW NETWORK.: 3ステップで考えるNew IPへの進化NEW WORLD. NEW NETWORK.: 3ステップで考えるNew IPへの進化
NEW WORLD. NEW NETWORK.: 3ステップで考えるNew IPへの進化
 
クラウドを用いるIoT開発における実費レポート
クラウドを用いるIoT開発における実費レポートクラウドを用いるIoT開発における実費レポート
クラウドを用いるIoT開発における実費レポート
 
オープニング
オープニングオープニング
オープニング
 
Japan IT Week 春 IoT/M2M展 安川情報システム様ブース | IoTが実現する遠隔制御ソリューション- SORACOM を用いた「既存設...
Japan IT Week 春 IoT/M2M展 安川情報システム様ブース | IoTが実現する遠隔制御ソリューション- SORACOM を用いた「既存設...Japan IT Week 春 IoT/M2M展 安川情報システム様ブース | IoTが実現する遠隔制御ソリューション- SORACOM を用いた「既存設...
Japan IT Week 春 IoT/M2M展 安川情報システム様ブース | IoTが実現する遠隔制御ソリューション- SORACOM を用いた「既存設...
 
Japan IT Week 春 IoT/M2M展 日本ノーベル様ブース| LPWA を手軽に実現!今日から始めるLPWAを用いたIoTシステム
Japan IT Week 春 IoT/M2M展 日本ノーベル様ブース| LPWA を手軽に実現!今日から始めるLPWAを用いたIoTシステムJapan IT Week 春 IoT/M2M展 日本ノーベル様ブース| LPWA を手軽に実現!今日から始めるLPWAを用いたIoTシステム
Japan IT Week 春 IoT/M2M展 日本ノーベル様ブース| LPWA を手軽に実現!今日から始めるLPWAを用いたIoTシステム
 
Japan IT Week 春 IoT/M2M展 ウイングアーク1st様ブース | 作らずに実現!働く現場に効くIoTの活用術ー明日から始められるIoTー
Japan IT Week 春 IoT/M2M展 ウイングアーク1st様ブース | 作らずに実現!働く現場に効くIoTの活用術ー明日から始められるIoTーJapan IT Week 春 IoT/M2M展 ウイングアーク1st様ブース | 作らずに実現!働く現場に効くIoTの活用術ー明日から始められるIoTー
Japan IT Week 春 IoT/M2M展 ウイングアーク1st様ブース | 作らずに実現!働く現場に効くIoTの活用術ー明日から始められるIoTー
 
No Moreハードウェア!?エッジ・ルータが仮想化されると何が変わる?
No Moreハードウェア!?エッジ・ルータが仮想化されると何が変わる?No Moreハードウェア!?エッジ・ルータが仮想化されると何が変わる?
No Moreハードウェア!?エッジ・ルータが仮想化されると何が変わる?
 
IoTで生き残れ!成功なんて結果論、こうすれば失敗します。プロ達が語る『IoT失敗あるある談』!!! | IoT ありがちな失敗パターンと 回避する方法
IoTで生き残れ!成功なんて結果論、こうすれば失敗します。プロ達が語る『IoT失敗あるある談』!!! | IoT ありがちな失敗パターンと 回避する方法IoTで生き残れ!成功なんて結果論、こうすれば失敗します。プロ達が語る『IoT失敗あるある談』!!! | IoT ありがちな失敗パターンと 回避する方法
IoTで生き残れ!成功なんて結果論、こうすれば失敗します。プロ達が語る『IoT失敗あるある談』!!! | IoT ありがちな失敗パターンと 回避する方法
 

Similar a ストリームデータ処理技術勉強会_イントロセッション

Markezine day 2012 gdo nakazawa
Markezine day 2012 gdo nakazawaMarkezine day 2012 gdo nakazawa
Markezine day 2012 gdo nakazawa
Shinya Nakazawa
 

Similar a ストリームデータ処理技術勉強会_イントロセッション (20)

IoT×ビジネス活用 ~最先端技術のビジネス活用に向けて~
IoT×ビジネス活用 ~最先端技術のビジネス活用に向けて~IoT×ビジネス活用 ~最先端技術のビジネス活用に向けて~
IoT×ビジネス活用 ~最先端技術のビジネス活用に向けて~
 
さくらのIoTプラットフォーム「sakura.io」を使ってみよう
さくらのIoTプラットフォーム「sakura.io」を使ってみようさくらのIoTプラットフォーム「sakura.io」を使ってみよう
さくらのIoTプラットフォーム「sakura.io」を使ってみよう
 
DataEngConf NYC’18 セッションサマリー #1
DataEngConf NYC’18 セッションサマリー #1DataEngConf NYC’18 セッションサマリー #1
DataEngConf NYC’18 セッションサマリー #1
 
[Gree] DataEngConf NYC’18 セッションサマリー #1
[Gree] DataEngConf NYC’18 セッションサマリー #1[Gree] DataEngConf NYC’18 セッションサマリー #1
[Gree] DataEngConf NYC’18 セッションサマリー #1
 
UDC2016キックオフ 新拠点紹介 岐阜
UDC2016キックオフ 新拠点紹介 岐阜UDC2016キックオフ 新拠点紹介 岐阜
UDC2016キックオフ 新拠点紹介 岐阜
 
Hack/HHVMの最新事情とメイン言語に採用した理由
Hack/HHVMの最新事情とメイン言語に採用した理由Hack/HHVMの最新事情とメイン言語に採用した理由
Hack/HHVMの最新事情とメイン言語に採用した理由
 
Hadoop Summit 2016 San Jose レポート
Hadoop Summit 2016  San Jose レポートHadoop Summit 2016  San Jose レポート
Hadoop Summit 2016 San Jose レポート
 
SORACOM Conference Discovery 2017 | E4. IoTにおけるビッグデータとリアルタイム処理
SORACOM Conference Discovery 2017 | E4. IoTにおけるビッグデータとリアルタイム処理SORACOM Conference Discovery 2017 | E4. IoTにおけるビッグデータとリアルタイム処理
SORACOM Conference Discovery 2017 | E4. IoTにおけるビッグデータとリアルタイム処理
 
座談会資料(趣旨説明資料) 20161117
座談会資料(趣旨説明資料) 20161117座談会資料(趣旨説明資料) 20161117
座談会資料(趣旨説明資料) 20161117
 
リクルートライフスタイルの考える ストリームデータの活かし方(Hadoop Spark Conference2016)
リクルートライフスタイルの考えるストリームデータの活かし方(Hadoop Spark Conference2016)リクルートライフスタイルの考えるストリームデータの活かし方(Hadoop Spark Conference2016)
リクルートライフスタイルの考える ストリームデータの活かし方(Hadoop Spark Conference2016)
 
Markezine day 2012 gdo nakazawa
Markezine day 2012 gdo nakazawaMarkezine day 2012 gdo nakazawa
Markezine day 2012 gdo nakazawa
 
OSS Market Momentum In Japan
OSS Market Momentum In JapanOSS Market Momentum In Japan
OSS Market Momentum In Japan
 
さくらのIoTプラットフォーム「sakura.io」を使ってみよう
さくらのIoTプラットフォーム「sakura.io」を使ってみようさくらのIoTプラットフォーム「sakura.io」を使ってみよう
さくらのIoTプラットフォーム「sakura.io」を使ってみよう
 
Linked Open Dataで市民協働と情報技術者をつなげる試み
Linked Open Dataで市民協働と情報技術者をつなげる試みLinked Open Dataで市民協働と情報技術者をつなげる試み
Linked Open Dataで市民協働と情報技術者をつなげる試み
 
エッジヘビーコンピューティングと機械学習
エッジヘビーコンピューティングと機械学習エッジヘビーコンピューティングと機械学習
エッジヘビーコンピューティングと機械学習
 
座談会資料 事前配布 20170225
座談会資料 事前配布 20170225座談会資料 事前配布 20170225
座談会資料 事前配布 20170225
 
記事には書けなかったHTML5の話
記事には書けなかったHTML5の話記事には書けなかったHTML5の話
記事には書けなかったHTML5の話
 
オープンデータ技術概論〜オープンデータからLinked Open Dataへ〜
オープンデータ技術概論〜オープンデータからLinked Open Dataへ〜オープンデータ技術概論〜オープンデータからLinked Open Dataへ〜
オープンデータ技術概論〜オープンデータからLinked Open Dataへ〜
 
エンジニアのキャリアのその先を考える
エンジニアのキャリアのその先を考えるエンジニアのキャリアのその先を考える
エンジニアのキャリアのその先を考える
 
マイクロアドのデータ基盤について アドテクを支える基盤〜10Tバイト/日のビッグデータを処理する〜
マイクロアドのデータ基盤について アドテクを支える基盤〜10Tバイト/日のビッグデータを処理する〜マイクロアドのデータ基盤について アドテクを支える基盤〜10Tバイト/日のビッグデータを処理する〜
マイクロアドのデータ基盤について アドテクを支える基盤〜10Tバイト/日のビッグデータを処理する〜
 

ストリームデータ処理技術勉強会_イントロセッション

  • 1. 空気になったKafkaと 本番導入が進むNiFiと 凄すぎたUberと 「DataWorks Summit 2017 San Jose」で見たデータストリーミングのトレンド GOMI Akiko@g3akk
  • 2. 自己紹介 – 五味明子/GOMI Akiko • IT系出版社の編集者→2011年からフリーランスライ ター • クラウドwatch、IT Leaders、gihyo.jp、 EnterpriseZine、ASCII Techなどテック系Web媒体中 心に執筆 • 取材分野はクラウド、ネットワーク、セキュリティ、 データアナリティクス、AI、IoT、IT企業動向など • 海外カンファレンス取材多め、1年の1/3はどこかに出 張中 • サンノゼのDataWorks Summit(旧Hadoop Summit) は2015年、2016年につづき3回目の参加
  • 3. DataWorks Summit 2017 Sun Jose • HortonworksとYahoo!が主催するHadoopエンジニ ア/ユーザを対象にした年次カンファレンス。世界各 地で開催されているが、毎年6月にサンノゼで行われ るこのイベントがもっとも規模が大きい • 今回(正確には3月のベルリン開催)から「Hadoop Summit」→「DataWorks Summit」に名称変更。ゾ ウさん色がうすめに→レポート※書きました! • 人気の話題はTensorFlowやSparkRなどAI/データサイ エンス関連。今年中にリリース予定のHadoop 3.0お よびYARNにも注目があつまる • データストリーミング関連も人気。Sparkがメジャー になってきた2015年ごろからHadoop + リアルタイ ム処理系のキーノートやセッションが増えはじめた。 さらにHortonworksがApache NiFiをベースにした 「Hortonworks DataFlow(HDF)」をHDPと並ぶコア 製品に位置づけたことで、NiFi関連のセッションが急 増中 ※過渡期を迎えるHadoopとデータビジネス - ゾウが消えた「DataWorks Summit 2017 San Jose」/ gihyo.jp
  • 4. そもそもストリーミングデータとは… • 膨大な数のデータソースから継続的に生成される • IoTセンサー、モバイルアプリ、ソーシャルネットワーク、ログファイル、… • ひとつひとつのデータサイズは小さい • たいていはキロバイト単位 • 絶えずどこかに向かって流れている • Hortonworksはこれを”Data-in-Motion”と呼んでいる • 時間の経過とともにデータの性質や価値が変化するので“いま”の状態の分析&可視化=リア ルタイム処理が重要 • 直近のデータに対する低レイテンシ(ミリ秒単位)な処理 • 向いている分野は、リアルタイムレスポンス、モニタリング、クイック集計など • 金融やeコマースにおける取引での不正/異常検知 • 移動中/輸送中の車両のリアルタイム追跡 • 産業機器の部品交換アラート • ソーシャルゲームのイベントでの順位集計 • オンラインメディアにおける読者ごとのコンテンツ最適化 • ソーシャルメディアでの炎上チェック
  • 5. DWS 2017 SJで見かけたデータストリーミング関連技術 メジャーどころ • Apache Kafka / Kafka Streams • Apache NiFi • Apache Spark Streaming • Apache Storm その他 • Apache Metron • Apache Beam • Apache Apex • Bullet by Yahoo! ←スケーラブル&リアル タイムなデータクエリエンジン、他のデー タストリーミング技術とプラがぶるな連携 が可能 The Best Session by ChatWork & NTT DATA Worldwide Scalable and Resilient Messaging Services by CQRS and Event Sourcing Using Akka, Kafka Streams and HBase レポート書きました→スケールするメッセージングシステムを構 築せよ ―チャットワークとNTTデータが挑んだKafkaベースの"土 管"づくり/gihyo.jp
  • 6. Pick Up – Kafka / Kafka Streams Kafkaは我々にとって頭で考えて使うものじゃない。Kafkaはもう空気みたいな存在で,なければ 息ができなくなってしまう – Josh Wills, CTO, Slack / Structure Data 2016 Kafkaは空気 • 2017年はKafkaのデフォ化がさらに加速。DWS17SJのデータストリーミング系のほとんどの セッションでは、Kafkaを使うことがあたりまえすぎるので、タイトルにわざわざKafkaを入れ ていない。逆にデータストリーミング処理にKafkaを使わないorまったく検討しない、という ケースはほぼ皆無 • シンプルなアーキテクチャ、パブサブ型、低レイテンシ/高スループット、他のストリーミング 技術との連携のしやすさ、etc.などからメッセージングシステムのデファクトに • Ex.) GoProの事例: コンシューマデバイスから吸い上げた多種多様なストリーミングデータを Kafka + Spark StreamingベースのダイナミックDDLシステムに流し込み、データサイエンスの ための分析基盤を提供→Kafkaをストリーミングデータの土管として機能させることで、どんな システムでも雛形をつくりやすい
  • 7. Pick Up – NiFi • 2015年にHortonworksがApache NiFiを開発するOnyaraを買収、プロジェクトリーダーのJoe Wittも移籍→NiFiをコアとするデータストリーミング製品「HDF」が登場、DWS17SJとほぼ同時 期にHDF 3.0にアップデート。データオーケストレーションの“コーディングレス化”が加速 • DWS17SJではNiFi関連のセッションが急増、技術セッションだけでなくIoTやマシンラーニング などと組み合わせたエンタープライズアダプションの事例も豊富に • Ex.) Rogers Communicationsの事例: カスタマーエクスペリエンス向上をはかるため、NiFiの ほかHadoop、Sparkをベースに、自然言語処理を取り入れた”360度のカスタマービュー”シス テムを構築。ソーシャルネットワークやオンラインチャットなど非構造化データの流れもNiFIで コントロール NSAで開発をはじめて、目の前のオフィスからNiagara Fallが見え た。なんとなく語呂が良いように感じて”NiFi”という名前にしたん だ – Joe Witt, Senior Director, Engineering, Hortonworks / Hadoop Summit 2015
  • 8. Pick Up – Uber Uberが1日あたりに処理するメッセージの件数は1兆を超える。そんなUberにとってKafkaは欠かせ ないデータハブ – Ankur Bansal, Senior Software Engineer, Streaming Team, Uber / DataWorks Summit 2017 San Jose • ホライゾンタリなスケーラビリティ • 5ミリ秒以下のレイテンシ • 99.99%の可用性 • 99.99%の耐障害性 • 複数のデータセンターをまたいだレプリ ケーション • 複数の言語のサポート(Java / Go / Node.js / C++) → これらの要件を満たす世界最大級の Kafkaクラスタを構築