翔泳社主催 Developers Summit 2018 15-B2の講演資料です。
-----------------
HadoopやSparkは、スタンダードな分析基盤として今ではすっかり定着しました。その上で、エンジニアにはPythonやRを使った機械学習などを求められるケースも多いかと思います。
また、従来のビッグデータではオフライン分析が主でしたが、Kafkaの台頭により、ストリームデータに対する要件も増えてきました。
本セッションでは、ストリームとバッチを融合したアナリティクスの事例紹介をベースにKafkaやHadoopでデータをストアし、Zeppelin上での機械学習をチュートリアル形式でお伝えします。
さらに、これからデータサイエンティストを目指す方のために、これらの環境を"タダ"で利用できるOracleのCloud環境も併せてご紹介させていだきます。
-------------------
http://event.shoeisha.jp/devsumi/20180215/session/1619/