Enviar búsqueda
Cargar
世界征服を目指す Jubatus だからこそ期待する 5 つのポイント
•
11 recomendaciones
•
2,645 vistas
Toru Shimogaki
Seguir
Jubatus Casual Talks #1, 2013/06/02
Leer menos
Leer más
Tecnología
Denunciar
Compartir
Denunciar
Compartir
1 de 15
Recomendados
Apache Hadoop 2.8.0 の新機能 (抜粋)
Apache Hadoop 2.8.0 の新機能 (抜粋)
NTT DATA OSS Professional Services
Ansibleで構成管理始める人のモチベーションをあげたい! (Cloudera World Tokyo 2014LT講演資料)
Ansibleで構成管理始める人のモチベーションをあげたい! (Cloudera World Tokyo 2014LT講演資料)
NTT DATA OSS Professional Services
Sparkをノートブックにまとめちゃおう。Zeppelinでね!(Hadoopソースコードリーディング 第19回 発表資料)
Sparkをノートブックにまとめちゃおう。Zeppelinでね!(Hadoopソースコードリーディング 第19回 発表資料)
NTT DATA OSS Professional Services
pg_dbms_statsの紹介
pg_dbms_statsの紹介
NTT DATA OSS Professional Services
Hadoop2.6の最新機能+
Hadoop2.6の最新機能+
NTT DATA OSS Professional Services
データ活用をもっともっと円滑に!~データ処理・分析基盤編を少しだけ~
データ活用をもっともっと円滑に!~データ処理・分析基盤編を少しだけ~
NTT DATA OSS Professional Services
【Jpug勉強会】10大ニュースで振り返るpg con2013
【Jpug勉強会】10大ニュースで振り返るpg con2013
Daichi Egawa
Hadoop 2.6の最新機能(Cloudera World Tokyo 2014 LT講演資料)
Hadoop 2.6の最新機能(Cloudera World Tokyo 2014 LT講演資料)
NTT DATA OSS Professional Services
Recomendados
Apache Hadoop 2.8.0 の新機能 (抜粋)
Apache Hadoop 2.8.0 の新機能 (抜粋)
NTT DATA OSS Professional Services
Ansibleで構成管理始める人のモチベーションをあげたい! (Cloudera World Tokyo 2014LT講演資料)
Ansibleで構成管理始める人のモチベーションをあげたい! (Cloudera World Tokyo 2014LT講演資料)
NTT DATA OSS Professional Services
Sparkをノートブックにまとめちゃおう。Zeppelinでね!(Hadoopソースコードリーディング 第19回 発表資料)
Sparkをノートブックにまとめちゃおう。Zeppelinでね!(Hadoopソースコードリーディング 第19回 発表資料)
NTT DATA OSS Professional Services
pg_dbms_statsの紹介
pg_dbms_statsの紹介
NTT DATA OSS Professional Services
Hadoop2.6の最新機能+
Hadoop2.6の最新機能+
NTT DATA OSS Professional Services
データ活用をもっともっと円滑に!~データ処理・分析基盤編を少しだけ~
データ活用をもっともっと円滑に!~データ処理・分析基盤編を少しだけ~
NTT DATA OSS Professional Services
【Jpug勉強会】10大ニュースで振り返るpg con2013
【Jpug勉強会】10大ニュースで振り返るpg con2013
Daichi Egawa
Hadoop 2.6の最新機能(Cloudera World Tokyo 2014 LT講演資料)
Hadoop 2.6の最新機能(Cloudera World Tokyo 2014 LT講演資料)
NTT DATA OSS Professional Services
Sparkコミュニティに飛び込もう!(Spark Meetup Tokyo 2015 講演資料、NTTデータ 猿田 浩輔)
Sparkコミュニティに飛び込もう!(Spark Meetup Tokyo 2015 講演資料、NTTデータ 猿田 浩輔)
NTT DATA OSS Professional Services
SIerとオープンソースの美味しい関係 ~コミュニティの力を活かして世界を目指そう~
SIerとオープンソースの美味しい関係 ~コミュニティの力を活かして世界を目指そう~
NTT DATA OSS Professional Services
10大ニュースで振り返るPGCon2015
10大ニュースで振り返るPGCon2015
NTT DATA OSS Professional Services
Spark MLlibではじめるスケーラブルな機械学習
Spark MLlibではじめるスケーラブルな機械学習
NTT DATA OSS Professional Services
2016年2月4日 空間OSの設計コンセプトと先端IT
2016年2月4日 空間OSの設計コンセプトと先端IT
aitc_jp
Hadoopのメンテナンスリリースバージョンをリリースしてみた (日本Hadoopユーザー会 ライトニングトーク@Cloudera World Tokyo...
Hadoopのメンテナンスリリースバージョンをリリースしてみた (日本Hadoopユーザー会 ライトニングトーク@Cloudera World Tokyo...
NTT DATA OSS Professional Services
今からはじめるPuppet 2016 ~ インフラエンジニアのたしなみ ~
今からはじめるPuppet 2016 ~ インフラエンジニアのたしなみ ~
NTT DATA OSS Professional Services
NVIDIA ディープラーニング最新情報
NVIDIA ディープラーニング最新情報
Hirono Jumpei
2016年2月4日 AITCと協働プロジェクトの活動概要
2016年2月4日 AITCと協働プロジェクトの活動概要
aitc_jp
[B23] PostgreSQLのインデックス・チューニング by Tomonari Katsumata
[B23] PostgreSQLのインデックス・チューニング by Tomonari Katsumata
Insight Technology, Inc.
perfを使ったPostgreSQLの解析(前編)
perfを使ったPostgreSQLの解析(前編)
Daichi Egawa
2016年2月4日 空間OSのためのビッグデータ技術基盤
2016年2月4日 空間OSのためのビッグデータ技術基盤
aitc_jp
2016年2月4日 空間OSが『空気を読む』ためのコンテキストコンピューティング
2016年2月4日 空間OSが『空気を読む』ためのコンテキストコンピューティング
aitc_jp
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
NTT DATA OSS Professional Services
20170303 java9 hadoop
20170303 java9 hadoop
NTT DATA OSS Professional Services
OSS系データベース、クラウド・データベースへ脱Oracleへの実現方法
OSS系データベース、クラウド・データベースへ脱Oracleへの実現方法
株式会社クライム
え、まって。その並列分散処理、Kafkaのしくみでもできるの? Apache Kafkaの機能を利用した大規模ストリームデータの並列分散処理
え、まって。その並列分散処理、Kafkaのしくみでもできるの? Apache Kafkaの機能を利用した大規模ストリームデータの並列分散処理
NTT DATA Technology & Innovation
PostgreSQLコミュニティに飛び込もう
PostgreSQLコミュニティに飛び込もう
NTT DATA OSS Professional Services
Hadoopことはじめ
Hadoopことはじめ
Katsunori Kanda
インメモリーデータグリッドの選択肢
インメモリーデータグリッドの選択肢
Masaki Yamakawa
AWS上でのDDoS攻撃緩和戦略
AWS上でのDDoS攻撃緩和戦略
Sakura Onishi
What's a macro?: Learning by Examples / Scalaのマクロに実用例から触れてみよう!
What's a macro?: Learning by Examples / Scalaのマクロに実用例から触れてみよう!
scalaconfjp
Más contenido relacionado
La actualidad más candente
Sparkコミュニティに飛び込もう!(Spark Meetup Tokyo 2015 講演資料、NTTデータ 猿田 浩輔)
Sparkコミュニティに飛び込もう!(Spark Meetup Tokyo 2015 講演資料、NTTデータ 猿田 浩輔)
NTT DATA OSS Professional Services
SIerとオープンソースの美味しい関係 ~コミュニティの力を活かして世界を目指そう~
SIerとオープンソースの美味しい関係 ~コミュニティの力を活かして世界を目指そう~
NTT DATA OSS Professional Services
10大ニュースで振り返るPGCon2015
10大ニュースで振り返るPGCon2015
NTT DATA OSS Professional Services
Spark MLlibではじめるスケーラブルな機械学習
Spark MLlibではじめるスケーラブルな機械学習
NTT DATA OSS Professional Services
2016年2月4日 空間OSの設計コンセプトと先端IT
2016年2月4日 空間OSの設計コンセプトと先端IT
aitc_jp
Hadoopのメンテナンスリリースバージョンをリリースしてみた (日本Hadoopユーザー会 ライトニングトーク@Cloudera World Tokyo...
Hadoopのメンテナンスリリースバージョンをリリースしてみた (日本Hadoopユーザー会 ライトニングトーク@Cloudera World Tokyo...
NTT DATA OSS Professional Services
今からはじめるPuppet 2016 ~ インフラエンジニアのたしなみ ~
今からはじめるPuppet 2016 ~ インフラエンジニアのたしなみ ~
NTT DATA OSS Professional Services
NVIDIA ディープラーニング最新情報
NVIDIA ディープラーニング最新情報
Hirono Jumpei
2016年2月4日 AITCと協働プロジェクトの活動概要
2016年2月4日 AITCと協働プロジェクトの活動概要
aitc_jp
[B23] PostgreSQLのインデックス・チューニング by Tomonari Katsumata
[B23] PostgreSQLのインデックス・チューニング by Tomonari Katsumata
Insight Technology, Inc.
perfを使ったPostgreSQLの解析(前編)
perfを使ったPostgreSQLの解析(前編)
Daichi Egawa
2016年2月4日 空間OSのためのビッグデータ技術基盤
2016年2月4日 空間OSのためのビッグデータ技術基盤
aitc_jp
2016年2月4日 空間OSが『空気を読む』ためのコンテキストコンピューティング
2016年2月4日 空間OSが『空気を読む』ためのコンテキストコンピューティング
aitc_jp
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
NTT DATA OSS Professional Services
20170303 java9 hadoop
20170303 java9 hadoop
NTT DATA OSS Professional Services
OSS系データベース、クラウド・データベースへ脱Oracleへの実現方法
OSS系データベース、クラウド・データベースへ脱Oracleへの実現方法
株式会社クライム
え、まって。その並列分散処理、Kafkaのしくみでもできるの? Apache Kafkaの機能を利用した大規模ストリームデータの並列分散処理
え、まって。その並列分散処理、Kafkaのしくみでもできるの? Apache Kafkaの機能を利用した大規模ストリームデータの並列分散処理
NTT DATA Technology & Innovation
PostgreSQLコミュニティに飛び込もう
PostgreSQLコミュニティに飛び込もう
NTT DATA OSS Professional Services
Hadoopことはじめ
Hadoopことはじめ
Katsunori Kanda
インメモリーデータグリッドの選択肢
インメモリーデータグリッドの選択肢
Masaki Yamakawa
La actualidad más candente
(20)
Sparkコミュニティに飛び込もう!(Spark Meetup Tokyo 2015 講演資料、NTTデータ 猿田 浩輔)
Sparkコミュニティに飛び込もう!(Spark Meetup Tokyo 2015 講演資料、NTTデータ 猿田 浩輔)
SIerとオープンソースの美味しい関係 ~コミュニティの力を活かして世界を目指そう~
SIerとオープンソースの美味しい関係 ~コミュニティの力を活かして世界を目指そう~
10大ニュースで振り返るPGCon2015
10大ニュースで振り返るPGCon2015
Spark MLlibではじめるスケーラブルな機械学習
Spark MLlibではじめるスケーラブルな機械学習
2016年2月4日 空間OSの設計コンセプトと先端IT
2016年2月4日 空間OSの設計コンセプトと先端IT
Hadoopのメンテナンスリリースバージョンをリリースしてみた (日本Hadoopユーザー会 ライトニングトーク@Cloudera World Tokyo...
Hadoopのメンテナンスリリースバージョンをリリースしてみた (日本Hadoopユーザー会 ライトニングトーク@Cloudera World Tokyo...
今からはじめるPuppet 2016 ~ インフラエンジニアのたしなみ ~
今からはじめるPuppet 2016 ~ インフラエンジニアのたしなみ ~
NVIDIA ディープラーニング最新情報
NVIDIA ディープラーニング最新情報
2016年2月4日 AITCと協働プロジェクトの活動概要
2016年2月4日 AITCと協働プロジェクトの活動概要
[B23] PostgreSQLのインデックス・チューニング by Tomonari Katsumata
[B23] PostgreSQLのインデックス・チューニング by Tomonari Katsumata
perfを使ったPostgreSQLの解析(前編)
perfを使ったPostgreSQLの解析(前編)
2016年2月4日 空間OSのためのビッグデータ技術基盤
2016年2月4日 空間OSのためのビッグデータ技術基盤
2016年2月4日 空間OSが『空気を読む』ためのコンテキストコンピューティング
2016年2月4日 空間OSが『空気を読む』ためのコンテキストコンピューティング
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
20170303 java9 hadoop
20170303 java9 hadoop
OSS系データベース、クラウド・データベースへ脱Oracleへの実現方法
OSS系データベース、クラウド・データベースへ脱Oracleへの実現方法
え、まって。その並列分散処理、Kafkaのしくみでもできるの? Apache Kafkaの機能を利用した大規模ストリームデータの並列分散処理
え、まって。その並列分散処理、Kafkaのしくみでもできるの? Apache Kafkaの機能を利用した大規模ストリームデータの並列分散処理
PostgreSQLコミュニティに飛び込もう
PostgreSQLコミュニティに飛び込もう
Hadoopことはじめ
Hadoopことはじめ
インメモリーデータグリッドの選択肢
インメモリーデータグリッドの選択肢
Destacado
AWS上でのDDoS攻撃緩和戦略
AWS上でのDDoS攻撃緩和戦略
Sakura Onishi
What's a macro?: Learning by Examples / Scalaのマクロに実用例から触れてみよう!
What's a macro?: Learning by Examples / Scalaのマクロに実用例から触れてみよう!
scalaconfjp
sbt, past and future / sbt, 傾向と対策
sbt, past and future / sbt, 傾向と対策
scalaconfjp
Weaving Dataflows with Silk - ScalaMatsuri 2014, Tokyo
Weaving Dataflows with Silk - ScalaMatsuri 2014, Tokyo
Taro L. Saito
Xitrum Web Framework Live Coding Demos / Xitrum Web Framework ライブコーディング
Xitrum Web Framework Live Coding Demos / Xitrum Web Framework ライブコーディング
scalaconfjp
Scalable Generator: Using Scala in SIer Business (ScalaMatsuri)
Scalable Generator: Using Scala in SIer Business (ScalaMatsuri)
TIS Inc.
The Evolution of Scala / Scala進化論
The Evolution of Scala / Scala進化論
scalaconfjp
Solid And Sustainable Development in Scala
Solid And Sustainable Development in Scala
Kazuhiro Sera
From Ruby to Scala
From Ruby to Scala
tod esking
Building a Unified Data Pipline in Spark / Apache Sparkを用いたBig Dataパイプラインの統一
Building a Unified Data Pipline in Spark / Apache Sparkを用いたBig Dataパイプラインの統一
scalaconfjp
GitBucket: The perfect Github clone by Scala
GitBucket: The perfect Github clone by Scala
takezoe
Introduction to Spark SQL and Catalyst / Spark SQLおよびCalalystの紹介
Introduction to Spark SQL and Catalyst / Spark SQLおよびCalalystの紹介
scalaconfjp
Scarab: SAT-based Constraint Programming System in Scala / Scala上で実現された制約プログラ...
Scarab: SAT-based Constraint Programming System in Scala / Scala上で実現された制約プログラ...
scalaconfjp
[ScalaMatsuri] グリー初のscalaプロダクト!チャットサービス公開までの苦労と工夫
[ScalaMatsuri] グリー初のscalaプロダクト!チャットサービス公開までの苦労と工夫
gree_tech
Node.js vs Play Framework (with Japanese subtitles)
Node.js vs Play Framework (with Japanese subtitles)
Yevgeniy Brikman
Destacado
(15)
AWS上でのDDoS攻撃緩和戦略
AWS上でのDDoS攻撃緩和戦略
What's a macro?: Learning by Examples / Scalaのマクロに実用例から触れてみよう!
What's a macro?: Learning by Examples / Scalaのマクロに実用例から触れてみよう!
sbt, past and future / sbt, 傾向と対策
sbt, past and future / sbt, 傾向と対策
Weaving Dataflows with Silk - ScalaMatsuri 2014, Tokyo
Weaving Dataflows with Silk - ScalaMatsuri 2014, Tokyo
Xitrum Web Framework Live Coding Demos / Xitrum Web Framework ライブコーディング
Xitrum Web Framework Live Coding Demos / Xitrum Web Framework ライブコーディング
Scalable Generator: Using Scala in SIer Business (ScalaMatsuri)
Scalable Generator: Using Scala in SIer Business (ScalaMatsuri)
The Evolution of Scala / Scala進化論
The Evolution of Scala / Scala進化論
Solid And Sustainable Development in Scala
Solid And Sustainable Development in Scala
From Ruby to Scala
From Ruby to Scala
Building a Unified Data Pipline in Spark / Apache Sparkを用いたBig Dataパイプラインの統一
Building a Unified Data Pipline in Spark / Apache Sparkを用いたBig Dataパイプラインの統一
GitBucket: The perfect Github clone by Scala
GitBucket: The perfect Github clone by Scala
Introduction to Spark SQL and Catalyst / Spark SQLおよびCalalystの紹介
Introduction to Spark SQL and Catalyst / Spark SQLおよびCalalystの紹介
Scarab: SAT-based Constraint Programming System in Scala / Scala上で実現された制約プログラ...
Scarab: SAT-based Constraint Programming System in Scala / Scala上で実現された制約プログラ...
[ScalaMatsuri] グリー初のscalaプロダクト!チャットサービス公開までの苦労と工夫
[ScalaMatsuri] グリー初のscalaプロダクト!チャットサービス公開までの苦労と工夫
Node.js vs Play Framework (with Japanese subtitles)
Node.js vs Play Framework (with Japanese subtitles)
Similar a 世界征服を目指す Jubatus だからこそ期待する 5 つのポイント
世界征服を目指すJubatusだからこそ期待する5つのポイント
世界征服を目指すJubatusだからこそ期待する5つのポイント
NTT DATA OSS Professional Services
SQL on Hadoop 比較検証 【2014月11日における検証レポート】
SQL on Hadoop 比較検証 【2014月11日における検証レポート】
NTT DATA OSS Professional Services
C27 基幹領域への適用におけるpostgre sqlの抱える課題 by 原嘉彦
C27 基幹領域への適用におけるpostgre sqlの抱える課題 by 原嘉彦
Insight Technology, Inc.
PostgreSQL9.3新機能紹介
PostgreSQL9.3新機能紹介
NTT DATA OSS Professional Services
Hadoop ecosystem NTTDATA osc15tk
Hadoop ecosystem NTTDATA osc15tk
NTT DATA OSS Professional Services
分散処理基盤Apache Hadoop入門とHadoopエコシステムの最新技術動向 (オープンソースカンファレンス 2015 Tokyo/Spring 講...
分散処理基盤Apache Hadoop入門とHadoopエコシステムの最新技術動向 (オープンソースカンファレンス 2015 Tokyo/Spring 講...
NTT DATA OSS Professional Services
NTTデータ流 Hadoop活用のすすめ ~インフラ構築・運用の勘所~
NTTデータ流 Hadoop活用のすすめ ~インフラ構築・運用の勘所~
NTT DATA OSS Professional Services
10大ニュースで振り返るpg con2013
10大ニュースで振り返るpg con2013
NTT DATA OSS Professional Services
ストリームデータ分散処理基盤Storm
ストリームデータ分散処理基盤Storm
NTT DATA OSS Professional Services
[db tech showcase Tokyo 2014] L34: そのデータベース 5年後大丈夫ですか by 日本ヒューレット・パッカード株式会社 後藤宏
[db tech showcase Tokyo 2014] L34: そのデータベース 5年後大丈夫ですか by 日本ヒューレット・パッカード株式会社 後藤宏
Insight Technology, Inc.
PostgreSQL9.1でつくる高可用性にまつわるエトセトラ
PostgreSQL9.1でつくる高可用性にまつわるエトセトラ
NTT DATA OSS Professional Services
NTT DATA と PostgreSQL が挑んだ総力戦
NTT DATA と PostgreSQL が挑んだ総力戦
NTT DATA OSS Professional Services
Hadoop上の多種多様な処理でPigの活きる道 (Hadoop Conferecne Japan 2013 Winter)
Hadoop上の多種多様な処理でPigの活きる道 (Hadoop Conferecne Japan 2013 Winter)
NTT DATA OSS Professional Services
PostgreSQL 14 モニタリング新機能紹介(PostgreSQL カンファレンス #24、2021/06/08)
PostgreSQL 14 モニタリング新機能紹介(PostgreSQL カンファレンス #24、2021/06/08)
NTT DATA Technology & Innovation
D22 目覚めよDBエンジニア 〜世界最速カラムナーデータベースは本物だ!〜 by Koji Shinkubo
D22 目覚めよDBエンジニア 〜世界最速カラムナーデータベースは本物だ!〜 by Koji Shinkubo
Insight Technology, Inc.
[D26] データハブとしてのPostgreSQL~9.3で進化した外部テーブル~ by Shigeru Hanada
[D26] データハブとしてのPostgreSQL~9.3で進化した外部テーブル~ by Shigeru Hanada
Insight Technology, Inc.
Apache Spark 1000 nodes NTT DATA
Apache Spark 1000 nodes NTT DATA
NTT DATA OSS Professional Services
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)
NTT DATA Technology & Innovation
PostgreSQLによるデータ分析ことはじめ
PostgreSQLによるデータ分析ことはじめ
Ohyama Masanori
Cloudianを利用したソリューション (Cloudian Summit 2012)
Cloudianを利用したソリューション (Cloudian Summit 2012)
CLOUDIAN KK
Similar a 世界征服を目指す Jubatus だからこそ期待する 5 つのポイント
(20)
世界征服を目指すJubatusだからこそ期待する5つのポイント
世界征服を目指すJubatusだからこそ期待する5つのポイント
SQL on Hadoop 比較検証 【2014月11日における検証レポート】
SQL on Hadoop 比較検証 【2014月11日における検証レポート】
C27 基幹領域への適用におけるpostgre sqlの抱える課題 by 原嘉彦
C27 基幹領域への適用におけるpostgre sqlの抱える課題 by 原嘉彦
PostgreSQL9.3新機能紹介
PostgreSQL9.3新機能紹介
Hadoop ecosystem NTTDATA osc15tk
Hadoop ecosystem NTTDATA osc15tk
分散処理基盤Apache Hadoop入門とHadoopエコシステムの最新技術動向 (オープンソースカンファレンス 2015 Tokyo/Spring 講...
分散処理基盤Apache Hadoop入門とHadoopエコシステムの最新技術動向 (オープンソースカンファレンス 2015 Tokyo/Spring 講...
NTTデータ流 Hadoop活用のすすめ ~インフラ構築・運用の勘所~
NTTデータ流 Hadoop活用のすすめ ~インフラ構築・運用の勘所~
10大ニュースで振り返るpg con2013
10大ニュースで振り返るpg con2013
ストリームデータ分散処理基盤Storm
ストリームデータ分散処理基盤Storm
[db tech showcase Tokyo 2014] L34: そのデータベース 5年後大丈夫ですか by 日本ヒューレット・パッカード株式会社 後藤宏
[db tech showcase Tokyo 2014] L34: そのデータベース 5年後大丈夫ですか by 日本ヒューレット・パッカード株式会社 後藤宏
PostgreSQL9.1でつくる高可用性にまつわるエトセトラ
PostgreSQL9.1でつくる高可用性にまつわるエトセトラ
NTT DATA と PostgreSQL が挑んだ総力戦
NTT DATA と PostgreSQL が挑んだ総力戦
Hadoop上の多種多様な処理でPigの活きる道 (Hadoop Conferecne Japan 2013 Winter)
Hadoop上の多種多様な処理でPigの活きる道 (Hadoop Conferecne Japan 2013 Winter)
PostgreSQL 14 モニタリング新機能紹介(PostgreSQL カンファレンス #24、2021/06/08)
PostgreSQL 14 モニタリング新機能紹介(PostgreSQL カンファレンス #24、2021/06/08)
D22 目覚めよDBエンジニア 〜世界最速カラムナーデータベースは本物だ!〜 by Koji Shinkubo
D22 目覚めよDBエンジニア 〜世界最速カラムナーデータベースは本物だ!〜 by Koji Shinkubo
[D26] データハブとしてのPostgreSQL~9.3で進化した外部テーブル~ by Shigeru Hanada
[D26] データハブとしてのPostgreSQL~9.3で進化した外部テーブル~ by Shigeru Hanada
Apache Spark 1000 nodes NTT DATA
Apache Spark 1000 nodes NTT DATA
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)
PostgreSQLによるデータ分析ことはじめ
PostgreSQLによるデータ分析ことはじめ
Cloudianを利用したソリューション (Cloudian Summit 2012)
Cloudianを利用したソリューション (Cloudian Summit 2012)
世界征服を目指す Jubatus だからこそ期待する 5 つのポイント
1.
Copyright © 2013
NTT DATA Corporation 2013/06/02 Jubatus Casual Talks #1 NTTデータ 基盤システム事業本部 OSSプロフェッショナルサービス 下垣 徹 世界征服を目指す Jubatus だからこそ 期待する 5 つのポイント
2.
2Copyright © 2013
NTT DATA Corporation 下垣 徹 (しもがき とおる / @shimtoru) 株式会社NTTデータ 基盤システム事業本部 RDBMSスペシャリスト OSSのデータベース「PostgreSQL」使い ミッションクリティカルなOracleのシステムを PostgreSQLへ移行する案件を手掛ける Oracleの高速データロードツールSQL*Loaderの PostgreSQL版を開発 ここ数年はHadoopに従事 巨大なデータをどう取り扱うかに取り組む 2011/01/28発売の「Hadoop徹底入門」 でとりまとめを担当 第4刷を発売中 もうすぐ第二版を発売予定 自己紹介
3.
3Copyright © 2013
NTT DATA Corporation 安定したシステムを提供するためには そのミドルウェアをコントロール可能であること コントロール可能であるためには、状態を正しく把握できること システムを提供する立場からすると「多種多様であること」は 必ずしも好ましいとは言えない 言うなれば 「多種 単 様」 であることが望ましい あれもこれも見ないといけない & 見るためのスキルが必要 結果としてメンテナンスコストが膨らむ 今日の立ち位置:システムを提供する側として
4.
4Copyright © 2013
NTT DATA Corporation 静的なシステム・アーキテクチャ 付加しなければならない機能を作り込みやすい フレームワークとして使いやすい、分かり易い インストールしやすい メンテナンスしやすい 動的なシステム・アーキテクチャ 性能、サイジング 障害の検知、復旧する アプリケーション開発 機会学習のフレームワークとして必要なもの .. こと足りてる? 機能を開発、実装、検証する際に必要な、道具立てが揃っている 今日の立ち位置:システムを提供する側として
5.
5Copyright © 2013
NTT DATA Corporation 比較的安心して使えるのは Classifier・Recommender あとは Anomaly Jubatus の各機能の実装状況 (2013年5月時点) NoNoNoNo 機能名機能名機能名機能名 実装状況実装状況実装状況実装状況 1 Classifier ◯ 最も安定した学習結果を得られる。 △ 学習の際のハイパーパラメータの調整機能が不足 2 Recommender ◯ 比較的安定した学習結果を得られる。 △ 類似度の計算方式を調整できない。 △ 並列処理時の有難味が薄い。 3 Regression △ 学習時の収束性に問題がある 4 Stat △ 基本的な統計処理が可能だが、統計処理の対象範囲指 定ができないため使い所が難しい 5 Graph △ 最短経路の探索機能に制限があり(landmarkの柔軟な 指定ができない)、出力される内容も正確でない場合がある。 △ 重み付きグラフ・有向グラフへに非対応 6 Anomaly ◯ 機能的には比較的使いやすい △ パラメータの調整が難しすぎる △ 自動的に「忘れる」機能が欲しい
6.
6Copyright © 2013
NTT DATA Corporation 1. モデルの取得 2. 障害に対する配慮 3. ミドルウェアとしての構成をシンプルに 4. mixが効果的に動いてほしい 5. Jubatus の動作モデルのあり方について 世界征服を目指す Jubatus だからこそ期待する5つのポイント
7.
7Copyright © 2013
NTT DATA Corporation 現状の Jubatus ではモデルを取得することができないため、Jubatus 内部での学習状況を把握できない 自社では Classifier について Jubatus の save の出力を参考に、モ デル(特徴ベクトル) を取得する機能を自作して活用中 「Rだと普通に使える機能」を提供してほしい @kumagi さんによると、すでに実装し終えているとか...?? 1. モデルが取得できない
8.
8Copyright © 2013
NTT DATA Corporation 現状の Jubatus は、障害に対する配慮が十分とはいえない そもそも、どういう障害が起こりえて、どこを観測していればどのような 障害が発生していることを確認できるのだろうか? 例:この2つのエラーメッセージ、状態の違いって何...? - msgpackrpc.error.TimeoutError: Request timed out - msgpackrpc.error.RPCError: request timed out まずは「事象を把握できること」を地道に作りこんでほしい エラーメッセージから問題が識別できる 問題が識別できるようにエラーメッセージを出す 2. 障害に対する配慮
9.
9Copyright © 2013
NTT DATA Corporation 現状の Jubatus は実験的に作ってみた要素が強い 1. パッケージの依存関係が多すぎる インストールが面倒くさい - devパッケージ・rpmパッケージともに用意されたので昔ほど煩雑ではない - ネットワークに繋がっている環境でインストールする分にはかまわないが... 依存パッケージのバージョンにもかなり引きずられる - Jubatus のバージョンアップのたびに周辺パッケージもアップデート いざ運用に入ったときにこれだけのパッケージの面倒をみるの...? - pficommon と MessagePack は特に強結合 3. ミドルウェアとしての構成が複雑
10.
10Copyright © 2013
NTT DATA Corporation 2. 実装言語も多すぎる Jubatus は C++ で実装されているが、そのコードの一部を自動生成 するためにIDLが用意されている - mpidl : 各種ヘッダファイルの作成 → Haskel - jenerator : impl や keeper の作成 → OCaml 本当に言語を分ける必要があるのか... 3. ミドルウェアとしての構成が複雑
11.
11Copyright © 2013
NTT DATA Corporation Jubatus の Classifier は mix によって重みベクトル(モデルの 実体)を平均化している しかし、この操作の意味は少なくとも自明に了解できる類のも のではない 例えば、以下の二つの状況を考える。 1. データを 2 プロセスに振り分けて学習し、結果を平均化する 2. データを 1/2 に間引き、1 プロセスで学習する このどちらが「正しい」のかの判断には慎重な検討を要し、ある程度以 上のデータ量を前提とすれば、直感的には、むしろ後者の方が統計的 に正しい結果を得られるようにも思われる。 mix を効果的に使うための構成やチューニング方法といった情 報の提供も望まれる 4. mixが効果的に動いてほしい
12.
12Copyright © 2013
NTT DATA Corporation (参考) mix の動作検証 mixなし mix間隔512 mix間隔64 mix間隔8 1プロセス 8プロセス mixあり/mixなしで収束速度はほぼ同じ ※グラフの横軸 は投入件数、縦 軸は正答率(25 件ごとの移動平 均) <評価について> ・1 プロセスの場 合、評価を 8 回 に 1 回とした ・評価は特定の 1 プロセスについ てのみ実施した (8 プロセスの場 合はそのうちの 1 プロセス) mix間隔を狭めるにつれむしろ正答率の立ち上がりが鈍化 ・mix が効果を発揮できているのかを調査 ・Classifier に対し、20 Newsgroups の場 合の記事を 1 件ずつ評価・学習の順で投 入し、評価結果が正解か不正解かを出力
13.
13Copyright © 2013
NTT DATA Corporation 機械学習の特性と並列処理の有効活用について Jubatus は最初に実装された Classifier に適した動作モデルになっているが、全 モデルで共通の構成で良いのか? レコード群を各プロセスで分割して保持し、評価を並列実行するようにすれば高速 化可能なはず → Recommender に限らず機械学習モデルごとに並列度を活かせ るような動作モデルをとる必要があるのでは? 5. Jubatus の動作モデルのあり方について Classifier Recommender 学習 遅い 速い 評価 速い 遅い Classifier の場合、相対的に処理速度が 遅くなる学習フェーズの部分を並列化す ることで高速化を図っている Recommender の場合、並列度を上げても評価に かかる時間は一定(Jubatus ではモデルを全プロセ スで共通化するため) → 並列化してもプロセスのプールができるだけで あり、高速化は期待できず、有り難みが少ない
14.
14Copyright © 2013
NTT DATA Corporation Jubatus は開発チームが非常にアクティブ バグを指摘すると素早く修正してくれる これからが正念場のプロダクト Jubatusの発展を応援しています! 一緒にPOCをやってみたいという方は遠慮なくご連絡を! 最後に
15.
Copyright © 2011
NTT DATA Corporation Copyright © 2013 NTT DATA Corporation お問い合わせ先: 株式会社NTTデータ 基盤システム事業本部 OSSプロフェッショナルサービス URL: http://oss.nttdata.co.jp/hadoop メール: hadoop@kits.nttdata.co.jp TEL: 050-5546-2496