SlideShare a Scribd company logo
1 of 46
Pythonistaに捧げる
「データインテグレーションとは何か?」
株式会社セゾン情報システムズ
常務取締役CTO テクノベーションセンター長
株式会社アプレッソ
代表取締役社長
小野 和俊
ono@appresso.com
• 1976年 生まれ
– 小学3年生から趣味でプログラミングを開始
• 1995-1999年 慶應義塾大学SFC 環境情報学部
– NRIにてナレッジマネジメントシステムを企画・開発
• 1999-2000年 サン・マイクロシステムズ
– シリコンバレーの米国本社にてJava + XMLを用いたサイジングアプリ
ケーションを開発、E3 Award受賞
– カリフォルニア州立大学サクラメント校大学院でのJava+XMLの授業を担
当
• 2000年 アプレッソ起業
– 「日本にエンジニアの楽園のような場所をつくりたい!」
– DataSpiderの企画・開発を開始、半年間で最初のバージョンが完成
– DataSpiderは現在4年連続顧客満足度No.1、3000社を超える導入実績
• 2013年 セゾン情報システムズ CTO
– アプレッソ株式を売却
– 常務取締役 CTO テクノベーションセンター長
– AWS re:invent 2015にてThink Big Award受賞
– 2017年、遂にHULFTは世界2位に!
2
自己紹介
• 未踏ソフトウェア創造事業
– PICSY(伝播貨幣) シミュレータークライアント設計&実装
(2002年)
– Galapagos(XM会議ツール) 共同開発者 (2004年)
• 日経ソフトウェア
– 巻頭連載「小野和俊のプログラマ独立独歩」(2007-2010年)
• 九州大学 工学部大学院
– 「高度ICTリーダーシップ特論」 非常勤講師 (2008-2011年)
3
自己紹介
株式会社アプレッソ
本 社 東京都文京区関口1-20-10 住友不動産江戸川橋駅前ビル
代表取締役社長 小野 和俊
2001年 6月 DataSpider製品 最初のユーザとしてNHK様に導入(全国高校野球地方予選大会の結果をWeb掲載)
2002年10月 財団法人ソフトウェア情報センター(SOFTIC)選定「2002年度ソフトウェア・プロダクト・オブ・ザ・イヤー」受賞
2003年 1月 DataSpider採用の清水建設様工事・建物DBシステム 日経コンピュータ 「第7回情報システム大賞」グランプリ受賞
2004年11月 慶応義塾大学(藤沢)による SFC Entrepreneur Award 2004 Silver Award受賞
2008年 8月 DataSpiderが 「Microsoft Innovation Award 2008 優秀賞」を受賞
2009年 4月 「つなぐ」第2弾製品 「PIMSYNC」発表
2010年 4月 「つなぐ」第3弾製品 「DataSpider BPM」発表
2010年 9月 DataSpider 2.4 IPA(独立行政法人 情報処理推進機構)
連携プログラム技術評価制度 評価書を取得
2011年 3月 クラウド連携にフォーカスした DataSpider 3.0 を発表
2012年 2月 DataSpider Servista3.0 財団法人 全国地域情報化推進協会(APPLIC)
地域情報プラットフォーム準拠認定
2013年 3月 株式会社セゾン情報システムズと資本・業務提携
2014年 3月 DataSpiderシリーズ 出荷累計 2000社突破
2015年 4月 「つなぐ」第4弾製品 「Thunderbus」発表
2015年11月 DataSpiderシリーズ 出荷累計 2500社突破
2016年 2月 IoT連携プラットフォーム「DataSpider Servista 4.0」を発表
2017年 1月 クラウド型データインテグレーションサービス「DataSpider Cloud」を提供開始
4
会社概要
「つくる」から「つなぐ」 をコンセプトに データ連携のソリューションを展開しています
会社概要:セゾン情報システムズ
 会社概要
商 号 株式会社セゾン情報システムズ
設立年月日 1970 年 9 月 1 日
代表取締役
社 長
内 田 和 弘
資 本 金 13億6,768万7,500円
事 業 内 容
‣ カードシステムソリューション事業
‣ 流通・ITソリューション事業
‣ 通信基盤ミドルウェア(HULFT)事業
従 業 員 数 1,203名(連結) 657名(単体)
本社所在地 東京都豊島区東池袋三丁目1番1号
上 場 市 場 東京証券取引所JASDAQスタンダード市場(9640)
主 要 株 主
(上位3位)
‣ 株式会社クレディセゾン
‣ ロイヤルバンクオブカナダトラストカンパニー(ケイマン)リミ
テッド
‣ イーシーエム マスターファンド エスピーヴイ ワン
認定・届出 総務省 電気通信事業者届出
品質
セキュリ
ティ
‣ プライバシーマーク付与認定取得
・登録番号 【11820059(09)】
‣ JISQ9001:2015(ISO9001:2015)認証取得
・登録番号 【JMAQA-041】
‣ JISQ27001:2014(ISO/IEC27001:2013) 認証取得
・登録番号 【JMAQA-S030】
‣ JISQ20000-1:2012(ISO/IEC20000-1:2011) 認証取得
・登録番号 【JMAQA-T002】
・登録範囲 【システムサービスセンター、テクノベーションセン
ター、ビジネスサポート部、監査部】
(2016年9月30日現在)
1970年
1992年
㈱西武情報センター設立・創業
西武流通グループ(当時)の情報処理機能の統合と新しい情報サービス
業の創造を目的として、設立。情報処理サービス事業、ソフトウェア開
発事業を開始。
㈱セゾン情報システムズに商号変更
信販業務システムを中心に情報サービス拡大・強化のため㈱緑屋計算セ
ンターを吸収合併(1981年)、豊島区のコンピュータ専用ビルに移転
(1984年)し、総合サービス企業としての基盤を整備。
1993年
JASDAQスタンダード市場に上場
通信ミドルウェア「HULFT」販売開始
業種・業界を問わず、全世界で43ヵ国、8,600社、185,800本、世界売
上シェア第4位、国内シェア第1位の実績を誇るファイル転送ミドルウェ
ア販売・保守・ソリューション事業の源となる。(2016年9月末時点)
2005年
㈱流通情報ソリューションズを吸収合併
流通システム事業の経営資源の集中、強化。旧西武流通グループから蓄
積した技術・ノウハウの成熟させ、業務を“つなぐ”クラウドインテグ
レーターとしてお客様事業を支える流通・ITソリューション事業に発展
する。
2010年
クラウド関連製品・サービス提供開始
webデータ連携「HULFTクラウド」、クラウド型ホスティングサービス
「SAISOS」を提供開始。クラウド&グローバル時代に求められるニー
ズに対応するための技術・環境を整備。
2015年 ASEAN拠点 HULFT Pte. Ltd.設立
2013年 ㈱アプレッソ株式を取得、子会社化
データ連携ソリューションの強化とともに、先端技術の研究開発経営の
基盤を醸成。
2016年
北米拠点 HULFT, Inc.を設立
2005年に中国拠点の世存信息技術(上海)有限公司設立を皮切りにグ
ローバルビジネス拡大を図るため、ASEAN、北米拠点会社を設立。米国
開催 AWS re:Invent 2015で「Think Big」賞を受賞。
5
© 2017 APPRESSO K.K. All Rights Reserved. 6
そもそもなんで
DataSpiderをつくったのか?
© 2017 APPRESSO K.K. All Rights Reserved. 7
大学時代のNRIでの開発のバイトでの教訓
「このシステムは・・・
テキストベースの言語で書くと辛い!」
© 2017 APPRESSO K.K. All Rights Reserved. 8
AIと言えば
データインテグレーションのお話です
データインテグレーションツール
•可視化
•予兆検知
•データガバナンス
Sensor
IoT
Factory
Mobile
FA
ERP HR DWH EDI
機械学習
データ
インテグレーション
ツール
ビッグデータ
・データフローコントロール
・ダイナミックルーティング
・データマネジメント
© 2017 APPRESSO K.K. All Rights Reserved. 9
DataSpider ServistaのGUIと開発イメージ
入力 変換 出力
一連の処理の流れ=スクリプト
DataSpider Studio
アダプタ アダプタコンバータ
ア
ダ
プ
タ
群
© 2017 APPRESSO K.K. All Rights Reserved. 10
1対1の変換
複数データの統合
DataSpiderのGUIと開発イメージ
コンバータツール 「Mapper」
© 2017 APPRESSO K.K. All Rights Reserved. 11
すべてのプロパティが日本語化/わかりやすくみやすい
設定のしやすいインターフェイス
ラベルがすべて
日本語でわかりやすい
マッピングもつながっている箇
所がみやすい
© 2017 APPRESSO K.K. All Rights Reserved. 12
データベース
■ Microsoft Access
■ DB2
■ DB2 for i
■ MySQL
■ Oracle
■ PostgreSQL
■ Microsoft SQL Server
グループウェア
■ IBM Domino
■ IBM Notes
クラウド
■ Amazon Web Services
■ Cloudn
■ Google Apps
■ Microsoft Azure
ネットワーク
■ FTP
■ JMS
■ Web
■ Webサービス
■ メール
■ Active Directory
■ REST
SDK
■ 追加アダプタ開発
■ JDBC
■ ODBC
■ NeoCore
■ Shunsaku
■ MongoDB
アプリケーション
■ DataSpider BPM
■ Thunderbusコネクタ
■ SAP
・SAP
・SAP BC
・SAP テーブルクエリ(差分抽出)
・ERP Adapter for SAP Basic Edition ※6
・ERP Adapter for SAP Table Query Edition ※6
・ERP Adapter for SAP Advanced Edition ※6
■ HULFT
■ Microsoft Dynamics AX ※4
■ Dr.Sum EA
■ SVF
■ StraForm-X(コネクタ)
■ 勘定奉行V ERP ※5
■ 商蔵奉行V ERP ※5
■ Sedue
■ List Creator
■ Xuras inicio
■ メインフレーム
■ Oracle EBS ※3
■ Tableau ※6
■ Microsoft Dynamics CRM
ファイル
■ CSV
■ Microsoft Excel
■ HTML
■ XML
■ 固定長
■ 可変長
■ ファイル操作
■ ファイルシステム
■ Apache™ Hadoop® ※2
■ ニフティクラウド
■ Salesforce
・Log Manager for Salesforce
■ GAEデータストア ※1
■ kintone
クラウドからビッグデータまで様々なシステムへ対応
多種多様なシステムへの対応
※1:販売元は、株式会社ティー・シー・エフ様です。
※2: Apache™ Hadoop® アダプタの正式製品名は「DataSpider アダプタ for Apache™ Hadoop®」です。
※3:Oracle EBS はOracleアダプタで接続できます。
※4:本製品は古河インフォメーション・テクノロジー株式会社様の製品です。
※5:販売元は、日本電通株式会社様です。
※6: 販売元は、SCSK 株式会社様です。
※1,※4,※5,※6 は代理販売によって提供致します。
© 2017 APPRESSO K.K. All Rights Reserved. 13
外部からの呼び出し
HTTP、SAP、Webサービス、ファイルイベント、スケジューラ、専用クライアント、Java API 、データ
ベース、FTP、HULFT、AmazonSQS、Azure Service bus
DataSpider 実行サーバ
アダプタ
トリガー
スケジューラ
販売管理DB メールサーバ FTPサーバ在庫管理DB 購買管理DB
SAPHTTP Webサービス
ファイル
イベント
運用監視
ツール
Java API データベース HULFT Azure
Service Bus
FTPサーバ
様々なタイミングで連携処理を自動実行可能
Amazon
SQS
© 2017 APPRESSO K.K. All Rights Reserved. 14
高速なパフォーマンス
モジュール
モジュール モジュール
コンパイル
コンパイル方式でJavaのプログラムと変わらないパフォーマンスを実現
DataSpider
Studio
DataSpider
Server
• 高速なデータ連携実行環境
– GUIで開発を行った処理フローやデータフローは、DataSpider 内部で
Java プログラムに変換後処理実行を行うため、プログラムによる開発・
実装と遜色ない高速な処理パフォーマンスを実現
© 2017 APPRESSO K.K. All Rights Reserved. 15
4
変換処理
1
3
2
1
抽出処理 書込処理
2
3
4
大容量データ対応①
一定の分割単位で各処理を並列に処理させることで、全体の処理速度が向上
最小限のメモリ量で大容量データを高速に連携
• 高速なデータ連携実行環境
– 大容量のデータをより高速に処理するために最適な方式を搭載
~ パラレルストリーミング機能 ~
© 2017 APPRESSO K.K. All Rights Reserved. 16
結合
集計ソート
MSC
DataSpider Servista V4 新開発の高速エンジン
マルチストリームコンバータ
大容量データ対応②
結合処理は従来のバージョンより10~15倍のパフォーマンス向上
新エンジン採用により集計/結合/ソートを高速化
© 2017 APPRESSO K.K. All Rights Reserved. 17
仕様書出力機能
ボタンひとつで作った処理を仕様書に出力可能
• 仕様書出力機能
– 開発内容の文書化と設定情報の確認を可能にします。
– メンテナンス時の設定確認や引き継ぎ等の作業に使用可能です。
© 2017 APPRESSO K.K. All Rights Reserved. 18
1. CSV連携パターン
a. Pythonで読み込むCSVをDataSpiderで生成
b. PythonでのCSV生成をトリガーにDataSpiderで各種データ
ソースに反映
→ CSVとのやり取りだけ意識すれば後はDataSpiderがCSV⇔各
種システムとの同期・連携をやってくれる
2. 直接呼び出し
a. PythonからDataSpiderスクリプトを実行(RESTful API/
Web Services / コマンド実行 etc.)
b. DataSpiderスクリプト内でPythonのコードを実行
→ Pythonの処理の一部をDataSpiderに委譲することができる /
DataSpiderの処理の一部をPythonに委譲することができる
© 2017 APPRESSO K.K. All Rights Reserved. 19
Pythonとの2つの連携パターン
© 2017 APPRESSO K.K. All Rights Reserved. 20
AIと言えば
AI x DI
1.データ準備
2.モデル作成
3.モデル検証
© 2017 APPRESSO K.K. All Rights Reserved. 21
機械学習、深層学習のステップ
for (;期待する結果が得られるまで;) {
1.データ準備
2.モデル作成
3.モデル検証
}
© 2017 APPRESSO K.K. All Rights Reserved. 22
実際の機械学習、深層学習のステップ
for (;期待する結果が得られるまで;) {
1. データ準備
2.モデル作成
3.モデル検証
}
© 2017 APPRESSO K.K. All Rights Reserved. 23
各ステップにかけたい時間
for (;期待する結果が得られるまで;) {
1.データ準備
2. モデル作成
3. モデル検証
}
© 2017 APPRESSO K.K. All Rights Reserved. 24
実際の各ステップにかかる時間
80%もの時間がデータ準備に
費やされているというデータもあります
• データってどこにあります?
• それらのフォーマットってどうなっています?
• 同じ意味のデータは同じデータになってい
ます?
© 2017 APPRESSO K.K. All Rights Reserved. 25
なぜそうなるのか?
• 例えば簡単な売上予想を考えてみます
• 学習用データや教師用データはセットに
なっていない
–天気→オープンデータ
–キャンペーン→キャンペーン管理システム
–セール→商品管理システム
–など
© 2017 APPRESSO K.K. All Rights Reserved. 26
なぜそうなるのか?
© 2017 APPRESSO K.K. All Rights Reserved. 27
データの所在
データベース? ファイル?
サービス/API? 基幹システム/ホスト?
• データベース
– Oracle、DB2、SQL Server、PosgreSQL、
MySQL・・・
• ファイル
– フラットファイル、Excel、ログ・・・
• サービス/API
– クラウドサービス、オープンデータ・・・
• 基幹システム/ホスト
– SAP、Domino/Notes、IBM z、MSP/XSP・・・
© 2017 APPRESSO K.K. All Rights Reserved. 28
データの取得
• 認証方法
– BASIC認証、ダイジェスト認証、NTLM認証、OAuth認証、SAML認
証・・・
• API/接続方式
– JDBC/ODBC、HTTP/HTTPS、Socket、SAP JCo、Notes C API、
POI/JExcel API
• プログラミング言語
– Java、.NET、C/C++、アセンブラ
• 型
– 数値(Integer、Float、Double)、文字列(CHAR、VARCHAR)、日
付・・・
• エラーハンドリング/パフォーマンスチューニング
– タイムアウト、フェッチ/バッチサイズ・・・
© 2017 APPRESSO K.K. All Rights Reserved. 29
必要な技術
© 2017 APPRESSO K.K. All Rights Reserved. 30
AIと言えばすべてのデータソースから
データを取得するプログラムが組める人?
• データベース
– 行列・・・
• ファイル
– CSV、固定長、可変長、Excel、アクセスログ、アプリケー
ションログ、バイナリファイル・・・
• サービス/API
– JSON、XML、CSV、変態CSV・・・
• 基幹システム/ホスト
– SAP固有、Domino/Notes固有、IBM z固有、MSP/XSP固
有・・・
© 2017 APPRESSO K.K. All Rights Reserved. 31
データフォーマット解析
• データフォーマットを解析する力
• データフォーマット解析ライブラリ
• 型フォーマット
– 日付フォーマット、数値フォーマット
• 大規模データ処理
• データフォーマットが変わったときにも対応す
る忍耐力
© 2017 APPRESSO K.K. All Rights Reserved. 32
必要な技術
© 2017 APPRESSO K.K. All Rights Reserved. 33
AIと言えば
データフォーマット解析したい人?
• 「JP」と「日本」を同じデータとして扱う
• 「東京」と「港区」のデータの意味は同じものとして扱
う?
• 全角と半角
• 「2017/07/27」は「27/7/17」と同じ
• 日時データの時間はいらない?
• 「k」や「m」の単位を合わせる
• 欠損データの取扱は?
– それとも学習データから除外?
© 2017 APPRESSO K.K. All Rights Reserved. 34
データ前処理
© 2017 APPRESSO K.K. All Rights Reserved. 35
AIと言えば
データ前処理したい人?
© 2017 APPRESSO K.K. All Rights Reserved. 36
AIと言えばデータを準備するだけで
結構大変なんです
for (;期待する結果が得られるまで;) {
1.データ準備
2. モデル作成
3. モデル検証
}
© 2017 APPRESSO K.K. All Rights Reserved. 37
現実の作業時間
80%もの時間がデータ準備に
費やされているというデータもあります
for (;期待する結果が得られるまで;) {
1. データ準備
2.モデル作成
3.モデル検証
}
© 2017 APPRESSO K.K. All Rights Reserved. 38
理想的な作業時間
1. データの選択
– どのようなデータが分析に使えるのか
– そのデータはどこにあるのか
2. データの前処理
– フォーマッティング
• DBやファイルのデータを取得します
• それぞれのフォーマットを同じフォーマットにします
– クリーニング
• 欠損データを取り除いたり、不正データを修正したりします
– サンプリング
• 不要なデータ(あまりにも過去など)を取り除きます
3. データの変換
– クレンジング
• 同じ意味のデータは同じものとしてデータを整えます
– スケーリング
• 桁を合わせます
– デコンポジション
• 組み合わさったデータを構成されるデータに分割します
– 例:日時などのデータを日と時に分割
– アグリゲーション
• 複数の特長を持ったデータを一つの特長に集約する
– 例:ログイン情報をログイン回数に集約する© 2017 APPRESSO K.K. All Rights Reserved. 39
データ準備まとめ
データインテグレーションツールが活躍します
•可視化
•予兆検知
•データガバナンス
Sensor
IoT
Factory
Mobile
FA
ERP HR DWH EDI
機械学習
データ
インテグレーション
ツール
ビッグデータ
・データフローコントロール
・ダイナミックルーティング
・データマネジメント
© 2017 APPRESSO K.K. All Rights Reserved. 40
• 多種多様な接続先を持っています
• GUIを持っています
• デフォルト値でそれなりに動くように
なっています
• データ取得の際にはツールの使い方を学
ぶだけです
© 2017 APPRESSO K.K. All Rights Reserved. 41
データインテグレーションツールの特長
• 接続先を確認しましょう
– 接続先がなければ元も子もないですよね
• 設定粒度に気を付けましょう
– GUIは制約にもなります
– どの程度汎用的に処理が組めるのか確認しましょう
• データインテグレーションツール自体の品質は良いものを選びま
しょう
– データインテグレーション自体でそれなりにハマります
– ツール自体にハマらないよう品質の良いものを選びましょう
• 処理速度は高速なものにしましょう
– データはどんどん大きくなっていきます
– 処理速度が速いものを選びましょう
• 最初はクラウドがいいですよね
© 2017 APPRESSO K.K. All Rights Reserved. 42
データインテグレーションツールの選び方
© 2017 APPRESSO K.K. All Rights Reserved. 43
ちょっと宣伝
• 機械学習のためのデータ準備は結構大変
です
• 機械学習ではデータ準備の時間を短くし
ましょう
• その際にはデータインテグレーション
ツールが有効です
• DataSpiderがおすすめですw
© 2017 APPRESSO K.K. All Rights Reserved. 44
まとめ
© 2017 APPRESSO K.K. All Rights Reserved. 45
私たちは仲間を募集しています
https://www.appresso.com/recruit/
ご静聴ありがとうございました

More Related Content

What's hot

PythonとYAMLでGCPをDeploy!「Google Cloud Deployment Manager」
PythonとYAMLでGCPをDeploy!「Google Cloud Deployment Manager」PythonとYAMLでGCPをDeploy!「Google Cloud Deployment Manager」
PythonとYAMLでGCPをDeploy!「Google Cloud Deployment Manager」Terui Masashi
 
Web App for Containers のデプロイでつまずいた話
Web App for Containers のデプロイでつまずいた話Web App for Containers のデプロイでつまずいた話
Web App for Containers のデプロイでつまずいた話Shigenari Ohnuma
 
DevLOVE関西2016.2.5 地道にAWS構築自動化に取り組んでいるお話し
DevLOVE関西2016.2.5 地道にAWS構築自動化に取り組んでいるお話しDevLOVE関西2016.2.5 地道にAWS構築自動化に取り組んでいるお話し
DevLOVE関西2016.2.5 地道にAWS構築自動化に取り組んでいるお話しAkira Nagata
 
[Developers Summit 2018] Microsoft AIプラットフォームによるインテリジェント アプリケーションの構築
[Developers Summit 2018] Microsoft AIプラットフォームによるインテリジェント アプリケーションの構築[Developers Summit 2018] Microsoft AIプラットフォームによるインテリジェント アプリケーションの構築
[Developers Summit 2018] Microsoft AIプラットフォームによるインテリジェント アプリケーションの構築Naoki (Neo) SATO
 
Web Component Framework Urushiのご紹介(OSC2017 Tokyo/Spring)
Web Component Framework Urushiのご紹介(OSC2017 Tokyo/Spring)Web Component Framework Urushiのご紹介(OSC2017 Tokyo/Spring)
Web Component Framework Urushiのご紹介(OSC2017 Tokyo/Spring)YuzoHirakawa
 
JSUG SpringOnePlatform 2016報告会 Case study2 - feed back - springoneplatform
JSUG SpringOnePlatform 2016報告会 Case study2 - feed back - springoneplatformJSUG SpringOnePlatform 2016報告会 Case study2 - feed back - springoneplatform
JSUG SpringOnePlatform 2016報告会 Case study2 - feed back - springoneplatformTakahiro Fujii
 
Introducing microsoft learn
 Introducing microsoft learn Introducing microsoft learn
Introducing microsoft learnru pic
 
[第37回 Machine Learning 15minutes!] Microsoft AI - Build 2019 Updates ~ Azure ...
[第37回 Machine Learning 15minutes!] Microsoft AI - Build 2019 Updates ~ Azure ...[第37回 Machine Learning 15minutes!] Microsoft AI - Build 2019 Updates ~ Azure ...
[第37回 Machine Learning 15minutes!] Microsoft AI - Build 2019 Updates ~ Azure ...Naoki (Neo) SATO
 
Azure Api Management 俺的マニュアル 2020年3月版
Azure Api Management 俺的マニュアル 2020年3月版Azure Api Management 俺的マニュアル 2020年3月版
Azure Api Management 俺的マニュアル 2020年3月版貴志 上坂
 
開発者のための機械学習入門:Azure Machine Learning Studioで構造化データから予測分析
開発者のための機械学習入門:Azure Machine Learning Studioで構造化データから予測分析開発者のための機械学習入門:Azure Machine Learning Studioで構造化データから予測分析
開発者のための機械学習入門:Azure Machine Learning Studioで構造化データから予測分析貴志 上坂
 
Microsoft learnご紹介vol2
Microsoft learnご紹介vol2Microsoft learnご紹介vol2
Microsoft learnご紹介vol2ru pic
 
【17-D-1】今どきのアーキテクチャを現場の立場で斬る
【17-D-1】今どきのアーキテクチャを現場の立場で斬る【17-D-1】今どきのアーキテクチャを現場の立場で斬る
【17-D-1】今どきのアーキテクチャを現場の立場で斬るDevelopers Summit
 
Spring Fest 2017 「エンタープライズで利用するSpring Boot」#jsug #sf_h1
Spring Fest 2017 「エンタープライズで利用するSpring Boot」#jsug #sf_h1Spring Fest 2017 「エンタープライズで利用するSpring Boot」#jsug #sf_h1
Spring Fest 2017 「エンタープライズで利用するSpring Boot」#jsug #sf_h1Takeshi Hirosue
 
Five Steps to Culture Change を日本語で解説する 2020/11/06
Five Steps to Culture Change を日本語で解説する 2020/11/06Five Steps to Culture Change を日本語で解説する 2020/11/06
Five Steps to Culture Change を日本語で解説する 2020/11/06Issei Hiraoka
 
.NET 6の期待の新機能とアップデート
.NET 6の期待の新機能とアップデート.NET 6の期待の新機能とアップデート
.NET 6の期待の新機能とアップデートTomomitsuKusaba
 
Azure Machine Learning Build 2020
Azure Machine Learning Build 2020Azure Machine Learning Build 2020
Azure Machine Learning Build 2020Keita Onabuta
 
Vs code conf2020-11-21-extensions-for-microservices-app-dev
Vs code conf2020-11-21-extensions-for-microservices-app-devVs code conf2020-11-21-extensions-for-microservices-app-dev
Vs code conf2020-11-21-extensions-for-microservices-app-devShotaro Suzuki
 
僕はあなたを監視する(MS Graph Subscriptionのβで公開されたpresencesを使おう!)
僕はあなたを監視する(MS Graph Subscriptionのβで公開されたpresencesを使おう!)僕はあなたを監視する(MS Graph Subscriptionのβで公開されたpresencesを使おう!)
僕はあなたを監視する(MS Graph Subscriptionのβで公開されたpresencesを使おう!)DevTakas
 
開発者のための機械学習入門:Azure Machine Learning Studioで構造化データから予測分析
開発者のための機械学習入門:Azure Machine Learning Studioで構造化データから予測分析開発者のための機械学習入門:Azure Machine Learning Studioで構造化データから予測分析
開発者のための機械学習入門:Azure Machine Learning Studioで構造化データから予測分析貴志 上坂
 

What's hot (20)

PythonとYAMLでGCPをDeploy!「Google Cloud Deployment Manager」
PythonとYAMLでGCPをDeploy!「Google Cloud Deployment Manager」PythonとYAMLでGCPをDeploy!「Google Cloud Deployment Manager」
PythonとYAMLでGCPをDeploy!「Google Cloud Deployment Manager」
 
Web App for Containers のデプロイでつまずいた話
Web App for Containers のデプロイでつまずいた話Web App for Containers のデプロイでつまずいた話
Web App for Containers のデプロイでつまずいた話
 
scrum_fest_osaka_2020
scrum_fest_osaka_2020scrum_fest_osaka_2020
scrum_fest_osaka_2020
 
DevLOVE関西2016.2.5 地道にAWS構築自動化に取り組んでいるお話し
DevLOVE関西2016.2.5 地道にAWS構築自動化に取り組んでいるお話しDevLOVE関西2016.2.5 地道にAWS構築自動化に取り組んでいるお話し
DevLOVE関西2016.2.5 地道にAWS構築自動化に取り組んでいるお話し
 
[Developers Summit 2018] Microsoft AIプラットフォームによるインテリジェント アプリケーションの構築
[Developers Summit 2018] Microsoft AIプラットフォームによるインテリジェント アプリケーションの構築[Developers Summit 2018] Microsoft AIプラットフォームによるインテリジェント アプリケーションの構築
[Developers Summit 2018] Microsoft AIプラットフォームによるインテリジェント アプリケーションの構築
 
Web Component Framework Urushiのご紹介(OSC2017 Tokyo/Spring)
Web Component Framework Urushiのご紹介(OSC2017 Tokyo/Spring)Web Component Framework Urushiのご紹介(OSC2017 Tokyo/Spring)
Web Component Framework Urushiのご紹介(OSC2017 Tokyo/Spring)
 
JSUG SpringOnePlatform 2016報告会 Case study2 - feed back - springoneplatform
JSUG SpringOnePlatform 2016報告会 Case study2 - feed back - springoneplatformJSUG SpringOnePlatform 2016報告会 Case study2 - feed back - springoneplatform
JSUG SpringOnePlatform 2016報告会 Case study2 - feed back - springoneplatform
 
Introducing microsoft learn
 Introducing microsoft learn Introducing microsoft learn
Introducing microsoft learn
 
[第37回 Machine Learning 15minutes!] Microsoft AI - Build 2019 Updates ~ Azure ...
[第37回 Machine Learning 15minutes!] Microsoft AI - Build 2019 Updates ~ Azure ...[第37回 Machine Learning 15minutes!] Microsoft AI - Build 2019 Updates ~ Azure ...
[第37回 Machine Learning 15minutes!] Microsoft AI - Build 2019 Updates ~ Azure ...
 
Azure Api Management 俺的マニュアル 2020年3月版
Azure Api Management 俺的マニュアル 2020年3月版Azure Api Management 俺的マニュアル 2020年3月版
Azure Api Management 俺的マニュアル 2020年3月版
 
開発者のための機械学習入門:Azure Machine Learning Studioで構造化データから予測分析
開発者のための機械学習入門:Azure Machine Learning Studioで構造化データから予測分析開発者のための機械学習入門:Azure Machine Learning Studioで構造化データから予測分析
開発者のための機械学習入門:Azure Machine Learning Studioで構造化データから予測分析
 
Microsoft learnご紹介vol2
Microsoft learnご紹介vol2Microsoft learnご紹介vol2
Microsoft learnご紹介vol2
 
【17-D-1】今どきのアーキテクチャを現場の立場で斬る
【17-D-1】今どきのアーキテクチャを現場の立場で斬る【17-D-1】今どきのアーキテクチャを現場の立場で斬る
【17-D-1】今どきのアーキテクチャを現場の立場で斬る
 
Spring Fest 2017 「エンタープライズで利用するSpring Boot」#jsug #sf_h1
Spring Fest 2017 「エンタープライズで利用するSpring Boot」#jsug #sf_h1Spring Fest 2017 「エンタープライズで利用するSpring Boot」#jsug #sf_h1
Spring Fest 2017 「エンタープライズで利用するSpring Boot」#jsug #sf_h1
 
Five Steps to Culture Change を日本語で解説する 2020/11/06
Five Steps to Culture Change を日本語で解説する 2020/11/06Five Steps to Culture Change を日本語で解説する 2020/11/06
Five Steps to Culture Change を日本語で解説する 2020/11/06
 
.NET 6の期待の新機能とアップデート
.NET 6の期待の新機能とアップデート.NET 6の期待の新機能とアップデート
.NET 6の期待の新機能とアップデート
 
Azure Machine Learning Build 2020
Azure Machine Learning Build 2020Azure Machine Learning Build 2020
Azure Machine Learning Build 2020
 
Vs code conf2020-11-21-extensions-for-microservices-app-dev
Vs code conf2020-11-21-extensions-for-microservices-app-devVs code conf2020-11-21-extensions-for-microservices-app-dev
Vs code conf2020-11-21-extensions-for-microservices-app-dev
 
僕はあなたを監視する(MS Graph Subscriptionのβで公開されたpresencesを使おう!)
僕はあなたを監視する(MS Graph Subscriptionのβで公開されたpresencesを使おう!)僕はあなたを監視する(MS Graph Subscriptionのβで公開されたpresencesを使おう!)
僕はあなたを監視する(MS Graph Subscriptionのβで公開されたpresencesを使おう!)
 
開発者のための機械学習入門:Azure Machine Learning Studioで構造化データから予測分析
開発者のための機械学習入門:Azure Machine Learning Studioで構造化データから予測分析開発者のための機械学習入門:Azure Machine Learning Studioで構造化データから予測分析
開発者のための機械学習入門:Azure Machine Learning Studioで構造化データから予測分析
 

Similar to stapy_028_talk1

dstn交流会_DataSpider のソーシャルとの融合、手組との融合
dstn交流会_DataSpider のソーシャルとの融合、手組との融合dstn交流会_DataSpider のソーシャルとの融合、手組との融合
dstn交流会_DataSpider のソーシャルとの融合、手組との融合dstn
 
[db tech showcase OSS 2017] A22: NoSQL:誰のための、何のためのデータベース?その将来は?by Aerospike, ...
[db tech showcase OSS 2017] A22: NoSQL:誰のための、何のためのデータベース?その将来は?by Aerospike, ...[db tech showcase OSS 2017] A22: NoSQL:誰のための、何のためのデータベース?その将来は?by Aerospike, ...
[db tech showcase OSS 2017] A22: NoSQL:誰のための、何のためのデータベース?その将来は?by Aerospike, ...Insight Technology, Inc.
 
Bluemixの概要とアプリの作り方
Bluemixの概要とアプリの作り方Bluemixの概要とアプリの作り方
Bluemixの概要とアプリの作り方BMXUG
 
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。 複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。 Insight Technology, Inc.
 
OSSではじめるオープン・スタンダードのクラウド @201304
OSSではじめるオープン・スタンダードのクラウド @201304OSSではじめるオープン・スタンダードのクラウド @201304
OSSではじめるオープン・スタンダードのクラウド @201304Shinichiro Arai
 
データレイクを基盤としたAWS上での機械学習サービス構築
データレイクを基盤としたAWS上での機械学習サービス構築データレイクを基盤としたAWS上での機械学習サービス構築
データレイクを基盤としたAWS上での機械学習サービス構築Amazon Web Services Japan
 
[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ by トレジャーデータ株式会社 斉藤太郎
[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ  by トレジャーデータ株式会社 斉藤太郎[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ  by トレジャーデータ株式会社 斉藤太郎
[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ by トレジャーデータ株式会社 斉藤太郎Insight Technology, Inc.
 
Classmethod共催IT部門向け Tableauを活用した全社レベルのデータ民主化とガバナンス
Classmethod共催IT部門向け Tableauを活用した全社レベルのデータ民主化とガバナンスClassmethod共催IT部門向け Tableauを活用した全社レベルのデータ民主化とガバナンス
Classmethod共催IT部門向け Tableauを活用した全社レベルのデータ民主化とガバナンスTakeo Hirakawa
 
データベースアプリケーション開発セミナー・最新のデータベースとアプリケーション開発の関係
データベースアプリケーション開発セミナー・最新のデータベースとアプリケーション開発の関係データベースアプリケーション開発セミナー・最新のデータベースとアプリケーション開発の関係
データベースアプリケーション開発セミナー・最新のデータベースとアプリケーション開発の関係Kaz Aiso
 
Prestoで実現するインタラクティブクエリ - dbtech showcase 2014 Tokyo
Prestoで実現するインタラクティブクエリ - dbtech showcase 2014 TokyoPrestoで実現するインタラクティブクエリ - dbtech showcase 2014 Tokyo
Prestoで実現するインタラクティブクエリ - dbtech showcase 2014 TokyoTreasure Data, Inc.
 
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...Atsushi Tsuchiya
 
【IVS CTO Night & Day】AWS re:Invent 2017 振り返り
【IVS CTO Night & Day】AWS re:Invent 2017 振り返り【IVS CTO Night & Day】AWS re:Invent 2017 振り返り
【IVS CTO Night & Day】AWS re:Invent 2017 振り返りAmazon Web Services Japan
 
Developers Summit 2022 プロダクト開発速度とデータの組織的価値をセットで飛躍的に高める開発戦略
Developers Summit 2022 プロダクト開発速度とデータの組織的価値をセットで飛躍的に高める開発戦略Developers Summit 2022 プロダクト開発速度とデータの組織的価値をセットで飛躍的に高める開発戦略
Developers Summit 2022 プロダクト開発速度とデータの組織的価値をセットで飛躍的に高める開発戦略Takanori Kawahara
 
データを集めて貯めて分析する… 最先端のテクノロジーが詰まったIBMクラウドのご紹介
データを集めて貯めて分析する…  最先端のテクノロジーが詰まったIBMクラウドのご紹介データを集めて貯めて分析する…  最先端のテクノロジーが詰まったIBMクラウドのご紹介
データを集めて貯めて分析する… 最先端のテクノロジーが詰まったIBMクラウドのご紹介IBM Analytics Japan
 
データ仮想化を活用したデータ分析のフローと分析モデル作成の自動化のご紹介
データ仮想化を活用したデータ分析のフローと分析モデル作成の自動化のご紹介データ仮想化を活用したデータ分析のフローと分析モデル作成の自動化のご紹介
データ仮想化を活用したデータ分析のフローと分析モデル作成の自動化のご紹介Denodo
 
20161027 hadoop summit Generating Recommendations at Amazon Scale with Apach...
20161027 hadoop summit  Generating Recommendations at Amazon Scale with Apach...20161027 hadoop summit  Generating Recommendations at Amazon Scale with Apach...
20161027 hadoop summit Generating Recommendations at Amazon Scale with Apach...Amazon Web Services Japan
 
AWS Summit New York 2017 Keynote Recap
AWS Summit New York 2017 Keynote RecapAWS Summit New York 2017 Keynote Recap
AWS Summit New York 2017 Keynote RecapEiji Shinohara
 

Similar to stapy_028_talk1 (20)

JavaOne2017参加報告 Microservices topic & approach #jjug
JavaOne2017参加報告 Microservices topic & approach #jjugJavaOne2017参加報告 Microservices topic & approach #jjug
JavaOne2017参加報告 Microservices topic & approach #jjug
 
dstn交流会_DataSpider のソーシャルとの融合、手組との融合
dstn交流会_DataSpider のソーシャルとの融合、手組との融合dstn交流会_DataSpider のソーシャルとの融合、手組との融合
dstn交流会_DataSpider のソーシャルとの融合、手組との融合
 
[db tech showcase OSS 2017] A22: NoSQL:誰のための、何のためのデータベース?その将来は?by Aerospike, ...
[db tech showcase OSS 2017] A22: NoSQL:誰のための、何のためのデータベース?その将来は?by Aerospike, ...[db tech showcase OSS 2017] A22: NoSQL:誰のための、何のためのデータベース?その将来は?by Aerospike, ...
[db tech showcase OSS 2017] A22: NoSQL:誰のための、何のためのデータベース?その将来は?by Aerospike, ...
 
Bluemixの概要とアプリの作り方
Bluemixの概要とアプリの作り方Bluemixの概要とアプリの作り方
Bluemixの概要とアプリの作り方
 
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。 複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。
 
OSSではじめるオープン・スタンダードのクラウド @201304
OSSではじめるオープン・スタンダードのクラウド @201304OSSではじめるオープン・スタンダードのクラウド @201304
OSSではじめるオープン・スタンダードのクラウド @201304
 
データレイクを基盤としたAWS上での機械学習サービス構築
データレイクを基盤としたAWS上での機械学習サービス構築データレイクを基盤としたAWS上での機械学習サービス構築
データレイクを基盤としたAWS上での機械学習サービス構築
 
[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ by トレジャーデータ株式会社 斉藤太郎
[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ  by トレジャーデータ株式会社 斉藤太郎[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ  by トレジャーデータ株式会社 斉藤太郎
[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ by トレジャーデータ株式会社 斉藤太郎
 
Classmethod共催IT部門向け Tableauを活用した全社レベルのデータ民主化とガバナンス
Classmethod共催IT部門向け Tableauを活用した全社レベルのデータ民主化とガバナンスClassmethod共催IT部門向け Tableauを活用した全社レベルのデータ民主化とガバナンス
Classmethod共催IT部門向け Tableauを活用した全社レベルのデータ民主化とガバナンス
 
データベースアプリケーション開発セミナー・最新のデータベースとアプリケーション開発の関係
データベースアプリケーション開発セミナー・最新のデータベースとアプリケーション開発の関係データベースアプリケーション開発セミナー・最新のデータベースとアプリケーション開発の関係
データベースアプリケーション開発セミナー・最新のデータベースとアプリケーション開発の関係
 
Prestoで実現するインタラクティブクエリ - dbtech showcase 2014 Tokyo
Prestoで実現するインタラクティブクエリ - dbtech showcase 2014 TokyoPrestoで実現するインタラクティブクエリ - dbtech showcase 2014 Tokyo
Prestoで実現するインタラクティブクエリ - dbtech showcase 2014 Tokyo
 
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...
 
【IVS CTO Night & Day】AWS re:Invent 2017 振り返り
【IVS CTO Night & Day】AWS re:Invent 2017 振り返り【IVS CTO Night & Day】AWS re:Invent 2017 振り返り
【IVS CTO Night & Day】AWS re:Invent 2017 振り返り
 
Developers Summit 2022 プロダクト開発速度とデータの組織的価値をセットで飛躍的に高める開発戦略
Developers Summit 2022 プロダクト開発速度とデータの組織的価値をセットで飛躍的に高める開発戦略Developers Summit 2022 プロダクト開発速度とデータの組織的価値をセットで飛躍的に高める開発戦略
Developers Summit 2022 プロダクト開発速度とデータの組織的価値をセットで飛躍的に高める開発戦略
 
データを集めて貯めて分析する… 最先端のテクノロジーが詰まったIBMクラウドのご紹介
データを集めて貯めて分析する…  最先端のテクノロジーが詰まったIBMクラウドのご紹介データを集めて貯めて分析する…  最先端のテクノロジーが詰まったIBMクラウドのご紹介
データを集めて貯めて分析する… 最先端のテクノロジーが詰まったIBMクラウドのご紹介
 
データ仮想化を活用したデータ分析のフローと分析モデル作成の自動化のご紹介
データ仮想化を活用したデータ分析のフローと分析モデル作成の自動化のご紹介データ仮想化を活用したデータ分析のフローと分析モデル作成の自動化のご紹介
データ仮想化を活用したデータ分析のフローと分析モデル作成の自動化のご紹介
 
[Japan Tech summit 2017] DAL 005
[Japan Tech summit 2017] DAL 005[Japan Tech summit 2017] DAL 005
[Japan Tech summit 2017] DAL 005
 
20161027 hadoop summit Generating Recommendations at Amazon Scale with Apach...
20161027 hadoop summit  Generating Recommendations at Amazon Scale with Apach...20161027 hadoop summit  Generating Recommendations at Amazon Scale with Apach...
20161027 hadoop summit Generating Recommendations at Amazon Scale with Apach...
 
[Japan Tech summit 2017] MAI 003
[Japan Tech summit 2017] MAI 003[Japan Tech summit 2017] MAI 003
[Japan Tech summit 2017] MAI 003
 
AWS Summit New York 2017 Keynote Recap
AWS Summit New York 2017 Keynote RecapAWS Summit New York 2017 Keynote Recap
AWS Summit New York 2017 Keynote Recap
 

More from Takeshi Akutsu

万年ビギナーによるPythonプログラミングのリハビリ計画
万年ビギナーによるPythonプログラミングのリハビリ計画万年ビギナーによるPythonプログラミングのリハビリ計画
万年ビギナーによるPythonプログラミングのリハビリ計画Takeshi Akutsu
 
Stapyの6年~本との出会いから生まれた技術コミュニティ~
Stapyの6年~本との出会いから生まれた技術コミュニティ~Stapyの6年~本との出会いから生まれた技術コミュニティ~
Stapyの6年~本との出会いから生まれた技術コミュニティ~Takeshi Akutsu
 
Start Python Club 2020年活動報告
Start Python Club 2020年活動報告Start Python Club 2020年活動報告
Start Python Club 2020年活動報告Takeshi Akutsu
 
みんなのPython勉強会#59 Intro
みんなのPython勉強会#59 IntroみんなのPython勉強会#59 Intro
みんなのPython勉強会#59 IntroTakeshi Akutsu
 
On the Necessity and Inapplicability of Python
On the Necessity and Inapplicability of PythonOn the Necessity and Inapplicability of Python
On the Necessity and Inapplicability of PythonTakeshi Akutsu
 
Stapyユーザーガイド
StapyユーザーガイドStapyユーザーガイド
StapyユーザーガイドTakeshi Akutsu
 
stapy_fukuoka_01_akutsu
stapy_fukuoka_01_akutsustapy_fukuoka_01_akutsu
stapy_fukuoka_01_akutsuTakeshi Akutsu
 
Python初心者が4年で5000人のコミュニティに作ったエモい話
Python初心者が4年で5000人のコミュニティに作ったエモい話Python初心者が4年で5000人のコミュニティに作ったエモい話
Python初心者が4年で5000人のコミュニティに作ったエモい話Takeshi Akutsu
 
Scipy Japan 2019参加レポート
Scipy Japan 2019参加レポートScipy Japan 2019参加レポート
Scipy Japan 2019参加レポートTakeshi Akutsu
 
Scipy Japan 2019の紹介
Scipy Japan 2019の紹介Scipy Japan 2019の紹介
Scipy Japan 2019の紹介Takeshi Akutsu
 
みんなのPython勉強会 in 長野 #3, Intro
みんなのPython勉強会 in 長野 #3, IntroみんなのPython勉強会 in 長野 #3, Intro
みんなのPython勉強会 in 長野 #3, IntroTakeshi Akutsu
 
みんなのPython勉強会#35 まとめ
みんなのPython勉強会#35 まとめみんなのPython勉強会#35 まとめ
みんなのPython勉強会#35 まとめTakeshi Akutsu
 
モダンな独学の道。そうだ、オープンソースでいこう!
モダンな独学の道。そうだ、オープンソースでいこう!モダンな独学の道。そうだ、オープンソースでいこう!
モダンな独学の道。そうだ、オープンソースでいこう!Takeshi Akutsu
 
プログラミング『超入門書』から見るPythonと解説テクニック
プログラミング『超入門書』から見るPythonと解説テクニックプログラミング『超入門書』から見るPythonと解説テクニック
プログラミング『超入門書』から見るPythonと解説テクニックTakeshi Akutsu
 
We are OSS Communities: Introduction of Start Python Club
We are OSS Communities: Introduction of Start Python ClubWe are OSS Communities: Introduction of Start Python Club
We are OSS Communities: Introduction of Start Python ClubTakeshi Akutsu
 
ドコモAIエージェントAPIのご紹介
ドコモAIエージェントAPIのご紹介ドコモAIエージェントAPIのご紹介
ドコモAIエージェントAPIのご紹介Takeshi Akutsu
 

More from Takeshi Akutsu (20)

万年ビギナーによるPythonプログラミングのリハビリ計画
万年ビギナーによるPythonプログラミングのリハビリ計画万年ビギナーによるPythonプログラミングのリハビリ計画
万年ビギナーによるPythonプログラミングのリハビリ計画
 
Stapyの6年~本との出会いから生まれた技術コミュニティ~
Stapyの6年~本との出会いから生まれた技術コミュニティ~Stapyの6年~本との出会いから生まれた技術コミュニティ~
Stapyの6年~本との出会いから生まれた技術コミュニティ~
 
Start Python Club 2020年活動報告
Start Python Club 2020年活動報告Start Python Club 2020年活動報告
Start Python Club 2020年活動報告
 
みんなのPython勉強会#59 Intro
みんなのPython勉強会#59 IntroみんなのPython勉強会#59 Intro
みんなのPython勉強会#59 Intro
 
On the Necessity and Inapplicability of Python
On the Necessity and Inapplicability of PythonOn the Necessity and Inapplicability of Python
On the Necessity and Inapplicability of Python
 
Stapyユーザーガイド
StapyユーザーガイドStapyユーザーガイド
Stapyユーザーガイド
 
stapy_fukuoka_01_akutsu
stapy_fukuoka_01_akutsustapy_fukuoka_01_akutsu
stapy_fukuoka_01_akutsu
 
Python初心者が4年で5000人のコミュニティに作ったエモい話
Python初心者が4年で5000人のコミュニティに作ったエモい話Python初心者が4年で5000人のコミュニティに作ったエモい話
Python初心者が4年で5000人のコミュニティに作ったエモい話
 
Scipy Japan 2019参加レポート
Scipy Japan 2019参加レポートScipy Japan 2019参加レポート
Scipy Japan 2019参加レポート
 
Scipy Japan 2019の紹介
Scipy Japan 2019の紹介Scipy Japan 2019の紹介
Scipy Japan 2019の紹介
 
みんなのPython勉強会 in 長野 #3, Intro
みんなのPython勉強会 in 長野 #3, IntroみんなのPython勉強会 in 長野 #3, Intro
みんなのPython勉強会 in 長野 #3, Intro
 
Introduction
IntroductionIntroduction
Introduction
 
みんなのPython勉強会#35 まとめ
みんなのPython勉強会#35 まとめみんなのPython勉強会#35 まとめ
みんなのPython勉強会#35 まとめ
 
モダンな独学の道。そうだ、オープンソースでいこう!
モダンな独学の道。そうだ、オープンソースでいこう!モダンな独学の道。そうだ、オープンソースでいこう!
モダンな独学の道。そうだ、オープンソースでいこう!
 
LT_by_Takeshi
LT_by_TakeshiLT_by_Takeshi
LT_by_Takeshi
 
Orientation
OrientationOrientation
Orientation
 
Introduction
IntroductionIntroduction
Introduction
 
プログラミング『超入門書』から見るPythonと解説テクニック
プログラミング『超入門書』から見るPythonと解説テクニックプログラミング『超入門書』から見るPythonと解説テクニック
プログラミング『超入門書』から見るPythonと解説テクニック
 
We are OSS Communities: Introduction of Start Python Club
We are OSS Communities: Introduction of Start Python ClubWe are OSS Communities: Introduction of Start Python Club
We are OSS Communities: Introduction of Start Python Club
 
ドコモAIエージェントAPIのご紹介
ドコモAIエージェントAPIのご紹介ドコモAIエージェントAPIのご紹介
ドコモAIエージェントAPIのご紹介
 

Recently uploaded

LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイスCRI Japan, Inc.
 
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Hiroshi Tomioka
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルCRI Japan, Inc.
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video UnderstandingToru Tamaki
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NTT DATA Technology & Innovation
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)Hiroshi Tomioka
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Gamesatsushi061452
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...Toru Tamaki
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 

Recently uploaded (11)

LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 

stapy_028_talk1

  • 2. • 1976年 生まれ – 小学3年生から趣味でプログラミングを開始 • 1995-1999年 慶應義塾大学SFC 環境情報学部 – NRIにてナレッジマネジメントシステムを企画・開発 • 1999-2000年 サン・マイクロシステムズ – シリコンバレーの米国本社にてJava + XMLを用いたサイジングアプリ ケーションを開発、E3 Award受賞 – カリフォルニア州立大学サクラメント校大学院でのJava+XMLの授業を担 当 • 2000年 アプレッソ起業 – 「日本にエンジニアの楽園のような場所をつくりたい!」 – DataSpiderの企画・開発を開始、半年間で最初のバージョンが完成 – DataSpiderは現在4年連続顧客満足度No.1、3000社を超える導入実績 • 2013年 セゾン情報システムズ CTO – アプレッソ株式を売却 – 常務取締役 CTO テクノベーションセンター長 – AWS re:invent 2015にてThink Big Award受賞 – 2017年、遂にHULFTは世界2位に! 2 自己紹介
  • 3. • 未踏ソフトウェア創造事業 – PICSY(伝播貨幣) シミュレータークライアント設計&実装 (2002年) – Galapagos(XM会議ツール) 共同開発者 (2004年) • 日経ソフトウェア – 巻頭連載「小野和俊のプログラマ独立独歩」(2007-2010年) • 九州大学 工学部大学院 – 「高度ICTリーダーシップ特論」 非常勤講師 (2008-2011年) 3 自己紹介
  • 4. 株式会社アプレッソ 本 社 東京都文京区関口1-20-10 住友不動産江戸川橋駅前ビル 代表取締役社長 小野 和俊 2001年 6月 DataSpider製品 最初のユーザとしてNHK様に導入(全国高校野球地方予選大会の結果をWeb掲載) 2002年10月 財団法人ソフトウェア情報センター(SOFTIC)選定「2002年度ソフトウェア・プロダクト・オブ・ザ・イヤー」受賞 2003年 1月 DataSpider採用の清水建設様工事・建物DBシステム 日経コンピュータ 「第7回情報システム大賞」グランプリ受賞 2004年11月 慶応義塾大学(藤沢)による SFC Entrepreneur Award 2004 Silver Award受賞 2008年 8月 DataSpiderが 「Microsoft Innovation Award 2008 優秀賞」を受賞 2009年 4月 「つなぐ」第2弾製品 「PIMSYNC」発表 2010年 4月 「つなぐ」第3弾製品 「DataSpider BPM」発表 2010年 9月 DataSpider 2.4 IPA(独立行政法人 情報処理推進機構) 連携プログラム技術評価制度 評価書を取得 2011年 3月 クラウド連携にフォーカスした DataSpider 3.0 を発表 2012年 2月 DataSpider Servista3.0 財団法人 全国地域情報化推進協会(APPLIC) 地域情報プラットフォーム準拠認定 2013年 3月 株式会社セゾン情報システムズと資本・業務提携 2014年 3月 DataSpiderシリーズ 出荷累計 2000社突破 2015年 4月 「つなぐ」第4弾製品 「Thunderbus」発表 2015年11月 DataSpiderシリーズ 出荷累計 2500社突破 2016年 2月 IoT連携プラットフォーム「DataSpider Servista 4.0」を発表 2017年 1月 クラウド型データインテグレーションサービス「DataSpider Cloud」を提供開始 4 会社概要 「つくる」から「つなぐ」 をコンセプトに データ連携のソリューションを展開しています
  • 5. 会社概要:セゾン情報システムズ  会社概要 商 号 株式会社セゾン情報システムズ 設立年月日 1970 年 9 月 1 日 代表取締役 社 長 内 田 和 弘 資 本 金 13億6,768万7,500円 事 業 内 容 ‣ カードシステムソリューション事業 ‣ 流通・ITソリューション事業 ‣ 通信基盤ミドルウェア(HULFT)事業 従 業 員 数 1,203名(連結) 657名(単体) 本社所在地 東京都豊島区東池袋三丁目1番1号 上 場 市 場 東京証券取引所JASDAQスタンダード市場(9640) 主 要 株 主 (上位3位) ‣ 株式会社クレディセゾン ‣ ロイヤルバンクオブカナダトラストカンパニー(ケイマン)リミ テッド ‣ イーシーエム マスターファンド エスピーヴイ ワン 認定・届出 総務省 電気通信事業者届出 品質 セキュリ ティ ‣ プライバシーマーク付与認定取得 ・登録番号 【11820059(09)】 ‣ JISQ9001:2015(ISO9001:2015)認証取得 ・登録番号 【JMAQA-041】 ‣ JISQ27001:2014(ISO/IEC27001:2013) 認証取得 ・登録番号 【JMAQA-S030】 ‣ JISQ20000-1:2012(ISO/IEC20000-1:2011) 認証取得 ・登録番号 【JMAQA-T002】 ・登録範囲 【システムサービスセンター、テクノベーションセン ター、ビジネスサポート部、監査部】 (2016年9月30日現在) 1970年 1992年 ㈱西武情報センター設立・創業 西武流通グループ(当時)の情報処理機能の統合と新しい情報サービス 業の創造を目的として、設立。情報処理サービス事業、ソフトウェア開 発事業を開始。 ㈱セゾン情報システムズに商号変更 信販業務システムを中心に情報サービス拡大・強化のため㈱緑屋計算セ ンターを吸収合併(1981年)、豊島区のコンピュータ専用ビルに移転 (1984年)し、総合サービス企業としての基盤を整備。 1993年 JASDAQスタンダード市場に上場 通信ミドルウェア「HULFT」販売開始 業種・業界を問わず、全世界で43ヵ国、8,600社、185,800本、世界売 上シェア第4位、国内シェア第1位の実績を誇るファイル転送ミドルウェ ア販売・保守・ソリューション事業の源となる。(2016年9月末時点) 2005年 ㈱流通情報ソリューションズを吸収合併 流通システム事業の経営資源の集中、強化。旧西武流通グループから蓄 積した技術・ノウハウの成熟させ、業務を“つなぐ”クラウドインテグ レーターとしてお客様事業を支える流通・ITソリューション事業に発展 する。 2010年 クラウド関連製品・サービス提供開始 webデータ連携「HULFTクラウド」、クラウド型ホスティングサービス 「SAISOS」を提供開始。クラウド&グローバル時代に求められるニー ズに対応するための技術・環境を整備。 2015年 ASEAN拠点 HULFT Pte. Ltd.設立 2013年 ㈱アプレッソ株式を取得、子会社化 データ連携ソリューションの強化とともに、先端技術の研究開発経営の 基盤を醸成。 2016年 北米拠点 HULFT, Inc.を設立 2005年に中国拠点の世存信息技術(上海)有限公司設立を皮切りにグ ローバルビジネス拡大を図るため、ASEAN、北米拠点会社を設立。米国 開催 AWS re:Invent 2015で「Think Big」賞を受賞。 5
  • 6. © 2017 APPRESSO K.K. All Rights Reserved. 6 そもそもなんで DataSpiderをつくったのか?
  • 7. © 2017 APPRESSO K.K. All Rights Reserved. 7 大学時代のNRIでの開発のバイトでの教訓 「このシステムは・・・ テキストベースの言語で書くと辛い!」
  • 8. © 2017 APPRESSO K.K. All Rights Reserved. 8 AIと言えば データインテグレーションのお話です
  • 9. データインテグレーションツール •可視化 •予兆検知 •データガバナンス Sensor IoT Factory Mobile FA ERP HR DWH EDI 機械学習 データ インテグレーション ツール ビッグデータ ・データフローコントロール ・ダイナミックルーティング ・データマネジメント © 2017 APPRESSO K.K. All Rights Reserved. 9
  • 10. DataSpider ServistaのGUIと開発イメージ 入力 変換 出力 一連の処理の流れ=スクリプト DataSpider Studio アダプタ アダプタコンバータ ア ダ プ タ 群 © 2017 APPRESSO K.K. All Rights Reserved. 10
  • 13. データベース ■ Microsoft Access ■ DB2 ■ DB2 for i ■ MySQL ■ Oracle ■ PostgreSQL ■ Microsoft SQL Server グループウェア ■ IBM Domino ■ IBM Notes クラウド ■ Amazon Web Services ■ Cloudn ■ Google Apps ■ Microsoft Azure ネットワーク ■ FTP ■ JMS ■ Web ■ Webサービス ■ メール ■ Active Directory ■ REST SDK ■ 追加アダプタ開発 ■ JDBC ■ ODBC ■ NeoCore ■ Shunsaku ■ MongoDB アプリケーション ■ DataSpider BPM ■ Thunderbusコネクタ ■ SAP ・SAP ・SAP BC ・SAP テーブルクエリ(差分抽出) ・ERP Adapter for SAP Basic Edition ※6 ・ERP Adapter for SAP Table Query Edition ※6 ・ERP Adapter for SAP Advanced Edition ※6 ■ HULFT ■ Microsoft Dynamics AX ※4 ■ Dr.Sum EA ■ SVF ■ StraForm-X(コネクタ) ■ 勘定奉行V ERP ※5 ■ 商蔵奉行V ERP ※5 ■ Sedue ■ List Creator ■ Xuras inicio ■ メインフレーム ■ Oracle EBS ※3 ■ Tableau ※6 ■ Microsoft Dynamics CRM ファイル ■ CSV ■ Microsoft Excel ■ HTML ■ XML ■ 固定長 ■ 可変長 ■ ファイル操作 ■ ファイルシステム ■ Apache™ Hadoop® ※2 ■ ニフティクラウド ■ Salesforce ・Log Manager for Salesforce ■ GAEデータストア ※1 ■ kintone クラウドからビッグデータまで様々なシステムへ対応 多種多様なシステムへの対応 ※1:販売元は、株式会社ティー・シー・エフ様です。 ※2: Apache™ Hadoop® アダプタの正式製品名は「DataSpider アダプタ for Apache™ Hadoop®」です。 ※3:Oracle EBS はOracleアダプタで接続できます。 ※4:本製品は古河インフォメーション・テクノロジー株式会社様の製品です。 ※5:販売元は、日本電通株式会社様です。 ※6: 販売元は、SCSK 株式会社様です。 ※1,※4,※5,※6 は代理販売によって提供致します。 © 2017 APPRESSO K.K. All Rights Reserved. 13
  • 14. 外部からの呼び出し HTTP、SAP、Webサービス、ファイルイベント、スケジューラ、専用クライアント、Java API 、データ ベース、FTP、HULFT、AmazonSQS、Azure Service bus DataSpider 実行サーバ アダプタ トリガー スケジューラ 販売管理DB メールサーバ FTPサーバ在庫管理DB 購買管理DB SAPHTTP Webサービス ファイル イベント 運用監視 ツール Java API データベース HULFT Azure Service Bus FTPサーバ 様々なタイミングで連携処理を自動実行可能 Amazon SQS © 2017 APPRESSO K.K. All Rights Reserved. 14
  • 15. 高速なパフォーマンス モジュール モジュール モジュール コンパイル コンパイル方式でJavaのプログラムと変わらないパフォーマンスを実現 DataSpider Studio DataSpider Server • 高速なデータ連携実行環境 – GUIで開発を行った処理フローやデータフローは、DataSpider 内部で Java プログラムに変換後処理実行を行うため、プログラムによる開発・ 実装と遜色ない高速な処理パフォーマンスを実現 © 2017 APPRESSO K.K. All Rights Reserved. 15
  • 17. 結合 集計ソート MSC DataSpider Servista V4 新開発の高速エンジン マルチストリームコンバータ 大容量データ対応② 結合処理は従来のバージョンより10~15倍のパフォーマンス向上 新エンジン採用により集計/結合/ソートを高速化 © 2017 APPRESSO K.K. All Rights Reserved. 17
  • 18. 仕様書出力機能 ボタンひとつで作った処理を仕様書に出力可能 • 仕様書出力機能 – 開発内容の文書化と設定情報の確認を可能にします。 – メンテナンス時の設定確認や引き継ぎ等の作業に使用可能です。 © 2017 APPRESSO K.K. All Rights Reserved. 18
  • 19. 1. CSV連携パターン a. Pythonで読み込むCSVをDataSpiderで生成 b. PythonでのCSV生成をトリガーにDataSpiderで各種データ ソースに反映 → CSVとのやり取りだけ意識すれば後はDataSpiderがCSV⇔各 種システムとの同期・連携をやってくれる 2. 直接呼び出し a. PythonからDataSpiderスクリプトを実行(RESTful API/ Web Services / コマンド実行 etc.) b. DataSpiderスクリプト内でPythonのコードを実行 → Pythonの処理の一部をDataSpiderに委譲することができる / DataSpiderの処理の一部をPythonに委譲することができる © 2017 APPRESSO K.K. All Rights Reserved. 19 Pythonとの2つの連携パターン
  • 20. © 2017 APPRESSO K.K. All Rights Reserved. 20 AIと言えば AI x DI
  • 21. 1.データ準備 2.モデル作成 3.モデル検証 © 2017 APPRESSO K.K. All Rights Reserved. 21 機械学習、深層学習のステップ
  • 22. for (;期待する結果が得られるまで;) { 1.データ準備 2.モデル作成 3.モデル検証 } © 2017 APPRESSO K.K. All Rights Reserved. 22 実際の機械学習、深層学習のステップ
  • 23. for (;期待する結果が得られるまで;) { 1. データ準備 2.モデル作成 3.モデル検証 } © 2017 APPRESSO K.K. All Rights Reserved. 23 各ステップにかけたい時間
  • 24. for (;期待する結果が得られるまで;) { 1.データ準備 2. モデル作成 3. モデル検証 } © 2017 APPRESSO K.K. All Rights Reserved. 24 実際の各ステップにかかる時間 80%もの時間がデータ準備に 費やされているというデータもあります
  • 25. • データってどこにあります? • それらのフォーマットってどうなっています? • 同じ意味のデータは同じデータになってい ます? © 2017 APPRESSO K.K. All Rights Reserved. 25 なぜそうなるのか?
  • 27. © 2017 APPRESSO K.K. All Rights Reserved. 27 データの所在 データベース? ファイル? サービス/API? 基幹システム/ホスト?
  • 28. • データベース – Oracle、DB2、SQL Server、PosgreSQL、 MySQL・・・ • ファイル – フラットファイル、Excel、ログ・・・ • サービス/API – クラウドサービス、オープンデータ・・・ • 基幹システム/ホスト – SAP、Domino/Notes、IBM z、MSP/XSP・・・ © 2017 APPRESSO K.K. All Rights Reserved. 28 データの取得
  • 29. • 認証方法 – BASIC認証、ダイジェスト認証、NTLM認証、OAuth認証、SAML認 証・・・ • API/接続方式 – JDBC/ODBC、HTTP/HTTPS、Socket、SAP JCo、Notes C API、 POI/JExcel API • プログラミング言語 – Java、.NET、C/C++、アセンブラ • 型 – 数値(Integer、Float、Double)、文字列(CHAR、VARCHAR)、日 付・・・ • エラーハンドリング/パフォーマンスチューニング – タイムアウト、フェッチ/バッチサイズ・・・ © 2017 APPRESSO K.K. All Rights Reserved. 29 必要な技術
  • 30. © 2017 APPRESSO K.K. All Rights Reserved. 30 AIと言えばすべてのデータソースから データを取得するプログラムが組める人?
  • 31. • データベース – 行列・・・ • ファイル – CSV、固定長、可変長、Excel、アクセスログ、アプリケー ションログ、バイナリファイル・・・ • サービス/API – JSON、XML、CSV、変態CSV・・・ • 基幹システム/ホスト – SAP固有、Domino/Notes固有、IBM z固有、MSP/XSP固 有・・・ © 2017 APPRESSO K.K. All Rights Reserved. 31 データフォーマット解析
  • 32. • データフォーマットを解析する力 • データフォーマット解析ライブラリ • 型フォーマット – 日付フォーマット、数値フォーマット • 大規模データ処理 • データフォーマットが変わったときにも対応す る忍耐力 © 2017 APPRESSO K.K. All Rights Reserved. 32 必要な技術
  • 33. © 2017 APPRESSO K.K. All Rights Reserved. 33 AIと言えば データフォーマット解析したい人?
  • 34. • 「JP」と「日本」を同じデータとして扱う • 「東京」と「港区」のデータの意味は同じものとして扱 う? • 全角と半角 • 「2017/07/27」は「27/7/17」と同じ • 日時データの時間はいらない? • 「k」や「m」の単位を合わせる • 欠損データの取扱は? – それとも学習データから除外? © 2017 APPRESSO K.K. All Rights Reserved. 34 データ前処理
  • 35. © 2017 APPRESSO K.K. All Rights Reserved. 35 AIと言えば データ前処理したい人?
  • 36. © 2017 APPRESSO K.K. All Rights Reserved. 36 AIと言えばデータを準備するだけで 結構大変なんです
  • 37. for (;期待する結果が得られるまで;) { 1.データ準備 2. モデル作成 3. モデル検証 } © 2017 APPRESSO K.K. All Rights Reserved. 37 現実の作業時間 80%もの時間がデータ準備に 費やされているというデータもあります
  • 38. for (;期待する結果が得られるまで;) { 1. データ準備 2.モデル作成 3.モデル検証 } © 2017 APPRESSO K.K. All Rights Reserved. 38 理想的な作業時間
  • 39. 1. データの選択 – どのようなデータが分析に使えるのか – そのデータはどこにあるのか 2. データの前処理 – フォーマッティング • DBやファイルのデータを取得します • それぞれのフォーマットを同じフォーマットにします – クリーニング • 欠損データを取り除いたり、不正データを修正したりします – サンプリング • 不要なデータ(あまりにも過去など)を取り除きます 3. データの変換 – クレンジング • 同じ意味のデータは同じものとしてデータを整えます – スケーリング • 桁を合わせます – デコンポジション • 組み合わさったデータを構成されるデータに分割します – 例:日時などのデータを日と時に分割 – アグリゲーション • 複数の特長を持ったデータを一つの特長に集約する – 例:ログイン情報をログイン回数に集約する© 2017 APPRESSO K.K. All Rights Reserved. 39 データ準備まとめ
  • 40. データインテグレーションツールが活躍します •可視化 •予兆検知 •データガバナンス Sensor IoT Factory Mobile FA ERP HR DWH EDI 機械学習 データ インテグレーション ツール ビッグデータ ・データフローコントロール ・ダイナミックルーティング ・データマネジメント © 2017 APPRESSO K.K. All Rights Reserved. 40
  • 41. • 多種多様な接続先を持っています • GUIを持っています • デフォルト値でそれなりに動くように なっています • データ取得の際にはツールの使い方を学 ぶだけです © 2017 APPRESSO K.K. All Rights Reserved. 41 データインテグレーションツールの特長
  • 42. • 接続先を確認しましょう – 接続先がなければ元も子もないですよね • 設定粒度に気を付けましょう – GUIは制約にもなります – どの程度汎用的に処理が組めるのか確認しましょう • データインテグレーションツール自体の品質は良いものを選びま しょう – データインテグレーション自体でそれなりにハマります – ツール自体にハマらないよう品質の良いものを選びましょう • 処理速度は高速なものにしましょう – データはどんどん大きくなっていきます – 処理速度が速いものを選びましょう • 最初はクラウドがいいですよね © 2017 APPRESSO K.K. All Rights Reserved. 42 データインテグレーションツールの選び方
  • 43. © 2017 APPRESSO K.K. All Rights Reserved. 43 ちょっと宣伝
  • 44. • 機械学習のためのデータ準備は結構大変 です • 機械学習ではデータ準備の時間を短くし ましょう • その際にはデータインテグレーション ツールが有効です • DataSpiderがおすすめですw © 2017 APPRESSO K.K. All Rights Reserved. 44 まとめ
  • 45. © 2017 APPRESSO K.K. All Rights Reserved. 45 私たちは仲間を募集しています https://www.appresso.com/recruit/

Editor's Notes

  1. 1
  2. 4
  3. 11
  4. 13
  5. 14
  6. 15
  7. 16
  8. 18
  9. 46