SlideShare una empresa de Scribd logo
1 de 47
DEEP LEARNINGを活用した
間取り画像における物体検出
株式会社LIFULL
AI戦略室
椎橋怜史
2019.03.05
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
自己紹介
椎橋 怜史(しいばしさとし)
データサイエンティスト
経歴
2016年LIFULL新卒入社
広告予算最適化、レコメンドなどの
機械学習開発
@shiibass
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
目次
• LIFULL会社紹介
• ABEJA PLATFORM ANNOTATION
• LIFULL事例紹介
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
目次
• LIFULL会社紹介
• ABEJA PLATFORM ANNOTATION
• LIFULL事例紹介
会社名
証券コード 2120(東証第一部)
代表者 代表取締役社長 井上 高志
沿革 1997年3月12日 設立
2006年10月 東証マザーズ上場
2010年3月 東証一部へ市場変更
資本金 3,999百万円
発行済株式数 118,789,100株(内、自己株式数73,736株)
連結従業員数 1,251名(内、臨時雇用者数220名、海外子会社125名)
主な株主 LIFULL役員、楽天株式会社(20%)
主な子会社
( )は議決権比率
Trovit Search, S.L. (100%)
株式会社LIFULL Marketing Partners(100%)
LIFULL のご紹介
一人ひとりのご要望を追求し、最適な
住まい探しを提案します。
のご紹介
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
プライスマップ
不動産価格を機械学習で予測・可視化
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
かざして検索
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
目次
• LIFULL会社紹介
• ABEJA PLATFORM ANNOTATION
• LIFULL事例紹介
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
ABEJA PLATFORMの全体像
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
一言で言えば
機械学習開発を効率化するクラウドサービス
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
ABEJA PLATFORMの機能
ABEJA Platformは開発・運用に必要なパイプラインをサポートする機能が充実しているため、AIの
ビジネスへの実装を短期間で実現し、継続して精度を維持・向上することができます。
取得したデータをスケーラブルにデータレイクへ格納し、
蓄積したデータのバリデーションを実行します。
教師データ作成(アノテーション)を効率的に実現するサ
ービスを提供します。
システムや多数のIoTデバイスとABEJA Platformが接続し、自
動的に負荷分散を行いながらデータの取得を行うことができ
ます。
1
2
3
4
5
取得
蓄積
学習
デプロイ
推論・再学習
GPUを使った学習環境が用意されており効率的にモデルの開発
ができます。チューニング時の学習データ、モデルなどのバー
ジョンをGUIツールで管理することにより、開発の時間短縮を
図れます。
学習ごとに自動的に精度評価を行うことができます。評価後
モデルを選択するだけで、IoTデバイスを含めた本番環境へ自
動的にデプロイを行うことができます。
システムの監視機能が標準装備され、デバイスの故障や異常を
検知します。スケジュール機能により、ユーザの任意のタイミ
ングでモデルの再学習が可能です。
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
ABEJA PLATFORMのLIFULLでの活用範囲
LIFULLではアノテーション(教師データ作成)機能を利用しています。
取得したデータをスケーラブルにデータレイク
へ格納し、蓄積したデータのバリデーションを
実行します。
教師データ作成(アノテーション)を効率的に
実現するサービスを提供 します。
2
蓄積・アノテーション
学習以降のプロセスはLIFULLの環境内で
開発・運用しています。
蓄積・アノテーション
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
アノテーションとは?
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
教師データ作成(アノテーション)の例
画像を保存していたとして、
こういう情報も
保管していますか?
• 犬であること
• 犬の種類
• 毛色
• 着ている服
• 犬が何をしている様子なのか123912301273123.jpg
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
教師データ作成(アノテーション)の例
画像を保存していたとして、
こういう情報も
保管していますか?
• 犬であること
• 犬の種類
• 毛色
• 着ている服
• 犬が何をしている様子なのか123912301273123.jpg
画像だけでは足りない
情報がある
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
教師データ作成(アノテーション)の例
明示的に何を表すかをマーク
づけするのがアノテーション
作業
• 犬であること → ”dog”
• 犬の種類 → ”〇〇”
• 毛色 → ”△色”
• 着ている服
• 犬が何をしている様子なのか123912301273123.jpg
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
教師データ作成にこだわる理由
• 教師データを必要とするタスクが多い
• 画像やテキスト、音声などのデータを持っていても学習させ
るラベルは持っていないケースが多い
• 人力で教師ラベルを作る必要があるケースが多い
• 高性能なモデルの開発にはアルゴリズムだけでなく、データ
の質も重要
• だけどデータ作成の人手が足りない
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
そのための
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
ABEJA PLATFORM ANNOTATION
データをアップロードしてアノテーション
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
ABEJA PLATFORM ANNOTATION
間取り画像の壁やアイコンにアノテーション
水色:寝室
黄色:キッチン
ピンク:壁
トイレ、クローゼット
など
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
皆さんがいだきそうな疑問を考えてみました
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
学習で重要なアノテーション作業を
外部に依頼してデータの質ってどうなの?
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
データの質
• ABEJAではワーカーの作業をレビューしていて、質の
低下を防いでいる
• アノテーションのルールを明確にして、それに従って
作業している
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
ちゃんとやってくれなかったらどうしよう
学習の精度落ちる
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
ABEJAのデータ作成業務の質を確認
• チェック用のダミーデータを混ぜて精度確認
• 並行して他社にも同じ作業を依頼
ABEJA、もう1社ともにデータの質は問題ない
丁寧にアノテーションしてくれました
結果的に… 当初想定していたよりも
少ないデータ量で学習ができた
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
どうしてABEJAにしたの?
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
アノテーション作業をABEJAに依頼した理由
• 正直、どこでもよかった(ちゃんとやってくれるなら)
• あえて言うなら、安いところがいい
2社試した結果、
もう一社はアノテーション用ツールや先方での作業管
理方法などの準備が大変だった
→ そういう環境を整えているのが
ABEJA Platform Annotationの選定理由になる
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
AWS SageMaker Ground Truth出たけど?
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
AWS Sagemaker Ground Truthとは
• ABEJA PLATFORM ANNOTATION類似サービス
• クラウドソーシングも利用可能
• 今外注するならAWSも検討にいれるべき
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
どっち選ぶ?
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
決め手になりそうなこと
金額
見積もりを出してみるしかない
データの質
ABEJAはGood,
AWSは使ってないので質は不明。
ワーカーが日本人じゃなかったら要件定義(ルール作成)が難しいかも?
アノテーションタスク
ABEJAの方が対応可能なタスクが多い (2019年1月時点)
- ABEJA : Video, Classify, Detection, Text, Segmentation Selectable, Speech to Text, Image to Text,
Polygon
- AWS : Text, Classify, Detection, Segmentation, Selectable
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
その他
https://qiita.com/advent-calendar/2018/abejaplatform
• ABEJA PLATFORMの活用についての記事です
• 純粋にMLOpsの技術勉強にもなります
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
目次
• LIFULL会社紹介
• ABEJA PLATFORM ANNOTATION
• LIFULL事例紹介
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
間取り図を解析して3Dモデルを作る
間取り図
物体認識・間取り構造推定
参考論文“Raster-to-Vector: Revisiting Floorplan Transformation”
〇m
縮尺・長さ推定
部屋の
3Dモデル
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
間取り画像のアノテーションを変換
間取り画像→テキストデータ(座標とラベル)
515.0 912.0 657.0 930.0 balcony
583.0 133.0 638.0 152.0 bathroom
661.0 104.0 758.0 247.0 bathtub
204.0 236.0 343.0 262.0 bedroom
← で作成したデータ
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
人間の骨格認識技術を応用する
Pose Estimation(骨格認識)技術
学習済みモデルも公開されてる
※Human pose estimation via Convolutional Part Heatmap Regressionから抜粋
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
画像と座標データを学習させて
間取りの骨格を認識
ドアの骨格
壁の交差点の骨格
この形→
predict
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
画像と座標データを学習させて
間取りの骨格を認識
ドアの骨格
壁の交差点の骨格
この形→
間取り画像のどこにパーツがあるかをそれぞれ学習させる
predict
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
学習済みモデルの重みを初期値にして学習
(転移学習)
メリット
• 少ないデータ数で学習可能
• 学習時間の短縮(低コスト)
画像と座標データを学習させて
間取りの骨格を認識
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
骨格情報から部屋情報を推定する
人間の骨格は一意(頭→首→胴体など)
部屋構造は一意ではない
ドアの骨格 壁の骨格
キッチンカウンターの骨格
などその他いくつか
骨格情報から
矛盾が起きない
部屋構造を推定する
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
制約充足問題に定式化
機械学習(ML)
・制約なし(基本的には)
・損失関数の最小解を探索
・凸最適化(基本的には)
制約充足問題(CSP)
・制約条件を満たす解を探索
・基本的にNP問題
CSP
最適化
機械学習
教師あり
イメージ↑
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
制約充足問題の例
虫食い算
A B C D
C A E F+
G D B C A
A~Gは0から9のいずれかで
それぞれ異なる
制約:
0 <= A,B,…, G <= 9, Integer
A != B, A != C,…, F != G
x, y,… ダミー変数
D + F = 10 * x + A
C + E + x= 10 * y + C
…
巨大になればなるほど総当たり計算や
ルールベースロジックは対応しにくくなる
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
制約充足問題に定式化
• ドアや窓は壁と密着している
• 部屋は四方を壁で囲まれている
• その他
などの制約をすべて満たす解釈方法を探索
壁の骨格ドアの骨格
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
学習結果
Predict
and
Optimize
Predict …
Optimize …
ディープラーニングで物体を認識
認識したパーツを組み合わせ、無矛盾
な解釈を探索する
© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
将来の展望
Predict
Optimize
3D Rendering ※イメージ
ご清聴、ありがとうございました
Ask the Speakerコーナーでお会いしましょう

Más contenido relacionado

Más de LIFULL Co., Ltd.

3D間取りを支える技術
3D間取りを支える技術3D間取りを支える技術
3D間取りを支える技術LIFULL Co., Ltd.
 
LIFULL HOME'Sのおとり広告予測モデルの開発
LIFULL HOME'Sのおとり広告予測モデルの開発LIFULL HOME'Sのおとり広告予測モデルの開発
LIFULL HOME'Sのおとり広告予測モデルの開発LIFULL Co., Ltd.
 
大企業でアジャイル開発を推進できる条件とその心構え
大企業でアジャイル開発を推進できる条件とその心構え大企業でアジャイル開発を推進できる条件とその心構え
大企業でアジャイル開発を推進できる条件とその心構えLIFULL Co., Ltd.
 
スクラムを利用したアジャイルオフショア開発のとりくみ
スクラムを利用したアジャイルオフショア開発のとりくみスクラムを利用したアジャイルオフショア開発のとりくみ
スクラムを利用したアジャイルオフショア開発のとりくみLIFULL Co., Ltd.
 
実践 マーケティングテクノロジーエンジニア
実践 マーケティングテクノロジーエンジニア実践 マーケティングテクノロジーエンジニア
実践 マーケティングテクノロジーエンジニアLIFULL Co., Ltd.
 
エンジニア × マーケティングテクノロジー が必要な理由
エンジニア × マーケティングテクノロジー が必要な理由エンジニア × マーケティングテクノロジー が必要な理由
エンジニア × マーケティングテクノロジー が必要な理由LIFULL Co., Ltd.
 
「空飛ぶホームズくん」を実現するVR技術
「空飛ぶホームズくん」を実現するVR技術「空飛ぶホームズくん」を実現するVR技術
「空飛ぶホームズくん」を実現するVR技術LIFULL Co., Ltd.
 
ニオイセンサで思索する街の新たな指標
ニオイセンサで思索する街の新たな指標ニオイセンサで思索する街の新たな指標
ニオイセンサで思索する街の新たな指標LIFULL Co., Ltd.
 
Well-beingを測る「LIFE WILL」開発の舞台裏
Well-beingを測る「LIFE WILL」開発の舞台裏Well-beingを測る「LIFE WILL」開発の舞台裏
Well-beingを測る「LIFE WILL」開発の舞台裏LIFULL Co., Ltd.
 
㊗ LINE新着物件通知 リリース!! PJ進行に沿って話す、 PjM/PdMとして やったこと
㊗ LINE新着物件通知 リリース!! PJ進行に沿って話す、 PjM/PdMとして やったこと㊗ LINE新着物件通知 リリース!! PJ進行に沿って話す、 PjM/PdMとして やったこと
㊗ LINE新着物件通知 リリース!! PJ進行に沿って話す、 PjM/PdMとして やったことLIFULL Co., Ltd.
 
ウェブアクセシビリティ推進活動はじめました
ウェブアクセシビリティ推進活動はじめましたウェブアクセシビリティ推進活動はじめました
ウェブアクセシビリティ推進活動はじめましたLIFULL Co., Ltd.
 
大きめレガシープロジェクトのフロント行く末
大きめレガシープロジェクトのフロント行く末大きめレガシープロジェクトのフロント行く末
大きめレガシープロジェクトのフロント行く末LIFULL Co., Ltd.
 
新しい検索体験とデザインシステム
新しい検索体験とデザインシステム新しい検索体験とデザインシステム
新しい検索体験とデザインシステムLIFULL Co., Ltd.
 
3時間でプロトタイプをユーザーにお届け!LIFULLの高速仮説検証プログラムとは?
3時間でプロトタイプをユーザーにお届け!LIFULLの高速仮説検証プログラムとは?3時間でプロトタイプをユーザーにお届け!LIFULLの高速仮説検証プログラムとは?
3時間でプロトタイプをユーザーにお届け!LIFULLの高速仮説検証プログラムとは?LIFULL Co., Ltd.
 
大規模サイト開発と新規事業開発の経験から見たそれぞれの違い
大規模サイト開発と新規事業開発の経験から見たそれぞれの違い大規模サイト開発と新規事業開発の経験から見たそれぞれの違い
大規模サイト開発と新規事業開発の経験から見たそれぞれの違いLIFULL Co., Ltd.
 
CTOの考えるエンジニアマネジメント2
CTOの考えるエンジニアマネジメント2CTOの考えるエンジニアマネジメント2
CTOの考えるエンジニアマネジメント2LIFULL Co., Ltd.
 
【Ltech#11】Kubernetesを利用した機械学習モデルの本番適用例
【Ltech#11】Kubernetesを利用した機械学習モデルの本番適用例【Ltech#11】Kubernetesを利用した機械学習モデルの本番適用例
【Ltech#11】Kubernetesを利用した機械学習モデルの本番適用例LIFULL Co., Ltd.
 
【Ltech#11】ガウス過程回帰を用いた広宣費予測と可視化
【Ltech#11】ガウス過程回帰を用いた広宣費予測と可視化【Ltech#11】ガウス過程回帰を用いた広宣費予測と可視化
【Ltech#11】ガウス過程回帰を用いた広宣費予測と可視化LIFULL Co., Ltd.
 
【Ltech#11】住まい探しにおける 対話AIの自然言語解析技術
【Ltech#11】住まい探しにおける対話AIの自然言語解析技術【Ltech#11】住まい探しにおける対話AIの自然言語解析技術
【Ltech#11】住まい探しにおける 対話AIの自然言語解析技術LIFULL Co., Ltd.
 
【Ltech#11】ディープラーニングで間取り図を3Dにする
【Ltech#11】ディープラーニングで間取り図を3Dにする【Ltech#11】ディープラーニングで間取り図を3Dにする
【Ltech#11】ディープラーニングで間取り図を3DにするLIFULL Co., Ltd.
 

Más de LIFULL Co., Ltd. (20)

3D間取りを支える技術
3D間取りを支える技術3D間取りを支える技術
3D間取りを支える技術
 
LIFULL HOME'Sのおとり広告予測モデルの開発
LIFULL HOME'Sのおとり広告予測モデルの開発LIFULL HOME'Sのおとり広告予測モデルの開発
LIFULL HOME'Sのおとり広告予測モデルの開発
 
大企業でアジャイル開発を推進できる条件とその心構え
大企業でアジャイル開発を推進できる条件とその心構え大企業でアジャイル開発を推進できる条件とその心構え
大企業でアジャイル開発を推進できる条件とその心構え
 
スクラムを利用したアジャイルオフショア開発のとりくみ
スクラムを利用したアジャイルオフショア開発のとりくみスクラムを利用したアジャイルオフショア開発のとりくみ
スクラムを利用したアジャイルオフショア開発のとりくみ
 
実践 マーケティングテクノロジーエンジニア
実践 マーケティングテクノロジーエンジニア実践 マーケティングテクノロジーエンジニア
実践 マーケティングテクノロジーエンジニア
 
エンジニア × マーケティングテクノロジー が必要な理由
エンジニア × マーケティングテクノロジー が必要な理由エンジニア × マーケティングテクノロジー が必要な理由
エンジニア × マーケティングテクノロジー が必要な理由
 
「空飛ぶホームズくん」を実現するVR技術
「空飛ぶホームズくん」を実現するVR技術「空飛ぶホームズくん」を実現するVR技術
「空飛ぶホームズくん」を実現するVR技術
 
ニオイセンサで思索する街の新たな指標
ニオイセンサで思索する街の新たな指標ニオイセンサで思索する街の新たな指標
ニオイセンサで思索する街の新たな指標
 
Well-beingを測る「LIFE WILL」開発の舞台裏
Well-beingを測る「LIFE WILL」開発の舞台裏Well-beingを測る「LIFE WILL」開発の舞台裏
Well-beingを測る「LIFE WILL」開発の舞台裏
 
㊗ LINE新着物件通知 リリース!! PJ進行に沿って話す、 PjM/PdMとして やったこと
㊗ LINE新着物件通知 リリース!! PJ進行に沿って話す、 PjM/PdMとして やったこと㊗ LINE新着物件通知 リリース!! PJ進行に沿って話す、 PjM/PdMとして やったこと
㊗ LINE新着物件通知 リリース!! PJ進行に沿って話す、 PjM/PdMとして やったこと
 
ウェブアクセシビリティ推進活動はじめました
ウェブアクセシビリティ推進活動はじめましたウェブアクセシビリティ推進活動はじめました
ウェブアクセシビリティ推進活動はじめました
 
大きめレガシープロジェクトのフロント行く末
大きめレガシープロジェクトのフロント行く末大きめレガシープロジェクトのフロント行く末
大きめレガシープロジェクトのフロント行く末
 
新しい検索体験とデザインシステム
新しい検索体験とデザインシステム新しい検索体験とデザインシステム
新しい検索体験とデザインシステム
 
3時間でプロトタイプをユーザーにお届け!LIFULLの高速仮説検証プログラムとは?
3時間でプロトタイプをユーザーにお届け!LIFULLの高速仮説検証プログラムとは?3時間でプロトタイプをユーザーにお届け!LIFULLの高速仮説検証プログラムとは?
3時間でプロトタイプをユーザーにお届け!LIFULLの高速仮説検証プログラムとは?
 
大規模サイト開発と新規事業開発の経験から見たそれぞれの違い
大規模サイト開発と新規事業開発の経験から見たそれぞれの違い大規模サイト開発と新規事業開発の経験から見たそれぞれの違い
大規模サイト開発と新規事業開発の経験から見たそれぞれの違い
 
CTOの考えるエンジニアマネジメント2
CTOの考えるエンジニアマネジメント2CTOの考えるエンジニアマネジメント2
CTOの考えるエンジニアマネジメント2
 
【Ltech#11】Kubernetesを利用した機械学習モデルの本番適用例
【Ltech#11】Kubernetesを利用した機械学習モデルの本番適用例【Ltech#11】Kubernetesを利用した機械学習モデルの本番適用例
【Ltech#11】Kubernetesを利用した機械学習モデルの本番適用例
 
【Ltech#11】ガウス過程回帰を用いた広宣費予測と可視化
【Ltech#11】ガウス過程回帰を用いた広宣費予測と可視化【Ltech#11】ガウス過程回帰を用いた広宣費予測と可視化
【Ltech#11】ガウス過程回帰を用いた広宣費予測と可視化
 
【Ltech#11】住まい探しにおける 対話AIの自然言語解析技術
【Ltech#11】住まい探しにおける対話AIの自然言語解析技術【Ltech#11】住まい探しにおける対話AIの自然言語解析技術
【Ltech#11】住まい探しにおける 対話AIの自然言語解析技術
 
【Ltech#11】ディープラーニングで間取り図を3Dにする
【Ltech#11】ディープラーニングで間取り図を3Dにする【Ltech#11】ディープラーニングで間取り図を3Dにする
【Ltech#11】ディープラーニングで間取り図を3Dにする
 

Último

デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NTT DATA Technology & Innovation
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)Hiroshi Tomioka
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案sugiuralab
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 

Último (9)

デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 

【SIX2019 】Deep Learningを活用した間取り画像における物体検出

  • 2. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 自己紹介 椎橋 怜史(しいばしさとし) データサイエンティスト 経歴 2016年LIFULL新卒入社 広告予算最適化、レコメンドなどの 機械学習開発 @shiibass
  • 3. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 目次 • LIFULL会社紹介 • ABEJA PLATFORM ANNOTATION • LIFULL事例紹介
  • 4. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 目次 • LIFULL会社紹介 • ABEJA PLATFORM ANNOTATION • LIFULL事例紹介
  • 5. 会社名 証券コード 2120(東証第一部) 代表者 代表取締役社長 井上 高志 沿革 1997年3月12日 設立 2006年10月 東証マザーズ上場 2010年3月 東証一部へ市場変更 資本金 3,999百万円 発行済株式数 118,789,100株(内、自己株式数73,736株) 連結従業員数 1,251名(内、臨時雇用者数220名、海外子会社125名) 主な株主 LIFULL役員、楽天株式会社(20%) 主な子会社 ( )は議決権比率 Trovit Search, S.L. (100%) 株式会社LIFULL Marketing Partners(100%) LIFULL のご紹介
  • 7. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 プライスマップ 不動産価格を機械学習で予測・可視化
  • 8. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 かざして検索
  • 9. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 目次 • LIFULL会社紹介 • ABEJA PLATFORM ANNOTATION • LIFULL事例紹介
  • 10. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 ABEJA PLATFORMの全体像
  • 11. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 一言で言えば 機械学習開発を効率化するクラウドサービス
  • 12. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 ABEJA PLATFORMの機能 ABEJA Platformは開発・運用に必要なパイプラインをサポートする機能が充実しているため、AIの ビジネスへの実装を短期間で実現し、継続して精度を維持・向上することができます。 取得したデータをスケーラブルにデータレイクへ格納し、 蓄積したデータのバリデーションを実行します。 教師データ作成(アノテーション)を効率的に実現するサ ービスを提供します。 システムや多数のIoTデバイスとABEJA Platformが接続し、自 動的に負荷分散を行いながらデータの取得を行うことができ ます。 1 2 3 4 5 取得 蓄積 学習 デプロイ 推論・再学習 GPUを使った学習環境が用意されており効率的にモデルの開発 ができます。チューニング時の学習データ、モデルなどのバー ジョンをGUIツールで管理することにより、開発の時間短縮を 図れます。 学習ごとに自動的に精度評価を行うことができます。評価後 モデルを選択するだけで、IoTデバイスを含めた本番環境へ自 動的にデプロイを行うことができます。 システムの監視機能が標準装備され、デバイスの故障や異常を 検知します。スケジュール機能により、ユーザの任意のタイミ ングでモデルの再学習が可能です。
  • 13. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 ABEJA PLATFORMのLIFULLでの活用範囲 LIFULLではアノテーション(教師データ作成)機能を利用しています。 取得したデータをスケーラブルにデータレイク へ格納し、蓄積したデータのバリデーションを 実行します。 教師データ作成(アノテーション)を効率的に 実現するサービスを提供 します。 2 蓄積・アノテーション 学習以降のプロセスはLIFULLの環境内で 開発・運用しています。 蓄積・アノテーション
  • 14. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 アノテーションとは?
  • 15. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 教師データ作成(アノテーション)の例 画像を保存していたとして、 こういう情報も 保管していますか? • 犬であること • 犬の種類 • 毛色 • 着ている服 • 犬が何をしている様子なのか123912301273123.jpg
  • 16. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 教師データ作成(アノテーション)の例 画像を保存していたとして、 こういう情報も 保管していますか? • 犬であること • 犬の種類 • 毛色 • 着ている服 • 犬が何をしている様子なのか123912301273123.jpg 画像だけでは足りない 情報がある
  • 17. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 教師データ作成(アノテーション)の例 明示的に何を表すかをマーク づけするのがアノテーション 作業 • 犬であること → ”dog” • 犬の種類 → ”〇〇” • 毛色 → ”△色” • 着ている服 • 犬が何をしている様子なのか123912301273123.jpg
  • 18. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 教師データ作成にこだわる理由 • 教師データを必要とするタスクが多い • 画像やテキスト、音声などのデータを持っていても学習させ るラベルは持っていないケースが多い • 人力で教師ラベルを作る必要があるケースが多い • 高性能なモデルの開発にはアルゴリズムだけでなく、データ の質も重要 • だけどデータ作成の人手が足りない
  • 19. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 そのための
  • 20. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 ABEJA PLATFORM ANNOTATION データをアップロードしてアノテーション
  • 21. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 ABEJA PLATFORM ANNOTATION 間取り画像の壁やアイコンにアノテーション 水色:寝室 黄色:キッチン ピンク:壁 トイレ、クローゼット など
  • 22. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 皆さんがいだきそうな疑問を考えてみました
  • 23. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 学習で重要なアノテーション作業を 外部に依頼してデータの質ってどうなの?
  • 24. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 データの質 • ABEJAではワーカーの作業をレビューしていて、質の 低下を防いでいる • アノテーションのルールを明確にして、それに従って 作業している
  • 25. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 ちゃんとやってくれなかったらどうしよう 学習の精度落ちる
  • 26. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 ABEJAのデータ作成業務の質を確認 • チェック用のダミーデータを混ぜて精度確認 • 並行して他社にも同じ作業を依頼 ABEJA、もう1社ともにデータの質は問題ない 丁寧にアノテーションしてくれました 結果的に… 当初想定していたよりも 少ないデータ量で学習ができた
  • 27. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 どうしてABEJAにしたの?
  • 28. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 アノテーション作業をABEJAに依頼した理由 • 正直、どこでもよかった(ちゃんとやってくれるなら) • あえて言うなら、安いところがいい 2社試した結果、 もう一社はアノテーション用ツールや先方での作業管 理方法などの準備が大変だった → そういう環境を整えているのが ABEJA Platform Annotationの選定理由になる
  • 29. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 AWS SageMaker Ground Truth出たけど?
  • 30. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 AWS Sagemaker Ground Truthとは • ABEJA PLATFORM ANNOTATION類似サービス • クラウドソーシングも利用可能 • 今外注するならAWSも検討にいれるべき
  • 31. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 どっち選ぶ?
  • 32. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 決め手になりそうなこと 金額 見積もりを出してみるしかない データの質 ABEJAはGood, AWSは使ってないので質は不明。 ワーカーが日本人じゃなかったら要件定義(ルール作成)が難しいかも? アノテーションタスク ABEJAの方が対応可能なタスクが多い (2019年1月時点) - ABEJA : Video, Classify, Detection, Text, Segmentation Selectable, Speech to Text, Image to Text, Polygon - AWS : Text, Classify, Detection, Segmentation, Selectable
  • 33. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 その他 https://qiita.com/advent-calendar/2018/abejaplatform • ABEJA PLATFORMの活用についての記事です • 純粋にMLOpsの技術勉強にもなります
  • 34. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 目次 • LIFULL会社紹介 • ABEJA PLATFORM ANNOTATION • LIFULL事例紹介
  • 35. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 間取り図を解析して3Dモデルを作る 間取り図 物体認識・間取り構造推定 参考論文“Raster-to-Vector: Revisiting Floorplan Transformation” 〇m 縮尺・長さ推定 部屋の 3Dモデル
  • 36. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 間取り画像のアノテーションを変換 間取り画像→テキストデータ(座標とラベル) 515.0 912.0 657.0 930.0 balcony 583.0 133.0 638.0 152.0 bathroom 661.0 104.0 758.0 247.0 bathtub 204.0 236.0 343.0 262.0 bedroom ← で作成したデータ
  • 37. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 人間の骨格認識技術を応用する Pose Estimation(骨格認識)技術 学習済みモデルも公開されてる ※Human pose estimation via Convolutional Part Heatmap Regressionから抜粋
  • 38. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 画像と座標データを学習させて 間取りの骨格を認識 ドアの骨格 壁の交差点の骨格 この形→ predict
  • 39. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 画像と座標データを学習させて 間取りの骨格を認識 ドアの骨格 壁の交差点の骨格 この形→ 間取り画像のどこにパーツがあるかをそれぞれ学習させる predict
  • 40. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 学習済みモデルの重みを初期値にして学習 (転移学習) メリット • 少ないデータ数で学習可能 • 学習時間の短縮(低コスト) 画像と座標データを学習させて 間取りの骨格を認識
  • 41. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 骨格情報から部屋情報を推定する 人間の骨格は一意(頭→首→胴体など) 部屋構造は一意ではない ドアの骨格 壁の骨格 キッチンカウンターの骨格 などその他いくつか 骨格情報から 矛盾が起きない 部屋構造を推定する
  • 42. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 制約充足問題に定式化 機械学習(ML) ・制約なし(基本的には) ・損失関数の最小解を探索 ・凸最適化(基本的には) 制約充足問題(CSP) ・制約条件を満たす解を探索 ・基本的にNP問題 CSP 最適化 機械学習 教師あり イメージ↑
  • 43. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 制約充足問題の例 虫食い算 A B C D C A E F+ G D B C A A~Gは0から9のいずれかで それぞれ異なる 制約: 0 <= A,B,…, G <= 9, Integer A != B, A != C,…, F != G x, y,… ダミー変数 D + F = 10 * x + A C + E + x= 10 * y + C … 巨大になればなるほど総当たり計算や ルールベースロジックは対応しにくくなる
  • 44. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 制約充足問題に定式化 • ドアや窓は壁と密着している • 部屋は四方を壁で囲まれている • その他 などの制約をすべて満たす解釈方法を探索 壁の骨格ドアの骨格
  • 45. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 学習結果 Predict and Optimize Predict … Optimize … ディープラーニングで物体を認識 認識したパーツを組み合わせ、無矛盾 な解釈を探索する
  • 46. © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。© LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。 将来の展望 Predict Optimize 3D Rendering ※イメージ