SlideShare una empresa de Scribd logo
1 de 103
Descargar para leer sin conexión
2016/2/18
ヤフオク!における機械学習
~深層学習、分散表現~
山下 勝司(やまかつ)
ヤフオク!カンパニー ヤフオク!開発本部
サイエンス部サイエンス
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
自己紹介
本名: 山下 勝司
通称: やまかつ
2015年1月中途入社
ヤフオク!カンパニー所属
ヤフオク!の機械学習周りを担当
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
ヤフオク!について
※1: 2015年6月実績 ※2: 2015年6月22日実績
※3: Nielsen NetView(家庭および職場からのPCによるアクセス。アプリは除く)Nielsen Mobile NetView(Android+iOS / アプリいずれも含む)
2015/04「訪問者数」データ、「オークション」サブカテゴリ
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
ヤフオク!について
サービス開始:1999年
※1: 2015年6月実績 ※2: 2015年6月22日実績
※3: Nielsen NetView(家庭および職場からのPCによるアクセス。アプリは除く)Nielsen Mobile NetView(Android+iOS / アプリいずれも含む)
2015/04「訪問者数」データ、「オークション」サブカテゴリ
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
ヤフオク!について
サービス開始:1999年
日本最大級の
インターネットオークションサイト
※1: 2015年6月実績 ※2: 2015年6月22日実績
※3: Nielsen NetView(家庭および職場からのPCによるアクセス。アプリは除く)Nielsen Mobile NetView(Android+iOS / アプリいずれも含む)
2015/04「訪問者数」データ、「オークション」サブカテゴリ
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
ヤフオク!について
サービス開始:1999年
日本最大級の
インターネットオークションサイト
出品数:常時約3900万個※1
※1: 2015年6月実績 ※2: 2015年6月22日実績
※3: Nielsen NetView(家庭および職場からのPCによるアクセス。アプリは除く)Nielsen Mobile NetView(Android+iOS / アプリいずれも含む)
2015/04「訪問者数」データ、「オークション」サブカテゴリ
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
ヤフオク!について
サービス開始:1999年
日本最大級の
インターネットオークションサイト
出品数:常時約3900万個※1
1秒あたり273個※2
※1: 2015年6月実績 ※2: 2015年6月22日実績
※3: Nielsen NetView(家庭および職場からのPCによるアクセス。アプリは除く)Nielsen Mobile NetView(Android+iOS / アプリいずれも含む)
2015/04「訪問者数」データ、「オークション」サブカテゴリ
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
ヤフオク!について
サービス開始:1999年
日本最大級の
インターネットオークションサイト
出品数:常時約3900万個※1
1秒あたり273個※2
ユーザ数(PC):約1117万人※3
※1: 2015年6月実績 ※2: 2015年6月22日実績
※3: Nielsen NetView(家庭および職場からのPCによるアクセス。アプリは除く)Nielsen Mobile NetView(Android+iOS / アプリいずれも含む)
2015/04「訪問者数」データ、「オークション」サブカテゴリ
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
ヤフオク!について
サービス開始:1999年
日本最大級の
インターネットオークションサイト
出品数:常時約3900万個※1
1秒あたり273個※2
ユーザ数(PC):約1117万人※3
ユーザ数(SP):約1671万人※3
※1: 2015年6月実績 ※2: 2015年6月22日実績
※3: Nielsen NetView(家庭および職場からのPCによるアクセス。アプリは除く)Nielsen Mobile NetView(Android+iOS / アプリいずれも含む)
2015/04「訪問者数」データ、「オークション」サブカテゴリ
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
アジェンダ
• ヤフオク!における深層学習を利用した
画像処理のご紹介
• ヤフオク!における分散表現を利用した
検索ランキングのご紹介
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
アジェンダ
• ヤフオク!における深層学習を利用した
画像処理のご紹介
• ヤフオク!における分散表現を利用した
検索ランキングのご紹介
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
解決したい課題
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
解決したい課題
MacBook Air
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
解決したい課題
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
解決したい課題
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
解決したい課題
カテゴリ違い
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
カテゴリ違い
入札ユーザ
「折角、カテゴリを絞って検索したのに、
関係ない商品が…」
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
カテゴリ違い
入札ユーザ
「折角、カテゴリを絞って検索したのに、
関係ない商品が…」
ユーザビリティの低下
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
カテゴリ違い
入札ユーザ
「折角、カテゴリを絞って検索したのに、
関係ない商品が…」
カテゴリ違いを検知!
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
カテゴリ違いの検知
人による検知
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
カテゴリ違いの検知
人による検知
・高い精度
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
カテゴリ違いの検知
人による検知
・高い精度
しかし限界も
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
カテゴリ違いの検知
人による検知
・高い精度
しかし限界も
・量
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
カテゴリ違いの検知
人による検知
・高い精度
しかし限界も
・量
・スピード
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
カテゴリ違いの検知
人による検知
・高い精度
しかし限界も
・量
・スピード
機械学習の利用
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
カテゴリ違いの検知
機械学習にも限界が
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
カテゴリ違いの検知
機械学習にも限界が
・未知のパターン
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
カテゴリ違いの検知
機械学習にも限界が
・未知のパターン
・100%の精度は難しい
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
カテゴリ違いの検知
機械学習にも限界が
・未知のパターン
・100%の精度は難しい
など
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
カテゴリ違いの検知
機械学習にも限界が
・未知のパターン
・100%の精度は難しい
など
機械学習は銀の弾丸ではない
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
カテゴリ違いの検知
人と機械学習のハイブリッド
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
カテゴリ違いの検知
人と機械学習のハイブリッド
・人:判断
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
カテゴリ違いの検知
人と機械学習のハイブリッド
・人:判断
・機械学習:人が判断する順序を決定
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
カテゴリ違いの検知
人と機械学習のハイブリッド
・人:判断
・機械学習:人が判断する順序を決定
メリットの両立
・人:高い精度
・機械学習:量とスピード
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
カテゴリ違いの検知モデル
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
カテゴリ違いの検知モデル
商品タイトルベース
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
カテゴリ違いの検知モデル
商品タイトルベース
ex. MacBook Air カテゴリへの出品
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
カテゴリ違いの検知モデル
商品タイトルベース
ex. MacBook Air カテゴリへの出品
「MacBook Air 用カバー」
「MacBook Air カバー」
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
カテゴリ違いの検知モデル
商品タイトルベース
ex. MacBook Air カテゴリへの出品
「MacBook Air 用カバー」 → ✕
「MacBook Air カバー」 → ✕
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
カテゴリ違いの検知モデル
商品タイトルベース
ex. MacBook Air カテゴリへの出品
「MacBook Air 用カバー」 → ✕
「MacBook Air カバー」 → ✕
「MacBook Air + カバー」
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
カテゴリ違いの検知モデル
商品タイトルベース
ex. MacBook Air カテゴリへの出品
「MacBook Air 用カバー」 → ✕
「MacBook Air カバー」 → ✕
「MacBook Air + カバー」 → ◯
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
カテゴリ違いの検知モデル
商品タイトルベース
ex. MacBook Air カテゴリへの出品
「MacBook Air 用カバー」 → ✕
「MacBook Air カバー」 → ✕
「MacBook Air + カバー」 → ◯
「MacBook Air おまけ付 カバー」
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
カテゴリ違いの検知モデル
商品タイトルベース
ex. MacBook Air カテゴリへの出品
「MacBook Air 用カバー」 → ✕
「MacBook Air カバー」 → ✕
「MacBook Air + カバー」 → ◯
「MacBook Air おまけ付 カバー」 → ?
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
カテゴリ違いの検知モデル
商品タイトルベース
ex. MacBook Air カテゴリへの出品
「MacBook Air 用カバー」 → ✕
「MacBook Air カバー」 → ✕
「MacBook Air + カバー」 → ◯
「MacBook Air おまけ付 カバー」 → ?
一定の精度はあるものの、限界も
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
カテゴリ違いの検知モデル
単語に加え、画像も利用
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
カテゴリ違いの検知モデル
単語に加え、画像も利用
例:MacBook Air カテゴリ
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
カテゴリ違いの検知モデル
単語に加え、画像も利用
例:MacBook Air カテゴリ
◯ ✕ ✕
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
カテゴリ違いの検知モデル
画像に写っている物体を認識
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
カテゴリ違いの検知モデル
画像に写っている物体を認識
深層学習(Deep Learning)を利用
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
深層学習の代表的手法
CNN(Convolutional Neural
Network)
RNN(Recurrent Neural Network)
RNN(Recursive Neural Network)
DBN(Deep Belief Network)
DBM(Deep Boltzmann Network)
DAE(Deep Autoencorder)
at el.
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
深層学習の代表的手法
CNN(Convolutional Neural
Network)
RNN(Recurrent Neural Network)
RNN(Recursive Neural Network)
DBN(Deep Belief Network)
DBM(Deep Boltzmann Network)
DAE(Deep Autoencorder)
at el.
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
CNNによる物体認識
画像に写っている物体を識別
Going deeper with convolutions (http://arxiv.org/pdf/1409.4842v1.pdf)より引用
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
CNNによる物体認識
画像に写っている物体を識別
シベリアンハスキー エスキーモドッグ
Going deeper with convolutions (http://arxiv.org/pdf/1409.4842v1.pdf)より引用
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
学習
学習データ
ヤフオク!の過去の出品画像
約2万件
環境
・Caffe v1.0rc2
・CUDA 7.5
・GPUサーバ(オンプレ)
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
識別
ノートPCである確率を出力
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
識別
ノートPCである確率を出力
80.1% 0.1% 0.9%
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
目視チェックの順序(イメージ)
80.1% 0.1% 0.9%
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
目視チェックの順序(イメージ)
80.1% 0.1% 0.9%
③ ②①
※実際には商品タイトル等の他の特徴を考慮
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
今後
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
今後
学習データを高精度、大量、継続的に
増加させる仕組み
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
今後
学習データを高精度、大量、継続的に
増加させる仕組み
ラベル付け:高コスト
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
今後
学習データを高精度、大量、継続的に
増加させる仕組み
ラベル付け:高コスト
精度の向上
新しいパターンへの対応
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
アジェンダ
• ヤフオク!における深層学習を利用した
画像処理のご紹介
• ヤフオク!における分散表現を利用した
検索ランキングのご紹介
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
ヤフオク! サイト内検索
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
ヤフオク! サイト内検索
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
ヤフオク! サイト内検索
機械学習によるランキング
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
検索ランキング
CTRやCVR等を最大化するモデル
CTR:商品詳細画面へ流入する確率
CVR:その後に入札する確率
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
検索ランキング
多くの特徴を利用
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
検索ランキング
多くの特徴を利用
重要な特徴の1つが単語
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
検索ランキング
多くの特徴を利用
重要な特徴の1つが単語
特にタイトル中の単語
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
検索ランキング
多くの特徴を利用
重要な特徴の1つが単語
特にタイトル中の単語
「MacBook Air」
「MacBook Air カバー」
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
単語の利用
単語を特徴に利用した場合の課題
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
単語の利用
単語を特徴に利用した場合の課題
表記ゆれ、同義語
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
単語の利用
単語を特徴に利用した場合の課題
表記ゆれ、同義語
一般的な対応
・正規化
小文字大文字、半角全角、記号等
・同義語辞書
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
単語の利用
同義語辞書の整備:人手
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
単語の利用
同義語辞書の整備:人手
・コスト
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
単語の利用
同義語辞書の整備:人手
・コスト
ヤフオク!の商品ドメイン:多
・服、本、スマホから自動車、家まで
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
単語の利用
同義語辞書の整備:人手
・コスト
ヤフオク!の商品ドメイン:多
・服、本、スマホから自動車、家まで
コストやばい
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
単語の利用
同義語辞書の整備:人手
・コスト
ヤフオク!の商品ドメイン:多
・服、本、スマホから自動車、家まで
計算で求めたい
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
単語の利用
同義語辞書の整備:人手
・コスト
ヤフオク!の商品ドメイン:多
・服、本、スマホから自動車、家まで
分散表現を利用
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
分散表現
局所表現
分散表現
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
分散表現
局所表現
サッカー: (1,0,0,0 … 0,0,0,0)
フットボール: (0,0,0,0 … 0,1,0,0)
分散表現
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
分散表現
局所表現
サッカー: (1,0,0,0 … 0,0,0,0)
フットボール: (0,0,0,0 … 0,1,0,0)
ベクトルは単純なエンコード
分散表現
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
分散表現
局所表現
サッカー: (1,0,0,0 … 0,0,0,0)
フットボール: (0,0,0,0 … 0,1,0,0)
ベクトルは単純なエンコード
分散表現
サッカー: (0.13, -0.32, … 0.1, 0.07)
フットボール: (0.11, -0.27, … 0.13, 0.07)
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
分散表現
局所表現
サッカー: (1,0,0,0 … 0,0,0,0)
フットボール: (0,0,0,0 … 0,1,0,0)
ベクトルは単純なエンコード
分散表現
サッカー: (0.13, -0.32, … 0.1, 0.07)
フットボール: (0.11, -0.27, … 0.13, 0.07)
意味が近い表現:近いベクトル
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
単語の分散表現
意味が近い単語:ベクトルが近い単語
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
単語の分散表現
意味が近い単語:ベクトルが近い単語
クラスタリング
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
単語の分散表現
意味が近い単語:ベクトルが近い単語
クラスタリング
意味が近い単語群:同一クラスタ
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
単語の分散表現
意味が近い単語:ベクトルが近い単語
クラスタリング
意味が近い単語群:同一クラスタ
検索ランキングのモデルの特徴
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
単語の分散表現
意味が近い単語:ベクトルが近い単語
クラスタリング
意味が近い単語群:同一クラスタ
検索ランキングのモデルの特徴
・単語
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
単語の分散表現
意味が近い単語:ベクトルが近い単語
クラスタリング
意味が近い単語群:同一クラスタ
検索ランキングのモデルの特徴
・単語
・クラスタID
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
分散表現の学習
学習コーパス
・商品タイトル
・商品数:約5000万件(重複除外)
・単語数:約3億8000万
・Vocabulary:約40万
モデル:
skip-gram (+negative sampling)
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
クラスタリング
モデル:k-means(k-means++)
距離:コサイン類似度
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
生成されたクラスタの例
クラスタ例1:
ザク, ドム, グフ, ゲルググ, ズゴック, …
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
生成されたクラスタの例
クラスタ例1:
ザク, ドム, グフ, ゲルググ, ズゴック, …
クラスタ例2:
アイパッド, iPad, iPadmini, Air, …
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
生成されたクラスタの例
クラスタ例1:
ザク, ドム, グフ, ゲルググ, ズゴック, …
クラスタ例2:
アイパッド, iPad, iPadmini, Air, …
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
商品タイトルの置き換え
クラスタ例1:ザク, ドム, グフ, ゲルググ, …
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
商品タイトルの置き換え
クラスタ例1:ザク, ドム, グフ, ゲルググ, …
中古 HY2M 1/12 ザク MS-06J ZAKUII
↓
中古 HY2M 1/12 cid_1 MS-06J ZAKUII
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
商品タイトルの置き換え
クラスタ例1:ザク, ドム, グフ, ゲルググ, …
中古 HY2M 1/12 ザク MS-06J ZAKUII
↓
中古 HY2M 1/12 cid_1 MS-06J ZAKUII
ガンプラ MG1/100 MS-09 ドム
↓
ガンプラ MG1/100 MS-09 cid_1
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
今後
skip-gram以降の分散表現のモデルを
利用
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
今後
skip-gram以降の分散表現のモデルを
利用
重複タイトルの判断精度
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
今後
skip-gram以降の分散表現のモデルを
利用
重複タイトルの判断精度
クラスタリング精度
ex. ディリクレ過程混合正規分布
Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止
ご静聴有難うございました

Más contenido relacionado

La actualidad más candente

第17回Lucene/Solr勉強会 #SolrJP – Apache Lucene Solrによる形態素解析の課題とN-bestの提案
第17回Lucene/Solr勉強会 #SolrJP – Apache Lucene Solrによる形態素解析の課題とN-bestの提案第17回Lucene/Solr勉強会 #SolrJP – Apache Lucene Solrによる形態素解析の課題とN-bestの提案
第17回Lucene/Solr勉強会 #SolrJP – Apache Lucene Solrによる形態素解析の課題とN-bestの提案Yahoo!デベロッパーネットワーク
 
OpenStack環境構築支援について
OpenStack環境構築支援についてOpenStack環境構築支援について
OpenStack環境構築支援についてSatoshi Konno
 
[デブサミ2012]趣味と実益の脆弱性発見
[デブサミ2012]趣味と実益の脆弱性発見[デブサミ2012]趣味と実益の脆弱性発見
[デブサミ2012]趣味と実益の脆弱性発見Yosuke HASEGAWA
 
JavaScript.Next
JavaScript.NextJavaScript.Next
JavaScript.Nextdynamis
 
Zabbix最新情報 @OSC 2017 Tokyo/Fall
Zabbix最新情報 @OSC 2017 Tokyo/FallZabbix最新情報 @OSC 2017 Tokyo/Fall
Zabbix最新情報 @OSC 2017 Tokyo/FallAtsushi Tanaka
 
Yahoo! JAPAN MeetUp #8 (インフラ技術カンファレンス)セッション①
Yahoo! JAPAN MeetUp #8 (インフラ技術カンファレンス)セッション①Yahoo! JAPAN MeetUp #8 (インフラ技術カンファレンス)セッション①
Yahoo! JAPAN MeetUp #8 (インフラ技術カンファレンス)セッション①Yahoo!デベロッパーネットワーク
 
爆速でAndroidアプリを ビルドするための仕組み DeNA TechCon #denatechcon
爆速でAndroidアプリを ビルドするための仕組み DeNA TechCon #denatechcon爆速でAndroidアプリを ビルドするための仕組み DeNA TechCon #denatechcon
爆速でAndroidアプリを ビルドするための仕組み DeNA TechCon #denatechconYosaku Toyama
 
とあるアプリの開発運用(トラブルシュート)
とあるアプリの開発運用(トラブルシュート)とあるアプリの開発運用(トラブルシュート)
とあるアプリの開発運用(トラブルシュート)Takafumi ONAKA
 
Yahoo!ブラウザーアプリのプロダクトマネージャーが考えていること
Yahoo!ブラウザーアプリのプロダクトマネージャーが考えていることYahoo!ブラウザーアプリのプロダクトマネージャーが考えていること
Yahoo!ブラウザーアプリのプロダクトマネージャーが考えていることYahoo!デベロッパーネットワーク
 

La actualidad más candente (20)

第17回Lucene/Solr勉強会 #SolrJP – Apache Lucene Solrによる形態素解析の課題とN-bestの提案
第17回Lucene/Solr勉強会 #SolrJP – Apache Lucene Solrによる形態素解析の課題とN-bestの提案第17回Lucene/Solr勉強会 #SolrJP – Apache Lucene Solrによる形態素解析の課題とN-bestの提案
第17回Lucene/Solr勉強会 #SolrJP – Apache Lucene Solrによる形態素解析の課題とN-bestの提案
 
Yahoo! JAPAN MeetUp #8 (インフラ技術カンファレンス)LT⑦
Yahoo! JAPAN MeetUp #8 (インフラ技術カンファレンス)LT⑦Yahoo! JAPAN MeetUp #8 (インフラ技術カンファレンス)LT⑦
Yahoo! JAPAN MeetUp #8 (インフラ技術カンファレンス)LT⑦
 
YJTC18 C-1 Kotlin導入の状況と展望
YJTC18 C-1 Kotlin導入の状況と展望YJTC18 C-1 Kotlin導入の状況と展望
YJTC18 C-1 Kotlin導入の状況と展望
 
OpenStack環境構築支援について
OpenStack環境構築支援についてOpenStack環境構築支援について
OpenStack環境構築支援について
 
大規模システムScrum実践 効果と課題 #rsgt2015
大規模システムScrum実践 効果と課題 #rsgt2015大規模システムScrum実践 効果と課題 #rsgt2015
大規模システムScrum実践 効果と課題 #rsgt2015
 
YJTC18 A-1 大規模サーバの戦略
YJTC18 A-1 大規模サーバの戦略YJTC18 A-1 大規模サーバの戦略
YJTC18 A-1 大規模サーバの戦略
 
ゼロからのscrum
ゼロからのscrumゼロからのscrum
ゼロからのscrum
 
[デブサミ2012]趣味と実益の脆弱性発見
[デブサミ2012]趣味と実益の脆弱性発見[デブサミ2012]趣味と実益の脆弱性発見
[デブサミ2012]趣味と実益の脆弱性発見
 
JavaScript.Next
JavaScript.NextJavaScript.Next
JavaScript.Next
 
Zabbix最新情報 @OSC 2017 Tokyo/Fall
Zabbix最新情報 @OSC 2017 Tokyo/FallZabbix最新情報 @OSC 2017 Tokyo/Fall
Zabbix最新情報 @OSC 2017 Tokyo/Fall
 
Yahoo! JAPAN MeetUp #8 (インフラ技術カンファレンス)セッション①
Yahoo! JAPAN MeetUp #8 (インフラ技術カンファレンス)セッション①Yahoo! JAPAN MeetUp #8 (インフラ技術カンファレンス)セッション①
Yahoo! JAPAN MeetUp #8 (インフラ技術カンファレンス)セッション①
 
爆速でAndroidアプリを ビルドするための仕組み DeNA TechCon #denatechcon
爆速でAndroidアプリを ビルドするための仕組み DeNA TechCon #denatechcon爆速でAndroidアプリを ビルドするための仕組み DeNA TechCon #denatechcon
爆速でAndroidアプリを ビルドするための仕組み DeNA TechCon #denatechcon
 
MySQL Binlog Events でストリーム処理してみた #MySQLUC15
MySQL Binlog Events でストリーム処理してみた #MySQLUC15MySQL Binlog Events でストリーム処理してみた #MySQLUC15
MySQL Binlog Events でストリーム処理してみた #MySQLUC15
 
ヤフーでHardeningを実施する意味 (#sec_kansai #sosaisec)
ヤフーでHardeningを実施する意味 (#sec_kansai #sosaisec)ヤフーでHardeningを実施する意味 (#sec_kansai #sosaisec)
ヤフーでHardeningを実施する意味 (#sec_kansai #sosaisec)
 
とあるアプリの開発運用(トラブルシュート)
とあるアプリの開発運用(トラブルシュート)とあるアプリの開発運用(トラブルシュート)
とあるアプリの開発運用(トラブルシュート)
 
ニュースアプリで起きた不具合から学んだ 最適への一歩
ニュースアプリで起きた不具合から学んだ 最適への一歩ニュースアプリで起きた不具合から学んだ 最適への一歩
ニュースアプリで起きた不具合から学んだ 最適への一歩
 
Serving Engine as a Service at Yahoo! JAPAN #SolrJP
Serving Engine as a Service at Yahoo! JAPAN #SolrJPServing Engine as a Service at Yahoo! JAPAN #SolrJP
Serving Engine as a Service at Yahoo! JAPAN #SolrJP
 
決済金融から始めるデータドリブンカンパニー #yjmu
決済金融から始めるデータドリブンカンパニー #yjmu決済金融から始めるデータドリブンカンパニー #yjmu
決済金融から始めるデータドリブンカンパニー #yjmu
 
Yahoo!ブラウザーアプリのプロダクトマネージャーが考えていること
Yahoo!ブラウザーアプリのプロダクトマネージャーが考えていることYahoo!ブラウザーアプリのプロダクトマネージャーが考えていること
Yahoo!ブラウザーアプリのプロダクトマネージャーが考えていること
 
kukai: 省エネ世界2位のディープラーニング・スパコン
kukai: 省エネ世界2位のディープラーニング・スパコンkukai: 省エネ世界2位のディープラーニング・スパコン
kukai: 省エネ世界2位のディープラーニング・スパコン
 

Destacado (7)

検索クエリの時間差を可視化することでわかる人の行動パターン #yjdsnight
検索クエリの時間差を可視化することでわかる人の行動パターン #yjdsnight検索クエリの時間差を可視化することでわかる人の行動パターン #yjdsnight
検索クエリの時間差を可視化することでわかる人の行動パターン #yjdsnight
 
ヤフー音声認識のご紹介#yjdsw1
ヤフー音声認識のご紹介#yjdsw1ヤフー音声認識のご紹介#yjdsw1
ヤフー音声認識のご紹介#yjdsw1
 
Yahoo!ショッピングと分散表現#yjdsw1
Yahoo!ショッピングと分散表現#yjdsw1Yahoo!ショッピングと分散表現#yjdsw1
Yahoo!ショッピングと分散表現#yjdsw1
 
爆速機械学習サービス応用:実践編#yjdsw1
爆速機械学習サービス応用:実践編#yjdsw1爆速機械学習サービス応用:実践編#yjdsw1
爆速機械学習サービス応用:実践編#yjdsw1
 
分散表現に基づく文書要約#yjdsw1
分散表現に基づく文書要約#yjdsw1分散表現に基づく文書要約#yjdsw1
分散表現に基づく文書要約#yjdsw1
 
ヤフートップページでの機械学習#yjdsw1
ヤフートップページでの機械学習#yjdsw1ヤフートップページでの機械学習#yjdsw1
ヤフートップページでの機械学習#yjdsw1
 
ヤフオク!と機械学習#yjdsw1
ヤフオク!と機械学習#yjdsw1ヤフオク!と機械学習#yjdsw1
ヤフオク!と機械学習#yjdsw1
 

Similar a ヤフオク!における機械学習 ~深層学習、分散表現~ #devsumi

いろいろなストリーム処理プロダクトをベンチマークしてみた #hcj2016
いろいろなストリーム処理プロダクトをベンチマークしてみた #hcj2016いろいろなストリーム処理プロダクトをベンチマークしてみた #hcj2016
いろいろなストリーム処理プロダクトをベンチマークしてみた #hcj2016Yahoo!デベロッパーネットワーク
 
Yahoo! JAPANが実践するOpenStackと大規模環境でのコンテナ利用 #devsumi
Yahoo! JAPANが実践するOpenStackと大規模環境でのコンテナ利用 #devsumiYahoo! JAPANが実践するOpenStackと大規模環境でのコンテナ利用 #devsumi
Yahoo! JAPANが実践するOpenStackと大規模環境でのコンテナ利用 #devsumiYahoo!デベロッパーネットワーク
 
海外通販楽しい! for Engineer
海外通販楽しい! for Engineer海外通販楽しい! for Engineer
海外通販楽しい! for Engineernbihibashi
 
ターゲットするユーザーに響き、貴社が伝えたい事が伝わる英語コンテンツを作るコツ | 世界へボカン株式会社
ターゲットするユーザーに響き、貴社が伝えたい事が伝わる英語コンテンツを作るコツ | 世界へボカン株式会社ターゲットするユーザーに響き、貴社が伝えたい事が伝わる英語コンテンツを作るコツ | 世界へボカン株式会社
ターゲットするユーザーに響き、貴社が伝えたい事が伝わる英語コンテンツを作るコツ | 世界へボカン株式会社YUKI TOKUDA
 
DeNAの機械学習・深層学習活用した 体験提供の挑戦
DeNAの機械学習・深層学習活用した体験提供の挑戦DeNAの機械学習・深層学習活用した体験提供の挑戦
DeNAの機械学習・深層学習活用した 体験提供の挑戦Koichi Hamada
 
Use aliexpress
Use aliexpressUse aliexpress
Use aliexpressnbihibashi
 
[CB16] 「ネットバンキングウイルス無力化作戦」の裏側と高度化する金融マルウェア by 高田一樹
[CB16] 「ネットバンキングウイルス無力化作戦」の裏側と高度化する金融マルウェア by 高田一樹[CB16] 「ネットバンキングウイルス無力化作戦」の裏側と高度化する金融マルウェア by 高田一樹
[CB16] 「ネットバンキングウイルス無力化作戦」の裏側と高度化する金融マルウェア by 高田一樹CODE BLUE
 
今からでも遅くない! 民泊投資で失敗しない方法
今からでも遅くない! 民泊投資で失敗しない方法今からでも遅くない! 民泊投資で失敗しない方法
今からでも遅くない! 民泊投資で失敗しない方法紫雲 留田
 
WSDM2016報告会−論文紹介(Understanding User Attention and Engagement in Online News R...
WSDM2016報告会−論文紹介(Understanding User Attention and Engagement in Online News R...WSDM2016報告会−論文紹介(Understanding User Attention and Engagement in Online News R...
WSDM2016報告会−論文紹介(Understanding User Attention and Engagement in Online News R...Yahoo!デベロッパーネットワーク
 
Yahoo!ニュースにおけるBFFパフォーマンスチューニング事例
Yahoo!ニュースにおけるBFFパフォーマンスチューニング事例Yahoo!ニュースにおけるBFFパフォーマンスチューニング事例
Yahoo!ニュースにおけるBFFパフォーマンスチューニング事例Yahoo!デベロッパーネットワーク
 
ジェスチャ認識・物体形状取得がもたらす新たな未来
ジェスチャ認識・物体形状取得がもたらす新たな未来ジェスチャ認識・物体形状取得がもたらす新たな未来
ジェスチャ認識・物体形状取得がもたらす新たな未来Kaoru NAKAMURA
 
虎の穴ラボ エンジニア採用説明資料 .pdf
虎の穴ラボ エンジニア採用説明資料 .pdf虎の穴ラボ エンジニア採用説明資料 .pdf
虎の穴ラボ エンジニア採用説明資料 .pdf虎の穴 開発室
 
Hol010 はじめてでもでき
Hol010 はじめてでもできHol010 はじめてでもでき
Hol010 はじめてでもできTech Summit 2016
 

Similar a ヤフオク!における機械学習 ~深層学習、分散表現~ #devsumi (20)

Yahoo! JAPAN の Ambari 活用事例 #ambarimeetup
Yahoo! JAPAN の Ambari 活用事例 #ambarimeetupYahoo! JAPAN の Ambari 活用事例 #ambarimeetup
Yahoo! JAPAN の Ambari 活用事例 #ambarimeetup
 
Yahoo! JAPAN の Ambari 活用事例 #yjdsnight
Yahoo! JAPAN の Ambari 活用事例 #yjdsnightYahoo! JAPAN の Ambari 活用事例 #yjdsnight
Yahoo! JAPAN の Ambari 活用事例 #yjdsnight
 
いろいろなストリーム処理プロダクトをベンチマークしてみた #hcj2016
いろいろなストリーム処理プロダクトをベンチマークしてみた #hcj2016いろいろなストリーム処理プロダクトをベンチマークしてみた #hcj2016
いろいろなストリーム処理プロダクトをベンチマークしてみた #hcj2016
 
Yahoo! JAPANが実践するOpenStackと大規模環境でのコンテナ利用 #devsumi
Yahoo! JAPANが実践するOpenStackと大規模環境でのコンテナ利用 #devsumiYahoo! JAPANが実践するOpenStackと大規模環境でのコンテナ利用 #devsumi
Yahoo! JAPANが実践するOpenStackと大規模環境でのコンテナ利用 #devsumi
 
海外通販楽しい! for Engineer
海外通販楽しい! for Engineer海外通販楽しい! for Engineer
海外通販楽しい! for Engineer
 
大規模CSゲームにおけるライトマス運用
大規模CSゲームにおけるライトマス運用大規模CSゲームにおけるライトマス運用
大規模CSゲームにおけるライトマス運用
 
ターゲットするユーザーに響き、貴社が伝えたい事が伝わる英語コンテンツを作るコツ | 世界へボカン株式会社
ターゲットするユーザーに響き、貴社が伝えたい事が伝わる英語コンテンツを作るコツ | 世界へボカン株式会社ターゲットするユーザーに響き、貴社が伝えたい事が伝わる英語コンテンツを作るコツ | 世界へボカン株式会社
ターゲットするユーザーに響き、貴社が伝えたい事が伝わる英語コンテンツを作るコツ | 世界へボカン株式会社
 
DeNAの機械学習・深層学習活用した 体験提供の挑戦
DeNAの機械学習・深層学習活用した体験提供の挑戦DeNAの機械学習・深層学習活用した体験提供の挑戦
DeNAの機械学習・深層学習活用した 体験提供の挑戦
 
Use aliexpress
Use aliexpressUse aliexpress
Use aliexpress
 
Ambari運用ツラたん #ambarimeetup
Ambari運用ツラたん #ambarimeetupAmbari運用ツラたん #ambarimeetup
Ambari運用ツラたん #ambarimeetup
 
[CB16] 「ネットバンキングウイルス無力化作戦」の裏側と高度化する金融マルウェア by 高田一樹
[CB16] 「ネットバンキングウイルス無力化作戦」の裏側と高度化する金融マルウェア by 高田一樹[CB16] 「ネットバンキングウイルス無力化作戦」の裏側と高度化する金融マルウェア by 高田一樹
[CB16] 「ネットバンキングウイルス無力化作戦」の裏側と高度化する金融マルウェア by 高田一樹
 
Apache Atlasの現状とデータガバナンス事例 #hadoopreading
Apache Atlasの現状とデータガバナンス事例 #hadoopreadingApache Atlasの現状とデータガバナンス事例 #hadoopreading
Apache Atlasの現状とデータガバナンス事例 #hadoopreading
 
State of the art Stream Processing #hadoopreading
State of the art Stream Processing #hadoopreadingState of the art Stream Processing #hadoopreading
State of the art Stream Processing #hadoopreading
 
Yahoo! JAPANにおけるオンライン機械学習実例 #streamctjp
Yahoo! JAPANにおけるオンライン機械学習実例 #streamctjpYahoo! JAPANにおけるオンライン機械学習実例 #streamctjp
Yahoo! JAPANにおけるオンライン機械学習実例 #streamctjp
 
今からでも遅くない! 民泊投資で失敗しない方法
今からでも遅くない! 民泊投資で失敗しない方法今からでも遅くない! 民泊投資で失敗しない方法
今からでも遅くない! 民泊投資で失敗しない方法
 
WSDM2016報告会−論文紹介(Understanding User Attention and Engagement in Online News R...
WSDM2016報告会−論文紹介(Understanding User Attention and Engagement in Online News R...WSDM2016報告会−論文紹介(Understanding User Attention and Engagement in Online News R...
WSDM2016報告会−論文紹介(Understanding User Attention and Engagement in Online News R...
 
Yahoo!ニュースにおけるBFFパフォーマンスチューニング事例
Yahoo!ニュースにおけるBFFパフォーマンスチューニング事例Yahoo!ニュースにおけるBFFパフォーマンスチューニング事例
Yahoo!ニュースにおけるBFFパフォーマンスチューニング事例
 
ジェスチャ認識・物体形状取得がもたらす新たな未来
ジェスチャ認識・物体形状取得がもたらす新たな未来ジェスチャ認識・物体形状取得がもたらす新たな未来
ジェスチャ認識・物体形状取得がもたらす新たな未来
 
虎の穴ラボ エンジニア採用説明資料 .pdf
虎の穴ラボ エンジニア採用説明資料 .pdf虎の穴ラボ エンジニア採用説明資料 .pdf
虎の穴ラボ エンジニア採用説明資料 .pdf
 
Hol010 はじめてでもでき
Hol010 はじめてでもできHol010 はじめてでもでき
Hol010 はじめてでもでき
 

Más de Yahoo!デベロッパーネットワーク

ヤフーでは開発迅速性と品質のバランスをどう取ってるか
ヤフーでは開発迅速性と品質のバランスをどう取ってるかヤフーでは開発迅速性と品質のバランスをどう取ってるか
ヤフーでは開発迅速性と品質のバランスをどう取ってるかYahoo!デベロッパーネットワーク
 
データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2
データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2
データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2Yahoo!デベロッパーネットワーク
 
ヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtc
ヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtcヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtc
ヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtcYahoo!デベロッパーネットワーク
 
Yahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtc
Yahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtcYahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtc
Yahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtcYahoo!デベロッパーネットワーク
 
ヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtc
ヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtcヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtc
ヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtcYahoo!デベロッパーネットワーク
 
新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtc
新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtc新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtc
新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtcYahoo!デベロッパーネットワーク
 
PC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtc
PC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtcPC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtc
PC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtcYahoo!デベロッパーネットワーク
 
モブデザインによる多職種チームのコミュニケーション改善 #yjtc
モブデザインによる多職種チームのコミュニケーション改善 #yjtcモブデザインによる多職種チームのコミュニケーション改善 #yjtc
モブデザインによる多職種チームのコミュニケーション改善 #yjtcYahoo!デベロッパーネットワーク
 
ユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtc
ユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtcユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtc
ユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtcYahoo!デベロッパーネットワーク
 

Más de Yahoo!デベロッパーネットワーク (20)

ゼロから始める転移学習
ゼロから始める転移学習ゼロから始める転移学習
ゼロから始める転移学習
 
継続的なモデルモニタリングを実現するKubernetes Operator
継続的なモデルモニタリングを実現するKubernetes Operator継続的なモデルモニタリングを実現するKubernetes Operator
継続的なモデルモニタリングを実現するKubernetes Operator
 
ヤフーでは開発迅速性と品質のバランスをどう取ってるか
ヤフーでは開発迅速性と品質のバランスをどう取ってるかヤフーでは開発迅速性と品質のバランスをどう取ってるか
ヤフーでは開発迅速性と品質のバランスをどう取ってるか
 
オンプレML基盤on Kubernetes パネルディスカッション
オンプレML基盤on Kubernetes パネルディスカッションオンプレML基盤on Kubernetes パネルディスカッション
オンプレML基盤on Kubernetes パネルディスカッション
 
LakeTahoe
LakeTahoeLakeTahoe
LakeTahoe
 
オンプレML基盤on Kubernetes 〜Yahoo! JAPAN AIPF〜
オンプレML基盤on Kubernetes 〜Yahoo! JAPAN AIPF〜オンプレML基盤on Kubernetes 〜Yahoo! JAPAN AIPF〜
オンプレML基盤on Kubernetes 〜Yahoo! JAPAN AIPF〜
 
Persistent-memory-native Database High-availability Feature
Persistent-memory-native Database High-availability FeaturePersistent-memory-native Database High-availability Feature
Persistent-memory-native Database High-availability Feature
 
データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2
データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2
データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2
 
eコマースと実店舗の相互利益を目指したデザイン #yjtc
eコマースと実店舗の相互利益を目指したデザイン #yjtceコマースと実店舗の相互利益を目指したデザイン #yjtc
eコマースと実店舗の相互利益を目指したデザイン #yjtc
 
ヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtc
ヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtcヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtc
ヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtc
 
Yahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtc
Yahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtcYahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtc
Yahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtc
 
ビッグデータから人々のムードを捉える #yjtc
ビッグデータから人々のムードを捉える #yjtcビッグデータから人々のムードを捉える #yjtc
ビッグデータから人々のムードを捉える #yjtc
 
サイエンス領域におけるMLOpsの取り組み #yjtc
サイエンス領域におけるMLOpsの取り組み #yjtcサイエンス領域におけるMLOpsの取り組み #yjtc
サイエンス領域におけるMLOpsの取り組み #yjtc
 
ヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtc
ヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtcヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtc
ヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtc
 
Yahoo! JAPAN Tech Conference 2022 Day2 Keynote #yjtc
Yahoo! JAPAN Tech Conference 2022 Day2 Keynote #yjtcYahoo! JAPAN Tech Conference 2022 Day2 Keynote #yjtc
Yahoo! JAPAN Tech Conference 2022 Day2 Keynote #yjtc
 
新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtc
新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtc新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtc
新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtc
 
PC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtc
PC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtcPC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtc
PC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtc
 
モブデザインによる多職種チームのコミュニケーション改善 #yjtc
モブデザインによる多職種チームのコミュニケーション改善 #yjtcモブデザインによる多職種チームのコミュニケーション改善 #yjtc
モブデザインによる多職種チームのコミュニケーション改善 #yjtc
 
「新しいおうち探し」のためのAIアシスト検索 #yjtc
「新しいおうち探し」のためのAIアシスト検索 #yjtc「新しいおうち探し」のためのAIアシスト検索 #yjtc
「新しいおうち探し」のためのAIアシスト検索 #yjtc
 
ユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtc
ユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtcユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtc
ユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtc
 

Último

CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NTT DATA Technology & Innovation
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)Hiroshi Tomioka
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 

Último (8)

CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 

ヤフオク!における機械学習 ~深層学習、分散表現~ #devsumi

  • 2. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 自己紹介 本名: 山下 勝司 通称: やまかつ 2015年1月中途入社 ヤフオク!カンパニー所属 ヤフオク!の機械学習周りを担当
  • 3. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 ヤフオク!について ※1: 2015年6月実績 ※2: 2015年6月22日実績 ※3: Nielsen NetView(家庭および職場からのPCによるアクセス。アプリは除く)Nielsen Mobile NetView(Android+iOS / アプリいずれも含む) 2015/04「訪問者数」データ、「オークション」サブカテゴリ
  • 4. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 ヤフオク!について サービス開始:1999年 ※1: 2015年6月実績 ※2: 2015年6月22日実績 ※3: Nielsen NetView(家庭および職場からのPCによるアクセス。アプリは除く)Nielsen Mobile NetView(Android+iOS / アプリいずれも含む) 2015/04「訪問者数」データ、「オークション」サブカテゴリ
  • 5. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 ヤフオク!について サービス開始:1999年 日本最大級の インターネットオークションサイト ※1: 2015年6月実績 ※2: 2015年6月22日実績 ※3: Nielsen NetView(家庭および職場からのPCによるアクセス。アプリは除く)Nielsen Mobile NetView(Android+iOS / アプリいずれも含む) 2015/04「訪問者数」データ、「オークション」サブカテゴリ
  • 6. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 ヤフオク!について サービス開始:1999年 日本最大級の インターネットオークションサイト 出品数:常時約3900万個※1 ※1: 2015年6月実績 ※2: 2015年6月22日実績 ※3: Nielsen NetView(家庭および職場からのPCによるアクセス。アプリは除く)Nielsen Mobile NetView(Android+iOS / アプリいずれも含む) 2015/04「訪問者数」データ、「オークション」サブカテゴリ
  • 7. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 ヤフオク!について サービス開始:1999年 日本最大級の インターネットオークションサイト 出品数:常時約3900万個※1 1秒あたり273個※2 ※1: 2015年6月実績 ※2: 2015年6月22日実績 ※3: Nielsen NetView(家庭および職場からのPCによるアクセス。アプリは除く)Nielsen Mobile NetView(Android+iOS / アプリいずれも含む) 2015/04「訪問者数」データ、「オークション」サブカテゴリ
  • 8. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 ヤフオク!について サービス開始:1999年 日本最大級の インターネットオークションサイト 出品数:常時約3900万個※1 1秒あたり273個※2 ユーザ数(PC):約1117万人※3 ※1: 2015年6月実績 ※2: 2015年6月22日実績 ※3: Nielsen NetView(家庭および職場からのPCによるアクセス。アプリは除く)Nielsen Mobile NetView(Android+iOS / アプリいずれも含む) 2015/04「訪問者数」データ、「オークション」サブカテゴリ
  • 9. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 ヤフオク!について サービス開始:1999年 日本最大級の インターネットオークションサイト 出品数:常時約3900万個※1 1秒あたり273個※2 ユーザ数(PC):約1117万人※3 ユーザ数(SP):約1671万人※3 ※1: 2015年6月実績 ※2: 2015年6月22日実績 ※3: Nielsen NetView(家庭および職場からのPCによるアクセス。アプリは除く)Nielsen Mobile NetView(Android+iOS / アプリいずれも含む) 2015/04「訪問者数」データ、「オークション」サブカテゴリ
  • 10. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 アジェンダ • ヤフオク!における深層学習を利用した 画像処理のご紹介 • ヤフオク!における分散表現を利用した 検索ランキングのご紹介
  • 11. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 アジェンダ • ヤフオク!における深層学習を利用した 画像処理のご紹介 • ヤフオク!における分散表現を利用した 検索ランキングのご紹介
  • 12. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 解決したい課題
  • 13. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 解決したい課題 MacBook Air
  • 14. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 解決したい課題
  • 15. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 解決したい課題
  • 16. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 解決したい課題 カテゴリ違い
  • 17. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 カテゴリ違い 入札ユーザ 「折角、カテゴリを絞って検索したのに、 関係ない商品が…」
  • 18. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 カテゴリ違い 入札ユーザ 「折角、カテゴリを絞って検索したのに、 関係ない商品が…」 ユーザビリティの低下
  • 19. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 カテゴリ違い 入札ユーザ 「折角、カテゴリを絞って検索したのに、 関係ない商品が…」 カテゴリ違いを検知!
  • 20. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 カテゴリ違いの検知 人による検知
  • 21. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 カテゴリ違いの検知 人による検知 ・高い精度
  • 22. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 カテゴリ違いの検知 人による検知 ・高い精度 しかし限界も
  • 23. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 カテゴリ違いの検知 人による検知 ・高い精度 しかし限界も ・量
  • 24. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 カテゴリ違いの検知 人による検知 ・高い精度 しかし限界も ・量 ・スピード
  • 25. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 カテゴリ違いの検知 人による検知 ・高い精度 しかし限界も ・量 ・スピード 機械学習の利用
  • 26. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 カテゴリ違いの検知 機械学習にも限界が
  • 27. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 カテゴリ違いの検知 機械学習にも限界が ・未知のパターン
  • 28. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 カテゴリ違いの検知 機械学習にも限界が ・未知のパターン ・100%の精度は難しい
  • 29. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 カテゴリ違いの検知 機械学習にも限界が ・未知のパターン ・100%の精度は難しい など
  • 30. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 カテゴリ違いの検知 機械学習にも限界が ・未知のパターン ・100%の精度は難しい など 機械学習は銀の弾丸ではない
  • 31. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 カテゴリ違いの検知 人と機械学習のハイブリッド
  • 32. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 カテゴリ違いの検知 人と機械学習のハイブリッド ・人:判断
  • 33. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 カテゴリ違いの検知 人と機械学習のハイブリッド ・人:判断 ・機械学習:人が判断する順序を決定
  • 34. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 カテゴリ違いの検知 人と機械学習のハイブリッド ・人:判断 ・機械学習:人が判断する順序を決定 メリットの両立 ・人:高い精度 ・機械学習:量とスピード
  • 35. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 カテゴリ違いの検知モデル
  • 36. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 カテゴリ違いの検知モデル 商品タイトルベース
  • 37. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 カテゴリ違いの検知モデル 商品タイトルベース ex. MacBook Air カテゴリへの出品
  • 38. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 カテゴリ違いの検知モデル 商品タイトルベース ex. MacBook Air カテゴリへの出品 「MacBook Air 用カバー」 「MacBook Air カバー」
  • 39. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 カテゴリ違いの検知モデル 商品タイトルベース ex. MacBook Air カテゴリへの出品 「MacBook Air 用カバー」 → ✕ 「MacBook Air カバー」 → ✕
  • 40. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 カテゴリ違いの検知モデル 商品タイトルベース ex. MacBook Air カテゴリへの出品 「MacBook Air 用カバー」 → ✕ 「MacBook Air カバー」 → ✕ 「MacBook Air + カバー」
  • 41. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 カテゴリ違いの検知モデル 商品タイトルベース ex. MacBook Air カテゴリへの出品 「MacBook Air 用カバー」 → ✕ 「MacBook Air カバー」 → ✕ 「MacBook Air + カバー」 → ◯
  • 42. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 カテゴリ違いの検知モデル 商品タイトルベース ex. MacBook Air カテゴリへの出品 「MacBook Air 用カバー」 → ✕ 「MacBook Air カバー」 → ✕ 「MacBook Air + カバー」 → ◯ 「MacBook Air おまけ付 カバー」
  • 43. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 カテゴリ違いの検知モデル 商品タイトルベース ex. MacBook Air カテゴリへの出品 「MacBook Air 用カバー」 → ✕ 「MacBook Air カバー」 → ✕ 「MacBook Air + カバー」 → ◯ 「MacBook Air おまけ付 カバー」 → ?
  • 44. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 カテゴリ違いの検知モデル 商品タイトルベース ex. MacBook Air カテゴリへの出品 「MacBook Air 用カバー」 → ✕ 「MacBook Air カバー」 → ✕ 「MacBook Air + カバー」 → ◯ 「MacBook Air おまけ付 カバー」 → ? 一定の精度はあるものの、限界も
  • 45. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 カテゴリ違いの検知モデル 単語に加え、画像も利用
  • 46. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 カテゴリ違いの検知モデル 単語に加え、画像も利用 例:MacBook Air カテゴリ
  • 47. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 カテゴリ違いの検知モデル 単語に加え、画像も利用 例:MacBook Air カテゴリ ◯ ✕ ✕
  • 48. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 カテゴリ違いの検知モデル 画像に写っている物体を認識
  • 49. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 カテゴリ違いの検知モデル 画像に写っている物体を認識 深層学習(Deep Learning)を利用
  • 50. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 深層学習の代表的手法 CNN(Convolutional Neural Network) RNN(Recurrent Neural Network) RNN(Recursive Neural Network) DBN(Deep Belief Network) DBM(Deep Boltzmann Network) DAE(Deep Autoencorder) at el.
  • 51. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 深層学習の代表的手法 CNN(Convolutional Neural Network) RNN(Recurrent Neural Network) RNN(Recursive Neural Network) DBN(Deep Belief Network) DBM(Deep Boltzmann Network) DAE(Deep Autoencorder) at el.
  • 52. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 CNNによる物体認識 画像に写っている物体を識別 Going deeper with convolutions (http://arxiv.org/pdf/1409.4842v1.pdf)より引用
  • 53. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 CNNによる物体認識 画像に写っている物体を識別 シベリアンハスキー エスキーモドッグ Going deeper with convolutions (http://arxiv.org/pdf/1409.4842v1.pdf)より引用
  • 54. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 学習 学習データ ヤフオク!の過去の出品画像 約2万件 環境 ・Caffe v1.0rc2 ・CUDA 7.5 ・GPUサーバ(オンプレ)
  • 55. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 識別 ノートPCである確率を出力
  • 56. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 識別 ノートPCである確率を出力 80.1% 0.1% 0.9%
  • 57. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 目視チェックの順序(イメージ) 80.1% 0.1% 0.9%
  • 58. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 目視チェックの順序(イメージ) 80.1% 0.1% 0.9% ③ ②① ※実際には商品タイトル等の他の特徴を考慮
  • 59. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 今後
  • 60. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 今後 学習データを高精度、大量、継続的に 増加させる仕組み
  • 61. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 今後 学習データを高精度、大量、継続的に 増加させる仕組み ラベル付け:高コスト
  • 62. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 今後 学習データを高精度、大量、継続的に 増加させる仕組み ラベル付け:高コスト 精度の向上 新しいパターンへの対応
  • 63. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 アジェンダ • ヤフオク!における深層学習を利用した 画像処理のご紹介 • ヤフオク!における分散表現を利用した 検索ランキングのご紹介
  • 64. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 ヤフオク! サイト内検索
  • 65. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 ヤフオク! サイト内検索
  • 66. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 ヤフオク! サイト内検索 機械学習によるランキング
  • 67. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 検索ランキング CTRやCVR等を最大化するモデル CTR:商品詳細画面へ流入する確率 CVR:その後に入札する確率
  • 68. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 検索ランキング 多くの特徴を利用
  • 69. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 検索ランキング 多くの特徴を利用 重要な特徴の1つが単語
  • 70. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 検索ランキング 多くの特徴を利用 重要な特徴の1つが単語 特にタイトル中の単語
  • 71. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 検索ランキング 多くの特徴を利用 重要な特徴の1つが単語 特にタイトル中の単語 「MacBook Air」 「MacBook Air カバー」
  • 72. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 単語の利用 単語を特徴に利用した場合の課題
  • 73. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 単語の利用 単語を特徴に利用した場合の課題 表記ゆれ、同義語
  • 74. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 単語の利用 単語を特徴に利用した場合の課題 表記ゆれ、同義語 一般的な対応 ・正規化 小文字大文字、半角全角、記号等 ・同義語辞書
  • 75. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 単語の利用 同義語辞書の整備:人手
  • 76. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 単語の利用 同義語辞書の整備:人手 ・コスト
  • 77. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 単語の利用 同義語辞書の整備:人手 ・コスト ヤフオク!の商品ドメイン:多 ・服、本、スマホから自動車、家まで
  • 78. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 単語の利用 同義語辞書の整備:人手 ・コスト ヤフオク!の商品ドメイン:多 ・服、本、スマホから自動車、家まで コストやばい
  • 79. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 単語の利用 同義語辞書の整備:人手 ・コスト ヤフオク!の商品ドメイン:多 ・服、本、スマホから自動車、家まで 計算で求めたい
  • 80. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 単語の利用 同義語辞書の整備:人手 ・コスト ヤフオク!の商品ドメイン:多 ・服、本、スマホから自動車、家まで 分散表現を利用
  • 81. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 分散表現 局所表現 分散表現
  • 82. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 分散表現 局所表現 サッカー: (1,0,0,0 … 0,0,0,0) フットボール: (0,0,0,0 … 0,1,0,0) 分散表現
  • 83. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 分散表現 局所表現 サッカー: (1,0,0,0 … 0,0,0,0) フットボール: (0,0,0,0 … 0,1,0,0) ベクトルは単純なエンコード 分散表現
  • 84. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 分散表現 局所表現 サッカー: (1,0,0,0 … 0,0,0,0) フットボール: (0,0,0,0 … 0,1,0,0) ベクトルは単純なエンコード 分散表現 サッカー: (0.13, -0.32, … 0.1, 0.07) フットボール: (0.11, -0.27, … 0.13, 0.07)
  • 85. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 分散表現 局所表現 サッカー: (1,0,0,0 … 0,0,0,0) フットボール: (0,0,0,0 … 0,1,0,0) ベクトルは単純なエンコード 分散表現 サッカー: (0.13, -0.32, … 0.1, 0.07) フットボール: (0.11, -0.27, … 0.13, 0.07) 意味が近い表現:近いベクトル
  • 86. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 単語の分散表現 意味が近い単語:ベクトルが近い単語
  • 87. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 単語の分散表現 意味が近い単語:ベクトルが近い単語 クラスタリング
  • 88. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 単語の分散表現 意味が近い単語:ベクトルが近い単語 クラスタリング 意味が近い単語群:同一クラスタ
  • 89. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 単語の分散表現 意味が近い単語:ベクトルが近い単語 クラスタリング 意味が近い単語群:同一クラスタ 検索ランキングのモデルの特徴
  • 90. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 単語の分散表現 意味が近い単語:ベクトルが近い単語 クラスタリング 意味が近い単語群:同一クラスタ 検索ランキングのモデルの特徴 ・単語
  • 91. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 単語の分散表現 意味が近い単語:ベクトルが近い単語 クラスタリング 意味が近い単語群:同一クラスタ 検索ランキングのモデルの特徴 ・単語 ・クラスタID
  • 92. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 分散表現の学習 学習コーパス ・商品タイトル ・商品数:約5000万件(重複除外) ・単語数:約3億8000万 ・Vocabulary:約40万 モデル: skip-gram (+negative sampling)
  • 93. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 クラスタリング モデル:k-means(k-means++) 距離:コサイン類似度
  • 94. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 生成されたクラスタの例 クラスタ例1: ザク, ドム, グフ, ゲルググ, ズゴック, …
  • 95. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 生成されたクラスタの例 クラスタ例1: ザク, ドム, グフ, ゲルググ, ズゴック, … クラスタ例2: アイパッド, iPad, iPadmini, Air, …
  • 96. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 生成されたクラスタの例 クラスタ例1: ザク, ドム, グフ, ゲルググ, ズゴック, … クラスタ例2: アイパッド, iPad, iPadmini, Air, …
  • 97. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 商品タイトルの置き換え クラスタ例1:ザク, ドム, グフ, ゲルググ, …
  • 98. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 商品タイトルの置き換え クラスタ例1:ザク, ドム, グフ, ゲルググ, … 中古 HY2M 1/12 ザク MS-06J ZAKUII ↓ 中古 HY2M 1/12 cid_1 MS-06J ZAKUII
  • 99. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 商品タイトルの置き換え クラスタ例1:ザク, ドム, グフ, ゲルググ, … 中古 HY2M 1/12 ザク MS-06J ZAKUII ↓ 中古 HY2M 1/12 cid_1 MS-06J ZAKUII ガンプラ MG1/100 MS-09 ドム ↓ ガンプラ MG1/100 MS-09 cid_1
  • 100. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 今後 skip-gram以降の分散表現のモデルを 利用
  • 101. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 今後 skip-gram以降の分散表現のモデルを 利用 重複タイトルの判断精度
  • 102. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 今後 skip-gram以降の分散表現のモデルを 利用 重複タイトルの判断精度 クラスタリング精度 ex. ディリクレ過程混合正規分布
  • 103. Copyright (C) 2016 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 ご静聴有難うございました