SlideShare una empresa de Scribd logo
1 de 8
第17回 Machine Learning 15minutes!(2017/10/28)
ビジネスの出会いを科学する
R&D Group 研究員:高橋 寛治@kanji250tr
法人向け名刺管理サービス 個人向け名刺アプリ
Sansanは2つの名刺サービスを提供しています
➢ 名刺のデータ化
➢ 名刺による人脈の管理
➢ 人手による正確なデータ化
名刺を企業の資産に変える
2
名刺は人と人との出会いの証である接点情報
→ 誰と誰が、いつ出会ったかを記録したビジネスデータベースとなる
データ化およびビジネスデータベースからの価値創出がR&Dの課題
ビジネスの出会いを科学するために必要な2つの領域
3
名刺データ化の自動化 データ活用
年間数億枚の名刺を99.9%の精度でデータ化
4
人力入力に比べ、名刺1枚あたりの入力コストを
機械学習を適用することで約80%削減
名刺画像の読取 名刺情報の入力 ビジネスデータベース
人力×機械学習など
データ活用一例:キーワードによる属性の付与
5
企業の特徴や属性を表すキーワードを付与する
業種分類
Sansan株式会社:情報処理サービス / パッケージソフト業
生きた情報(トレンド)も含めたい
IoT, ディープラーニング, ビットコイン, AI, Fintech
名詞の連接を計算しキーワードを抽出
6
キーワード抽出
• 形態素解析や不用語削除など前処理
を適用
• 会社単位でキーワード候補を抽出
• TermExtractによりスコアリング
• Top Nをキーワードとして抽出
1. トップページを取得 2. 形態素解析
クラウド 名詞
名刺管理 名詞
サービス 名詞
を 助詞
提供 名詞
する 動詞
3. キーワード候補抽出4. キーワード抽出
クラウド 名詞
名刺管理 名詞
サービス 名詞
提供 名詞
クラウド名刺管理
𝐹𝐿𝑅 𝐶𝑁 = 𝑓 𝐶𝑁 × 𝐿𝑅 𝐶𝑁
𝐿𝑅 𝐶𝑁 = ෑ
𝑖=1
𝐿
𝐹𝐿 𝑁𝑖 + 1 𝐹𝑅 𝑁𝑖 + 1
1
2𝐿
出会いの
精査
意図した
複数の
出会い
出会いへの
アプローチ
ミッション
目的
成果
偶然の
複数の
出会い
ミッション
目的との
マッチング
出会う
べき人
名刺DB
・成果の理解
・人物特徴の分析
・リコメンド
Sansan
レコメンドエンジン
データ活用の今後

Más contenido relacionado

Similar a 第17回Machine Learning 15 minutes!:ビジネスの出会いを科学する

採用プラットフォームサービス『転職ナビ』
採用プラットフォームサービス『転職ナビ』採用プラットフォームサービス『転職ナビ』
採用プラットフォームサービス『転職ナビ』akitakatanaka
 
【講演資料】アテにされる / どういうこと?どすればいいの?
【講演資料】アテにされる / どういうこと?どすればいいの?【講演資料】アテにされる / どういうこと?どすればいいの?
【講演資料】アテにされる / どういうこと?どすればいいの?Masanori Saito
 
機械学習を活用するための、3本の柱~教育型の機械学習ツールの必要性~
機械学習を活用するための、3本の柱~教育型の機械学習ツールの必要性~機械学習を活用するための、3本の柱~教育型の機械学習ツールの必要性~
機械学習を活用するための、3本の柱~教育型の機械学習ツールの必要性~Takahiro Kubo
 
量子コンピュータ
量子コンピュータ量子コンピュータ
量子コンピュータMasanori Saito
 
量子コンピュータ
量子コンピュータ量子コンピュータ
量子コンピュータMasanori Saito
 
Sansan ~ ハッカーズチャンプルー2017 スポンサーセッション ~
Sansan ~ ハッカーズチャンプルー2017 スポンサーセッション ~Sansan ~ ハッカーズチャンプルー2017 スポンサーセッション ~
Sansan ~ ハッカーズチャンプルー2017 スポンサーセッション ~Yotaro Fujii
 

Similar a 第17回Machine Learning 15 minutes!:ビジネスの出会いを科学する (7)

採用プラットフォームサービス『転職ナビ』
採用プラットフォームサービス『転職ナビ』採用プラットフォームサービス『転職ナビ』
採用プラットフォームサービス『転職ナビ』
 
【講演資料】アテにされる / どういうこと?どすればいいの?
【講演資料】アテにされる / どういうこと?どすればいいの?【講演資料】アテにされる / どういうこと?どすればいいの?
【講演資料】アテにされる / どういうこと?どすればいいの?
 
機械学習を活用するための、3本の柱~教育型の機械学習ツールの必要性~
機械学習を活用するための、3本の柱~教育型の機械学習ツールの必要性~機械学習を活用するための、3本の柱~教育型の機械学習ツールの必要性~
機械学習を活用するための、3本の柱~教育型の機械学習ツールの必要性~
 
量子コンピュータ
量子コンピュータ量子コンピュータ
量子コンピュータ
 
量子コンピュータ
量子コンピュータ量子コンピュータ
量子コンピュータ
 
Tech summit2018 PR02
Tech summit2018 PR02Tech summit2018 PR02
Tech summit2018 PR02
 
Sansan ~ ハッカーズチャンプルー2017 スポンサーセッション ~
Sansan ~ ハッカーズチャンプルー2017 スポンサーセッション ~Sansan ~ ハッカーズチャンプルー2017 スポンサーセッション ~
Sansan ~ ハッカーズチャンプルー2017 スポンサーセッション ~
 

Más de Kanji Takahashi

20180718Eightニュースフィード活性化のための自然言語処理の取り組み
20180718Eightニュースフィード活性化のための自然言語処理の取り組み20180718Eightニュースフィード活性化のための自然言語処理の取り組み
20180718Eightニュースフィード活性化のための自然言語処理の取り組みKanji Takahashi
 
論文読み会 Creating Speech and Language Data With Amazon’s Mechanical Turk
論文読み会 Creating Speech and Language Data With Amazon’s Mechanical Turk論文読み会 Creating Speech and Language Data With Amazon’s Mechanical Turk
論文読み会 Creating Speech and Language Data With Amazon’s Mechanical TurkKanji Takahashi
 
論文読み会 Enriching Word Vectors with Subword Information
論文読み会 Enriching Word Vectors with Subword Information論文読み会 Enriching Word Vectors with Subword Information
論文読み会 Enriching Word Vectors with Subword InformationKanji Takahashi
 
論文読み会 Data Augmentation for Low-Resource Neural Machine Translation
論文読み会 Data Augmentation for Low-Resource Neural Machine Translation論文読み会 Data Augmentation for Low-Resource Neural Machine Translation
論文読み会 Data Augmentation for Low-Resource Neural Machine TranslationKanji Takahashi
 
言語処理学会第23回年次大会参加報告
言語処理学会第23回年次大会参加報告言語処理学会第23回年次大会参加報告
言語処理学会第23回年次大会参加報告Kanji Takahashi
 
20170203The Effects of Data Size and Frequency Range on Distributional Semant...
20170203The Effects of Data Size and Frequency Range on Distributional Semant...20170203The Effects of Data Size and Frequency Range on Distributional Semant...
20170203The Effects of Data Size and Frequency Range on Distributional Semant...Kanji Takahashi
 
20161215Neural Machine Translation of Rare Words with Subword Units
20161215Neural Machine Translation of Rare Words with Subword Units20161215Neural Machine Translation of Rare Words with Subword Units
20161215Neural Machine Translation of Rare Words with Subword UnitsKanji Takahashi
 
Enriching Morphologically Poor Languages for Statistical Machine Translation
Enriching Morphologically Poor Languages for Statistical Machine TranslationEnriching Morphologically Poor Languages for Statistical Machine Translation
Enriching Morphologically Poor Languages for Statistical Machine TranslationKanji Takahashi
 
A Beam-Search Decoder for Normalization of Social Media Text with Application...
A Beam-Search Decoder for Normalization of Social Media Text with Application...A Beam-Search Decoder for Normalization of Social Media Text with Application...
A Beam-Search Decoder for Normalization of Social Media Text with Application...Kanji Takahashi
 
Reducing the Impact of Data Sparsity in Statistical Machine Translation
Reducing the Impact of Data Sparsity in Statistical Machine TranslationReducing the Impact of Data Sparsity in Statistical Machine Translation
Reducing the Impact of Data Sparsity in Statistical Machine TranslationKanji Takahashi
 
文献紹介:Morphological analysis for Statistical Machine Translation
文献紹介:Morphological analysis for Statistical Machine Translation文献紹介:Morphological analysis for Statistical Machine Translation
文献紹介:Morphological analysis for Statistical Machine TranslationKanji Takahashi
 
Distributed Representations of Words and Phrases and their Compositionally
Distributed Representations of Words and Phrases and their CompositionallyDistributed Representations of Words and Phrases and their Compositionally
Distributed Representations of Words and Phrases and their CompositionallyKanji Takahashi
 
Nlp2016参加報告(高橋)
Nlp2016参加報告(高橋)Nlp2016参加報告(高橋)
Nlp2016参加報告(高橋)Kanji Takahashi
 
Domain-spesific Paraphrase Extraction
Domain-spesific Paraphrase ExtractionDomain-spesific Paraphrase Extraction
Domain-spesific Paraphrase ExtractionKanji Takahashi
 
Vietnamese Word Segmentation with CRFs and SVMs: An Investigation
Vietnamese Word Segmentation with CRFs and SVMs: An InvestigationVietnamese Word Segmentation with CRFs and SVMs: An Investigation
Vietnamese Word Segmentation with CRFs and SVMs: An InvestigationKanji Takahashi
 
Improving vietnamese word segmentation and pos tagging using MEM with various...
Improving vietnamese word segmentation and pos tagging using MEM with various...Improving vietnamese word segmentation and pos tagging using MEM with various...
Improving vietnamese word segmentation and pos tagging using MEM with various...Kanji Takahashi
 
日本語機能表現の自動検出と統計的係り受け解析への応用
日本語機能表現の自動検出と統計的係り受け解析への応用日本語機能表現の自動検出と統計的係り受け解析への応用
日本語機能表現の自動検出と統計的係り受け解析への応用Kanji Takahashi
 
20150916How Far are We from Fully Automatic High Quality Grammatical Error Co...
20150916How Far are We from Fully Automatic High Quality Grammatical Error Co...20150916How Far are We from Fully Automatic High Quality Grammatical Error Co...
20150916How Far are We from Fully Automatic High Quality Grammatical Error Co...Kanji Takahashi
 
20150728So similar and yet incompatible: Toward automated identification of s...
20150728So similar and yet incompatible:Toward automated identification of s...20150728So similar and yet incompatible:Toward automated identification of s...
20150728So similar and yet incompatible: Toward automated identification of s...Kanji Takahashi
 
20150701 Improving SMT quality with morpho-syntactic analysis
20150701 Improving SMT quality with morpho-syntactic analysis20150701 Improving SMT quality with morpho-syntactic analysis
20150701 Improving SMT quality with morpho-syntactic analysisKanji Takahashi
 

Más de Kanji Takahashi (20)

20180718Eightニュースフィード活性化のための自然言語処理の取り組み
20180718Eightニュースフィード活性化のための自然言語処理の取り組み20180718Eightニュースフィード活性化のための自然言語処理の取り組み
20180718Eightニュースフィード活性化のための自然言語処理の取り組み
 
論文読み会 Creating Speech and Language Data With Amazon’s Mechanical Turk
論文読み会 Creating Speech and Language Data With Amazon’s Mechanical Turk論文読み会 Creating Speech and Language Data With Amazon’s Mechanical Turk
論文読み会 Creating Speech and Language Data With Amazon’s Mechanical Turk
 
論文読み会 Enriching Word Vectors with Subword Information
論文読み会 Enriching Word Vectors with Subword Information論文読み会 Enriching Word Vectors with Subword Information
論文読み会 Enriching Word Vectors with Subword Information
 
論文読み会 Data Augmentation for Low-Resource Neural Machine Translation
論文読み会 Data Augmentation for Low-Resource Neural Machine Translation論文読み会 Data Augmentation for Low-Resource Neural Machine Translation
論文読み会 Data Augmentation for Low-Resource Neural Machine Translation
 
言語処理学会第23回年次大会参加報告
言語処理学会第23回年次大会参加報告言語処理学会第23回年次大会参加報告
言語処理学会第23回年次大会参加報告
 
20170203The Effects of Data Size and Frequency Range on Distributional Semant...
20170203The Effects of Data Size and Frequency Range on Distributional Semant...20170203The Effects of Data Size and Frequency Range on Distributional Semant...
20170203The Effects of Data Size and Frequency Range on Distributional Semant...
 
20161215Neural Machine Translation of Rare Words with Subword Units
20161215Neural Machine Translation of Rare Words with Subword Units20161215Neural Machine Translation of Rare Words with Subword Units
20161215Neural Machine Translation of Rare Words with Subword Units
 
Enriching Morphologically Poor Languages for Statistical Machine Translation
Enriching Morphologically Poor Languages for Statistical Machine TranslationEnriching Morphologically Poor Languages for Statistical Machine Translation
Enriching Morphologically Poor Languages for Statistical Machine Translation
 
A Beam-Search Decoder for Normalization of Social Media Text with Application...
A Beam-Search Decoder for Normalization of Social Media Text with Application...A Beam-Search Decoder for Normalization of Social Media Text with Application...
A Beam-Search Decoder for Normalization of Social Media Text with Application...
 
Reducing the Impact of Data Sparsity in Statistical Machine Translation
Reducing the Impact of Data Sparsity in Statistical Machine TranslationReducing the Impact of Data Sparsity in Statistical Machine Translation
Reducing the Impact of Data Sparsity in Statistical Machine Translation
 
文献紹介:Morphological analysis for Statistical Machine Translation
文献紹介:Morphological analysis for Statistical Machine Translation文献紹介:Morphological analysis for Statistical Machine Translation
文献紹介:Morphological analysis for Statistical Machine Translation
 
Distributed Representations of Words and Phrases and their Compositionally
Distributed Representations of Words and Phrases and their CompositionallyDistributed Representations of Words and Phrases and their Compositionally
Distributed Representations of Words and Phrases and their Compositionally
 
Nlp2016参加報告(高橋)
Nlp2016参加報告(高橋)Nlp2016参加報告(高橋)
Nlp2016参加報告(高橋)
 
Domain-spesific Paraphrase Extraction
Domain-spesific Paraphrase ExtractionDomain-spesific Paraphrase Extraction
Domain-spesific Paraphrase Extraction
 
Vietnamese Word Segmentation with CRFs and SVMs: An Investigation
Vietnamese Word Segmentation with CRFs and SVMs: An InvestigationVietnamese Word Segmentation with CRFs and SVMs: An Investigation
Vietnamese Word Segmentation with CRFs and SVMs: An Investigation
 
Improving vietnamese word segmentation and pos tagging using MEM with various...
Improving vietnamese word segmentation and pos tagging using MEM with various...Improving vietnamese word segmentation and pos tagging using MEM with various...
Improving vietnamese word segmentation and pos tagging using MEM with various...
 
日本語機能表現の自動検出と統計的係り受け解析への応用
日本語機能表現の自動検出と統計的係り受け解析への応用日本語機能表現の自動検出と統計的係り受け解析への応用
日本語機能表現の自動検出と統計的係り受け解析への応用
 
20150916How Far are We from Fully Automatic High Quality Grammatical Error Co...
20150916How Far are We from Fully Automatic High Quality Grammatical Error Co...20150916How Far are We from Fully Automatic High Quality Grammatical Error Co...
20150916How Far are We from Fully Automatic High Quality Grammatical Error Co...
 
20150728So similar and yet incompatible: Toward automated identification of s...
20150728So similar and yet incompatible:Toward automated identification of s...20150728So similar and yet incompatible:Toward automated identification of s...
20150728So similar and yet incompatible: Toward automated identification of s...
 
20150701 Improving SMT quality with morpho-syntactic analysis
20150701 Improving SMT quality with morpho-syntactic analysis20150701 Improving SMT quality with morpho-syntactic analysis
20150701 Improving SMT quality with morpho-syntactic analysis
 

第17回Machine Learning 15 minutes!:ビジネスの出会いを科学する