SlideShare a Scribd company logo
Enviar búsqueda
Cargar
Iniciar sesión
Registrarse
コーパス学習による Apache Solr の徹底活用
Denunciar
Koji Sekiguchi
Seguir
RONDHUIT Co.,Ltd. - Founder & CEO en RONDHUIT Co.,Ltd.
2 de Sep de 2014
•
0 recomendaciones
•
5,263 vistas
1
de
24
コーパス学習による Apache Solr の徹底活用
2 de Sep de 2014
•
0 recomendaciones
•
5,263 vistas
Descargar ahora
Descargar para leer sin conexión
Denunciar
Tecnología
第14回Solr勉強会の発表資料です。
Koji Sekiguchi
Seguir
RONDHUIT Co.,Ltd. - Founder & CEO en RONDHUIT Co.,Ltd.
Recomendados
情報検索におけるランキング計算の紹介
Koji Sekiguchi
3.1K vistas
•
15 diapositivas
Geolocation gurunavi
Jun Chiba
782 vistas
•
13 diapositivas
Geolocation4 system
Jun Chiba
882 vistas
•
6 diapositivas
Pythonのガベージコレクション
Atsuo Ishimoto
4.6K vistas
•
10 diapositivas
HMM viterbi
Koji Sekiguchi
15.2K vistas
•
16 diapositivas
Apache Solr 検索エンジン入門
Yahoo!デベロッパーネットワーク
7.1K vistas
•
127 diapositivas
Más contenido relacionado
Destacado
WikipediaからのSolr用類義語辞書の自動生成
Koji Sekiguchi
12.6K vistas
•
27 diapositivas
マーケティング科学第1回(スライドシェア用)
Shinya Fujimura
4.1K vistas
•
40 diapositivas
数式を(ちょっとしか)使わずに隠れマルコフモデル
Yuya Takashina
9.1K vistas
•
19 diapositivas
概要と具体例で学ぶHMM(隠れマルコフモデル)
thinkn1108
15.5K vistas
•
7 diapositivas
10年前「Microsoftの社員だと思って働け!」と教育されて嫌気がさして出てった人から見た「外の世界」の話 #JCCMVP
Kazuhito Miura
2.1K vistas
•
114 diapositivas
IoTって何が良いの? 〜言うてるオレもわからんわ〜 #kinoko_iot
Kazuhito Miura
2.1K vistas
•
57 diapositivas
Destacado
(8)
WikipediaからのSolr用類義語辞書の自動生成
Koji Sekiguchi
•
12.6K vistas
マーケティング科学第1回(スライドシェア用)
Shinya Fujimura
•
4.1K vistas
数式を(ちょっとしか)使わずに隠れマルコフモデル
Yuya Takashina
•
9.1K vistas
概要と具体例で学ぶHMM(隠れマルコフモデル)
thinkn1108
•
15.5K vistas
10年前「Microsoftの社員だと思って働け!」と教育されて嫌気がさして出てった人から見た「外の世界」の話 #JCCMVP
Kazuhito Miura
•
2.1K vistas
IoTって何が良いの? 〜言うてるオレもわからんわ〜 #kinoko_iot
Kazuhito Miura
•
2.1K vistas
Poor Self-esteem: Just Beat It!
SlideShop.com
•
114K vistas
Build Features, Not Apps
Natasha Murashev
•
388.9K vistas
Más de Koji Sekiguchi
20221209-ApacheSolrによるはじめてのセマンティックサーチ.pdf
Koji Sekiguchi
96 vistas
•
14 diapositivas
Solr から使う OpenNLP の日本語固有表現抽出
Koji Sekiguchi
3.7K vistas
•
14 diapositivas
Learning-to-Rank meetup Vol. 1
Koji Sekiguchi
2.7K vistas
•
24 diapositivas
Lucene 6819-good-bye-index-time-boost
Koji Sekiguchi
2.1K vistas
•
10 diapositivas
NLP4L - 情報検索における性能改善のためのコーパスの活用とランキング学習
Koji Sekiguchi
3.3K vistas
•
25 diapositivas
An Introduction to NLP4L (Scala by the Bay / Big Data Scala 2015)
Koji Sekiguchi
3.6K vistas
•
86 diapositivas
Más de Koji Sekiguchi
(20)
20221209-ApacheSolrによるはじめてのセマンティックサーチ.pdf
Koji Sekiguchi
•
96 vistas
Solr から使う OpenNLP の日本語固有表現抽出
Koji Sekiguchi
•
3.7K vistas
Learning-to-Rank meetup Vol. 1
Koji Sekiguchi
•
2.7K vistas
Lucene 6819-good-bye-index-time-boost
Koji Sekiguchi
•
2.1K vistas
NLP4L - 情報検索における性能改善のためのコーパスの活用とランキング学習
Koji Sekiguchi
•
3.3K vistas
An Introduction to NLP4L (Scala by the Bay / Big Data Scala 2015)
Koji Sekiguchi
•
3.6K vistas
An Introduction to NLP4L
Koji Sekiguchi
•
3.7K vistas
Nlp4 l intro-20150513
Koji Sekiguchi
•
7.6K vistas
情報検索の基礎からデータの徹底活用まで
Koji Sekiguchi
•
3.9K vistas
LUCENE-5252 NGramSynonymTokenizer
Koji Sekiguchi
•
3.3K vistas
系列パターンマイニングを用いた単語パターン学習とWikipediaからの組織名抽出
Koji Sekiguchi
•
2.6K vistas
Luceneインデックスの共起単語分析とSolrによる共起単語サジェスチョン
Koji Sekiguchi
•
1.8K vistas
Html noise reduction
Koji Sekiguchi
•
2.2K vistas
Lucene terms extraction
Koji Sekiguchi
•
8.4K vistas
Visualize terms network in Lucene index
Koji Sekiguchi
•
2.3K vistas
NLP x Lucene/Solr
Koji Sekiguchi
•
2.5K vistas
OpenNLP - MEM and Perceptron
Koji Sekiguchi
•
5.1K vistas
自然言語処理における機械学習による曖昧性解消入門
Koji Sekiguchi
•
8.9K vistas
Similarity functions in Lucene 4.0
Koji Sekiguchi
•
8.5K vistas
Pre rondhuit-naming-story
Koji Sekiguchi
•
6.2K vistas
Último
ヒアラブルデバイスにおける音漏れ信号を用いた空中ジェスチャ認識
sugiuralab
5 vistas
•
1 diapositiva
CCoE実践者コミュニティ#1_CCoEが進めるセキュリティカイゼンの旅.pptx
Tomoaki Tada
57 vistas
•
20 diapositivas
IGDA Japan SIG Audio #20-1 室内・野外でのマイク収録と整音.pdf
IGDA Japan SIG-Audio
115 vistas
•
31 diapositivas
GraphQLはどんな時に使うか
Yutaka Tachibana
14 vistas
•
37 diapositivas
20230921_IoTLT_vol103_kitazaki_v1.pdf
Ayachika Kitazaki
164 vistas
•
16 diapositivas
MLOps Course Slides_JP(配布用).pdf
Yuya Yamamoto
118 vistas
•
31 diapositivas
Último
(14)
ヒアラブルデバイスにおける音漏れ信号を用いた空中ジェスチャ認識
sugiuralab
•
5 vistas
CCoE実践者コミュニティ#1_CCoEが進めるセキュリティカイゼンの旅.pptx
Tomoaki Tada
•
57 vistas
IGDA Japan SIG Audio #20-1 室内・野外でのマイク収録と整音.pdf
IGDA Japan SIG-Audio
•
115 vistas
GraphQLはどんな時に使うか
Yutaka Tachibana
•
14 vistas
20230921_IoTLT_vol103_kitazaki_v1.pdf
Ayachika Kitazaki
•
164 vistas
MLOps Course Slides_JP(配布用).pdf
Yuya Yamamoto
•
118 vistas
CatBoost on GPU のひみつ
Takuji Tahara
•
548 vistas
2023情報処理学会関西支部大会-G12.pdf
KoseiShimoda1
•
7 vistas
拡散する画像生成.pdf
NTTDOCOMO-ServiceInnovation
•
44 vistas
画像生成AIの問題点
iPride Co., Ltd.
•
10 vistas
磁石内臓イヤリングによる磁力変化を利用したジェスチャ識別
sugiuralab
•
7 vistas
テスト自動化.pdf
ssuserf8ea02
•
29 vistas
遠隔お酌IoTLT2309.pptx
Yoshiaki Ito
•
145 vistas
インフラチームとCCoEの関係.pptx
ssuser5c7ee4
•
20 vistas
コーパス学習による Apache Solr の徹底活用
1.
コーパス学習による Apache Solr
の徹底活用 関口宏司@ロンウイット 1
2.
情報検索の性能指標 ドキュメントの全体集合 2
3.
情報検索の性能指標 正解 3
4.
情報検索の性能指標 システム出力正解 4
5.
情報検索の性能指標 精度 :
P = B / ( A + B ) 再現率 : R = B / ( B + C ) A B C システム出力正解 5
6.
精度と再現率 精度と再現率はトレードオフの関係にある! 6
7.
精度と再現率 精度と再現率はトレードオフの関係にある! 正解
7
8.
精度と再現率 精度と再現率はトレードオフの関係にある! システム出力正解
高精度 低再現率 8
9.
精度と再現率 精度と再現率はトレードオフの関係にある! システム出力正解
低精度 高再現率 9
10.
Apache Solr の徹底活用
表記揺れへの対応 絞り込み検索による 漸次的精度改善 ランキング チューニング 10
11.
Apache Solr の徹底活用
表記揺れへの対応 絞り込み検索による 漸次的精度改善 ランキング チューニング 11
12.
表記揺れへの対応後 システム出力正解 12
13.
漸次的精度改善 13
14.
漸次的精度改善 q=ハワイ システム出力正解
14
15.
漸次的精度改善 システム出力正解 予算(10~15万円)
で絞り込む 15
16.
漸次的精度改善 システム出力正解 予算(10~15万円)
で絞り込む 出発地(羽田空港) で絞り込む 16
17.
構造化文書 ID ツアー名価格出発地
1 ハワイオアフ島7日間9万円成田 2 ハワイオアフ島&マウイ島燃油込み12万円羽田 17
18.
非構造化文書はどうする? • 非構造化文書の例
• WordやPDFファイル • 新聞記事 • 書籍 18
19.
非構造化文書 ID 記事
1 安倍首相は12日、甲府市で開かれた自民党ゴルフコンペで… 2 モスクワで開かれている世界陸上の男子100m予選で、日本の高校生桐 生が… : : 19
20.
非構造化文書の構造化 ID 記事人名地名イベント…
1 安倍首相は12日、甲府市で開かれた 自民党ゴルフコンペで… 安倍甲府市ゴルフコ ンペ 2 モスクワで開かれている世界陸上の 男子100m予選で、日本の高校生桐生 が… 桐生モスクワ、 日本世界陸上 : : 20
21.
アーキテクチャ Update Request
Processor CRFsuite Corpus Model InSdoelrx Docs 21
22.
ビジネス志向のタグ ACCESS FOOD
PLAN DATETIME LANGUAGE PRINTING DISEASE LOCATION PRODUCT EVENT ORGANIZATION TITLE FACILITY PERSON VEHICLE 22
23.
参考文献 • Apache
Solr 無料セミナー(毎月開催) • http://www.rondhuit.com/services/ seminars.html • 情報検索のための自然言語処理ツール群の開発 • https://dspace.jaist.ac.jp/dspace/handle/ 10119/12033 23
24.
ご静聴ありがとう ございました 24