SlideShare una empresa de Scribd logo
1 de 26
Descargar para leer sin conexión
オープンなデータベースを利用した行動計画提案に関する研究
加藤 文彦(国立情報学研究所)
小出 誠二(国立情報学研究所)
武田 英明(国立情報学研究所,総合研究大学院大学)
落合 勇太(トヨタ自動車株式会社)
上田 健揮(トヨタ自動車株式会社)
常識推論の研究の現在
l 常識推論研究[Davis16]
n Web Mining
n 知識ベースアプローチ
u フォーマルアプローチ
l Situation calculus, QPT etc.
u インフォーマルアプローチ
l Frame, Scripts, Case-based
u 大規模
l CYC
n クラウドソーシング
u CoceptNet, OpenMind
l 80年代以降、実用的な意味ではどのアプローチも大きな進歩は見られない
[Davis 16] Davis, E. and Marcus, G.: Commonsense reasoning and commonsense knowledge in artificial intelligence.
Commun. ACM, Vol. 58, No. 9, pp.92-103. (2015) DOI:https://doi.org/10.1145/2701413.
本研究のアプローチ
l 環境の変化
n 大規模知識ベース、データベースの存在
n 大規模computing
n Semantic Web Technologies
l 目的:既存の大規模知識ベース、データベースを利用して、
特定問題の解決システムを作る。
n 自動車の搭乗者の曖昧な要求を理解して、目的地やスケ
ジュールを提案する。
l 手段:DBpedia, Linked Geo Data (Open Street Map), Wikidata,
WordNetを合目的的に結合して利用する。
課題設定
l 入力: 目的地に関する要求 または 行動要求
n “ライオンが見たいな”
n “温泉に入りたい”
n “酒が飲みたい”
l 出力: 具体的な場所(施設,観光地等)や地域
n “上野恩賜公園”
n “大江戸温泉物語”
n “神谷バー”
ユーザ要求: “ライオンが⾒たい”
ユーザ要求: “ライオンが⾒たい” 提案: “恩賜上野動物園”
ユーザ要求: “ライオンが⾒たい” 提案: “恩賜上野動物園”
この間にはギャップがある
“動物のライオンを見たい”としたときに,
人は動物園や類似施設と限定して探す
この限定はどこから来るのか?
問題まとめ
1. ユーザ要求の曖昧性解消
n 要求対象の「ライオン」とは
u 「動物」「店」「会社」など
u 動物のライオン: 生きているのか剥製なのか
2. 対象についての知識
n 「(動物の)ライオン」は「動物」であり「哺乳類」であり
3. 施設についての知識
n 「動物園」では「動物」を「見る」ことができる
n デパート特設展示で剥製見るといった特殊条件は省略
4. 実施設の提示
n 「動物園」がどこにあるのか
本研究のアプローチ
l 問題2-4について既存のオープンなデータベースや知識を組み
合わせることでどの程度解決可能か
n 既知のつながりもあるが不十分
n 目的に応じてつなぐ知識を追加
データセット 版 トリプル数 クラス数 利用状況
事実
DBpedia core+en 2016-04-01 1,131,657,931 - △
DBpedia Japanese 2017-02-20 113,299,748 - ○
LinkedGeoData 2015-11-02 1,216,560,762 - ○
汎用オントロジー
DBpedia Ontology 2016-11-01 30,793 758○
LGD Ontology 2014-09-09 24,530 1,200○
日本語WordNet 2013-06-26 4,003,288 57,238○
日本語Wikipediaオントロジー 2013-11-07 21,863,327 166,397×
YAGO 3.0.2 1,001,461,792 5,130,031×
OpenCyc 2012-05-10 5,783,451 233,644×
UMBEL 1.5 392,728 33,686×
世界に関する
一般的知識
経験的知識
事実に関する知識
(Fact DB)
知識の分類
個別の事象,事柄に関して客観的に記述したもの
事象,事柄を抽象的に記述したもの,その関係を記述したもの
一部の間で合意されている知識や個人的知識
世界に関する
一般的知識
経験的知識
事実に関する知識
(Fact DB)
Linked Geo Data
(Open Street Map)
DBpedia/Wikipedia
Wikidata
WordNet
既存知識の構造
世界に関する
一般的知識
経験的知識
事実に関する知識
(Fact DB)
Linked Geo Data
(Open Street Map)
DBpedia/Wikipedia
Wikidata
WordNet
つなぐための知識の追加
施設オントロジー
サービスオントロジー
行動対象
オントロジー
施設データ
要求解釈知識
行動要求
施設オントロジー
l LGDの施設関連クラスを主な対象
n LGDはOSMベースなのでクラスもインスタンスも豊富
n レジャーや食事中心
l 関係するDBpediaクラスへマッピング
n LGDのインスタンスを補完
l 施設サービスを手動で定義
n サービス = ユーザが行える行動とその行動対象のペア
lgdo:Zoo a owl:Class;
servicevoc:dbpediaClass dbo:Zoo ;
servicevoc:provideService
[ servicevoc:hasService [
servicevoc:action action:払う;
servicevoc:target target:文化施設入場料 ], [
servicevoc:action action:見る;
servicevoc:target target:動物 ]] ;
rdfs:subClassOf servicevoc:Facility .
行動対象オントロジー
l サービス記述には行動対象の体系化が必要
l 施設におけるユーザ行動: 購買とそれ以外
n 購買: 家計調査収支項目分類よりオントロジー生成
n それ以外: WordNetを利用
target:文化施設入場料 a owl:Class;
rdfs:label "文化施設入場料";
rdfs:subClassOf target:入場・観覧・ゲーム代 .
サービスオントロジー
l 施設オントロジーのサービス部分を体系化
l サービスレベルで関連する施設クラスを探索可能
service:見る_動物_サービス a owl:Class;
rdfs:label "見る_動物_サービス";
servicevoc:hasService [
servicevoc:action action:見る;
servicevoc:target target:動物
];
rdfs:subClassOf service:見る_サービス .
データセット 版 トリプル数 クラス数
施設オントロジー 2017-02-20 3,257 418
サービスオントロジー 2017-02-20 3,933 750
行動対象オントロジー 2017-02-20 2,030 622
行動オントロジー 2017-02-20 153 55
計 9,373 1,845
追加知識の統計
要求
適切な対象と
動詞の設定
適切なサービスと
施設クラスの決定
適切な施設
インスタンスの決定
WordNet
行動対象オントロジー
サービスオントロジー
施設オントロジー
Linked Geo Data
DBpedia
処理の流れと対応するデータ
ライオンが見たいの処理例
推論
プロセス 3: 施設探索
プロセス 2: 施設クラス探索
プロセス 1: 行動対象探索
行動: 見る
行動対象: ライオン
0 要求解釈
RDF Store
行動対象オントロジー
WordNet
施設オントロジー
LinkedGeoData
DBpedia Japanese
行動: 見る
行動対象: 動物
1-n ない場合
行動対象を汎化して 1へ
施設クラス: lgdo:動物園
Q1 行動対象があるか
Q3 施設があるか
2-n ない場合 1へ
3-n ない場合 1へ
1-y 行動対象あり
2-y 施設クラスあり
3-y 施設あり
ユーザ要求
ライオンが見たい
出力
恩賜上野動物園
Q2 施設クラスがあるか
system> ライオンを見たい。そのあと温泉に入りたい。
現在地はNIIです。
動物を見る場所を探します。
一番近くの場所を案内します。
距離は3.0625353kmです。
場所:恩賜上野動物園
緯度:35.7175
経度:139.771
URL :"http://ja.dbpedia.org/resource/恩賜上野動物園"
現在地は(35.7175 . 139.771)です。
温泉に入る場所を探します。
…….
温泉に入る場所を探します。
一番近くの場所を案内します。
距離は3.0740614kmです。
場所:Inari-yu
緯度:35.6901
経度:139.766
URL :"http://linkedgeodata.org/triplify/node1744076702"
system>
実行例
アルゴリズムの概要
Main
loop sentence = ユーザより1行入力
morphs = sentence を 形態素解析(mecab+ipadic)
interp = morphs を shift-reduce 法 により構文解析
aspect = 文末情報から文章のaspect(質問/要望/宣言)を決定
if 質問 then 質問に答える
else if 要望 then 要望を満足する場所をSPARQL複合検索
else if 宣言 then 宣言を記憶
end loop
SPARQL複合検索
subject,verb,object,to-place,from-place,tool
= interp の格解析結果
loop verb と object によるSPARQL複合検索を実行
while 結果 = Nul
do object を汎化
場所の緯度・経度から一番近い場所を求めて答えとする
複合SPARQL検索例
PREFIX geo: <http://www.w3.org/2003/01/geo/wgs84_pos#>
PREFIX virtrdf: <http://www.openlinksw.com/schemas/virtrdf#>
PREFIX servicevoc: <http://tp.lodac.nii.ac.jp/ns/service#>
PREFIX action: <http://tp.lodac.nii.ac.jp/action/>
PREFIX target: <http://tp.lodac.nii.ac.jp/target/>
PREFIX wn20instances: <http://www.w3.org/2006/03/wn/wn20/instances/>
PREFIX wn20schema: <http://www.w3.org/2006/03/wn/wn20/schema/>
PREFIX wn30instances: <http://www.w3.org/2006/03/wn/wn30/instances/>
PREFIX wnja11instances: <http://wordnet.jp/ja11/instances/>
PREFIX wn21schema: <http://www.w3.org/2006/03/wn/wn21/schema/>
select distinct *
where {
GRAPH <http://tp.lodac.nii.ac.jp> {
?lgd_class rdfs:subClassOf servicevoc:Facility ;
servicevoc:provideService/servicevoc:hasService [
servicevoc:action action:見る ;
servicevoc:target target:動物
] .
target:動物 servicevoc:wordnet ?wordnet
}
GRAPH <http://wordnet.jp> {
?wordnet wn20schema:sense ?sense .
}
}
LIMIT 10
まとめ
l アプローチ
n 既存の知識ベース・データベースを組み合わせて問題解決
l 課題
n そのままでは繋がらない
l 課題解決
n 繋ぐ知識を作ることで可能になる
l メリット
n 大規模知識・データを利用できる
n さらに知識を加えることも可能
u 専門的データベース、商用データベース
l デメリット
n 各知識・データの不完全性、非一貫性、誤謬をどう処理するか。
u オープン知識処理の課題
n 繋ぐ知識構築
u 新しい知識工学の必要性
Attribution
l 上野動物園 by Wei-Te Wong
l ライオン by 吉鷹
l ライオン岩 (Lion rock) by pakku
l 銀座ライオン by Sharon Hahn Darlin
l Zoo Free Icon by My Town Leisure

Más contenido relacionado

Similar a オープンなデータベースを利用した行動計画提案に関する研究

行動計量シンポジウム20140321 http://lab.synergy-marketing.co.jp/activity/bsj_98th
行動計量シンポジウム20140321 http://lab.synergy-marketing.co.jp/activity/bsj_98th行動計量シンポジウム20140321 http://lab.synergy-marketing.co.jp/activity/bsj_98th
行動計量シンポジウム20140321 http://lab.synergy-marketing.co.jp/activity/bsj_98th
Yoichi Motomura
 
大規模画像認識とその周辺
大規模画像認識とその周辺大規模画像認識とその周辺
大規模画像認識とその周辺
n_hidekey
 
地域のLinked Open Dataでできること
 ー 奈良の観光情報を例に ー
地域のLinked Open Dataでできること
 ー 奈良の観光情報を例に ー地域のLinked Open Dataでできること
 ー 奈良の観光情報を例に ー
地域のLinked Open Dataでできること
 ー 奈良の観光情報を例に ー
Fuyuko Matsumura
 
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
Yuya Unno
 
この Visualization がすごい2014 〜データ世界を彩るツール6選〜
この Visualization がすごい2014 〜データ世界を彩るツール6選〜この Visualization がすごい2014 〜データ世界を彩るツール6選〜
この Visualization がすごい2014 〜データ世界を彩るツール6選〜
Takahiro Inoue
 
Big data解析ビジネス
Big data解析ビジネスBig data解析ビジネス
Big data解析ビジネス
Mie Mori
 

Similar a オープンなデータベースを利用した行動計画提案に関する研究 (20)

行動計量シンポジウム20140321 http://lab.synergy-marketing.co.jp/activity/bsj_98th
行動計量シンポジウム20140321 http://lab.synergy-marketing.co.jp/activity/bsj_98th行動計量シンポジウム20140321 http://lab.synergy-marketing.co.jp/activity/bsj_98th
行動計量シンポジウム20140321 http://lab.synergy-marketing.co.jp/activity/bsj_98th
 
「モダンな」可視化アプリケーション開発とはどのようなものか?
「モダンな」可視化アプリケーション開発とはどのようなものか?「モダンな」可視化アプリケーション開発とはどのようなものか?
「モダンな」可視化アプリケーション開発とはどのようなものか?
 
What's Information Visualization?
What's Information Visualization?What's Information Visualization?
What's Information Visualization?
 
大規模画像認識とその周辺
大規模画像認識とその周辺大規模画像認識とその周辺
大規模画像認識とその周辺
 
サブカルのためのWord2vec
サブカルのためのWord2vecサブカルのためのWord2vec
サブカルのためのWord2vec
 
地域のLinked Open Dataでできること
 ー 奈良の観光情報を例に ー
地域のLinked Open Dataでできること
 ー 奈良の観光情報を例に ー地域のLinked Open Dataでできること
 ー 奈良の観光情報を例に ー
地域のLinked Open Dataでできること
 ー 奈良の観光情報を例に ー
 
研究支援に係るアカデミッククラウド システムの調査検討
研究支援に係るアカデミッククラウド システムの調査検討研究支援に係るアカデミッククラウド システムの調査検討
研究支援に係るアカデミッククラウド システムの調査検討
 
Cross-modality meta-survey of dataset
Cross-modality meta-survey of datasetCross-modality meta-survey of dataset
Cross-modality meta-survey of dataset
 
San Diego Japan Bio Forum: ライフサイエンス向けデータ可視化技術の現状
San Diego Japan Bio Forum: ライフサイエンス向けデータ可視化技術の現状San Diego Japan Bio Forum: ライフサイエンス向けデータ可視化技術の現状
San Diego Japan Bio Forum: ライフサイエンス向けデータ可視化技術の現状
 
データサイエンティストが力を発揮できるアジャイルデータ活用基盤
データサイエンティストが力を発揮できるアジャイルデータ活用基盤データサイエンティストが力を発揮できるアジャイルデータ活用基盤
データサイエンティストが力を発揮できるアジャイルデータ活用基盤
 
ナレッジグラフ推論チャレンジ技術勉強会(2018/10/18)
ナレッジグラフ推論チャレンジ技術勉強会(2018/10/18)ナレッジグラフ推論チャレンジ技術勉強会(2018/10/18)
ナレッジグラフ推論チャレンジ技術勉強会(2018/10/18)
 
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
 
[JAWS2012]CRFを用いた メディア情報の抽出とLinked Data化 ~ ソーシャルメディアとマスメディアの比較事例 ~
[JAWS2012]CRFを用いた メディア情報の抽出とLinked Data化 ~ ソーシャルメディアとマスメディアの比較事例 ~[JAWS2012]CRFを用いた メディア情報の抽出とLinked Data化 ~ ソーシャルメディアとマスメディアの比較事例 ~
[JAWS2012]CRFを用いた メディア情報の抽出とLinked Data化 ~ ソーシャルメディアとマスメディアの比較事例 ~
 
この Visualization がすごい2014 〜データ世界を彩るツール6選〜
この Visualization がすごい2014 〜データ世界を彩るツール6選〜この Visualization がすごい2014 〜データ世界を彩るツール6選〜
この Visualization がすごい2014 〜データ世界を彩るツール6選〜
 
機械学習エンジニアリング・品質保証 (ESS2018招待講演 鷲崎弘宜)
機械学習エンジニアリング・品質保証 (ESS2018招待講演 鷲崎弘宜)機械学習エンジニアリング・品質保証 (ESS2018招待講演 鷲崎弘宜)
機械学習エンジニアリング・品質保証 (ESS2018招待講演 鷲崎弘宜)
 
AWSで作る分析基盤
AWSで作る分析基盤AWSで作る分析基盤
AWSで作る分析基盤
 
Big data解析ビジネス
Big data解析ビジネスBig data解析ビジネス
Big data解析ビジネス
 
Elastichelps fintechenablesdx usingaibasedautomationand anomalydetection
Elastichelps fintechenablesdx usingaibasedautomationand anomalydetectionElastichelps fintechenablesdx usingaibasedautomationand anomalydetection
Elastichelps fintechenablesdx usingaibasedautomationand anomalydetection
 
tut_pfi_2012
tut_pfi_2012tut_pfi_2012
tut_pfi_2012
 
リクルート式 自然言語処理技術の適応事例紹介
リクルート式 自然言語処理技術の適応事例紹介リクルート式 自然言語処理技術の適応事例紹介
リクルート式 自然言語処理技術の適応事例紹介
 

Más de Fumihiro Kato

シビックテック: インターネット時代の市民と行政の協働
シビックテック: インターネット時代の市民と行政の協働シビックテック: インターネット時代の市民と行政の協働
シビックテック: インターネット時代の市民と行政の協働
Fumihiro Kato
 

Más de Fumihiro Kato (20)

DBpedia Japanese
DBpedia JapaneseDBpedia Japanese
DBpedia Japanese
 
ウィキペディアタウン: 市民による地域情報化の一手法
ウィキペディアタウン: 市民による地域情報化の一手法ウィキペディアタウン: 市民による地域情報化の一手法
ウィキペディアタウン: 市民による地域情報化の一手法
 
Linked Data Cloudの話
Linked Data Cloudの話Linked Data Cloudの話
Linked Data Cloudの話
 
DBpedia Japanese 運営の現状
DBpedia Japanese 運営の現状DBpedia Japanese 運営の現状
DBpedia Japanese 運営の現状
 
シビックテック: インターネット時代の市民と行政の協働
シビックテック: インターネット時代の市民と行政の協働シビックテック: インターネット時代の市民と行政の協働
シビックテック: インターネット時代の市民と行政の協働
 
オープンデータカタログの先
オープンデータカタログの先オープンデータカタログの先
オープンデータカタログの先
 
Open Park Yokohama: 公園LODの試作
Open Park Yokohama: 公園LODの試作Open Park Yokohama: 公園LODの試作
Open Park Yokohama: 公園LODの試作
 
ウィキペディアタウン
ウィキペディアタウンウィキペディアタウン
ウィキペディアタウン
 
DBpedia in the Japanese LOD cloud
DBpedia in the Japanese LOD cloudDBpedia in the Japanese LOD cloud
DBpedia in the Japanese LOD cloud
 
Open Park Yokohama
Open Park YokohamaOpen Park Yokohama
Open Park Yokohama
 
データポータルソフトウェアCKAN
データポータルソフトウェアCKANデータポータルソフトウェアCKAN
データポータルソフトウェアCKAN
 
データカタログソフトウェア CKAN
データカタログソフトウェア CKANデータカタログソフトウェア CKAN
データカタログソフトウェア CKAN
 
オープンデータとLinked Open Data
オープンデータとLinked Open DataオープンデータとLinked Open Data
オープンデータとLinked Open Data
 
LOD: Linked Open Data
LOD: Linked Open DataLOD: Linked Open Data
LOD: Linked Open Data
 
スキーマとURI
スキーマとURIスキーマとURI
スキーマとURI
 
CKAN日本語コミュニティの現状と課題
CKAN日本語コミュニティの現状と課題CKAN日本語コミュニティの現状と課題
CKAN日本語コミュニティの現状と課題
 
日本語Linked Data Cloudの現状
日本語Linked Data Cloudの現状日本語Linked Data Cloudの現状
日本語Linked Data Cloudの現状
 
sgvizler
sgvizlersgvizler
sgvizler
 
えほん関連検索
えほん関連検索えほん関連検索
えほん関連検索
 
第5回AIツール入門講座 Linked Open Dataの現状とその活用
第5回AIツール入門講座 Linked Open Dataの現状とその活用第5回AIツール入門講座 Linked Open Dataの現状とその活用
第5回AIツール入門講座 Linked Open Dataの現状とその活用
 

Último

Último (11)

Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 

オープンなデータベースを利用した行動計画提案に関する研究