SlideShare una empresa de Scribd logo
1 de 30
2013/9/20
第24回統合DBミーティング
Integrated MTG in NIBIO
本日の予定
• Sagace
– アクセス解析
– 進捗報告
– Sagaceに追加するDBについて
・医薬基盤研内のデータのRDF化
– 希少疾病用医薬品のRDF化について
• 厚生労働科学研究成果データベース
– カタログ化と論文化について
• 今後の予定
追加予定のDBについて
ファセット分類
/データベース
名 ウイルス図鑑 KEGG BRITE KEGG ORTHOLOGY
データベースの
種類
文献・用語
集・辞書
その他のデータ
ベース その他のデータベース
生物種 微生物 特定生物なし 特定生物なし
生体の階層 個体 その他 遺伝子
分類 A B A
進捗報告
• 難病情報センターのインデックスの
追加
• ファセット部分の表示の高速化
http://www.mkbergman.com/968/a-new-best-friend-gephi-for-large-scale-networks/
Linked Open Data
セマンティックウェブ
• データが意味を持ちつつ繋がりを作
るデータのウェブ
• コンピュータが意味を理解可能な構
造化されたデータを使ったウェブ
• Linked Open Dataでは,セマン
ティック・ウェブ分野で検討されて
きた知識の構造化手法を適用
活用例
• 一般
– DBpedia, BBC, Data.gov.uk,
– Geonames, RDF Book Mashup
• ライフサイエンス・医薬
– Bio2RDF, UniProt, KEGG
– Open Drug Data, ChEMBL, Drugbank
実装方法
• 複雑なグラフを書く
– RDF (RDF/XML,N3,Turtleなど)など
• html上で書く
– Microdata, RDFa Liteなど
RDF(Resource Description
Framework)
• データ間の関係性を記述し,データ
を連結させていくフレームワーク
(8薬A)第81号 イミグルセラーゼ
医薬品の名称
基本的な考え方はグラフ
ライフサイエンスにおける
RDF化のメリット
データ構成が複雑かつ
ファジーなデータを柔軟
に統合することが可能
基本的な考え方はグラフ
• グラフ間の関係性は明示する。
(8薬A)第81号 イミグルセラーゼ
医薬品の名称
RDFの場合
• トリプルでグラフを表記
URI URI
希少疾病用医薬品のRDF化
• Object(目的語)に複数のPredicate(述語)を
Subject(主語)に 付与した場合
希少疾病用医薬品のRDF化
Predicateの種類を色で示した場合
• 同種関係性のデータは同じpredicate
で書かれている方が望ましい。
• ID化されているデータの活用でハブ
となるノードを増やせる。
希少疾病用医薬品のRDF化
ハブ
RDFの記述方法(Turtle形式の場合)
@prefix drgb: <http://bio2rdf.org/drugbank_vocabulary/> .
@prefix drgn: <http://www.nibio.go.jp/drugVocabulary#> .
@prefix db: <http://dbpedia.org/ontology/> .
<http://www.nibio.go.jp/orphanDrugTarget#(8薬A)第81号>
drgb:name "イミグルセラーゼ(遺伝子組換え)";
drgn:designationApplicant "ジェンザイム・ジャパン㈱";
db:icd10 "E752" .
ラフになる。
(8 薬 A)第 81 号
イミグルセラーゼ
ジェンザイム・ジャパン㈱
E752
医薬品の名称
販売者
ICD10
Subject
Predicate
Object
RDFの記述方法(Turtle形式の場合)
@prefix drgb: <http://bio2rdf.org/drugbank_vocabulary/> .
@prefix drgn: <http://www.nibio.go.jp/drugVocabulary#> .
@prefix db: <http://dbpedia.org/ontology/> .
<http://www.nibio.go.jp/orphanDrugTarget#(8薬A)第81号>
drgb:name "イミグルセラーゼ(遺伝子組換え)";
drgn:designationApplicant "ジェンザイム・ジャパン㈱";
db:icd10 "E752" .
汎用性の高いPredicateを
可能な限り使用することも
同種のデータを取り出すことを
考えると重要
データの取得・検索方法
• SPARQLの利用
• SPARQL(SPARQL Protocol and RDF Query
Language)
– RDFを検索・操作するためのクエリ言
語の一種
PREFIX ab: <http://learningsparql.com/ns/addressbook#>
SELECT ?craigEmail WHERE
{
?person ab:firstName "Craig" .
?person ab:email ?craigEmail . }
@prefix ab: <http://learningsparql.com/ns/addressbook#> .
@prefix d: <http://learningsparql.com/ns/data#> .
d:i9771 ab:firstName "Cindy" .
d:i9771 ab:lastName "Marshall" .
d:i9771 ab:homeTel "(245) 646-5488" .
d:i9771 ab:email "cindym@gmail.com" .
d:i8301 ab:firstName "Craig" .
d:i8301 ab:lastName "Ellis" .
d:i8301 ab:email "craigellis@yahoo.com" .
d:i8301 ab:email "c.ellis@usairwaysgroup.com" .
--------------------------------------------
| craigEmail |
=========================
| "c.ellis@usairwaysgroup.com" |
| "craigellis@yahoo.com” |
--------------------------------------------
RDF (turtle形式)
SPARQL
firstNameが”Craig”という人を
personとした時に
その人のemailを
craigEmailとして出して!
実行結果
SPARQL endpoint例:DBpedia
• http://dbpedia.org/snorql
クエリ例
• 中田ヤスタカさんがプロデュースし
たアーティストの名前とアルバム名
を取り出してくださいな。
PREFIX d: <http://dbpedia.org/ontology/>
SELECT ?artistName ?albumName
WHERE
{
?album d:producer :Yasutaka_Nakata;
d:musicalArtist ?artist;
rdfs:label ?albumName.
?artist rdfs:label ?artistName.
}
実行結果
近況
• ひと通り希少疾病用医薬品のデータ
をRDF化
• 研究振興部の希少疾病用医薬品・希
少疾病用医療機器の業務支援システ
ムへの導入を予定
– RDFを自動作成
– ウェブにRDFデータのダウンロード機
能を搭載
今後の予定(RDF化について)
• 希少疾病用医薬品のデータと
ToxygatesのデータをRDFによる統合
• 実験動物研究資源バンクのRDF化
• 上記データをダウンロード可能へ
• SPARQL endpointの立ち上げ
• 上記RDFデータをSPARQL endpoint
から検索可能に。
祝!論文アクセプト!!
厚生労働科学研究成果データベース
• 文献情報
– 報告区分,研究課題名,研究年度,研
究代表者と所属機関,研究費,開始年
度から終了予定年度
• 研究報告書
– 概要版
– 本文(添付ファイルのPDF)
カタログのみにする場合
• 2009年度までは調査済み
• 検出されたデータベース
– 2009:17件,2008:16件,2007:13件,2006:9
件,2005:7件,2004以前:14件
• DB名,URL,タイトル,文献,連絡先,
運用機関が調査済み
カタログのみにする場合
• 2010年度以降
– “データベース”で検索
– 該当する報告書の概要等をチェック
– データベースと関連のありそうなものをピッ
クアップ(皆さんの協力要)
– 除:カタログに既に掲載,調査済み
– カタログに掲載する価値の有無を判断
– カタログに掲載するためのメタデータ
(名称,URL,運用機関,説明,生物種,文献等)を記入
論文にする場合
• カタログに必要な情報+αを調査
• 2009年度以前も調査が必要。
• 必要なデータはcsv形式でダウンロード可
能(本文はPDFのため除く)
• DBの名称やURLは報告書に無いことも多
いため,分担作業が必要(カタログ化の場
合も同様)
• 2012年 “データベース”で検索
• 201件ヒット,うち調査が必要な(DBと関
連がありそうなDB)報告書132件
今後の予定
• 9月
– 文献データを検索結果に反映
– Apache Solrの検討と実装
• 10月
– トーゴーの日
• 11月
– 実験動物バンクのRDF化
– 外部データベースとの連携
• 12月
– 分子生物学会
• 1月
– BioHackathon 国内版
次回
• 10月25日(金)?

Más contenido relacionado

Destacado

36th mtg in NIBIO
 36th mtg in NIBIO 36th mtg in NIBIO
36th mtg in NIBIOMaori Ito
 
HowToMakeTOGOTV(new)
HowToMakeTOGOTV(new)HowToMakeTOGOTV(new)
HowToMakeTOGOTV(new)Maori Ito
 
Presentation forpd bj_1
Presentation forpd bj_1Presentation forpd bj_1
Presentation forpd bj_1Maori Ito
 
30th Integrated DB MTG in NIBIO
30th Integrated DB MTG in NIBIO30th Integrated DB MTG in NIBIO
30th Integrated DB MTG in NIBIOMaori Ito
 
29th Integrated DB MTG in NIBIO
29th Integrated DB MTG in NIBIO29th Integrated DB MTG in NIBIO
29th Integrated DB MTG in NIBIOMaori Ito
 
37th mtg in NIBIO
37th mtg in NIBIO37th mtg in NIBIO
37th mtg in NIBIOMaori Ito
 
Cross search and_semantic_web_mbsj2013
Cross search and_semantic_web_mbsj2013Cross search and_semantic_web_mbsj2013
Cross search and_semantic_web_mbsj2013Maori Ito
 
Cell salon vol5
Cell salon vol5Cell salon vol5
Cell salon vol5Maori Ito
 
How To Make TOGO TV (latest version)
How To Make TOGO TV (latest version)How To Make TOGO TV (latest version)
How To Make TOGO TV (latest version)Maori Ito
 
40th MTG in NIBIO
40th MTG in NIBIO40th MTG in NIBIO
40th MTG in NIBIOMaori Ito
 
35th mtg in NIBIO
35th mtg in NIBIO35th mtg in NIBIO
35th mtg in NIBIOMaori Ito
 
Life Science Database Cross Search and Metadata
Life Science Database Cross Search and MetadataLife Science Database Cross Search and Metadata
Life Science Database Cross Search and MetadataMaori Ito
 
Bh13.13 sagace 1
Bh13.13 sagace 1Bh13.13 sagace 1
Bh13.13 sagace 1Maori Ito
 
41st MTG in NIBIO
41st MTG in NIBIO41st MTG in NIBIO
41st MTG in NIBIOMaori Ito
 

Destacado (16)

36th mtg in NIBIO
 36th mtg in NIBIO 36th mtg in NIBIO
36th mtg in NIBIO
 
HowToMakeTOGOTV(new)
HowToMakeTOGOTV(new)HowToMakeTOGOTV(new)
HowToMakeTOGOTV(new)
 
Presentation forpd bj_1
Presentation forpd bj_1Presentation forpd bj_1
Presentation forpd bj_1
 
30th Integrated DB MTG in NIBIO
30th Integrated DB MTG in NIBIO30th Integrated DB MTG in NIBIO
30th Integrated DB MTG in NIBIO
 
29th Integrated DB MTG in NIBIO
29th Integrated DB MTG in NIBIO29th Integrated DB MTG in NIBIO
29th Integrated DB MTG in NIBIO
 
27th mtg 1
27th mtg 127th mtg 1
27th mtg 1
 
37th mtg in NIBIO
37th mtg in NIBIO37th mtg in NIBIO
37th mtg in NIBIO
 
Cross search and_semantic_web_mbsj2013
Cross search and_semantic_web_mbsj2013Cross search and_semantic_web_mbsj2013
Cross search and_semantic_web_mbsj2013
 
Cell salon vol5
Cell salon vol5Cell salon vol5
Cell salon vol5
 
How To Make TOGO TV (latest version)
How To Make TOGO TV (latest version)How To Make TOGO TV (latest version)
How To Make TOGO TV (latest version)
 
40th MTG in NIBIO
40th MTG in NIBIO40th MTG in NIBIO
40th MTG in NIBIO
 
35th mtg in NIBIO
35th mtg in NIBIO35th mtg in NIBIO
35th mtg in NIBIO
 
Life Science Database Cross Search and Metadata
Life Science Database Cross Search and MetadataLife Science Database Cross Search and Metadata
Life Science Database Cross Search and Metadata
 
Bh13.13 sagace 1
Bh13.13 sagace 1Bh13.13 sagace 1
Bh13.13 sagace 1
 
41st MTG in NIBIO
41st MTG in NIBIO41st MTG in NIBIO
41st MTG in NIBIO
 
Véhicules électriques
Véhicules électriquesVéhicules électriques
Véhicules électriques
 

Similar a 24th mtg 1

33rd MTG In NIBIO
33rd MTG In NIBIO33rd MTG In NIBIO
33rd MTG In NIBIOMaori Ito
 
第57回日本人類遺伝学会大会 教育講演「バイオインフォマティクス:データベース統合化によるアプローチ」
第57回日本人類遺伝学会大会 教育講演「バイオインフォマティクス:データベース統合化によるアプローチ」第57回日本人類遺伝学会大会 教育講演「バイオインフォマティクス:データベース統合化によるアプローチ」
第57回日本人類遺伝学会大会 教育講演「バイオインフォマティクス:データベース統合化によるアプローチ」Hidemasa Bono
 
共通語彙の構築の基本的な考え方と方法 〜研究データのために語彙・スキーマを作るには〜
共通語彙の構築の基本的な考え方と方法 〜研究データのために語彙・スキーマを作るには〜共通語彙の構築の基本的な考え方と方法 〜研究データのために語彙・スキーマを作るには〜
共通語彙の構築の基本的な考え方と方法 〜研究データのために語彙・スキーマを作るには〜National Institute of Informatics (NII)
 
DDBJ センターにおける一次データベースの展開
DDBJ センターにおける一次データベースの展開DDBJ センターにおける一次データベースの展開
DDBJ センターにおける一次データベースの展開DNA Data Bank of Japan center
 
Jpg uosawa0525
Jpg uosawa0525Jpg uosawa0525
Jpg uosawa0525arosawa
 
大規模医療データベースを活用した治療効果研究の計画と報告:DB研究の手続き
大規模医療データベースを活用した治療効果研究の計画と報告:DB研究の手続き大規模医療データベースを活用した治療効果研究の計画と報告:DB研究の手続き
大規模医療データベースを活用した治療効果研究の計画と報告:DB研究の手続きSayuri Shimizu
 
科学技術イノベーション政策におけるBig-Dataの利活用促進 SPIAS: SciREX 政策形成インテリジェント支援システムの構想
科学技術イノベーション政策におけるBig-Dataの利活用促進 SPIAS: SciREX 政策形成インテリジェント支援システムの構想科学技術イノベーション政策におけるBig-Dataの利活用促進 SPIAS: SciREX 政策形成インテリジェント支援システムの構想
科学技術イノベーション政策におけるBig-Dataの利活用促進 SPIAS: SciREX 政策形成インテリジェント支援システムの構想scirexcenter
 
ゼミ用スライド2015 6
ゼミ用スライド2015 6ゼミ用スライド2015 6
ゼミ用スライド2015 6Ryuji Matsuoka
 
DDBJ Nucleotide Sequence Submission System の紹介
DDBJ Nucleotide Sequence Submission System の紹介DDBJ Nucleotide Sequence Submission System の紹介
DDBJ Nucleotide Sequence Submission System の紹介DNA Data Bank of Japan center
 
[DDBJing29]DDBJ Nucleotide Sequence Submission System の紹介(第29回 DDBJing 講習会 in...
[DDBJing29]DDBJ Nucleotide Sequence Submission System の紹介(第29回 DDBJing 講習会 in...[DDBJing29]DDBJ Nucleotide Sequence Submission System の紹介(第29回 DDBJing 講習会 in...
[DDBJing29]DDBJ Nucleotide Sequence Submission System の紹介(第29回 DDBJing 講習会 in...DNA Data Bank of Japan center
 
ライフサイエンスデータベースの現状
ライフサイエンスデータベースの現状ライフサイエンスデータベースの現状
ライフサイエンスデータベースの現状Takeru Nakazato
 
生物多様性情報の標準データフォーマットDarwin Core Archiveと生態学データに適合させる拡張形式"Sample-based Data"
生物多様性情報の標準データフォーマットDarwin Core Archiveと生態学データに適合させる拡張形式"Sample-based Data"生物多様性情報の標準データフォーマットDarwin Core Archiveと生態学データに適合させる拡張形式"Sample-based Data"
生物多様性情報の標準データフォーマットDarwin Core Archiveと生態学データに適合させる拡張形式"Sample-based Data"arosawa
 

Similar a 24th mtg 1 (12)

33rd MTG In NIBIO
33rd MTG In NIBIO33rd MTG In NIBIO
33rd MTG In NIBIO
 
第57回日本人類遺伝学会大会 教育講演「バイオインフォマティクス:データベース統合化によるアプローチ」
第57回日本人類遺伝学会大会 教育講演「バイオインフォマティクス:データベース統合化によるアプローチ」第57回日本人類遺伝学会大会 教育講演「バイオインフォマティクス:データベース統合化によるアプローチ」
第57回日本人類遺伝学会大会 教育講演「バイオインフォマティクス:データベース統合化によるアプローチ」
 
共通語彙の構築の基本的な考え方と方法 〜研究データのために語彙・スキーマを作るには〜
共通語彙の構築の基本的な考え方と方法 〜研究データのために語彙・スキーマを作るには〜共通語彙の構築の基本的な考え方と方法 〜研究データのために語彙・スキーマを作るには〜
共通語彙の構築の基本的な考え方と方法 〜研究データのために語彙・スキーマを作るには〜
 
DDBJ センターにおける一次データベースの展開
DDBJ センターにおける一次データベースの展開DDBJ センターにおける一次データベースの展開
DDBJ センターにおける一次データベースの展開
 
Jpg uosawa0525
Jpg uosawa0525Jpg uosawa0525
Jpg uosawa0525
 
大規模医療データベースを活用した治療効果研究の計画と報告:DB研究の手続き
大規模医療データベースを活用した治療効果研究の計画と報告:DB研究の手続き大規模医療データベースを活用した治療効果研究の計画と報告:DB研究の手続き
大規模医療データベースを活用した治療効果研究の計画と報告:DB研究の手続き
 
科学技術イノベーション政策におけるBig-Dataの利活用促進 SPIAS: SciREX 政策形成インテリジェント支援システムの構想
科学技術イノベーション政策におけるBig-Dataの利活用促進 SPIAS: SciREX 政策形成インテリジェント支援システムの構想科学技術イノベーション政策におけるBig-Dataの利活用促進 SPIAS: SciREX 政策形成インテリジェント支援システムの構想
科学技術イノベーション政策におけるBig-Dataの利活用促進 SPIAS: SciREX 政策形成インテリジェント支援システムの構想
 
ゼミ用スライド2015 6
ゼミ用スライド2015 6ゼミ用スライド2015 6
ゼミ用スライド2015 6
 
DDBJ Nucleotide Sequence Submission System の紹介
DDBJ Nucleotide Sequence Submission System の紹介DDBJ Nucleotide Sequence Submission System の紹介
DDBJ Nucleotide Sequence Submission System の紹介
 
[DDBJing29]DDBJ Nucleotide Sequence Submission System の紹介(第29回 DDBJing 講習会 in...
[DDBJing29]DDBJ Nucleotide Sequence Submission System の紹介(第29回 DDBJing 講習会 in...[DDBJing29]DDBJ Nucleotide Sequence Submission System の紹介(第29回 DDBJing 講習会 in...
[DDBJing29]DDBJ Nucleotide Sequence Submission System の紹介(第29回 DDBJing 講習会 in...
 
ライフサイエンスデータベースの現状
ライフサイエンスデータベースの現状ライフサイエンスデータベースの現状
ライフサイエンスデータベースの現状
 
生物多様性情報の標準データフォーマットDarwin Core Archiveと生態学データに適合させる拡張形式"Sample-based Data"
生物多様性情報の標準データフォーマットDarwin Core Archiveと生態学データに適合させる拡張形式"Sample-based Data"生物多様性情報の標準データフォーマットDarwin Core Archiveと生態学データに適合させる拡張形式"Sample-based Data"
生物多様性情報の標準データフォーマットDarwin Core Archiveと生態学データに適合させる拡張形式"Sample-based Data"
 

Más de Maori Ito

Test slide for the lab - Target prioritization
Test slide for the lab - Target prioritization Test slide for the lab - Target prioritization
Test slide for the lab - Target prioritization Maori Ito
 
Test for lab_j Psiver j
Test for lab_j Psiver jTest for lab_j Psiver j
Test for lab_j Psiver jMaori Ito
 
32nd MTG in NIBIO
32nd MTG in NIBIO32nd MTG in NIBIO
32nd MTG in NIBIOMaori Ito
 
The Progress on Sagace and Data Integration
The Progress on Sagace and Data IntegrationThe Progress on Sagace and Data Integration
The Progress on Sagace and Data IntegrationMaori Ito
 
Schema.org extension for biological database @ Biohackathon2013
Schema.org extension for biological database @ Biohackathon2013Schema.org extension for biological database @ Biohackathon2013
Schema.org extension for biological database @ Biohackathon2013Maori Ito
 
Cell salon vol5
Cell salon vol5Cell salon vol5
Cell salon vol5Maori Ito
 

Más de Maori Ito (8)

Test slide for the lab - Target prioritization
Test slide for the lab - Target prioritization Test slide for the lab - Target prioritization
Test slide for the lab - Target prioritization
 
Test for lab_j Psiver j
Test for lab_j Psiver jTest for lab_j Psiver j
Test for lab_j Psiver j
 
Psiver j
Psiver jPsiver j
Psiver j
 
32nd MTG in NIBIO
32nd MTG in NIBIO32nd MTG in NIBIO
32nd MTG in NIBIO
 
The Progress on Sagace and Data Integration
The Progress on Sagace and Data IntegrationThe Progress on Sagace and Data Integration
The Progress on Sagace and Data Integration
 
Schema.org extension for biological database @ Biohackathon2013
Schema.org extension for biological database @ Biohackathon2013Schema.org extension for biological database @ Biohackathon2013
Schema.org extension for biological database @ Biohackathon2013
 
Cellsalon5
Cellsalon5Cellsalon5
Cellsalon5
 
Cell salon vol5
Cell salon vol5Cell salon vol5
Cell salon vol5
 

24th mtg 1