SlideShare una empresa de Scribd logo
1 de 70
Descargar para leer sin conexión
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
立体構造データの検索・可視化法
大阪大学蛋白質研究所
くどう たかひろ
工藤 高裕
All-in-one 合同講習会 2016 ~バイオビッグデータ解析入門~
2016/07/23 @グランフロント大阪
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
今日のお話
1. 自己紹介
2. PDBについて
3. 立体構造データの計測法
4. データ検索・フォーマット・視覚化
2
[1] [2] [3]
[4]
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
今日のお話
1. 自己紹介
2. PDBについて
3. 立体構造データの計測法
4. データ検索・フォーマット・視覚化
5
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
PDBとは
6
Protein Data Bank
(蛋白質構造データバンク)
• 生体高分子(タンパク質、核酸など)の
立体構造のデータバンク
• 1つの実験条件ごとに1つのエントリー
• 実験で確認されたデータのみ
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
PDBとは
7
4つの拠点で協力してPDBを運営
[9]
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
PDB
PDBとは
8
データ受け入れ
(登録)
各拠点で分担
データ公開 各拠点共通
毎週水曜0:00(日本時間9:00)
同時公開
PDB
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
今日のお話
1. 自己紹介
2. PDBについて
3. 立体構造データの計測法
4. データ検索・フォーマット・視覚化
9
[1] [2] [3]
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
立体構造データの計測法
10
107455
89%
11361
10%
1069
1%
377
0%
実験手法別エントリー数
X線結晶解析
溶液NMR
電子顕微鏡
その他
計120262(2016/07/06現在)
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
X線結晶解析
11
分子の結晶をつくり、それにX線を当てて得られる回折像から構
造情報を得る[11]。
【長所】
分子量の制約がない
【短所】
結晶をつくる必要がある
結晶状態の分子が生体内で機能している状態と同じとは限らな
い
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
溶液NMR(核磁気共鳴)
12
• 分子の溶けた溶液に磁場をかける
• 質量数が奇数の原子(1H、13Cなど)は原子種ごとに特有な周
波数で原子核が歳差運動をする
• 同じ周波数で磁場を回転させると共鳴が起きて電磁波の吸収
や放出が起こる
• 各原子の結合状態などによってその周波数は少しずれる(化
学シフト)
• 医療診断に用いられるMRIも同じ原理。
【長所】
結晶をつくる必要がない
【短所】
分子量に制約あり(〜40kDa)
13Cなどを含む材料が高くつく
[11][12]
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
電子顕微鏡(単粒子解析)
13
1分子の電子顕微鏡写真をたくさんとって、その平均から分子の
立体構造を計算する[11]。
【長所】
結晶化はいらない
大きな分子が得意
ウイルス粒子など対称性の高い分子が得意
【短所】
一般に解像度が低い
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
今日のお話
1. 自己紹介
2. PDBについて
3. 立体構造データの計測法
4. データ検索・フォーマット・視覚化
14
[4]
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
ファイル形式
15
現在元となっているデータ形式(STAR形式の一つ)
最も歴史ある形式、1行80文字固定。情報は一部分。
提供は順次終了(コンバータのみ提供)
mmCIFをXML形式に変換したもの
PDBx/mmCIF
PDB format
PDBML
PDBMLadd
wwPDB/RDF
PDBMLに実験情報等を追加(PDBj独自)
PDBMLと結合→PDBMLplus
RDF形式(XMLの一種)に変換したもの
いずれもテキストデータ(エディタで読める)
mmCIF: macromolecular Crystallographic Information File
PDBx:PDB extension
RDF: Resource Description Framework
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
検索
16
• とりあえず「元データを直接読む」必要はありま
せん。
• 検索サーバに聞くと代わりに元データを読んで
情報を表示してくれます。
• 分子の絵もソフトがかいてくれます。それをウェ
ブブラウザ上で見ることができます。
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
PDBjトップページ
PDBj http://pdbj.org/
17
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
幅が狭い→メニューが隠れる
18
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
?→ヘルプ・問い合わせ
ヘルプ
お問い合わせ
19
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
パネル→配置変更可能
20
ドラッグ
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
キーワード検索
PDBjでは
• 日本語検索可能
• 横断検索可能
PDB、化合物、サイト内
21
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
キーワード検索 − 検索結果
22
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
キーワード検索 − 検索結果
23
自動で英語変換して検索!
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
PDBID
24
取り得るPDBIDの最大数は
9×363=419,904
現エントリー数は120,000余り…まだ当面は足りる
1文字目 「1-9」の数字
2〜4文字目 「0-9」の数字か「a-z」の英字
(大文字小文字の区別なし)
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
キーワード検索 − 検索結果
25
PDBエントリー(2016年7月13日現在777件)
未公開エントリーの状態
低分子化合物
PDBjサイト内検索
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
キーワード検索 − 検索結果
結果ダウンロードも可
(csv、tsv、json)
26
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
キーワード検索 − 検索結果
27
表示順を変更可能
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
キーワード検索 − 検索結果
28
ウェブサイト
(2016年7月13日現在16件)
• ヘルプ
• ニュース
• 今月の分子
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
キーワード検索 − 検索結果
29
クリック
→個別エントリーのページへ
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
個別PDBエントリーページ
30
エントリー全体
鎖(分子)ごと
実験条件
機能部位
類似配列検索
各書式データダウンロード
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
個別PDBエントリーページ – 概要
31
エントリー
の概要
構造の品質
主な書式の
データダウンロード
分子構造
閲覧ページ
関連データベース
へのリンク
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
個別PDBエントリーページ – 3D Viewer
32
登録座標(非対称単位)
≠
生体内で機能する時の単位
(生物学的単位)
の時もあります。
PDBID:1pbx
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
個別PDBエントリーページ – 3D Viewer
33
ソフト名 開発 備考
jV PDBj Java実行環境(JRE)が必要
Molmil PDBj Javaは不要、WebGLが動作する環境(最近
のブラウザ)が必要 動きは軽快
Jmol オープンソース Java実行環境が必要 多言語対応
JSmol オープンソース Java不要(JmolのJavaScript移植版) 遅い
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
個別PDBエントリーページ – JSmol
34
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
個別PDBエントリーページ – JSmol
35
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
個別PDBエントリーページ – 配列情報
36
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
個別PDBエントリーページ – ダウンロード
37
ブラウザで表示
ファイルをダウンロード
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
個別PDBエントリーページ – 構造情報
38
各鎖の説明、他デー
タベースへのリンク、
由来生物種など
配列、二次構造、
結合部位などの情報
分子数・分子量
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
個別PDBエントリーページ – 実験情報
39
水色の*
=
PDBMLadd
(PDBjで独自に追加)
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
個別PDBエントリーページ – 機能情報
40
分子の機能に関する情報
(リガンドなどの結合部位、
関係するGene Ontology
の用語、など)
△クリックで
パネルが開閉
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
個別PDBエントリーページ – 相同蛋白質
41
▼クリックで開閉
類似配列検索
(=Sequence Navigator)
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
個別PDBエントリーページ – ダウンロード
42
「ダウンロード」
をクリック
PDB format
mmCIF
PDBML
PDBMLplus
RDF
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
PDBの基本情報
43
PDBの各エントリーに格納されている情報の中でも基本的な項目を以
下に挙げます。
PDBID PDBに登録されている各エントリーに割り振ら
れている一意な値で、書式は
「1~9の1文字+英数字3文字」です
(例:1mbn)。
鎖識別子(Chain ID) PDBの各エントリーには複数の分子(鎖)で構
成されていることがあります。その各分子を識
別するための一意な値です。
原則として「1文字の英数字」です(例:A)。
Aからアルファベット順に命名される場合が多
いですが、抗体などで重鎖をH、軽鎖をLとする
など例外もあります。
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
PDBの基本情報
44
残基番号
(residue number)
各高分子の各構成要素に割り振られる識別子。
必ずしも1から始まるとは限らず、負の数や文
字を含んだ値である場合もあります。
化合物ID
(chem_comp ID)
PDBに登録されている各エントリーに登場する
各種化合物(アミノ酸、ヌクレオチドなどの高分
子鎖構成要素、その他リガンドなど)は全て3
文字以内の識別子が割り振られています。
ペプチドの残基名もこの中に含まれます。
例:GLY(グリシン)、A(アデノシン-5’-1リン酸)、
ATP、G39(オセルタミビル)
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
PDBの基本情報
45
原子ID
(atom number)
各原子を識別するための一意な数値。
原子名
(atom name)
4文字以内で記述される原子の名称。分子(残
基)内で重複がないようPDBが定めた辞書に従
い命名されている。
アミノ酸の例:
CA→α炭素、N→主鎖の窒素原子
CB→β位の炭素
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
PDBフォーマット
46
HEADER OXYGEN TRANSPORT 06-MAY-92 1BAB
TITLE HEMOGLOBIN THIONVILLE: AN ALPHA-CHAIN VARIANT WITH A SUBSTITUTION OF A
TITLE 2 GLUTAMATE FOR VALINE AT NA-1 AND HAVING AN ACETYLATED METHIONINE NH2
TITLE 3 TERMINUS
COMPND MOL_ID: 1;
COMPND 2 MOLECULE: HEMOGLOBIN THIONVILLE (DEOXY) (ALPHA CHAIN);
COMPND 3 CHAIN: A, C;
COMPND 4 ENGINEERED: YES;
COMPND 5 MOL_ID: 2;
COMPND 6 MOLECULE: HEMOGLOBIN THIONVILLE (DEOXY) (BETA CHAIN);
COMPND 7 CHAIN: B, D;
COMPND 8 ENGINEERED: YES
SOURCE MOL_ID: 1;
SOURCE 2 ORGANISM_SCIENTIFIC: HOMO SAPIENS;
SOURCE 3 ORGANISM_COMMON: HUMAN;
SOURCE 4 ORGANISM_TAXID: 9606;
SOURCE 5 MOL_ID: 2;
SOURCE 6 ORGANISM_SCIENTIFIC: HOMO SAPIENS;
SOURCE 7 ORGANISM_COMMON: HUMAN;
SOURCE 8 ORGANISM_TAXID: 9606
KEYWDS OXYGEN TRANSPORT
EXPDTA X-RAY DIFFRACTION
AUTHOR J.S.KAVANAUGH,A.ARNONE
項目名 内容
由来生物種
(SOURCE)
構成分子(鎖)
(COMPND)
80列
行番号:値が複数行にまたがる時に表示
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
PDBフォーマット
47
...
HETATM 1 C ACE A 0 2.779 16.023 3.370 1.00 31.31 C
HETATM 2 O ACE A 0 2.503 15.263 2.399 1.00 44.36 O
HETATM 3 CH3 ACE A 0 1.802 17.070 3.818 1.00 36.07 C
ATOM 4 N MET A 1 3.731 15.587 4.153 1.00 37.41 N
ATOM 5 CA MET A 1 5.138 15.646 4.141 1.00 35.32 C
ATOM 6 C MET A 1 5.633 16.755 3.199 1.00 36.65 C
ATOM 7 O MET A 1 5.247 17.091 2.090 1.00 38.17 O
ATOM 8 CB AMET A 1 5.948 14.392 4.107 0.50 41.69 C
ATOM 9 CB BMET A 1 5.845 14.342 3.844 0.50 50.59 C
ATOM 10 CG AMET A 1 5.190 13.146 4.444 0.50 48.68 C
ATOM 11 CG BMET A 1 7.255 14.502 3.338 0.50 55.46 C
ATOM 12 SD AMET A 1 5.671 12.457 6.047 0.50 38.49 S
ATOM 13 SD BMET A 1 7.674 13.001 2.363 0.50 64.47 S
ATOM 14 CE AMET A 1 5.513 10.705 5.729 0.50 15.99 C
ATOM 15 CE BMET A 1 6.791 13.369 0.844 0.50 50.65 C
ATOM 16 N GLU A 2 6.572 17.395 3.874 1.00 29.52 N
ATOM 17 CA GLU A 2 7.303 18.521 3.312 1.00 27.19 C
ATOM 18 C GLU A 2 8.797 18.347 3.570 1.00 21.42 C
ATOM 19 O GLU A 2 9.243 17.888 4.644 1.00 25.36 O
ATOM 20 CB GLU A 2 6.844 19.851 3.878 1.00 30.27 C
ATOM 21 CG GLU A 2 6.452 20.870 2.781 1.00 42.56 C
ATOM 22 CD GLU A 2 6.771 22.291 3.186 1.00 54.97 C
ATOM 23 OE1 GLU A 2 7.058 22.597 4.382 1.00 45.83 O
...
原子座標部分(ATOM/HETATM)
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
PDBフォーマット
48
書式の定義(wwPDB、英語)
http://www.wwpdb.org/documentation/file-format-content/format33/v3.3.html
書式の定義(PDBj、日本語)
http://legacy.pdbj.org/doc/pdbformats/pdb_ja.html
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
PDBフォーマットのまとめ
• 1行80文字固定
• 1行に収まらない時は次の行に継続(7~10
コラム目に継続を示す数字がある)
• 代表的なヘッダは:HEADER, TITLE,
COMPND, SOURCE, EXPDTA, AUTHOR,
JRNL, REMARK (番号つき), ATOM,
HETATM
• 情報は一部だけ・将来的には廃止
• 詳しくは http://www.wwpdb.org/docs.html
49
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
PDBx/mmCIF
50
data_1BAB
#
_entry.id 1BAB
#
_audit_conform.dict_name mmcif_pdbx.dic
_audit_conform.dict_version 4.007
_audit_conform.dict_location http://mmcif.pdb.org/dictionaries/ascii/mmcif_pdbx.dic
#
_database_2.database_id PDB
_database_2.database_code 1BAB
#
loop_
_database_PDB_rev.num
_database_PDB_rev.date
_database_PDB_rev.date_original
_database_PDB_rev.status
_database_PDB_rev.replaces
_database_PDB_rev.mod_type
1 1994-01-31 1992-05-06 ? 1BAB 0
2 2003-04-01 ? ? 1BAB 1
3 2009-02-24 ? ? 1BAB 1
4 2011-07-13 ? ? 1BAB 1
…
項目名(カテゴリ名.要素名) 値
可変
更新情報
(database_PDB_rev)
書式定義辞書
(audit_confirm)
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
PDBx/mmCIF
51
data_1BAB
#
_entry.id 1BAB
#
_audit_conform.dict_name mmcif_pdbx.dic
_audit_conform.dict_version 4.007
_audit_conform.dict_location http://mmcif.pdb.org/dictionaries/ascii/mmcif_pdbx.dic
#
_database_2.database_id PDB
_database_2.database_code 1BAB
#
loop_
_database_PDB_rev.num
_database_PDB_rev.date
_database_PDB_rev.date_original
_database_PDB_rev.status
_database_PDB_rev.replaces
_database_PDB_rev.mod_type
1 1994-01-31 1992-05-06 ? 1BAB 0
2 2003-04-01 ? ? 1BAB 1
3 2009-02-24 ? ? 1BAB 1
4 2011-07-13 ? ? 1BAB 1
…
項目名(_カテゴリ名.要素名) 値
データが2組以上
loop
先に項目名を列挙
各データセットをを空白区切りで記述
データが1組
項目名 値
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
PDBx/mmCIF
52
…
loop
_atom_site.group_PDB
_atom_site.id
_atom_site.type_symbol
_atom_site.label_atom_id
_atom_site.label_alt_id
_atom_site.label_comp_id
_atom_site.label_asym_id
_atom_site.label_entity_id
_atom_site.label_seq_id
_atom_site.pdbx_PDB_ins_code
_atom_site.Cartn_x
_atom_site.Cartn_y
_atom_site.Cartn_z
_atom_site.occupancy
_atom_site.B_iso_or_equiv
_atom_site.Cartn_x_esd
_atom_site.Cartn_y_esd
_atom_site.Cartn_z_esd
_atom_site.occupancy_esd
_atom_site.B_iso_or_equiv_esd
_atom_site.pdbx_formal_charge
_atom_site.auth_seq_id
_atom_site.auth_comp_id
_atom_site.auth_asym_id
_atom_site.auth_atom_id
_atom_site.pdbx_PDB_model_num
ATOM 1 C C . ACE A 1 1 ? 2.779 16.023 3.370 1.00 31.31 ? ? ? ? ? ? 0 ACE A C 1
ATOM 2 O O . ACE A 1 1 ? 2.503 15.263 2.399 1.00 44.36 ? ? ? ? ? ? 0 ACE A O 1
ATOM 3 C CH3 . ACE A 1 1 ? 1.802 17.070 3.818 1.00 36.07 ? ? ? ? ? ? 0 ACE A CH3 1
…
項目名(カテゴリ名.要素名) 値
各原子の情報
(atom_site)
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
PDBx/mmCIFの中身
53
各情報は「カテゴリ」に分類され、更にカテゴリはグループ化されていま
す。以下に代表的なグループ名とその概要、所属するカテゴリの例を
挙げます。
atom_group 原子の属性に関する情報
例:atom_site
chem_comp_group 低分子リガンドなどに関する情報
例:chem_comp
citation_group 文献に関する情報
例:citation
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
PDBx/mmCIFの中身
54
entity_group 化合物・分子に関する情報
例:entity、entity_poly(高分子)、
entity_poly_seq(配列情報)、
entity_src_gen(遺伝子源生物)、
entity_src_nat(分子源生物)、
pdbx_entity_src_syn(人工合成分子)
struct_group 構造情報
例:struct_asym(非対称単位)、struct_biol(生
物学的単位)、struct_ref(他DB情報)、
struct_conf(αらせん・ターン)、struct_sheet
(βシート)、struct_site(活性部位・基質結
合部位など)
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
PDBx/mmCIF
55
書式の概要
http://mmcif.pdbj.org/docs/tutorials/mechanics/pdbx-mmcif-syntax.html
各項目の定義
http://mmcif.pdbj.org/dictionaries/mmcif_pdbx_v40.dic/Index/
各項目の定義
http://mmcif.pdbj.org/dictionaries/mmcif_pdbx_v40.dic/Index/
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
PDBx/mmCIFのまとめ
• 文脈自由文法(STAR[Self-defining Text Archive and
Retrieval]形式)
• タグ(カテゴリ名+要素名)とアノテーションの組。
• タグは「_」で始まる。
• タグとアノテーションの組が複数ある場合には「loop_」構
文で繰り返しを指定する。
• 各タグの意味はmmCIF dictionaryで定義されている。
• 色々な種類のデータは「カテゴリー」によってグループ化さ
れている。
• 書式定義など詳しくは http://mmcif.pdbj.org/
56
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
要素(データセット)
PDBML
57
<?xml version="1.0" encoding="UTF-8" ?>
<PDBx:datablock datablockName="1BAB"
xmlns:PDBx="http://pdbml.pdb.org/schema/pdbx-v40.xsd"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://pdbml.pdb.org/schema/pdbx-v40.xsd pdbx-v40.xsd">
<PDBx:atom_siteCategory>
<PDBx:atom_site id="1">
<PDBx:B_iso_or_equiv>31.31</PDBx:B_iso_or_equiv>
<PDBx:Cartn_x>2.779</PDBx:Cartn_x>
<PDBx:Cartn_y>16.023</PDBx:Cartn_y>
<PDBx:Cartn_z>3.370</PDBx:Cartn_z>
<PDBx:auth_asym_id>A</PDBx:auth_asym_id>
<PDBx:auth_atom_id>C</PDBx:auth_atom_id>
<PDBx:auth_comp_id>ACE</PDBx:auth_comp_id>
<PDBx:auth_seq_id>0</PDBx:auth_seq_id>
<PDBx:group_PDB>ATOM</PDBx:group_PDB>
<PDBx:label_alt_id xsi:nil="true" />
<PDBx:label_asym_id>A</PDBx:label_asym_id>
<PDBx:label_atom_id>C</PDBx:label_atom_id>
<PDBx:label_comp_id>ACE</PDBx:label_comp_id>
<PDBx:label_entity_id>1</PDBx:label_entity_id>
<PDBx:occupancy>1.00</PDBx:occupancy>
<PDBx:pdbx_PDB_model_num>1</PDBx:pdbx_PDB_model_num>
<PDBx:type_symbol>C</PDBx:type_symbol>
</PDBx:atom_site>
…
</PDBx:atom_siteCategory>
カテゴリ
値要素名 +
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
PDBMLの概要
• 文脈自由文法(XML)
• PDBx/mmCIFをXMLに翻訳したもの
• XMLはより一般的なフォーマットだが、
PDBx/mmCIFよりファイルサイズが大きくなる
• XML要素の型はPDBMLのXML Schemaで定義
されている(タグの意味はPDBx/mmCIFから継
承されている。)
58
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
各フォーマットの特徴
フォーマット 形式 データの完
全性
人が読みや
すい
プログラム
で処理しや
すい
標準化
PDB flat × ◎ × wwPDB
mmCIF STAR ○ ○ ○ IUCr
wwPDB
PDBML XML ○ × ◎ W3C
wwPDB
59
• PDBフォーマットは一部データが割愛されているが、主要データを人が読む
用途には適している。自由記述されている部分がありプログラムで一貫して
扱うにはあまり適さない。
• mmCIFはデータが完全で、人が読む用途にも比較的適している。パーザライ
ブラリ(C++)はRCSBから用意されている。
• PDBMLは適当なブラウザ(PDBjの「Display」機能、Firefoxなど)がないと人が
直接読む用途には向かない。一般的なXML処理ライブラリを用いることがで
きる。
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
おまけ〜演習など
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
演習1
• キーワード「アルコール脱水素酵素」で検索
– 何件ヒットするか?
– 公開日が最も古いエントリーは?
– その公開日は?
– そのエントリーの論文は何年に発表された?
– その分子の由来生物種は?
– そのリガンド結合部位となる残基は?
61
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
演習1解答例
62
335件ヒット
(2016年7月20日現在)
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
演習1解答例
63
公開日の古い順
に並べ替え
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
演習1解答例
64
5ADHが最も公開日
が古いエントリー
公開日:1984年7月18日
論文発表年:1986年
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
演習1解答例
65
5ADHの概要ページ
由来生物種:
Equus caballus (horse)
(ウマ)
論文発表年:1986年
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
演習1解答例
66
5ADHの機能情報ページ
ATPの結合部位は
A鎖のARG47、HIS51など
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
より凝った検索 – 詳細検索
67
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
より凝った検索 – 詳細検索
68
クリックで項目の表示を
ON/OFF
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
演習2
• 以下の条件で検索
– キーワード「リボソーム」
– 由来生物種に「ヒト」を含む
– L体ペプチド鎖とRNA鎖の両方を含む
– 2010年以降に公開
• ヒット数は?
• どんな鎖で構成されているか?
69
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
演習2
70
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
クレジット
72
1. “X-ray diffraction pattern 3clpro.jpg” by Jeff Dahl - Own work, CC 表示-継承 3.0,
https://commons.wikimedia.org/w/index.php?curid=3020011
2. “NMR-Spectrometer.JPG” by Andel Früh & Andreas Maccagnan - 投稿者自身による作品,
CC 表示-継承 3.0, https://commons.wikimedia.org/w/index.php?curid=927647
3. Licensed under CC 表示 4.0 ©Togo picture gallery by Database Center for Life Science (DBCLS)
http://g86.dbcls.jp/~togoriv/wp-content/uploads/2011/06/TEM.png
4. Licensed under CC 表示 4.0 by PDBj http://pdbj.org/pdb_images2/1bab.png
PDBID:1bab
9. "Mollweide-projection" by Mdf - 投稿者自身による作品. Licensed under パブリック・ドメイン via ウィキメディ
ア・コモンズ - https://commons.wikimedia.org/wiki/File:Mollweide-projection.jpg#/media/File:Mollweide-
projection.jpg
©2016 PDBj講習会 licensed under CC 表示 4.0 国際
参考文献・サイト
73
10. David S.Goodsell『生命のメカニズム 原著第2版 -美しいイメージで学ぶ構造生命科学入門-』
中村春木 監訳、工藤高裕 西川建 中村春木 訳、シナジー、2015年、ISBN:978-4-916166-62-3
11. 神田 大輔「いきなりはじめる構造生物学」学研メディカル秀潤社、2011年、
ISBN 978-4-7809-0842-8
12. 核磁気共鳴 – Wikipedia
https://ja.wikipedia.org/wiki/核磁気共鳴
13. 今月の分子 http://pdbj.org/mom

Más contenido relacionado

Más de DNA Data Bank of Japan center

[All-in-one2016] 文献情報を利用したサービスの活用法
[All-in-one2016] 文献情報を利用したサービスの活用法[All-in-one2016] 文献情報を利用したサービスの活用法
[All-in-one2016] 文献情報を利用したサービスの活用法DNA Data Bank of Japan center
 
[All-in-one2016] JST/NBDC が提供するサービス及びプロジェクト概観
[All-in-one2016] JST/NBDC が提供するサービス及びプロジェクト概観[All-in-one2016] JST/NBDC が提供するサービス及びプロジェクト概観
[All-in-one2016] JST/NBDC が提供するサービス及びプロジェクト概観DNA Data Bank of Japan center
 
[All-in-one2016] 文献情報を利用したサービスの活用法
[All-in-one2016] 文献情報を利用したサービスの活用法[All-in-one2016] 文献情報を利用したサービスの活用法
[All-in-one2016] 文献情報を利用したサービスの活用法DNA Data Bank of Japan center
 
[All-in-one2016] DDBJデータベースを用いた配列の検索と解析
[All-in-one2016] DDBJデータベースを用いた配列の検索と解析[All-in-one2016] DDBJデータベースを用いた配列の検索と解析
[All-in-one2016] DDBJデータベースを用いた配列の検索と解析DNA Data Bank of Japan center
 
[All in-one2017] 「生命の素子」のカタチのデータベース: 蛋質構造データバンク
[All in-one2017] 「生命の素子」のカタチのデータベース: 蛋質構造データバンク[All in-one2017] 「生命の素子」のカタチのデータベース: 蛋質構造データバンク
[All in-one2017] 「生命の素子」のカタチのデータベース: 蛋質構造データバンクDNA Data Bank of Japan center
 
[All in-one2017] 誰でも使える最先端の研究成果/今日からあなたも生命科学者
[All in-one2017] 誰でも使える最先端の研究成果/今日からあなたも生命科学者[All in-one2017] 誰でも使える最先端の研究成果/今日からあなたも生命科学者
[All in-one2017] 誰でも使える最先端の研究成果/今日からあなたも生命科学者DNA Data Bank of Japan center
 
[DDBJing34] NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Mac用)
[DDBJing34]  NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Mac用)[DDBJing34]  NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Mac用)
[DDBJing34] NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Mac用)DNA Data Bank of Japan center
 
[DDBJing34]NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Win用)
[DDBJing34]NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Win用)[DDBJing34]NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Win用)
[DDBJing34]NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Win用)DNA Data Bank of Japan center
 
[DDBJjing34] DRA(DDBJ Read Sequence Archive) の紹介
[DDBJjing34] DRA(DDBJ Read Sequence Archive) の紹介[DDBJjing34] DRA(DDBJ Read Sequence Archive) の紹介
[DDBJjing34] DRA(DDBJ Read Sequence Archive) の紹介DNA Data Bank of Japan center
 
DDBJ センターにおける一次データベースの展開
DDBJ センターにおける一次データベースの展開DDBJ センターにおける一次データベースの展開
DDBJ センターにおける一次データベースの展開DNA Data Bank of Japan center
 
[DDBJ Challenge 2016] DDBJデータ解析事例「ChIP-Atlasデータベース」の紹介
[DDBJ Challenge 2016] DDBJデータ解析事例「ChIP-Atlasデータベース」の紹介[DDBJ Challenge 2016] DDBJデータ解析事例「ChIP-Atlasデータベース」の紹介
[DDBJ Challenge 2016] DDBJデータ解析事例「ChIP-Atlasデータベース」の紹介DNA Data Bank of Japan center
 
[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境
[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境
[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境DNA Data Bank of Japan center
 
[DDBJ Challenge 2016] 機械学習コンペティションにおける予測モデリング手法の傾向
[DDBJ Challenge 2016] 機械学習コンペティションにおける予測モデリング手法の傾向[DDBJ Challenge 2016] 機械学習コンペティションにおける予測モデリング手法の傾向
[DDBJ Challenge 2016] 機械学習コンペティションにおける予測モデリング手法の傾向DNA Data Bank of Japan center
 
[DDBJ Challenge 2016] 機械学習と予測モデルコンペティション
[DDBJ Challenge 2016] 機械学習と予測モデルコンペティション[DDBJ Challenge 2016] 機械学習と予測モデルコンペティション
[DDBJ Challenge 2016] 機械学習と予測モデルコンペティションDNA Data Bank of Japan center
 
「次世代シークエンスデータの登録」(理研横浜)
「次世代シークエンスデータの登録」(理研横浜)「次世代シークエンスデータの登録」(理研横浜)
「次世代シークエンスデータの登録」(理研横浜)DNA Data Bank of Japan center
 
[DDBJing33] ゲノムワイド多型を利用した遺伝解析の実際
[DDBJing33] ゲノムワイド多型を利用した遺伝解析の実際[DDBJing33] ゲノムワイド多型を利用した遺伝解析の実際
[DDBJing33] ゲノムワイド多型を利用した遺伝解析の実際DNA Data Bank of Japan center
 
DDBJ Nucleotide Sequence Submission System の紹介
DDBJ Nucleotide Sequence Submission System の紹介DDBJ Nucleotide Sequence Submission System の紹介
DDBJ Nucleotide Sequence Submission System の紹介DNA Data Bank of Japan center
 

Más de DNA Data Bank of Japan center (20)

[All-in-one2016] 文献情報を利用したサービスの活用法
[All-in-one2016] 文献情報を利用したサービスの活用法[All-in-one2016] 文献情報を利用したサービスの活用法
[All-in-one2016] 文献情報を利用したサービスの活用法
 
[All-in-one2016] JST/NBDC が提供するサービス及びプロジェクト概観
[All-in-one2016] JST/NBDC が提供するサービス及びプロジェクト概観[All-in-one2016] JST/NBDC が提供するサービス及びプロジェクト概観
[All-in-one2016] JST/NBDC が提供するサービス及びプロジェクト概観
 
[All-in-one2016] 文献情報を利用したサービスの活用法
[All-in-one2016] 文献情報を利用したサービスの活用法[All-in-one2016] 文献情報を利用したサービスの活用法
[All-in-one2016] 文献情報を利用したサービスの活用法
 
[All-in-one2016] DDBJデータベースを用いた配列の検索と解析
[All-in-one2016] DDBJデータベースを用いた配列の検索と解析[All-in-one2016] DDBJデータベースを用いた配列の検索と解析
[All-in-one2016] DDBJデータベースを用いた配列の検索と解析
 
[All in-one2017] 「生命の素子」のカタチのデータベース: 蛋質構造データバンク
[All in-one2017] 「生命の素子」のカタチのデータベース: 蛋質構造データバンク[All in-one2017] 「生命の素子」のカタチのデータベース: 蛋質構造データバンク
[All in-one2017] 「生命の素子」のカタチのデータベース: 蛋質構造データバンク
 
[All in-one2017] 誰でも使える最先端の研究成果/今日からあなたも生命科学者
[All in-one2017] 誰でも使える最先端の研究成果/今日からあなたも生命科学者[All in-one2017] 誰でも使える最先端の研究成果/今日からあなたも生命科学者
[All in-one2017] 誰でも使える最先端の研究成果/今日からあなたも生命科学者
 
[DDBJing34] NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Mac用)
[DDBJing34]  NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Mac用)[DDBJing34]  NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Mac用)
[DDBJing34] NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Mac用)
 
[DDBJing34]NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Win用)
[DDBJing34]NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Win用)[DDBJing34]NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Win用)
[DDBJing34]NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Win用)
 
[DDBJjing34] DRA(DDBJ Read Sequence Archive) の紹介
[DDBJjing34] DRA(DDBJ Read Sequence Archive) の紹介[DDBJjing34] DRA(DDBJ Read Sequence Archive) の紹介
[DDBJjing34] DRA(DDBJ Read Sequence Archive) の紹介
 
[DDBJing34] BioProject, BioSample の紹介
[DDBJing34] BioProject, BioSample の紹介[DDBJing34] BioProject, BioSample の紹介
[DDBJing34] BioProject, BioSample の紹介
 
[DDBJing34] DDBJ と NIG SuperComputer の紹介
[DDBJing34] DDBJ と NIG SuperComputer の紹介[DDBJing34] DDBJ と NIG SuperComputer の紹介
[DDBJing34] DDBJ と NIG SuperComputer の紹介
 
DDBJ センターにおける一次データベースの展開
DDBJ センターにおける一次データベースの展開DDBJ センターにおける一次データベースの展開
DDBJ センターにおける一次データベースの展開
 
[DDBJ Challenge 2016] DDBJデータ解析事例「ChIP-Atlasデータベース」の紹介
[DDBJ Challenge 2016] DDBJデータ解析事例「ChIP-Atlasデータベース」の紹介[DDBJ Challenge 2016] DDBJデータ解析事例「ChIP-Atlasデータベース」の紹介
[DDBJ Challenge 2016] DDBJデータ解析事例「ChIP-Atlasデータベース」の紹介
 
[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境
[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境
[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境
 
[DDBJ Challenge 2016] 機械学習コンペティションにおける予測モデリング手法の傾向
[DDBJ Challenge 2016] 機械学習コンペティションにおける予測モデリング手法の傾向[DDBJ Challenge 2016] 機械学習コンペティションにおける予測モデリング手法の傾向
[DDBJ Challenge 2016] 機械学習コンペティションにおける予測モデリング手法の傾向
 
[DDBJ Challenge 2016] 機械学習と予測モデルコンペティション
[DDBJ Challenge 2016] 機械学習と予測モデルコンペティション[DDBJ Challenge 2016] 機械学習と予測モデルコンペティション
[DDBJ Challenge 2016] 機械学習と予測モデルコンペティション
 
「次世代シークエンスデータの登録」(理研横浜)
「次世代シークエンスデータの登録」(理研横浜)「次世代シークエンスデータの登録」(理研横浜)
「次世代シークエンスデータの登録」(理研横浜)
 
[DDBJing33] Mass Submission System の紹介
[DDBJing33] Mass Submission System の紹介[DDBJing33] Mass Submission System の紹介
[DDBJing33] Mass Submission System の紹介
 
[DDBJing33] ゲノムワイド多型を利用した遺伝解析の実際
[DDBJing33] ゲノムワイド多型を利用した遺伝解析の実際[DDBJing33] ゲノムワイド多型を利用した遺伝解析の実際
[DDBJing33] ゲノムワイド多型を利用した遺伝解析の実際
 
DDBJ Nucleotide Sequence Submission System の紹介
DDBJ Nucleotide Sequence Submission System の紹介DDBJ Nucleotide Sequence Submission System の紹介
DDBJ Nucleotide Sequence Submission System の紹介
 

[All-in-one2016] 立体構造データの検索・可視化法

  • 1. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 立体構造データの検索・可視化法 大阪大学蛋白質研究所 くどう たかひろ 工藤 高裕 All-in-one 合同講習会 2016 ~バイオビッグデータ解析入門~ 2016/07/23 @グランフロント大阪
  • 2. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 今日のお話 1. 自己紹介 2. PDBについて 3. 立体構造データの計測法 4. データ検索・フォーマット・視覚化 2 [1] [2] [3] [4]
  • 3. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 今日のお話 1. 自己紹介 2. PDBについて 3. 立体構造データの計測法 4. データ検索・フォーマット・視覚化 5
  • 4. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 PDBとは 6 Protein Data Bank (蛋白質構造データバンク) • 生体高分子(タンパク質、核酸など)の 立体構造のデータバンク • 1つの実験条件ごとに1つのエントリー • 実験で確認されたデータのみ
  • 5. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 PDBとは 7 4つの拠点で協力してPDBを運営 [9]
  • 6. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 PDB PDBとは 8 データ受け入れ (登録) 各拠点で分担 データ公開 各拠点共通 毎週水曜0:00(日本時間9:00) 同時公開 PDB
  • 7. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 今日のお話 1. 自己紹介 2. PDBについて 3. 立体構造データの計測法 4. データ検索・フォーマット・視覚化 9 [1] [2] [3]
  • 8. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 立体構造データの計測法 10 107455 89% 11361 10% 1069 1% 377 0% 実験手法別エントリー数 X線結晶解析 溶液NMR 電子顕微鏡 その他 計120262(2016/07/06現在)
  • 9. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 X線結晶解析 11 分子の結晶をつくり、それにX線を当てて得られる回折像から構 造情報を得る[11]。 【長所】 分子量の制約がない 【短所】 結晶をつくる必要がある 結晶状態の分子が生体内で機能している状態と同じとは限らな い
  • 10. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 溶液NMR(核磁気共鳴) 12 • 分子の溶けた溶液に磁場をかける • 質量数が奇数の原子(1H、13Cなど)は原子種ごとに特有な周 波数で原子核が歳差運動をする • 同じ周波数で磁場を回転させると共鳴が起きて電磁波の吸収 や放出が起こる • 各原子の結合状態などによってその周波数は少しずれる(化 学シフト) • 医療診断に用いられるMRIも同じ原理。 【長所】 結晶をつくる必要がない 【短所】 分子量に制約あり(〜40kDa) 13Cなどを含む材料が高くつく [11][12]
  • 11. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 電子顕微鏡(単粒子解析) 13 1分子の電子顕微鏡写真をたくさんとって、その平均から分子の 立体構造を計算する[11]。 【長所】 結晶化はいらない 大きな分子が得意 ウイルス粒子など対称性の高い分子が得意 【短所】 一般に解像度が低い
  • 12. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 今日のお話 1. 自己紹介 2. PDBについて 3. 立体構造データの計測法 4. データ検索・フォーマット・視覚化 14 [4]
  • 13. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 ファイル形式 15 現在元となっているデータ形式(STAR形式の一つ) 最も歴史ある形式、1行80文字固定。情報は一部分。 提供は順次終了(コンバータのみ提供) mmCIFをXML形式に変換したもの PDBx/mmCIF PDB format PDBML PDBMLadd wwPDB/RDF PDBMLに実験情報等を追加(PDBj独自) PDBMLと結合→PDBMLplus RDF形式(XMLの一種)に変換したもの いずれもテキストデータ(エディタで読める) mmCIF: macromolecular Crystallographic Information File PDBx:PDB extension RDF: Resource Description Framework
  • 14. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 検索 16 • とりあえず「元データを直接読む」必要はありま せん。 • 検索サーバに聞くと代わりに元データを読んで 情報を表示してくれます。 • 分子の絵もソフトがかいてくれます。それをウェ ブブラウザ上で見ることができます。
  • 15. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 PDBjトップページ PDBj http://pdbj.org/ 17
  • 16. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 幅が狭い→メニューが隠れる 18
  • 17. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 ?→ヘルプ・問い合わせ ヘルプ お問い合わせ 19
  • 18. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 パネル→配置変更可能 20 ドラッグ
  • 19. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 キーワード検索 PDBjでは • 日本語検索可能 • 横断検索可能 PDB、化合物、サイト内 21
  • 20. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 キーワード検索 − 検索結果 22
  • 21. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 キーワード検索 − 検索結果 23 自動で英語変換して検索!
  • 22. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 PDBID 24 取り得るPDBIDの最大数は 9×363=419,904 現エントリー数は120,000余り…まだ当面は足りる 1文字目 「1-9」の数字 2〜4文字目 「0-9」の数字か「a-z」の英字 (大文字小文字の区別なし)
  • 23. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 キーワード検索 − 検索結果 25 PDBエントリー(2016年7月13日現在777件) 未公開エントリーの状態 低分子化合物 PDBjサイト内検索
  • 24. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 キーワード検索 − 検索結果 結果ダウンロードも可 (csv、tsv、json) 26
  • 25. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 キーワード検索 − 検索結果 27 表示順を変更可能
  • 26. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 キーワード検索 − 検索結果 28 ウェブサイト (2016年7月13日現在16件) • ヘルプ • ニュース • 今月の分子
  • 27. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 キーワード検索 − 検索結果 29 クリック →個別エントリーのページへ
  • 28. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 個別PDBエントリーページ 30 エントリー全体 鎖(分子)ごと 実験条件 機能部位 類似配列検索 各書式データダウンロード
  • 29. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 個別PDBエントリーページ – 概要 31 エントリー の概要 構造の品質 主な書式の データダウンロード 分子構造 閲覧ページ 関連データベース へのリンク
  • 30. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 個別PDBエントリーページ – 3D Viewer 32 登録座標(非対称単位) ≠ 生体内で機能する時の単位 (生物学的単位) の時もあります。 PDBID:1pbx
  • 31. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 個別PDBエントリーページ – 3D Viewer 33 ソフト名 開発 備考 jV PDBj Java実行環境(JRE)が必要 Molmil PDBj Javaは不要、WebGLが動作する環境(最近 のブラウザ)が必要 動きは軽快 Jmol オープンソース Java実行環境が必要 多言語対応 JSmol オープンソース Java不要(JmolのJavaScript移植版) 遅い
  • 32. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 個別PDBエントリーページ – JSmol 34
  • 33. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 個別PDBエントリーページ – JSmol 35
  • 34. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 個別PDBエントリーページ – 配列情報 36
  • 35. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 個別PDBエントリーページ – ダウンロード 37 ブラウザで表示 ファイルをダウンロード
  • 36. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 個別PDBエントリーページ – 構造情報 38 各鎖の説明、他デー タベースへのリンク、 由来生物種など 配列、二次構造、 結合部位などの情報 分子数・分子量
  • 37. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 個別PDBエントリーページ – 実験情報 39 水色の* = PDBMLadd (PDBjで独自に追加)
  • 38. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 個別PDBエントリーページ – 機能情報 40 分子の機能に関する情報 (リガンドなどの結合部位、 関係するGene Ontology の用語、など) △クリックで パネルが開閉
  • 39. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 個別PDBエントリーページ – 相同蛋白質 41 ▼クリックで開閉 類似配列検索 (=Sequence Navigator)
  • 40. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 個別PDBエントリーページ – ダウンロード 42 「ダウンロード」 をクリック PDB format mmCIF PDBML PDBMLplus RDF
  • 41. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 PDBの基本情報 43 PDBの各エントリーに格納されている情報の中でも基本的な項目を以 下に挙げます。 PDBID PDBに登録されている各エントリーに割り振ら れている一意な値で、書式は 「1~9の1文字+英数字3文字」です (例:1mbn)。 鎖識別子(Chain ID) PDBの各エントリーには複数の分子(鎖)で構 成されていることがあります。その各分子を識 別するための一意な値です。 原則として「1文字の英数字」です(例:A)。 Aからアルファベット順に命名される場合が多 いですが、抗体などで重鎖をH、軽鎖をLとする など例外もあります。
  • 42. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 PDBの基本情報 44 残基番号 (residue number) 各高分子の各構成要素に割り振られる識別子。 必ずしも1から始まるとは限らず、負の数や文 字を含んだ値である場合もあります。 化合物ID (chem_comp ID) PDBに登録されている各エントリーに登場する 各種化合物(アミノ酸、ヌクレオチドなどの高分 子鎖構成要素、その他リガンドなど)は全て3 文字以内の識別子が割り振られています。 ペプチドの残基名もこの中に含まれます。 例:GLY(グリシン)、A(アデノシン-5’-1リン酸)、 ATP、G39(オセルタミビル)
  • 43. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 PDBの基本情報 45 原子ID (atom number) 各原子を識別するための一意な数値。 原子名 (atom name) 4文字以内で記述される原子の名称。分子(残 基)内で重複がないようPDBが定めた辞書に従 い命名されている。 アミノ酸の例: CA→α炭素、N→主鎖の窒素原子 CB→β位の炭素
  • 44. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 PDBフォーマット 46 HEADER OXYGEN TRANSPORT 06-MAY-92 1BAB TITLE HEMOGLOBIN THIONVILLE: AN ALPHA-CHAIN VARIANT WITH A SUBSTITUTION OF A TITLE 2 GLUTAMATE FOR VALINE AT NA-1 AND HAVING AN ACETYLATED METHIONINE NH2 TITLE 3 TERMINUS COMPND MOL_ID: 1; COMPND 2 MOLECULE: HEMOGLOBIN THIONVILLE (DEOXY) (ALPHA CHAIN); COMPND 3 CHAIN: A, C; COMPND 4 ENGINEERED: YES; COMPND 5 MOL_ID: 2; COMPND 6 MOLECULE: HEMOGLOBIN THIONVILLE (DEOXY) (BETA CHAIN); COMPND 7 CHAIN: B, D; COMPND 8 ENGINEERED: YES SOURCE MOL_ID: 1; SOURCE 2 ORGANISM_SCIENTIFIC: HOMO SAPIENS; SOURCE 3 ORGANISM_COMMON: HUMAN; SOURCE 4 ORGANISM_TAXID: 9606; SOURCE 5 MOL_ID: 2; SOURCE 6 ORGANISM_SCIENTIFIC: HOMO SAPIENS; SOURCE 7 ORGANISM_COMMON: HUMAN; SOURCE 8 ORGANISM_TAXID: 9606 KEYWDS OXYGEN TRANSPORT EXPDTA X-RAY DIFFRACTION AUTHOR J.S.KAVANAUGH,A.ARNONE 項目名 内容 由来生物種 (SOURCE) 構成分子(鎖) (COMPND) 80列 行番号:値が複数行にまたがる時に表示
  • 45. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 PDBフォーマット 47 ... HETATM 1 C ACE A 0 2.779 16.023 3.370 1.00 31.31 C HETATM 2 O ACE A 0 2.503 15.263 2.399 1.00 44.36 O HETATM 3 CH3 ACE A 0 1.802 17.070 3.818 1.00 36.07 C ATOM 4 N MET A 1 3.731 15.587 4.153 1.00 37.41 N ATOM 5 CA MET A 1 5.138 15.646 4.141 1.00 35.32 C ATOM 6 C MET A 1 5.633 16.755 3.199 1.00 36.65 C ATOM 7 O MET A 1 5.247 17.091 2.090 1.00 38.17 O ATOM 8 CB AMET A 1 5.948 14.392 4.107 0.50 41.69 C ATOM 9 CB BMET A 1 5.845 14.342 3.844 0.50 50.59 C ATOM 10 CG AMET A 1 5.190 13.146 4.444 0.50 48.68 C ATOM 11 CG BMET A 1 7.255 14.502 3.338 0.50 55.46 C ATOM 12 SD AMET A 1 5.671 12.457 6.047 0.50 38.49 S ATOM 13 SD BMET A 1 7.674 13.001 2.363 0.50 64.47 S ATOM 14 CE AMET A 1 5.513 10.705 5.729 0.50 15.99 C ATOM 15 CE BMET A 1 6.791 13.369 0.844 0.50 50.65 C ATOM 16 N GLU A 2 6.572 17.395 3.874 1.00 29.52 N ATOM 17 CA GLU A 2 7.303 18.521 3.312 1.00 27.19 C ATOM 18 C GLU A 2 8.797 18.347 3.570 1.00 21.42 C ATOM 19 O GLU A 2 9.243 17.888 4.644 1.00 25.36 O ATOM 20 CB GLU A 2 6.844 19.851 3.878 1.00 30.27 C ATOM 21 CG GLU A 2 6.452 20.870 2.781 1.00 42.56 C ATOM 22 CD GLU A 2 6.771 22.291 3.186 1.00 54.97 C ATOM 23 OE1 GLU A 2 7.058 22.597 4.382 1.00 45.83 O ... 原子座標部分(ATOM/HETATM)
  • 46. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 PDBフォーマット 48 書式の定義(wwPDB、英語) http://www.wwpdb.org/documentation/file-format-content/format33/v3.3.html 書式の定義(PDBj、日本語) http://legacy.pdbj.org/doc/pdbformats/pdb_ja.html
  • 47. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 PDBフォーマットのまとめ • 1行80文字固定 • 1行に収まらない時は次の行に継続(7~10 コラム目に継続を示す数字がある) • 代表的なヘッダは:HEADER, TITLE, COMPND, SOURCE, EXPDTA, AUTHOR, JRNL, REMARK (番号つき), ATOM, HETATM • 情報は一部だけ・将来的には廃止 • 詳しくは http://www.wwpdb.org/docs.html 49
  • 48. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 PDBx/mmCIF 50 data_1BAB # _entry.id 1BAB # _audit_conform.dict_name mmcif_pdbx.dic _audit_conform.dict_version 4.007 _audit_conform.dict_location http://mmcif.pdb.org/dictionaries/ascii/mmcif_pdbx.dic # _database_2.database_id PDB _database_2.database_code 1BAB # loop_ _database_PDB_rev.num _database_PDB_rev.date _database_PDB_rev.date_original _database_PDB_rev.status _database_PDB_rev.replaces _database_PDB_rev.mod_type 1 1994-01-31 1992-05-06 ? 1BAB 0 2 2003-04-01 ? ? 1BAB 1 3 2009-02-24 ? ? 1BAB 1 4 2011-07-13 ? ? 1BAB 1 … 項目名(カテゴリ名.要素名) 値 可変 更新情報 (database_PDB_rev) 書式定義辞書 (audit_confirm)
  • 49. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 PDBx/mmCIF 51 data_1BAB # _entry.id 1BAB # _audit_conform.dict_name mmcif_pdbx.dic _audit_conform.dict_version 4.007 _audit_conform.dict_location http://mmcif.pdb.org/dictionaries/ascii/mmcif_pdbx.dic # _database_2.database_id PDB _database_2.database_code 1BAB # loop_ _database_PDB_rev.num _database_PDB_rev.date _database_PDB_rev.date_original _database_PDB_rev.status _database_PDB_rev.replaces _database_PDB_rev.mod_type 1 1994-01-31 1992-05-06 ? 1BAB 0 2 2003-04-01 ? ? 1BAB 1 3 2009-02-24 ? ? 1BAB 1 4 2011-07-13 ? ? 1BAB 1 … 項目名(_カテゴリ名.要素名) 値 データが2組以上 loop 先に項目名を列挙 各データセットをを空白区切りで記述 データが1組 項目名 値
  • 50. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 PDBx/mmCIF 52 … loop _atom_site.group_PDB _atom_site.id _atom_site.type_symbol _atom_site.label_atom_id _atom_site.label_alt_id _atom_site.label_comp_id _atom_site.label_asym_id _atom_site.label_entity_id _atom_site.label_seq_id _atom_site.pdbx_PDB_ins_code _atom_site.Cartn_x _atom_site.Cartn_y _atom_site.Cartn_z _atom_site.occupancy _atom_site.B_iso_or_equiv _atom_site.Cartn_x_esd _atom_site.Cartn_y_esd _atom_site.Cartn_z_esd _atom_site.occupancy_esd _atom_site.B_iso_or_equiv_esd _atom_site.pdbx_formal_charge _atom_site.auth_seq_id _atom_site.auth_comp_id _atom_site.auth_asym_id _atom_site.auth_atom_id _atom_site.pdbx_PDB_model_num ATOM 1 C C . ACE A 1 1 ? 2.779 16.023 3.370 1.00 31.31 ? ? ? ? ? ? 0 ACE A C 1 ATOM 2 O O . ACE A 1 1 ? 2.503 15.263 2.399 1.00 44.36 ? ? ? ? ? ? 0 ACE A O 1 ATOM 3 C CH3 . ACE A 1 1 ? 1.802 17.070 3.818 1.00 36.07 ? ? ? ? ? ? 0 ACE A CH3 1 … 項目名(カテゴリ名.要素名) 値 各原子の情報 (atom_site)
  • 51. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 PDBx/mmCIFの中身 53 各情報は「カテゴリ」に分類され、更にカテゴリはグループ化されていま す。以下に代表的なグループ名とその概要、所属するカテゴリの例を 挙げます。 atom_group 原子の属性に関する情報 例:atom_site chem_comp_group 低分子リガンドなどに関する情報 例:chem_comp citation_group 文献に関する情報 例:citation
  • 52. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 PDBx/mmCIFの中身 54 entity_group 化合物・分子に関する情報 例:entity、entity_poly(高分子)、 entity_poly_seq(配列情報)、 entity_src_gen(遺伝子源生物)、 entity_src_nat(分子源生物)、 pdbx_entity_src_syn(人工合成分子) struct_group 構造情報 例:struct_asym(非対称単位)、struct_biol(生 物学的単位)、struct_ref(他DB情報)、 struct_conf(αらせん・ターン)、struct_sheet (βシート)、struct_site(活性部位・基質結 合部位など)
  • 53. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 PDBx/mmCIF 55 書式の概要 http://mmcif.pdbj.org/docs/tutorials/mechanics/pdbx-mmcif-syntax.html 各項目の定義 http://mmcif.pdbj.org/dictionaries/mmcif_pdbx_v40.dic/Index/ 各項目の定義 http://mmcif.pdbj.org/dictionaries/mmcif_pdbx_v40.dic/Index/
  • 54. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 PDBx/mmCIFのまとめ • 文脈自由文法(STAR[Self-defining Text Archive and Retrieval]形式) • タグ(カテゴリ名+要素名)とアノテーションの組。 • タグは「_」で始まる。 • タグとアノテーションの組が複数ある場合には「loop_」構 文で繰り返しを指定する。 • 各タグの意味はmmCIF dictionaryで定義されている。 • 色々な種類のデータは「カテゴリー」によってグループ化さ れている。 • 書式定義など詳しくは http://mmcif.pdbj.org/ 56
  • 55. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 要素(データセット) PDBML 57 <?xml version="1.0" encoding="UTF-8" ?> <PDBx:datablock datablockName="1BAB" xmlns:PDBx="http://pdbml.pdb.org/schema/pdbx-v40.xsd" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://pdbml.pdb.org/schema/pdbx-v40.xsd pdbx-v40.xsd"> <PDBx:atom_siteCategory> <PDBx:atom_site id="1"> <PDBx:B_iso_or_equiv>31.31</PDBx:B_iso_or_equiv> <PDBx:Cartn_x>2.779</PDBx:Cartn_x> <PDBx:Cartn_y>16.023</PDBx:Cartn_y> <PDBx:Cartn_z>3.370</PDBx:Cartn_z> <PDBx:auth_asym_id>A</PDBx:auth_asym_id> <PDBx:auth_atom_id>C</PDBx:auth_atom_id> <PDBx:auth_comp_id>ACE</PDBx:auth_comp_id> <PDBx:auth_seq_id>0</PDBx:auth_seq_id> <PDBx:group_PDB>ATOM</PDBx:group_PDB> <PDBx:label_alt_id xsi:nil="true" /> <PDBx:label_asym_id>A</PDBx:label_asym_id> <PDBx:label_atom_id>C</PDBx:label_atom_id> <PDBx:label_comp_id>ACE</PDBx:label_comp_id> <PDBx:label_entity_id>1</PDBx:label_entity_id> <PDBx:occupancy>1.00</PDBx:occupancy> <PDBx:pdbx_PDB_model_num>1</PDBx:pdbx_PDB_model_num> <PDBx:type_symbol>C</PDBx:type_symbol> </PDBx:atom_site> … </PDBx:atom_siteCategory> カテゴリ 値要素名 +
  • 56. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 PDBMLの概要 • 文脈自由文法(XML) • PDBx/mmCIFをXMLに翻訳したもの • XMLはより一般的なフォーマットだが、 PDBx/mmCIFよりファイルサイズが大きくなる • XML要素の型はPDBMLのXML Schemaで定義 されている(タグの意味はPDBx/mmCIFから継 承されている。) 58
  • 57. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 各フォーマットの特徴 フォーマット 形式 データの完 全性 人が読みや すい プログラム で処理しや すい 標準化 PDB flat × ◎ × wwPDB mmCIF STAR ○ ○ ○ IUCr wwPDB PDBML XML ○ × ◎ W3C wwPDB 59 • PDBフォーマットは一部データが割愛されているが、主要データを人が読む 用途には適している。自由記述されている部分がありプログラムで一貫して 扱うにはあまり適さない。 • mmCIFはデータが完全で、人が読む用途にも比較的適している。パーザライ ブラリ(C++)はRCSBから用意されている。 • PDBMLは適当なブラウザ(PDBjの「Display」機能、Firefoxなど)がないと人が 直接読む用途には向かない。一般的なXML処理ライブラリを用いることがで きる。
  • 58. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 おまけ〜演習など
  • 59. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 演習1 • キーワード「アルコール脱水素酵素」で検索 – 何件ヒットするか? – 公開日が最も古いエントリーは? – その公開日は? – そのエントリーの論文は何年に発表された? – その分子の由来生物種は? – そのリガンド結合部位となる残基は? 61
  • 60. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 演習1解答例 62 335件ヒット (2016年7月20日現在)
  • 61. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 演習1解答例 63 公開日の古い順 に並べ替え
  • 62. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 演習1解答例 64 5ADHが最も公開日 が古いエントリー 公開日:1984年7月18日 論文発表年:1986年
  • 63. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 演習1解答例 65 5ADHの概要ページ 由来生物種: Equus caballus (horse) (ウマ) 論文発表年:1986年
  • 64. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 演習1解答例 66 5ADHの機能情報ページ ATPの結合部位は A鎖のARG47、HIS51など
  • 65. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 より凝った検索 – 詳細検索 67
  • 66. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 より凝った検索 – 詳細検索 68 クリックで項目の表示を ON/OFF
  • 67. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 演習2 • 以下の条件で検索 – キーワード「リボソーム」 – 由来生物種に「ヒト」を含む – L体ペプチド鎖とRNA鎖の両方を含む – 2010年以降に公開 • ヒット数は? • どんな鎖で構成されているか? 69
  • 68. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 演習2 70
  • 69. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 クレジット 72 1. “X-ray diffraction pattern 3clpro.jpg” by Jeff Dahl - Own work, CC 表示-継承 3.0, https://commons.wikimedia.org/w/index.php?curid=3020011 2. “NMR-Spectrometer.JPG” by Andel Früh & Andreas Maccagnan - 投稿者自身による作品, CC 表示-継承 3.0, https://commons.wikimedia.org/w/index.php?curid=927647 3. Licensed under CC 表示 4.0 ©Togo picture gallery by Database Center for Life Science (DBCLS) http://g86.dbcls.jp/~togoriv/wp-content/uploads/2011/06/TEM.png 4. Licensed under CC 表示 4.0 by PDBj http://pdbj.org/pdb_images2/1bab.png PDBID:1bab 9. "Mollweide-projection" by Mdf - 投稿者自身による作品. Licensed under パブリック・ドメイン via ウィキメディ ア・コモンズ - https://commons.wikimedia.org/wiki/File:Mollweide-projection.jpg#/media/File:Mollweide- projection.jpg
  • 70. ©2016 PDBj講習会 licensed under CC 表示 4.0 国際 参考文献・サイト 73 10. David S.Goodsell『生命のメカニズム 原著第2版 -美しいイメージで学ぶ構造生命科学入門-』 中村春木 監訳、工藤高裕 西川建 中村春木 訳、シナジー、2015年、ISBN:978-4-916166-62-3 11. 神田 大輔「いきなりはじめる構造生物学」学研メディカル秀潤社、2011年、 ISBN 978-4-7809-0842-8 12. 核磁気共鳴 – Wikipedia https://ja.wikipedia.org/wiki/核磁気共鳴 13. 今月の分子 http://pdbj.org/mom