2. NGS data
(raw reads)
+ Assembly
+ Annotation
Sanger data
e.g. WGS, CON, TSA etc.e.g. 16S rRNA, EST etc.
e.g. complete genome
DDBJ Data Submission
DDBJ Trace Archive
(DTA)
http://trace.ddbj.nig.ac.jp/dta/index_e.html
DDBJ Sequence Read
Archive
(DRA)
http://trace.ddbj.nig.ac.jp/dra/index_e.html
DDBJ Nucleotide Sequence
Submission System
http://www.ddbj.nig.ac.jp/sub/websub-e.html
Mass Submission System
http://www.ddbj.nig.ac.jp/sub/mss_flow-e.html
Interactive nucleotide sequence
submission system via WWW
Raw outputs
Kosuge,T. et al. Nucl. Acids Res.(2014) 42(D1):D44-D49
- multi-FASTA format
- authenticated submission system based on e-mail
- flexible input system
- specialized templates such as 16S rRNA, CDS, D-loop etc.
6.Issue
Accession
No.
1.MSS
Request
2.Introduce
how to use
MSS
3.BioProject
BioSample
4. Submission
files
5. Check by
annotators
UME check
tool
- large-scale sequences
- multiple nucleotide sequences
- complex or many features
- FASTA file + Annotation file
+Annotation file
+Sequence file
(+)AGP file(CON)
(submitter)
(submitter)
(submitter)
- Genome-level data
- Transcriptome Shotgun Assembly
(TSA)
For large-scale data
WGS, CON, EST, TSA, complete genome etc.
1
3. raw reads
次世代シークエンサ(NGS)の Genomic DNA
Assembly(overlapping)
個々に登録された一連の配列データを相互に
結合し, より長い配列を構築
(supercontig, scaffoldcontig)
WGS data contig(overlapping reads) 配列
Sequencing gap を用いた断片配列の連結構造
Complete genome
Finished 配列
CON data
gap gap
・WGS (Whole Genome Shotgun)
- 冗長な raw reads をつなぎ合わせた contig(overlapping reads)
- CDS 等のアノテーションの記載が可能/未記載も登録可能
- "アノテーションファイル + 配列ファイル"
・CON division
- 個々に登録された一連の配列データ(WGS または HTG データ)を
sequencing gap を用い相互に結合し、再構築したデータ
- CDS 等のアノテーションの記載が可能/未記載も登録可能
- "アノテーションファイル + AGP ファイル" + option(配列ファイル)
・Complete genome sequence
(Taxonomic Division)
- 配列解析を Finishing したデータ
- CDS,tRNA,rRNA等のアノテーションに /locus_tag の使用
- "アノテーションファイル + 配列ファイル"
Genome-level data 概要
MSS submission
DDBJ Sequence Read Archive (DRA)
MSS submission
第33回 DDBJing 講習会 (DDBJ) 2
http://www.ddbj.nig.ac.jp/sub/wgs-j.html
http://www.ddbj.nig.ac.jp/sub/con-j.html
4. 第33回 DDBJing 講習会 (DDBJ) 3
contig(overlapping reads) 配列
Sequencing gap を用いた断片配列の連結構造
gap gap
Genome-level data 概要
MSS submission
WGS data
http://www.ddbj.nig.ac.jp/sub/wgs-j.html
WGS 登録データについて
5. raw reads
新型シーケンサー 由来の Genomic DNA
Assembly
TSA data
contig(overlapping) 配列
Transcriptome Shotgun Assembly (TSA) data 概要
MSS submission
再構成された (assembled) mRNA 配列
EST data
cDNA1
cDNA2
cDNA3
TSA contig1
TSA contig2
TSA contig3
- 先立ってアセンブリの元となる1次転写産物 (primary transcripts)の配列データ(プライマリーエントリ)
が DDBJ/EMBL-Bank/GenBank の EST division,DDBJ Trace Archive,DDBJ Sequence Read Archive (DRA)
の何れかに登録されている必要がある
(注意);プライマリーエントリが TSA 登録者と異なる登録者に帰属する配列データである場合は,TPA
(Third Party Annotation)
http://www.ddbj.nig.ac.jp/sub/tsa-j.html
MSS submission
DRA
MSS submission
第33回 DDBJing 講習会 (DDBJ) 4