Se ha denunciado esta presentación.
Utilizamos tu perfil de LinkedIn y tus datos de actividad para personalizar los anuncios y mostrarte publicidad más relevante. Puedes cambiar tus preferencias de publicidad en cualquier momento.

Bioinformatics tool & database 20130722 이승배

1.649 visualizaciones

Publicado el

Wrtten by Seung-Bae,Lee

Publicado en: Atención sanitaria
  • Inicia sesión para ver los comentarios

Bioinformatics tool & database 20130722 이승배

  1. 1. ’13年07月
  2. 2. • 시퀀싱 세대 별 공개-상용 분석 Tool 2
  3. 3. 3 장비 종류 ABI3730 (Sanger Sequencer) 전용 Align Tool (Freeware)  PHRED : ABI 3730 등의 Sequencer를 통해 나온 바이너리 형태의 데이터를 텍스트 형태로 변환. Quality Score생성.  PHRAP : PHRED 를 통해 나온 텍스트 염기서열 분석 파일이나, FASTA 포맷을 하나의 긴 서열로 붙임.(assembly)  CONSED : PHRAP이 결과를 시각화. 장비 종류 Illumina Life-Tech ROCHE 전용 Align Tool (Freeware) 1) ELAND : 일루미나 개발 전용 aligner 2) BOWTie: 아주 빠르고, 효율적으로 메모리를 사용하는 짧은 서열 조각 aligner 3) Novoalign: Needleman-wunsch 알고리즘을 사용하는 민감성 높은 일루미나 데이터용 aligner 4) SOAP: alignment를 위한 짧은 핵산 서열 분석 패키지 5) MrFAST: 복제 수 변이(CNV) 검출을 위해 여러 곳에 alignment를 허용하는 aligner 1) Corona-lite :라이프테크놀로지 사 가 직접 제공하는 솔리드 데이터 전용 aligner 2) SHRiMP: Smith-Waterman 알고리 즘 기반 aligner 1) Newbler: 로쉬 회사가 직접 제공하 는 454 데이터 전용 assembler 겸용, aligner 2) SSAHA2: SAM 친화적 해쉬 알고리 즘 기반 서열 검색 및 정렬 프로그램. 3) BWA-SW: Smith-Waterman 알고리 즘 기반으로 구현한 SAM 친화적 긴 서 열용 BWA 프로그램. 공통 Align Tool (Freeware) 1) BFAST : 일루미나 및 솔리드 데이터 모두 처리 가능한 BLAT 프로그램과 유사한 빠른 Aligner 2) BWA: 일루미나, 솔리드 및 454 데이터 모두 처리 가능한 Burrows-Wheeler 알고리즘 기반 aligner 3) Maq: 일루미나 및 솔리드 데이터 처리용으로 널리 사용되어온 mapping 도구(BWA로 대체됨) * Sequencing 세대 별 기본 분석 Tool(Free)
  4. 4. 4 세대 장비 상용 Tool 1 세대(ABI 7370) NGS (Illumina, Roche, Life Tech) 전 용 분석 Tool Mutation Surveyor 서열 trace 정보로부터 유전자 변이 분석을 수행하기 위한 분석 Tool. Soft genetics사에서 개발한 anti-correlation 특허 이용, 시퀀싱 데이터의 mutation 분석에 높은 정확성과 편리성을 제공. ◆ 제품 특징 Trace 비교 방법으로 돌연변이 확인 및 검출 (체세포 돌연변이를 감지하여 암 연구에 적용 가능) Insertion과 deletion 분석 Reference 서열과 샘플 DNA 단편의 비교를 통한 false positive 확인. Base calling의 miscall 또는 overcalls 검색 CpG islands 서열 내의 cytosine(C) methylation 구조 변화 확인. 개체마다 뚜렷이 구별되는 hyper variable 영역 분석 맞춤 치료 프로토콜 개발과 질병 진단에 유용하게 사용. 질병에 대한 초기 스크리닝 도구로 사용 가능 ① Partek Genomics Suite (Partek사)  DNA-Seq, RNA-Seq, ChIP-Seq, miRNA-Seq  Integrated Genomics - RNA-Seq & Exon microarray - Gene Expression & ChIP-Seq - Gene Expression & Copy num 개별 분석과 복합 비교 분석이 가능함. ② Geneious Pro (Biomatters 사)  Align/Assembly외에 유전자tree 생성,DB 검색 등 복합적인 분 석 tool ③ Pedant-Pro™(Biomax사)  다양한 Public 분석tool을 고도화/통합하여 유전체 자동 Pilpe- line (입력->서열분석->DB구축)  가장 최적의 유전자 모델을 선정하고 유전자 부위를 예측하며, 관련된 DB 정보를 제공하는 통합 자동화 솔루션임.(독일) ④ Sequencher® Ver 5.0 (Genecodes사) contig assembly, contig 편집, heterozygote & SNP 검색과 분석, cDNA 서열과 Genomic DNA 서열의 large gap alignment, 서열 비교, ORF 부위 예측, GenBank feature import, 제한효소사이트 분석 등 ⑤ NextGENe (SoftGenetics 사) De novo assembly, WGS, RNA-Seq, ChiP-Seq 등 종합 분석. ⑥ Mining station (Genomatix 사) WGS, RNA-Seq, ChiP Seq 등 과 SNP 분석 및 dbSNP와 연동 분 석. - 계 속 - * Sequencing 세대 별 기본 분석 Tool ( Commercial )
  5. 5. 통합 분석 Tool CLC Genomic Workbench & CLC Cell (덴마크 CLC Bio사)  De novo / Reference assembly 수행 / Large scale Genome의 assembly 수행 / EST 및 cDNA 서열 assembly 수행  SNP 및 DIP 검출 및 보고서 제공 / mRNA sequencing 데이터의 유전자 발현계산. / Microarray 분석 지원 / ChIP-seq 분석  기본적인 서열 분석 툴 모두 포함 5 세대 장비 상용 Tool 1 세대(ABI 7370) NGS (Illumina, Roche, Life Tech) 전 용 분석 Tool ⑦ ExPlain™ : promoter와 pathway 분석 툴이 결합된 유니크 한 데이터 분석 시스템. Microarray 및 RNA-Seq 분석에서 유전자 발현에 영향을 미치는 transcription factors를 확인할 수 있을 뿐만 아니라 그 조합에서 관찰된 유전자 발현 패턴 을 알아내는 방법을 예측 가능. ⑧ FGENSH: 유전자서열을 예측하는 HMM(Hidden Markov Model) 기반의 프로그램으로, 가장 널리 알려진 유전자 예측 프로그램 중 하나인 Genescan보다 50~100배 빠르게 분석 가능. ⑨ SeqMan Ngen (DNASTAR 사) – 2차 분석 Tool (고도화 분석 용) : Cancer Genomics 과 통계 분석 기능, 외부 DB 연동. ⑩ IPA, IVA, iReport(Ingenuity Systems 사) – 2차 분석 Tool (고도화 분석 용) * IPA(Ingenuity Pathways Analysis) : - 전사체 / 바이오마커 발굴 / 마이크로 RNA / 독성 유전체 / 대사체 / 신약 재창출(Drug Repositioning) / 표적 치료 / 단백질 고도화 분석 tool * IVA(Ingenuity Variant Analysis) : 질병과 변의 관계를 바탕으로 소수의 원인 변이들을 파악 하도록 지원하기 위해서 Ingenuity Knowledge Base를 통해 정확한 분석 제공. * iReport : 세부 발현 차이, Pathway, 진행과정, 질병 연합 연구, 분자 상호작용, isoform(아형) 수준의 RNA-Seq 분석 내용 등 상세한 분석 내용을 다양한 레포팅 방식으로 제공하는 tool * Sequencing 세대 별 기본 분석 Tool ( Commercial )
  6. 6. • 분야별 고도화 분석 Tool과 DB 6
  7. 7. ▣ CpG Island DB(http://data.microsarrays.ca/cpg) UHN(University Heath Network) Microarray Centre(http://www.microarrays.ca)에서 만든 CpG Island 데이터베이스, HCGI 12K와 HCGI 8.1K 마이크로어레이로 실험한 결과를 분석하기 위한 정보를 제공. ▣ MethDB(http://www.methdb.net/) DNA 메틸화 데이터를 저장하고 제공해 체계적인 커뮤니티를 구축하기 위한 목적의 데이터베이스. 이는 일반적인 모든 DNA 메틸화 관련 데이터의 저장. DNA 메틸화 프로필과 패턴, 전장 메틸화 데이터와 함께, DNA 메틸화 상태에 영향을 미치는 환경적 요인에 관한 다양한 검색 가능. ▣ MethyCancer(http://methycancer.psych.ac.cn/) DNA 메틸화, 유전자 발현 및 암 사이의 상호작용을 연구하기 위한 인간 DNA와 암의 메틸화에 대한 데이터베이스. 공공적으로 제공되는 DNA 메틸화, 암 유전자, 돌연변이 등에 관한 통합된 데이터와 대규모 시퀀싱으로 얻은 CpG Island클론을 제공 ▣ NGSmethDB(http://bioinfo2.ugr.es/meth/NGSmethDB.php) 차세대 시퀀싱으로 얻은 시토신 메틸화 데이터와 문맥(CpG와 CAG/CTG) 정보의 저장과 검색이 가능한 데이터 베이스 ▣ PubMeth(http://www.pubmeth.org) 퍼브메드 논문에 기술되어 있는 암 관련 메틸화에 관한 내요응ㄹ 텍스트 마이닝으로 발췌한 데이터 베이스 ▣ CpG Viewer(http://dna.leeds.ac.uk/cpgviewer) bisulfite sequencing 데이터를 참조서열과 정렬하여 분석, 처리하기 위한 통합도구. ▣ Meth PrimerDB(http://medgen.ugent.be/methprimerdb/) DNA 메틸화 분석(Methylation-specific PCR, Bisulfite-PCR-SSCP, Methylation-sensitive single-nucleotide primer extension, combined bisulfite restriction analysis, bisulfite sequencing)시 사용되는 pcr 프라이머 데이터베이스 7 * 후성 유전체 DB와 분석도구 (Free)
  8. 8. ▣ ChromatinDB(http://www.bioinformatics2.wsu.edu/ChromatinDB) 전장 유전체 히스톤 변형 패턴 데이터베이스 ▣ Human Histone Modification Database(HHMD) : http://bioinfo.hrbmu.edu.cn/hhmd) 실험으로 얻어진 인간 히스톤 변형 데이터셋을 통합하고 저장해 놓은 데이터베이스 ▣ DAnCER(Disease-Annotated Chromatin Epigenetics Resource) http://wodaklab.org/dancer 염색질 재구성과 관련된 인간 질병 관련 데이터베이스 ▣ PeakSeq(http://info.gersteinlab.org/PeakSeq/) ChIP-Seq실험에서 peak region을 탐색하고 순위를 매기는 프로그램. 입력으로 ChIP-Seq 실험에서 나온 매핑된 단편서열을 넣으면 Q-value순위로 정렬된 출력물이 나옴. ▣ ChIP-Seq과 관련한 다양한 유전체 주석 정보를 분석하기 위한 다양한 도구 모음. o ChIP-cor:Feature Correlation Tool o ChIP-center: Tag Centering Tool o ChIP-peak: Signal Peaks Detection Tool o ChIP-part:Partitioning Tool o ChIP-convert : format Conversion tool ▣ CisGenome:(http://www.biostat.jhsph.edu/~hji/cisgenome/) • Tiling array, ChIP-seq, cis-regulatory element 분석을 위한 통합도구 8 * 히스톤 변형 데이터베이스와 분석도구(Free)
  9. 9. ▣ NONCODE: http://www.noncode.org/NONCODERv3) 1,238개의 종에 대하여 Trna와 Rrna를 제외한 ncRNA의 DB ▣ miRBASE(http://www.mirbase.org) 출판된 miRNA 서열과 주석정보를 담은 DB ▣ MicroCosm Targets(http://www.ebi.ac.uk/enright-srv/microcosm/htdocs/targets/v5/) 많은 종에 대한 miRNA의 타겟 예측에 참고. ▣ miRanda miRNA Target DB(http://www.microrna.org/microrna/home.do) miRNA의 타겟 유전자와 발현을 예측에 참고. miRanda를 이용하여 인간,초파리,제브라 피쉬의 miRNA 타겟 유전자를 추정. ▣ Target Scran miRNA Target DataBase(http://www.targetscan.org) 포유류의 miRNA 타겟 유전자 탐색 ▣ STarMir(http://sfold.wadsworth.org/cgi-bin/starmir/pl) miRNA folding 과 2차 구조에 대해 분석 도구 ▣ miRDeep2(http://www.mdc-berlin.de/en/research/research_teams/systems_biology_of_gene_regula- tory-elements/projects/miRDeep/index.html) miRDeep2는 7개의 종에서 RNA-Seq 데이터를 분석해서 miRNA gene을 찾는데 사용. ▣ Gomir(http://www.bioacademy.gr/bioinformatics/projects/GOmir/) 인간 miRNA 타겟 유전자 예측과 유전자 온톨로지 클러스터 분석 프로그램 9 Non coding RNA 데이터베이스 와 분석도구(Free)
  10. 10. ◈ TRANSFAC® 은 현재까지 연구된 전사인자(transcription factor)들의 binding site들을 수집한 데이터베이스로서 전문가 리뷰를 통해 얻어진 positional weight matrices를 제공하여 유전자 조절 기작에 대한 총체적이고 다양한 정보를 제공. 또한 positional weight matrices를 기본으로 한 high-throughput 데이터의 프로모터 분석 및 pathway 분석을 ExPlainTM과 연계 하여 함께 분석 가능.  Transcription factors,  miRNAs,  관련된 유전자의 프로모터 정보  ChIP-Seq 데이터로부터 1,000,000건 이상의 binding sites 정보,  57,000건 이상의 human RNA polymeraseII의 위치정보를 포함. 정보는 모두 실험적으로 증명 되었거나 논문에 게재된 정보를 전문가의 리뷰를 통해 정확하면서도 통합적인 이해 가능 함. ◈ 주요 용도: transcription factor binding site나 혹은 composite elements를 증명하고자 할 때, o promoter sequence를 찾고자 할 때 o miRNA targets을 찾고자 할 때 o 관심 있는 영역에 binding 가능한 transcription factor를 찾고자 할 때 o transcription factor들 간의 조절을 알고자 할 때 실험에 앞서 가능한 factor들의 기초 정보를 제공하게 된다. 따라서 Sequencing이나 Array로 유전자 발현 패턴을 분석했다면 동일한 발현 패턴을 보이는 유전자들의 상관관계를 분석하는데 많이 이용되며, 약리 반응이나 신물질의 target을 밝히는 데에도 기초 자료로 인용 • TRANSFAC® Professional은 공개된 데이터에 비해 약 4년 정도의 데이터가 업데이트되어 있는 상태로 그 데이터양은 promoter서열 이 약 280,000건, 700,000건의 ChIP-chip/-Seq 데이터를 더 포함하고 있다(위 그림). 10 TRANSFAC® Database (Commercial)
  11. 11. • Open source 기반 분석 Tool을 조합하여 Pipe-line을 구성하는 방식은 주로 연구소에서 많이 사용하나, 상용 서비스나 임상 분야에 적용을 위해서는 매우 높은 정확성과 빠른 처리를 위해 기본 분야 상용 분석 Tool 인 CLC Bio 제품을 많이 사용하며, 고도화 분석에서는 질병 원인 분석, 예측, 바이오 마커 발굴을 위해서 Ingenuity Systems사의 분석 Tool을 많이 사용하고, 고도화 DB로 Biobase 사의 TRANSFAC을 주로 많이 사 용 함. • 다만, 염색체 이상에 의한 태아 돌연변이 이상을 확인하는 NIPT만을 목적으로 한다면, 상용 Tool과 DB는 반 드시 필요하지는 않다고 판단됨. (정량 분석법과 SNP 분석법은 NIPT 알고리즘이 핵심 Routine 이므로) • 다만, 그 외에 Single Gene Disorder (단일 유전자 변이에 의한 질환) 등을 추가로 제공 할 경우에는 상용 Tool과 DB는 필요할 것으로 판단됨 11 * 결 론
  12. 12. END OF DOCUMENT 감사합니다

×