2 cluster analysis

•Descargar como PPTX, PDF•

3 recomendaciones•32,281 vistas

Dmitry Grapov

Biology

Chemistry
Informatics

Evaluation of metabolomic
sample processing methods using
hierarchical cluster analysis

Cluster Analysis

Goal:
Use hierarchical cluster analysis (HCA) to evaluate
data variance structure
Topics:
1. Evaluate sample and variable similarities
2. Identify the effect of data transformation,
distance and linkage methods on data
similarities

Clustering data
Biology

Chemistry
Informatics

Cluster Analysis

Goal:

Use HCA to cluster samples (Use DATA: Pumpkin data 1.csv)

Visualize:
1. Sample (row) raw similarities as a heat map
2. Annotate heatmap with extraction and treatment type
3. Select cluster distance and linkage method to cluster the samples
4. Determine the effect of data transformations on the cluster structure
(view as a dendrogram)
Exercises:
1. What factor, extraction or treatment, has the greatest contribution to
the data variance structure?
2. Describe the effect of clustering raw data or sample correlations

Biology

Chemistry

Raw data matrix visualized as
a heatmap
samples

variables

Cluster Analysis

Informatics

Raw data matrix organized by HCA
Biology

Chemistry
Informatics

Cluster Analysis

•ACN:/IPA/water|fresh and
MeOH/CH3Cl/water|dried
display distinct patterns in
metabolites which are most
similar to each other
•Sample similarities are linked
to metabolite magnitudes

Biology

Chemistry

Clustering based on sample
correlations (spearman)

Informatics

Cluster Analysis

•100% MeOH/fresh is the
most dissimilar protocol from
all others
•ACN:/IPA/water and
MeOH/CH3Cl/water are most
similar to each other
•Sample similarities are
decoupled from metabolite
magnitudes

Clustering metabolites
Biology

Chemistry
Informatics

Goal 2: Use HCA to evaluate metabolite similarities

Cluster Analysis

Visualize:
1.Z-scaled and correlation based variable clustering
2.Use a dendrogram to extract variable clusters
3.Select two variables from the same cluster and visualize their
correlation
Exercise:
1.Do the clustered variables share biological functions?
2.Which type of correlation is most robust to outliers?
3.Are the correlations for the visualized variable independent of
extraction/treatment?

Z-scaled variable clusters
Biology

Chemistry

Cluster Analysis

Informatics

Correlation based variable clusters
Biology

Chemistry

Cluster Analysis

Informatics

Biology

Chemistry

Extraction of clusters of
correlated variables

Informatics

less similar

most similar cluster

Cluster Analysis

lowest common
branch height
more similar

Biology

Chemistry

Cluster Analysis

Informatics

Correlation among cluster
members (4)

Más contenido relacionado

La actualidad más candente

Normalization of Large-Scale Metabolomic Studies 2014Dmitry Grapov

Multivarite and network tools for biological data analysisDmitry Grapov

Metabolomic Data Analysis Case StudiesDmitry Grapov

General Concepts in QSAR for Using the QSAR Application Toolbox Part 3International QSAR Foundation

7 network mapping iDmitry Grapov

Prote-OMIC Data Analysis and VisualizationDmitry Grapov

Data Normalization Approaches for Large-scale Biological StudiesDmitry Grapov

Data analysis workflows part 2 2015Dmitry Grapov

3 data normalization (2014 lab tutorial)Dmitry Grapov

Mapping to the Metabolomic ManifoldDmitry Grapov

Metabolomics and Beyond Challenges and Strategies for Next-gen Omic Analyses Dmitry Grapov

Advanced strategies for Metabolomics Data AnalysisDmitry Grapov

Strategies for Metabolomics Data AnalysisDmitry Grapov

Case Study: Overview of Metabolomic Data Normalization StrategiesDmitry Grapov

Metabolomic data analysis and visualization toolsDmitry Grapov

Data analysis and Visualisation Techniques for Compound Combination ModellingRichard Lewis

Automation of (Biological) Data Analysis and Report GenerationDmitry Grapov

Omic Data Integration StrategiesDmitry Grapov

Embase technology showcase mla v9Ann-Marie Roche

Data handling metabolomicsShruthi Shree Gandhi

La actualidad más candente (20)

Normalization of Large-Scale Metabolomic Studies 2014

Multivarite and network tools for biological data analysis

Metabolomic Data Analysis Case Studies

General Concepts in QSAR for Using the QSAR Application Toolbox Part 3

7 network mapping i

Prote-OMIC Data Analysis and Visualization

Data Normalization Approaches for Large-scale Biological Studies

Data analysis workflows part 2 2015

3 data normalization (2014 lab tutorial)

Mapping to the Metabolomic Manifold

Metabolomics and Beyond Challenges and Strategies for Next-gen Omic Analyses

Advanced strategies for Metabolomics Data Analysis

Strategies for Metabolomics Data Analysis

Case Study: Overview of Metabolomic Data Normalization Strategies

Metabolomic data analysis and visualization tools

Data analysis and Visualisation Techniques for Compound Combination Modelling

Automation of (Biological) Data Analysis and Report Generation

Omic Data Integration Strategies

Embase technology showcase mla v9

Data handling metabolomics

Similar a 2 cluster analysis

ATTRIBUTE REDUCTION-BASED ENSEMBLE RULE CLASSIFIERS METHOD FOR DATASET CLASSI...csandit

Multivariate Analysis and Visualization of Proteomic DataUC Davis

New Feature Selection Model Based Ensemble Rule Classifiers Method for Datase...ijaia

The International Journal of Engineering and Science (The IJES)theijes

Metabolite Set Enrichment Analysis (ChemRICH)Dinesh Barupal

Analytical chemistry_Instrumentation_IntroductionBivek Timalsina

A Threshold Fuzzy Entropy Based Feature Selection: Comparative StudyIJMER

An experimental study on hypothyroid using rotation forestIJDKP

Advanced Strategies for Analysis of Metabolomic DataDmitry Grapov

Metabolic Set Enrichment Analysis - chemrich - 2019Dinesh Barupal

A new, automated retrosynthetic search engine: ARChemUS Environmental Protection Agency (EPA), Center for Computational Toxicology and Exposure

Cluster spss week7Birat Sharma

Prediction Of Bioactivity From Chemical StructureJeremy Besnard

RUCK 2017 김성환 R 패키지 메타주성분분석(MetaPCA)r-kor

JBEI Research Highlights - November 2018 Irina Silva

Chapter 1MEI MEI

Note 2 writing a researchSHAYA'A OTHMAN MANAGEMENT & RESEARCH METHODOLOGY

ERVA-NMRDaniel JACOB

Applying fuzzy ahp to evaluate the carbon foot print on the workplace in educ...eSAT Publishing House

OTTO-ReportAntonio Maria Fiscarelli

Similar a 2 cluster analysis (20)

ATTRIBUTE REDUCTION-BASED ENSEMBLE RULE CLASSIFIERS METHOD FOR DATASET CLASSI...

Multivariate Analysis and Visualization of Proteomic Data

New Feature Selection Model Based Ensemble Rule Classifiers Method for Datase...

The International Journal of Engineering and Science (The IJES)

Metabolite Set Enrichment Analysis (ChemRICH)

Analytical chemistry_Instrumentation_Introduction

A Threshold Fuzzy Entropy Based Feature Selection: Comparative Study

An experimental study on hypothyroid using rotation forest

Advanced Strategies for Analysis of Metabolomic Data

Metabolic Set Enrichment Analysis - chemrich - 2019

A new, automated retrosynthetic search engine: ARChem

Cluster spss week7

Prediction Of Bioactivity From Chemical Structure

RUCK 2017 김성환 R 패키지 메타주성분분석(MetaPCA)

JBEI Research Highlights - November 2018

Chapter 1

Note 2 writing a research

ERVA-NMR

Applying fuzzy ahp to evaluate the carbon foot print on the workplace in educ...

OTTO-Report

Más de Dmitry Grapov

R programming for Data Science - A Beginner’s GuideDmitry Grapov

Network mapping 101 courseDmitry Grapov

Rise of Deep Learning for Genomic, Proteomic, and Metabolomic Data Integratio...Dmitry Grapov

Dmitry Grapov Resume and CVDmitry Grapov

Machine Learning Powered Metabolomic Network AnalysisDmitry Grapov

Complex Systems Biology Informed Data Analysis and Machine LearningDmitry Grapov

Data analysis workflows part 1 2015Dmitry Grapov

Modeling posterDmitry Grapov

Gene Ontology Enrichment Network Analysis -TutorialDmitry Grapov

American Society of Mass Spectrommetry Conference 2014Dmitry Grapov

Más de Dmitry Grapov (10)

R programming for Data Science - A Beginner’s Guide

Network mapping 101 course

Rise of Deep Learning for Genomic, Proteomic, and Metabolomic Data Integratio...

Dmitry Grapov Resume and CV

Machine Learning Powered Metabolomic Network Analysis

Complex Systems Biology Informed Data Analysis and Machine Learning

Data analysis workflows part 1 2015

Modeling poster

Gene Ontology Enrichment Network Analysis -Tutorial

American Society of Mass Spectrommetry Conference 2014

2 cluster analysis

1. Biology Chemistry Informatics Evaluation of metabolomic sample processing methods using hierarchical cluster analysis Cluster Analysis Goal: Use hierarchical cluster analysis (HCA) to evaluate data variance structure Topics: 1. Evaluate sample and variable similarities 2. Identify the effect of data transformation, distance and linkage methods on data similarities

2. Clustering data Biology Chemistry Informatics Cluster Analysis Goal: Use HCA to cluster samples (Use DATA: Pumpkin data 1.csv) Visualize: 1. Sample (row) raw similarities as a heat map 2. Annotate heatmap with extraction and treatment type 3. Select cluster distance and linkage method to cluster the samples 4. Determine the effect of data transformations on the cluster structure (view as a dendrogram) Exercises: 1. What factor, extraction or treatment, has the greatest contribution to the data variance structure? 2. Describe the effect of clustering raw data or sample correlations

3. Biology Chemistry Raw data matrix visualized as a heatmap samples variables Cluster Analysis Informatics

4. Raw data matrix organized by HCA Biology Chemistry Informatics Cluster Analysis •ACN:/IPA/water|fresh and MeOH/CH3Cl/water|dried display distinct patterns in metabolites which are most similar to each other •Sample similarities are linked to metabolite magnitudes

5. Biology Chemistry Clustering based on sample correlations (spearman) Informatics Cluster Analysis •100% MeOH/fresh is the most dissimilar protocol from all others •ACN:/IPA/water and MeOH/CH3Cl/water are most similar to each other •Sample similarities are decoupled from metabolite magnitudes

6. Clustering metabolites Biology Chemistry Informatics Goal 2: Use HCA to evaluate metabolite similarities Cluster Analysis Visualize: 1.Z-scaled and correlation based variable clustering 2.Use a dendrogram to extract variable clusters 3.Select two variables from the same cluster and visualize their correlation Exercise: 1.Do the clustered variables share biological functions? 2.Which type of correlation is most robust to outliers? 3.Are the correlations for the visualized variable independent of extraction/treatment?

7. Z-scaled variable clusters Biology Chemistry Cluster Analysis Informatics

8. Correlation based variable clusters Biology Chemistry Cluster Analysis Informatics

9. Biology Chemistry Extraction of clusters of correlated variables Informatics less similar most similar cluster Cluster Analysis lowest common branch height more similar

10. Biology Chemistry Cluster Analysis Informatics Correlation among cluster members (4)

2 cluster analysis

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Similar a 2 cluster analysis

Similar a 2 cluster analysis (20)

Más de Dmitry Grapov

Más de Dmitry Grapov (10)

2 cluster analysis