SlideShare una empresa de Scribd logo
1 de 62
Descargar para leer sin conexión
Définition et analyse de graphes
d’interactions de gènes pour la qualité de
la viande de porc ; relations avec le PH
Nathalie Villa-Vialaneix
http://www.nathalievilla.org
IUT de Carcassonne (UPVD)
& Institut de Mathématiques de Toulouse
Groupe de travail BioPuces, INRA de Castanet
14 Janvier 2011
1 / 27
Nathalie Villa-Vialaneix
Présentation générale
1 Les données
2 Principe général de construction d’un graphe
d’interactions
3 Analyse du graphe d’interactions des gènes régulés par un
eQTL
Analyse descriptive
Classification des sommets
4 Analyse de la corrélation avec le PH à l’aide d’outils de
statistique spatiale
2 / 27
Nathalie Villa-Vialaneix
Les données
Sommaire
1 Les données
2 Principe général de construction d’un graphe
d’interactions
3 Analyse du graphe d’interactions des gènes régulés par un
eQTL
Analyse descriptive
Classification des sommets
4 Analyse de la corrélation avec le PH à l’aide d’outils de
statistique spatiale
3 / 27
Nathalie Villa-Vialaneix
Les données
Production d’animaux F2 avec des fac-
teurs de variation génétique
F0 : 16 ♂ (Piétrain) × 28 ♀ (Synthétique)
F1 : 17 ♂ × 62 ♀
F2 : 1200 animaux structurés par lignée de père
Prélèvement de tissus
(dont longissimus dorsi)
Mesures phénotypiques (30)
(force de cisaillement, PH ...)
4 / 27
Nathalie Villa-Vialaneix
Les données
Production d’animaux F2 avec des fac-
teurs de variation génétique
F0 : 16 ♂ (Piétrain) × 28 ♀ (Synthétique)
F1 : 17 ♂ × 62 ♀
F2 : 1200 animaux structurés par lignée de père
Prélèvement de tissus
(dont longissimus dorsi)
Mesures phénotypiques (30)
(force de cisaillement, PH ...)
Données retenues : Une famille de 57 individus F2 (plus forte
variabilité pour force de cisaillement et PH) ; transcri. 2 464 gènes.
4 / 27
Nathalie Villa-Vialaneix
Les données
Premières extractions des données
1 Les données ont été normalisées et les valeurs manquantes
complétées ;
5 / 27
Nathalie Villa-Vialaneix
Les données
Premières extractions des données
1 Les données ont été normalisées et les valeurs manquantes
complétées ;
2 Une nomenclature par défaut pour les gènes (non validée
précisément) a été définie sur la base de plusieurs types
d’annotations, en plus de la référence au spot ;
5 / 27
Nathalie Villa-Vialaneix
Les données
Premières extractions des données
1 Les données ont été normalisées et les valeurs manquantes
complétées ;
2 Une nomenclature par défaut pour les gènes (non validée
précisément) a été définie sur la base de plusieurs types
d’annotations, en plus de la référence au spot ;
3 Les gènes régulés par un eQTL ont été extraits : 272 gènes sont
réputés régulés par un eQTL ;
5 / 27
Nathalie Villa-Vialaneix
Les données
Premières extractions des données
1 Les données ont été normalisées et les valeurs manquantes
complétées ;
2 Une nomenclature par défaut pour les gènes (non validée
précisément) a été définie sur la base de plusieurs types
d’annotations, en plus de la référence au spot ;
3 Les gènes régulés par un eQTL ont été extraits : 272 gènes sont
réputés régulés par un eQTL ;
4 Les gènes différentiellement exprimés pour le PH ont été extraits
: 23 gènes sont réuputés différentiellement exprimés pour le PH.
5 / 27
Nathalie Villa-Vialaneix
Les données
Premières extractions des données
1 Les données ont été normalisées et les valeurs manquantes
complétées ;
2 Une nomenclature par défaut pour les gènes (non validée
précisément) a été définie sur la base de plusieurs types
d’annotations, en plus de la référence au spot ;
3 Les gènes régulés par un eQTL ont été extraits : 272 gènes sont
réputés régulés par un eQTL ;
4 Les gènes différentiellement exprimés pour le PH ont été extraits
: 23 gènes sont réuputés différentiellement exprimés pour le PH.
Remarque : 2 gènes différentiellement exprimés pour le PH sont
régulés par un eQTL ; il s’agit de D04-D07 (BX671434) et de
N01-C04 (ZRANB1).
5 / 27
Nathalie Villa-Vialaneix
Principe général de construction d’un graphe d’interactions
Sommaire
1 Les données
2 Principe général de construction d’un graphe
d’interactions
3 Analyse du graphe d’interactions des gènes régulés par un
eQTL
Analyse descriptive
Classification des sommets
4 Analyse de la corrélation avec le PH à l’aide d’outils de
statistique spatiale
6 / 27
Nathalie Villa-Vialaneix
Principe général de construction d’un graphe d’interactions
Des gènes aux réseaux de gènes
Intérêt : Détecter et analyser les réseaux de gènes impliqués dans
une ou plusieurs fonctions biologiques.
7 / 27
Nathalie Villa-Vialaneix
Principe général de construction d’un graphe d’interactions
Des gènes aux réseaux de gènes
Intérêt : Détecter et analyser les réseaux de gènes impliqués dans
une ou plusieurs fonctions biologiques.
Que modélise un réseau de gènes ?
Sommets : Gènes
Arêtes : Corrélation forte dans
l’expression des deux gènes
7 / 27
Nathalie Villa-Vialaneix
Principe général de construction d’un graphe d’interactions
Corrélations, corrélations partielles
Problème : Le calcul direct des corrélations entre deux gènes
peut être perturbé par des relations communes indirectes qui ne
sont pas révélatrices d’un phénomène biologique.
8 / 27
Nathalie Villa-Vialaneix
Principe général de construction d’un graphe d’interactions
Corrélations, corrélations partielles
Problème : Le calcul direct des corrélations entre deux gènes
peut être perturbé par des relations communes indirectes qui ne
sont pas révélatrices d’un phénomène biologique.
Solution courante : Modèle graphique Gaussien
H : La matrice d’expression des gènes, X, est issue d’une
distribution N(µ, Σ) ;
Quantité d’intérêt : Les corrélations partielles, i.e.,
πij = Cor(Xi
, Xj
|(Xk
)k i,j) ;
8 / 27
Nathalie Villa-Vialaneix
Principe général de construction d’un graphe d’interactions
Corrélations, corrélations partielles
Problème : Le calcul direct des corrélations entre deux gènes
peut être perturbé par des relations communes indirectes qui ne
sont pas révélatrices d’un phénomène biologique.
Solution courante : Modèle graphique Gaussien
H : La matrice d’expression des gènes, X, est issue d’une
distribution N(µ, Σ) ;
Quantité d’intérêt : Les corrélations partielles, i.e.,
πij = Cor(Xi
, Xj
|(Xk
)k i,j) ;
Sous H, πij =
−wij
√
wii wjj
avec Σ−1
= (wij)i,j.
8 / 27
Nathalie Villa-Vialaneix
Principe général de construction d’un graphe d’interactions
Corrélations, corrélations partielles
Problème : Le calcul direct des corrélations entre deux gènes
peut être perturbé par des relations communes indirectes qui ne
sont pas révélatrices d’un phénomène biologique.
Solution courante : Modèle graphique Gaussien
H : La matrice d’expression des gènes, X, est issue d’une
distribution N(µ, Σ) ;
Quantité d’intérêt : Les corrélations partielles, i.e.,
πij = Cor(Xi
, Xj
|(Xk
)k i,j) ;
Sous H, πij =
−wij
√
wii wjj
avec Σ−1
= (wij)i,j.
Problème important : Estimation et inversion de Σ !
8 / 27
Nathalie Villa-Vialaneix
Principe général de construction d’un graphe d’interactions
Estimation des corrélations partielles
[Schäfer and Strimmer, 2005]
Estimation des corrélations partielles par boostrap (package R
“GeneNet”) : Répéter
1 Générer un échantillon bootstrap b∗
dans les données initiales ;
2 Déterminer la variance empirique sur l’échantillon boostrap, ˆΣb∗
;
3 Calculer le pseudo-inverse de ˆΣb∗
, ˆWb∗
puis ˆΠb∗
;
9 / 27
Nathalie Villa-Vialaneix
Principe général de construction d’un graphe d’interactions
Estimation des corrélations partielles
[Schäfer and Strimmer, 2005]
Estimation des corrélations partielles par boostrap (package R
“GeneNet”) : Répéter
1 Générer un échantillon bootstrap b∗
dans les données initiales ;
2 Déterminer la variance empirique sur l’échantillon boostrap, ˆΣb∗
;
3 Calculer le pseudo-inverse de ˆΣb∗
, ˆWb∗
puis ˆΠb∗
;
Estimer Π par la moyenne des ˆΠb∗
.
9 / 27
Nathalie Villa-Vialaneix
Principe général de construction d’un graphe d’interactions
Estimation des corrélations partielles
[Schäfer and Strimmer, 2005]
Estimation des corrélations partielles par boostrap (package R
“GeneNet”) : Répéter
1 Générer un échantillon bootstrap b∗
dans les données initiales ;
2 Déterminer la variance empirique sur l’échantillon boostrap, ˆΣb∗
;
3 Calculer le pseudo-inverse de ˆΣb∗
, ˆWb∗
puis ˆΠb∗
;
Estimer Π par la moyenne des ˆΠb∗
.
Combien d’observations pour estimer correctement Π ?
9 / 27
Nathalie Villa-Vialaneix
Principe général de construction d’un graphe d’interactions
Mise en œuvre de la méthode
La méthode a été mise en œuvre pour définir trois graphes :
graphe d’interactions des gènes régulés par un eQTL (272
sommets) ;
graphe d’interactions des gènes différentiellement exprimés pour le
PH (23 sommets) ;
graphe d’interactions des gènes régulés par un eQTL ou
différentiellement exprimés pour le PH (293 sommets).
10 / 27
Nathalie Villa-Vialaneix
Principe général de construction d’un graphe d’interactions
Mise en œuvre de la méthode
La méthode a été mise en œuvre pour définir trois graphes :
graphe d’interactions des gènes régulés par un eQTL (272
sommets) ;
graphe d’interactions des gènes différentiellement exprimés pour le
PH (23 sommets) ;
graphe d’interactions des gènes régulés par un eQTL ou
différentiellement exprimés pour le PH (293 sommets).
Une procédure de bootstrap (4 000 répétitions d’échantillons
bootstrap de 20 cochons) a été programmée pour estimer les
corrélations partielles (fonction ggm.estimate du package
GeneNet).
10 / 27
Nathalie Villa-Vialaneix
Principe général de construction d’un graphe d’interactions
Mise en œuvre de la méthode
La méthode a été mise en œuvre pour définir trois graphes :
graphe d’interactions des gènes régulés par un eQTL (272
sommets) ;
graphe d’interactions des gènes différentiellement exprimés pour le
PH (23 sommets) ;
graphe d’interactions des gènes régulés par un eQTL ou
différentiellement exprimés pour le PH (293 sommets).
Une procédure de bootstrap (4 000 répétitions d’échantillons
bootstrap de 20 cochons) a été programmée pour estimer les
corrélations partielles (fonction ggm.estimate du package
GeneNet).
Un graphe d’interactions est construit dans lequel les arêtes sont
les corrélations partielles significatives (test de significativité de
la fonction ggm.test.edges, basé sur une approche bayésienne).
10 / 27
Nathalie Villa-Vialaneix
Analyse du graphe d’interactions des gènes régulés par un eQTL
Sommaire
1 Les données
2 Principe général de construction d’un graphe
d’interactions
3 Analyse du graphe d’interactions des gènes régulés par un
eQTL
Analyse descriptive
Classification des sommets
4 Analyse de la corrélation avec le PH à l’aide d’outils de
statistique spatiale
11 / 27
Nathalie Villa-Vialaneix
Analyse du graphe d’interactions des gènes régulés par un eQTL
Description basique du graphe
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
272 sommets (connexe) ; Densité : 6,4 % ; Transitivité : 25,4 % 12 / 27
Nathalie Villa-Vialaneix
Analyse du graphe d’interactions des gènes régulés par un eQTL
Analyse des degrés des sommets
Degré d’un sommet : Nombre d’arêtes afférentes au sommet.
Histogramme des degrés
Degrés
Frequency
5 10 15 20 25 30
010203040
13 / 27
Nathalie Villa-Vialaneix
Analyse du graphe d’interactions des gènes régulés par un eQTL
Analyse des degrés des sommets
Degré d’un sommet : Nombre d’arêtes afférentes au sommet.
Gènes de plus forts degrés : 21 gènes identifiés
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
PCBP2_MOUSE
RPL7L1
N4BP2TRIAP1 SLA−1
TPM3
SLC39A14
SSR4
BX921641
BX672573AW359912
GPI
BX915888
BMPR2
UTP23
SUZ12
FTH1
MGP
DGKI
PRDX4
BX670979
13 / 27
Nathalie Villa-Vialaneix
Analyse du graphe d’interactions des gènes régulés par un eQTL
Analyse des indices de centralité
Centralité d’un sommet : Nombre de plus courts chemins entre
deux sommets du graphe passant par le sommet d’intérêt ⇒
Mesure de l’importance du sommet dans la connectivité du
graphe.
Indices de centralité des degrés
q
q
qq
qqqqq
qqqqqqqqqqqqq
qqq
qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq
0 50 100 150 200 250
0100200300400500
Rang
Indicedecentralité
14 / 27
Nathalie Villa-Vialaneix
Analyse du graphe d’interactions des gènes régulés par un eQTL
Analyse des indices de centralité
Gènes de plus fortes centralités : 25 gènes identifiés
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
BX922566
BX676386
CCAR1
BX676495
FAM151B
TRIAP1
BX922608
SLC39A14
SSR4
CLTA
BX921641
BX922995
GPI
BI359863
SUZ12
FTH1
MGP
BX914936
SON
UBE2H
FADD
ROCK2
PRDX4RNASEK
BX924180
14 / 27
Nathalie Villa-Vialaneix
Analyse du graphe d’interactions des gènes régulés par un eQTL
Comparaison entre les deux listes
8 gènes sont en commun dans les deux listes :
BX921641 ; FTH1 ; TRIAP1 ; SLC9A14 ; GPI ; SUZ12 ; MGP ;
PRDX4
Reconnaissez-vous des amis ?
15 / 27
Nathalie Villa-Vialaneix
Analyse du graphe d’interactions des gènes régulés par un eQTL
Principe de la classification de sommets
But : Faire des groupes de sommets fortement connectés entre
eux et faiblement connectés aux autres.
16 / 27
Nathalie Villa-Vialaneix
Analyse du graphe d’interactions des gènes régulés par un eQTL
Principe de la classification de sommets
But : Faire des groupes de sommets fortement connectés entre
eux et faiblement connectés aux autres.
Méthode utilisée : Suite au travail d’Adrien, optimisation de la
modularité par un algorithme de recuit simulé (comme dans
[Villa et al., 2009]) car :
la modularité est une mesure de la densité des classes qui tient
compte du degré des sommets : il est moins exceptionnel d’être
lié à un hub qu’à un sommet de faible degré donc le coût de
“couper” une arête connecté à un hub doit être plus faible.
l’algorithme de recuit simulé est très facile à mettre en œuvre
même si il peut être long. Il est bien adapté à des graphes de cette
taille.
16 / 27
Nathalie Villa-Vialaneix
Analyse du graphe d’interactions des gènes régulés par un eQTL
Méthodologie et résultats
Plusieurs nombres de classes (de 4 à 12) ont été testées et la
solution avec plus forte modularité a été conservée.
Répartition du nombre de sommets dans les classes
Numéro de classe 1 2 3 4 5 6 7
Nombre de sommets 33 44 58 28 41 28 40
modularité = 0,395
17 / 27
Nathalie Villa-Vialaneix
Analyse du graphe d’interactions des gènes régulés par un eQTL
Méthodologie et résultats
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
1
2
3
4
5
6
7
17 / 27
Nathalie Villa-Vialaneix
Analyse du graphe d’interactions des gènes régulés par un eQTL
Méthodologie et résultats
q
q
q
qq q
qq
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
17 / 27
Nathalie Villa-Vialaneix
Analyse du graphe d’interactions des gènes régulés par un eQTL
Méthodologie et résultats
q
q
q
qq
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
CCDC56
RPL7L1
AGPS
BF442271FBXL3
MYH2
N4BP2 BX674324
X91724
CCAR1
SLA−1
TPM3
SSR4
BX672573
AW359912
BX674550
BX915888
BMPR2
UTP23
FTH1
STC1
MGP
BX671472
DGKI
RPL27A
ATP2A1
BX670979
BX674399
28 nodes
294 edges
Density: 77.8%
Transitivity: 85.6%
17 / 27
Nathalie Villa-Vialaneix
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Sommaire
1 Les données
2 Principe général de construction d’un graphe
d’interactions
3 Analyse du graphe d’interactions des gènes régulés par un
eQTL
Analyse descriptive
Classification des sommets
4 Analyse de la corrélation avec le PH à l’aide d’outils de
statistique spatiale
18 / 27
Nathalie Villa-Vialaneix
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Données, but
But : Comprendre si et comment un phénotype d’intérêt (le PH de
la viande) influence la manière dont des gènes, sélectionnés sur
des caractéristiques génétiques, sont organisés entre eux.
19 / 27
Nathalie Villa-Vialaneix
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Données, but
But : Comprendre si et comment un phénotype d’intérêt (le PH de
la viande) influence la manière dont des gènes, sélectionnés sur
des caractéristiques génétiques, sont organisés entre eux.
Données : Le réseau de co-expression de gènes étudié
précédemment et, pour chacun des 272 sommets, sa corrélation
(partielle) avec le PH.
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
19 / 27
Nathalie Villa-Vialaneix
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Relation entre PH et classification
qq
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
1 2 3 4 5 6 7
−0.02−0.010.000.010.020.03
Cluster
PartialcorrelationwithPH
20 / 27
Nathalie Villa-Vialaneix
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Relation entre PH et classification
qq
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
1 2 3 4 5 6 7
−0.02−0.010.000.010.020.03
Cluster
PartialcorrelationwithPH
ANOVA non significative mais test de Student pour le modèle
linéaire donne un niveau de signification élevé pour le coefficient
correspondant à la classe 4.
20 / 27
Nathalie Villa-Vialaneix
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Relation entre PH et classes
Deux exemples :
q
q
q
qq q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q q
q
q
q
q
q
q
BX925971
RRAS
BX922566
SEC24ABX671434 PATL1
BX671687BX672338
ACOX1
APITD1
BX923543
XRCC6
NUDT21
Neb
CLTA
BX667801
BX671017
BX674989
BX675907
BX665214
BX675319
CSDE1
BX671545
TACC1 BX915330
ALDH2 HIAT1
scaj0012.o.01
PPIA
BX923052
SLA−1
FADD
TMEM201
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
BX919092
PSMC3IP
THRB
XIAP
ARHGAP8
X91721
BX917912
EAPP
LSM2
BX922053
BX922491
H2AFY
ENH_RAT
LMF1
FTCD
BX925690
B2M
GPI
BX667979
BX920538
BX671131
RNF2
BX673501
KPNA1
BX674063
BX918923
RPS11
UBE2H
Classe 1 Classe 4
Remarque : Beaucoup des gènes avec une forte corrélation
positive avec le PH se trouvent dans la classe 4. 21 / 27
Nathalie Villa-Vialaneix
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Auto-corrélation spatiale dans le réseau
pour la relation avec le PH : I de Moran
[Moran, 1950] a introduit une mesure de corrélation spatiale
nommée le I (de Moran):
I =
1
2m i j wij¯ci¯cj
1
n i ¯c2
i
où m = 1
2 i j wij (total des poids dans le réseau), ci est la
corrélation partielle du gène i avec le PH et ¯ci = ci − ¯c avec
¯c = 1
n i ci.
22 / 27
Nathalie Villa-Vialaneix
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Auto-corrélation spatiale dans le réseau
pour la relation avec le PH : I de Moran
[Moran, 1950] a introduit une mesure de corrélation spatiale
nommée le I (de Moran):
I =
1
2m i j wij¯ci¯cj
1
n i ¯c2
i
où m = 1
2 i j wij (total des poids dans le réseau), ci est la
corrélation partielle du gène i avec le PH et ¯ci = ci − ¯c avec
¯c = 1
n i ci.
Interprétation : Quand I est “grand”, les sommets ont tendance à
être reliés à des sommets dont la valeur de ci est similaire; quand I
est “petit”, les sommets ont tendance à être reliés à des sommets
dont la valeur de ci est très différente. Un I “moyen” signifie qu’il n’y
a pas de relation entre les valeurs (ci)i et la structure du réseau.
22 / 27
Nathalie Villa-Vialaneix
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Auto-corrélation spatiale dans le réseau
pour la relation avec le PH : I de Moran
[Moran, 1950] a introduit une mesure de corrélation spatiale
nommée le I (de Moran):
I =
1
2m i j wij¯ci¯cj
1
n i ¯c2
i
où m = 1
2 i j wij (total des poids dans le réseau), ci est la
corrélation partielle du gène i avec le PH et ¯ci = ci − ¯c avec
¯c = 1
n i ci.
Interprétation : Quand I est “grand”, les sommets ont tendance à
être reliés à des sommets dont la valeur de ci est similaire; quand I
est “petit”, les sommets ont tendance à être reliés à des sommets
dont la valeur de ci est très différente. Un I “moyen” signifie qu’il n’y
a pas de relation entre les valeurs (ci)i et la structure du réseau.
22 / 27
Nathalie Villa-Vialaneix
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Significativité de I
Il existe un résultat de normalité asymptotique pour I (mais sous
des conditions particulières et pour des réseaux assez grands).
On utilise une simulation de Monte Carlo pour estimer la p-value
de I.
23 / 27
Nathalie Villa-Vialaneix
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Significativité de I
Il existe un résultat de normalité asymptotique pour I (mais sous
des conditions particulières et pour des réseaux assez grands).
On utilise une simulation de Monte Carlo pour estimer la p-value
de I.
Méthode :
permutation aléatoire des valeurs de ci entre les sommets du
graphe, P fois (P grand) ;
⇒ calcul de P valeurs du I de Moran et détermination de la
distribution empirique ;
comparaison avec la valeur observée.
23 / 27
Nathalie Villa-Vialaneix
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Résultat sur les données étudiées
Moran's I
Frequency
−0.05 0.00 0.05 0.10 0.15 0.20
050100150
Le I de Moran est significativement élevé : les gènes ont
tendance à être liés à des gènes pour lesquels la corrélation avec
le PH est très similaire.
24 / 27
Nathalie Villa-Vialaneix
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Résultat sur les données étudiées
Moran's I
Frequency
−0.05 0.00 0.05 0.10 0.15 0.20
050100150
Interprétation possible : Les quelques gènes fortement corrélés
positivement avec le PH sont tous dans la même classe (i.e., ils
sont fortement liés).
24 / 27
Nathalie Villa-Vialaneix
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Résultat sur les données étudiées
Moran's I
Frequency
−0.05 0.00 0.05 0.10 0.15 0.20
050100150
Remarque, question : Peut-être qu’il serait plus pertinent de faire
ce test avec (|ci|)i plutôt qu’avec (ci)i ???
24 / 27
Nathalie Villa-Vialaneix
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Avec la valeur absolue...
Moran's I
Frequency
−0.05 0.00 0.05 0.10 0.15
050100150
Le I de Moran est également significativement élevé : les gènes
ont tendance à être liés à des gènes pour lesquels la corrélation
(en valeur absolue) avec le PH est très similaire (les gènes très
corrélés sont liés à des gènes très corrélés et inversement).
25 / 27
Nathalie Villa-Vialaneix
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Diagramme de Moran pour mettre en
valeur les gènes influents pour la cor-
rélation avec le PH
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qqq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
qq
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q q
q
q
q
−0.02 −0.01 0.00 0.01 0.02 0.03
−0.0050.0000.0050.010
CorPH
AxCorPH
H−H
H−L
L−L
L−H
Graphique des moyennes de la corrélation avec le PH dans le
voisinage en fonction de la corrélation avec le PH.
26 / 27
Nathalie Villa-Vialaneix
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Diagramme de Moran pour mettre en
valeur les gènes influents pour la cor-
rélation avec le PH
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qqq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
qq
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q q
q
q
q
−0.02 −0.01 0.00 0.01 0.02 0.03
−0.0050.0000.0050.010
CorPH
AxCorPH
H−H
H−L
L−L
L−H
Graphique des moyennes de la corrélation avec le PH dans le
voisinage en fonction de la corrélation avec le PH.
Tests de significativité pour déterminer les gènes “influents”.
26 / 27
Nathalie Villa-Vialaneix
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Où sont les gènes influents ?
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
H−H
H−L
L−L
L−H
Réseau entier
27 / 27
Nathalie Villa-Vialaneix
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Où sont les gènes influents ?
q
q
q
qq q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q q
q
q
q
q
q
q
BX925971
RRAS
BX922566
SEC24ABX671434 PATL1
BX671687BX672338
ACOX1
APITD1
BX923543
XRCC6
NUDT21
Neb
CLTA
BX667801
BX671017
BX674989
BX675907
BX665214
BX675319
CSDE1
BX671545
TACC1 BX915330
ALDH2 HIAT1
scaj0012.o.01
PPIA
BX923052
SLA−1
FADD
TMEM201
Cluster 1
27 / 27
Nathalie Villa-Vialaneix
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Où sont les gènes influents ?
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q q
q
q
q
qq
q
q
q
q
q
q
PLOD1
SEP15
CCDC47
C5H22orf32
LOC511599
BX921227
PDLIM7
SPARCL1
LDHA
PRKG2
BX667797
B2M
CR939574
BE033242
BX673681
OCLN
BX915984
BX670104
ZYX
BX922075
UBE2M
TRIAP1
BX674839
BX926631
CCT2
BX668837
BX669337
BEX1
RPS15BX920987
IL8
BX671117BX665361
BX665356
C2
BI359863
BX665098SUZ12
ZRANB1
KIAA0152
BX920480
NFU1
TNNI1
KCTD1
Cluster 2
27 / 27
Nathalie Villa-Vialaneix
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Où sont les gènes influents ?
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
EIF3C
COMMD1
IK
BX917871
CR940191
BX676386
C11orf59
BX671424
BX673689
SMARCC2
BX924343
CLPTM1L
TRIM33
BX927037
BX917034
SEPW1
BX676495
CDKN2D
BX924633
GLRX3
BX920718
PRPF40A
SLC16A3 PARD3IL13RA2
SLN
BX918744
BX671723
BX669206
ILKAP
TREX1
ACTN2
BX668043
BX921641
BSG
MTIF2
EMG1
CALM1
CENPE
UBAP1
GNAI2
SLA−1
LOC777786
BX668068
SON
LOC780405
X91330
PRDX4
BX924187
THYN1
HNRPA1
LOC733592
BX921514
PABPN1
MRPL41
GTF2E1
HSP90B1
BX924180
Cluster 3
27 / 27
Nathalie Villa-Vialaneix
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Où sont les gènes influents ?
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
BX919092
PSMC3IP
THRB
XIAP
ARHGAP8
X91721
BX917912
EAPP
LSM2
BX922053
BX922491
H2AFY
ENH_RAT
LMF1
FTCD
BX925690
B2M
GPI
BX667979
BX920538
BX671131
RNF2
BX673501
KPNA1
BX674063
BX918923
RPS11
UBE2H
Cluster 4
27 / 27
Nathalie Villa-Vialaneix
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Où sont les gènes influents ?
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
APIP
PRPF3
CREB3L3
SLC35B2
BX669670
CXCL12
scai0001.d.08
TMEM14C
SELH_HUMAN
ANXA7
FAM151B
BX669689
BX923207
QIL1
BX922608
BX917123
C7H19orf62
TEC
DDX3X
ANKRD40
XBP1
BX672614
BX922943 CSNK1A1
BX668060
ODC1
PDE4DIP
BX665674
LOC616632
BX914936
ARFIP1
DAPK1
CFL2
LPL
BX669627
RNASEK
SLC25A22
EEF1A1
MGST1_PIG
COMT
RPS5
Cluster 5
27 / 27
Nathalie Villa-Vialaneix
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Où sont les gènes influents ?
q
q
q
qq
q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
CCDC56
RPL7L1
AGPS
BF442271FBXL3
MYH2
N4BP2 BX674324
X91724
CCAR1
SLA−1
TPM3
SSR4
BX672573
AW359912
BX674550
BX915888
BMPR2
UTP23
FTH1
STC1
MGP
BX671472
DGKI
RPL27A
ATP2A1
BX670979
BX674399
Cluster 6
27 / 27
Nathalie Villa-Vialaneix
Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale
Où sont les gènes influents ?
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
BX918989
BX916347
SNW1
PCBP2_MOUSE
MTCH1
BG834885
PABPC1
CD81
BX918478
BX924513
BX926921
BX667806
RBM9
EEF1A1
BX926575
BX672767
EEF1A−2
KIAA494
SLA−1
SLC39A14
CCDC56
BX915803
CR939198
B2M
FIT1
BX922995
AARS
TMEM126B
H3F3B
SEPP1
GNG10
TJP3
BX915764
IMMT
BX918369
ROCK2
BX919942
TYR
BX676048
BX920880
Cluster 7
27 / 27
Nathalie Villa-Vialaneix
Moran, P. (1950).
Notes on continuous stochastic phenomena.
Biometrika, 37:17–23.
Schäfer, J. and Strimmer, K. (2005).
An empirical bayes approach to inferring large-scale gene association networks.
Bioinformatics, 21(6):754–764.
Villa, N., Dkaki, T., Gadat, S., Inglebert, J., and Truong, Q. (2009).
Recherche et représentation de communautés dans des grands graphes.
In Actes du colloque Veille Stratégique, Scientifique et Technologique (VSST 2009), Nancy, France.
27 / 27
Nathalie Villa-Vialaneix

Más contenido relacionado

Destacado

Multiple kernel Self-Organizing Maps
Multiple kernel Self-Organizing MapsMultiple kernel Self-Organizing Maps
Multiple kernel Self-Organizing Mapstuxette
 
Consensual gene co-expression network inference with multiple samples
Consensual gene co-expression network inference with multiple samplesConsensual gene co-expression network inference with multiple samples
Consensual gene co-expression network inference with multiple samplestuxette
 
What is a MOOC?
What is a MOOC?What is a MOOC?
What is a MOOC?tuxette
 
Inferring networks from multiple samples with consensus LASSO
Inferring networks from multiple samples with consensus LASSOInferring networks from multiple samples with consensus LASSO
Inferring networks from multiple samples with consensus LASSOtuxette
 
Mining co-expression network
Mining co-expression networkMining co-expression network
Mining co-expression networktuxette
 
Traitement de données fonctionnelles par Support Vector Machine
Traitement de données fonctionnelles par Support Vector MachineTraitement de données fonctionnelles par Support Vector Machine
Traitement de données fonctionnelles par Support Vector Machinetuxette
 
Inferring networks from multiple samples with consensus LASSO
Inferring networks from multiple samples with consensus LASSOInferring networks from multiple samples with consensus LASSO
Inferring networks from multiple samples with consensus LASSOtuxette
 
Inferring networks from multiple samples with consensus LASSO
Inferring networks from multiple samples with consensus LASSOInferring networks from multiple samples with consensus LASSO
Inferring networks from multiple samples with consensus LASSOtuxette
 
Slides Lycée Jules Fil 2014
Slides Lycée Jules Fil 2014Slides Lycée Jules Fil 2014
Slides Lycée Jules Fil 2014tuxette
 
A short introduction to statistical learning
A short introduction to statistical learningA short introduction to statistical learning
A short introduction to statistical learningtuxette
 
Interpretable Sparse Sliced Inverse Regression for digitized functional data
Interpretable Sparse Sliced Inverse Regression for digitized functional dataInterpretable Sparse Sliced Inverse Regression for digitized functional data
Interpretable Sparse Sliced Inverse Regression for digitized functional datatuxette
 
Visualiser et fouiller des réseaux - Méthodes et exemples dans R
Visualiser et fouiller des réseaux - Méthodes et exemples dans RVisualiser et fouiller des réseaux - Méthodes et exemples dans R
Visualiser et fouiller des réseaux - Méthodes et exemples dans Rtuxette
 
Discrimination de courbes par SVM
Discrimination de courbes par SVMDiscrimination de courbes par SVM
Discrimination de courbes par SVMtuxette
 
Théorie de l’apprentissage et SVM : présentation rapide et premières idées da...
Théorie de l’apprentissage et SVM : présentation rapide et premières idées da...Théorie de l’apprentissage et SVM : présentation rapide et premières idées da...
Théorie de l’apprentissage et SVM : présentation rapide et premières idées da...tuxette
 
A comparison of learning methods to predict N2O fluxes and N leaching
A comparison of learning methods to predict N2O fluxes and N leachingA comparison of learning methods to predict N2O fluxes and N leaching
A comparison of learning methods to predict N2O fluxes and N leachingtuxette
 
Dynamique de l’occupation des sols de la région des Garrotxes
Dynamique de l’occupation des sols de la région des GarrotxesDynamique de l’occupation des sols de la région des Garrotxes
Dynamique de l’occupation des sols de la région des Garrotxestuxette
 
Réseaux de neurones à entrées fonctionnelles
Réseaux de neurones à entrées fonctionnellesRéseaux de neurones à entrées fonctionnelles
Réseaux de neurones à entrées fonctionnellestuxette
 
Cartes auto-organisée de Kohonen et clustering
Cartes auto-organisée de Kohonen et clusteringCartes auto-organisée de Kohonen et clustering
Cartes auto-organisée de Kohonen et clusteringtuxette
 
Modélisation de la dynamique d’occupation du sol par réseaux de neurones
Modélisation de la dynamique d’occupation du sol par réseaux de neuronesModélisation de la dynamique d’occupation du sol par réseaux de neurones
Modélisation de la dynamique d’occupation du sol par réseaux de neuronestuxette
 
Graph mining 2: Statistical approaches for graph mining
Graph mining 2: Statistical approaches for graph miningGraph mining 2: Statistical approaches for graph mining
Graph mining 2: Statistical approaches for graph miningtuxette
 

Destacado (20)

Multiple kernel Self-Organizing Maps
Multiple kernel Self-Organizing MapsMultiple kernel Self-Organizing Maps
Multiple kernel Self-Organizing Maps
 
Consensual gene co-expression network inference with multiple samples
Consensual gene co-expression network inference with multiple samplesConsensual gene co-expression network inference with multiple samples
Consensual gene co-expression network inference with multiple samples
 
What is a MOOC?
What is a MOOC?What is a MOOC?
What is a MOOC?
 
Inferring networks from multiple samples with consensus LASSO
Inferring networks from multiple samples with consensus LASSOInferring networks from multiple samples with consensus LASSO
Inferring networks from multiple samples with consensus LASSO
 
Mining co-expression network
Mining co-expression networkMining co-expression network
Mining co-expression network
 
Traitement de données fonctionnelles par Support Vector Machine
Traitement de données fonctionnelles par Support Vector MachineTraitement de données fonctionnelles par Support Vector Machine
Traitement de données fonctionnelles par Support Vector Machine
 
Inferring networks from multiple samples with consensus LASSO
Inferring networks from multiple samples with consensus LASSOInferring networks from multiple samples with consensus LASSO
Inferring networks from multiple samples with consensus LASSO
 
Inferring networks from multiple samples with consensus LASSO
Inferring networks from multiple samples with consensus LASSOInferring networks from multiple samples with consensus LASSO
Inferring networks from multiple samples with consensus LASSO
 
Slides Lycée Jules Fil 2014
Slides Lycée Jules Fil 2014Slides Lycée Jules Fil 2014
Slides Lycée Jules Fil 2014
 
A short introduction to statistical learning
A short introduction to statistical learningA short introduction to statistical learning
A short introduction to statistical learning
 
Interpretable Sparse Sliced Inverse Regression for digitized functional data
Interpretable Sparse Sliced Inverse Regression for digitized functional dataInterpretable Sparse Sliced Inverse Regression for digitized functional data
Interpretable Sparse Sliced Inverse Regression for digitized functional data
 
Visualiser et fouiller des réseaux - Méthodes et exemples dans R
Visualiser et fouiller des réseaux - Méthodes et exemples dans RVisualiser et fouiller des réseaux - Méthodes et exemples dans R
Visualiser et fouiller des réseaux - Méthodes et exemples dans R
 
Discrimination de courbes par SVM
Discrimination de courbes par SVMDiscrimination de courbes par SVM
Discrimination de courbes par SVM
 
Théorie de l’apprentissage et SVM : présentation rapide et premières idées da...
Théorie de l’apprentissage et SVM : présentation rapide et premières idées da...Théorie de l’apprentissage et SVM : présentation rapide et premières idées da...
Théorie de l’apprentissage et SVM : présentation rapide et premières idées da...
 
A comparison of learning methods to predict N2O fluxes and N leaching
A comparison of learning methods to predict N2O fluxes and N leachingA comparison of learning methods to predict N2O fluxes and N leaching
A comparison of learning methods to predict N2O fluxes and N leaching
 
Dynamique de l’occupation des sols de la région des Garrotxes
Dynamique de l’occupation des sols de la région des GarrotxesDynamique de l’occupation des sols de la région des Garrotxes
Dynamique de l’occupation des sols de la région des Garrotxes
 
Réseaux de neurones à entrées fonctionnelles
Réseaux de neurones à entrées fonctionnellesRéseaux de neurones à entrées fonctionnelles
Réseaux de neurones à entrées fonctionnelles
 
Cartes auto-organisée de Kohonen et clustering
Cartes auto-organisée de Kohonen et clusteringCartes auto-organisée de Kohonen et clustering
Cartes auto-organisée de Kohonen et clustering
 
Modélisation de la dynamique d’occupation du sol par réseaux de neurones
Modélisation de la dynamique d’occupation du sol par réseaux de neuronesModélisation de la dynamique d’occupation du sol par réseaux de neurones
Modélisation de la dynamique d’occupation du sol par réseaux de neurones
 
Graph mining 2: Statistical approaches for graph mining
Graph mining 2: Statistical approaches for graph miningGraph mining 2: Statistical approaches for graph mining
Graph mining 2: Statistical approaches for graph mining
 

Más de tuxette

Racines en haut et feuilles en bas : les arbres en maths
Racines en haut et feuilles en bas : les arbres en mathsRacines en haut et feuilles en bas : les arbres en maths
Racines en haut et feuilles en bas : les arbres en mathstuxette
 
Méthodes à noyaux pour l’intégration de données hétérogènes
Méthodes à noyaux pour l’intégration de données hétérogènesMéthodes à noyaux pour l’intégration de données hétérogènes
Méthodes à noyaux pour l’intégration de données hétérogènestuxette
 
Méthodologies d'intégration de données omiques
Méthodologies d'intégration de données omiquesMéthodologies d'intégration de données omiques
Méthodologies d'intégration de données omiquestuxette
 
Projets autour de l'Hi-C
Projets autour de l'Hi-CProjets autour de l'Hi-C
Projets autour de l'Hi-Ctuxette
 
Can deep learning learn chromatin structure from sequence?
Can deep learning learn chromatin structure from sequence?Can deep learning learn chromatin structure from sequence?
Can deep learning learn chromatin structure from sequence?tuxette
 
Multi-omics data integration methods: kernel and other machine learning appro...
Multi-omics data integration methods: kernel and other machine learning appro...Multi-omics data integration methods: kernel and other machine learning appro...
Multi-omics data integration methods: kernel and other machine learning appro...tuxette
 
ASTERICS : une application pour intégrer des données omiques
ASTERICS : une application pour intégrer des données omiquesASTERICS : une application pour intégrer des données omiques
ASTERICS : une application pour intégrer des données omiquestuxette
 
Autour des projets Idefics et MetaboWean
Autour des projets Idefics et MetaboWeanAutour des projets Idefics et MetaboWean
Autour des projets Idefics et MetaboWeantuxette
 
Rserve, renv, flask, Vue.js dans un docker pour intégrer des données omiques ...
Rserve, renv, flask, Vue.js dans un docker pour intégrer des données omiques ...Rserve, renv, flask, Vue.js dans un docker pour intégrer des données omiques ...
Rserve, renv, flask, Vue.js dans un docker pour intégrer des données omiques ...tuxette
 
Apprentissage pour la biologie moléculaire et l’analyse de données omiques
Apprentissage pour la biologie moléculaire et l’analyse de données omiquesApprentissage pour la biologie moléculaire et l’analyse de données omiques
Apprentissage pour la biologie moléculaire et l’analyse de données omiquestuxette
 
Quelques résultats préliminaires de l'évaluation de méthodes d'inférence de r...
Quelques résultats préliminaires de l'évaluation de méthodes d'inférence de r...Quelques résultats préliminaires de l'évaluation de méthodes d'inférence de r...
Quelques résultats préliminaires de l'évaluation de méthodes d'inférence de r...tuxette
 
Intégration de données omiques multi-échelles : méthodes à noyau et autres ap...
Intégration de données omiques multi-échelles : méthodes à noyau et autres ap...Intégration de données omiques multi-échelles : méthodes à noyau et autres ap...
Intégration de données omiques multi-échelles : méthodes à noyau et autres ap...tuxette
 
Journal club: Validation of cluster analysis results on validation data
Journal club: Validation of cluster analysis results on validation dataJournal club: Validation of cluster analysis results on validation data
Journal club: Validation of cluster analysis results on validation datatuxette
 
Overfitting or overparametrization?
Overfitting or overparametrization?Overfitting or overparametrization?
Overfitting or overparametrization?tuxette
 
Selective inference and single-cell differential analysis
Selective inference and single-cell differential analysisSelective inference and single-cell differential analysis
Selective inference and single-cell differential analysistuxette
 
SOMbrero : un package R pour les cartes auto-organisatrices
SOMbrero : un package R pour les cartes auto-organisatricesSOMbrero : un package R pour les cartes auto-organisatrices
SOMbrero : un package R pour les cartes auto-organisatricestuxette
 
Graph Neural Network for Phenotype Prediction
Graph Neural Network for Phenotype PredictionGraph Neural Network for Phenotype Prediction
Graph Neural Network for Phenotype Predictiontuxette
 
A short and naive introduction to using network in prediction models
A short and naive introduction to using network in prediction modelsA short and naive introduction to using network in prediction models
A short and naive introduction to using network in prediction modelstuxette
 
Explanable models for time series with random forest
Explanable models for time series with random forestExplanable models for time series with random forest
Explanable models for time series with random foresttuxette
 
Présentation du projet ASTERICS
Présentation du projet ASTERICSPrésentation du projet ASTERICS
Présentation du projet ASTERICStuxette
 

Más de tuxette (20)

Racines en haut et feuilles en bas : les arbres en maths
Racines en haut et feuilles en bas : les arbres en mathsRacines en haut et feuilles en bas : les arbres en maths
Racines en haut et feuilles en bas : les arbres en maths
 
Méthodes à noyaux pour l’intégration de données hétérogènes
Méthodes à noyaux pour l’intégration de données hétérogènesMéthodes à noyaux pour l’intégration de données hétérogènes
Méthodes à noyaux pour l’intégration de données hétérogènes
 
Méthodologies d'intégration de données omiques
Méthodologies d'intégration de données omiquesMéthodologies d'intégration de données omiques
Méthodologies d'intégration de données omiques
 
Projets autour de l'Hi-C
Projets autour de l'Hi-CProjets autour de l'Hi-C
Projets autour de l'Hi-C
 
Can deep learning learn chromatin structure from sequence?
Can deep learning learn chromatin structure from sequence?Can deep learning learn chromatin structure from sequence?
Can deep learning learn chromatin structure from sequence?
 
Multi-omics data integration methods: kernel and other machine learning appro...
Multi-omics data integration methods: kernel and other machine learning appro...Multi-omics data integration methods: kernel and other machine learning appro...
Multi-omics data integration methods: kernel and other machine learning appro...
 
ASTERICS : une application pour intégrer des données omiques
ASTERICS : une application pour intégrer des données omiquesASTERICS : une application pour intégrer des données omiques
ASTERICS : une application pour intégrer des données omiques
 
Autour des projets Idefics et MetaboWean
Autour des projets Idefics et MetaboWeanAutour des projets Idefics et MetaboWean
Autour des projets Idefics et MetaboWean
 
Rserve, renv, flask, Vue.js dans un docker pour intégrer des données omiques ...
Rserve, renv, flask, Vue.js dans un docker pour intégrer des données omiques ...Rserve, renv, flask, Vue.js dans un docker pour intégrer des données omiques ...
Rserve, renv, flask, Vue.js dans un docker pour intégrer des données omiques ...
 
Apprentissage pour la biologie moléculaire et l’analyse de données omiques
Apprentissage pour la biologie moléculaire et l’analyse de données omiquesApprentissage pour la biologie moléculaire et l’analyse de données omiques
Apprentissage pour la biologie moléculaire et l’analyse de données omiques
 
Quelques résultats préliminaires de l'évaluation de méthodes d'inférence de r...
Quelques résultats préliminaires de l'évaluation de méthodes d'inférence de r...Quelques résultats préliminaires de l'évaluation de méthodes d'inférence de r...
Quelques résultats préliminaires de l'évaluation de méthodes d'inférence de r...
 
Intégration de données omiques multi-échelles : méthodes à noyau et autres ap...
Intégration de données omiques multi-échelles : méthodes à noyau et autres ap...Intégration de données omiques multi-échelles : méthodes à noyau et autres ap...
Intégration de données omiques multi-échelles : méthodes à noyau et autres ap...
 
Journal club: Validation of cluster analysis results on validation data
Journal club: Validation of cluster analysis results on validation dataJournal club: Validation of cluster analysis results on validation data
Journal club: Validation of cluster analysis results on validation data
 
Overfitting or overparametrization?
Overfitting or overparametrization?Overfitting or overparametrization?
Overfitting or overparametrization?
 
Selective inference and single-cell differential analysis
Selective inference and single-cell differential analysisSelective inference and single-cell differential analysis
Selective inference and single-cell differential analysis
 
SOMbrero : un package R pour les cartes auto-organisatrices
SOMbrero : un package R pour les cartes auto-organisatricesSOMbrero : un package R pour les cartes auto-organisatrices
SOMbrero : un package R pour les cartes auto-organisatrices
 
Graph Neural Network for Phenotype Prediction
Graph Neural Network for Phenotype PredictionGraph Neural Network for Phenotype Prediction
Graph Neural Network for Phenotype Prediction
 
A short and naive introduction to using network in prediction models
A short and naive introduction to using network in prediction modelsA short and naive introduction to using network in prediction models
A short and naive introduction to using network in prediction models
 
Explanable models for time series with random forest
Explanable models for time series with random forestExplanable models for time series with random forest
Explanable models for time series with random forest
 
Présentation du projet ASTERICS
Présentation du projet ASTERICSPrésentation du projet ASTERICS
Présentation du projet ASTERICS
 

Définition et analyse de graphes d’interactions de gènes pour la qualité de la viande de porc ; relations avec le PH

  • 1. Définition et analyse de graphes d’interactions de gènes pour la qualité de la viande de porc ; relations avec le PH Nathalie Villa-Vialaneix http://www.nathalievilla.org IUT de Carcassonne (UPVD) & Institut de Mathématiques de Toulouse Groupe de travail BioPuces, INRA de Castanet 14 Janvier 2011 1 / 27 Nathalie Villa-Vialaneix
  • 2. Présentation générale 1 Les données 2 Principe général de construction d’un graphe d’interactions 3 Analyse du graphe d’interactions des gènes régulés par un eQTL Analyse descriptive Classification des sommets 4 Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale 2 / 27 Nathalie Villa-Vialaneix
  • 3. Les données Sommaire 1 Les données 2 Principe général de construction d’un graphe d’interactions 3 Analyse du graphe d’interactions des gènes régulés par un eQTL Analyse descriptive Classification des sommets 4 Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale 3 / 27 Nathalie Villa-Vialaneix
  • 4. Les données Production d’animaux F2 avec des fac- teurs de variation génétique F0 : 16 ♂ (Piétrain) × 28 ♀ (Synthétique) F1 : 17 ♂ × 62 ♀ F2 : 1200 animaux structurés par lignée de père Prélèvement de tissus (dont longissimus dorsi) Mesures phénotypiques (30) (force de cisaillement, PH ...) 4 / 27 Nathalie Villa-Vialaneix
  • 5. Les données Production d’animaux F2 avec des fac- teurs de variation génétique F0 : 16 ♂ (Piétrain) × 28 ♀ (Synthétique) F1 : 17 ♂ × 62 ♀ F2 : 1200 animaux structurés par lignée de père Prélèvement de tissus (dont longissimus dorsi) Mesures phénotypiques (30) (force de cisaillement, PH ...) Données retenues : Une famille de 57 individus F2 (plus forte variabilité pour force de cisaillement et PH) ; transcri. 2 464 gènes. 4 / 27 Nathalie Villa-Vialaneix
  • 6. Les données Premières extractions des données 1 Les données ont été normalisées et les valeurs manquantes complétées ; 5 / 27 Nathalie Villa-Vialaneix
  • 7. Les données Premières extractions des données 1 Les données ont été normalisées et les valeurs manquantes complétées ; 2 Une nomenclature par défaut pour les gènes (non validée précisément) a été définie sur la base de plusieurs types d’annotations, en plus de la référence au spot ; 5 / 27 Nathalie Villa-Vialaneix
  • 8. Les données Premières extractions des données 1 Les données ont été normalisées et les valeurs manquantes complétées ; 2 Une nomenclature par défaut pour les gènes (non validée précisément) a été définie sur la base de plusieurs types d’annotations, en plus de la référence au spot ; 3 Les gènes régulés par un eQTL ont été extraits : 272 gènes sont réputés régulés par un eQTL ; 5 / 27 Nathalie Villa-Vialaneix
  • 9. Les données Premières extractions des données 1 Les données ont été normalisées et les valeurs manquantes complétées ; 2 Une nomenclature par défaut pour les gènes (non validée précisément) a été définie sur la base de plusieurs types d’annotations, en plus de la référence au spot ; 3 Les gènes régulés par un eQTL ont été extraits : 272 gènes sont réputés régulés par un eQTL ; 4 Les gènes différentiellement exprimés pour le PH ont été extraits : 23 gènes sont réuputés différentiellement exprimés pour le PH. 5 / 27 Nathalie Villa-Vialaneix
  • 10. Les données Premières extractions des données 1 Les données ont été normalisées et les valeurs manquantes complétées ; 2 Une nomenclature par défaut pour les gènes (non validée précisément) a été définie sur la base de plusieurs types d’annotations, en plus de la référence au spot ; 3 Les gènes régulés par un eQTL ont été extraits : 272 gènes sont réputés régulés par un eQTL ; 4 Les gènes différentiellement exprimés pour le PH ont été extraits : 23 gènes sont réuputés différentiellement exprimés pour le PH. Remarque : 2 gènes différentiellement exprimés pour le PH sont régulés par un eQTL ; il s’agit de D04-D07 (BX671434) et de N01-C04 (ZRANB1). 5 / 27 Nathalie Villa-Vialaneix
  • 11. Principe général de construction d’un graphe d’interactions Sommaire 1 Les données 2 Principe général de construction d’un graphe d’interactions 3 Analyse du graphe d’interactions des gènes régulés par un eQTL Analyse descriptive Classification des sommets 4 Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale 6 / 27 Nathalie Villa-Vialaneix
  • 12. Principe général de construction d’un graphe d’interactions Des gènes aux réseaux de gènes Intérêt : Détecter et analyser les réseaux de gènes impliqués dans une ou plusieurs fonctions biologiques. 7 / 27 Nathalie Villa-Vialaneix
  • 13. Principe général de construction d’un graphe d’interactions Des gènes aux réseaux de gènes Intérêt : Détecter et analyser les réseaux de gènes impliqués dans une ou plusieurs fonctions biologiques. Que modélise un réseau de gènes ? Sommets : Gènes Arêtes : Corrélation forte dans l’expression des deux gènes 7 / 27 Nathalie Villa-Vialaneix
  • 14. Principe général de construction d’un graphe d’interactions Corrélations, corrélations partielles Problème : Le calcul direct des corrélations entre deux gènes peut être perturbé par des relations communes indirectes qui ne sont pas révélatrices d’un phénomène biologique. 8 / 27 Nathalie Villa-Vialaneix
  • 15. Principe général de construction d’un graphe d’interactions Corrélations, corrélations partielles Problème : Le calcul direct des corrélations entre deux gènes peut être perturbé par des relations communes indirectes qui ne sont pas révélatrices d’un phénomène biologique. Solution courante : Modèle graphique Gaussien H : La matrice d’expression des gènes, X, est issue d’une distribution N(µ, Σ) ; Quantité d’intérêt : Les corrélations partielles, i.e., πij = Cor(Xi , Xj |(Xk )k i,j) ; 8 / 27 Nathalie Villa-Vialaneix
  • 16. Principe général de construction d’un graphe d’interactions Corrélations, corrélations partielles Problème : Le calcul direct des corrélations entre deux gènes peut être perturbé par des relations communes indirectes qui ne sont pas révélatrices d’un phénomène biologique. Solution courante : Modèle graphique Gaussien H : La matrice d’expression des gènes, X, est issue d’une distribution N(µ, Σ) ; Quantité d’intérêt : Les corrélations partielles, i.e., πij = Cor(Xi , Xj |(Xk )k i,j) ; Sous H, πij = −wij √ wii wjj avec Σ−1 = (wij)i,j. 8 / 27 Nathalie Villa-Vialaneix
  • 17. Principe général de construction d’un graphe d’interactions Corrélations, corrélations partielles Problème : Le calcul direct des corrélations entre deux gènes peut être perturbé par des relations communes indirectes qui ne sont pas révélatrices d’un phénomène biologique. Solution courante : Modèle graphique Gaussien H : La matrice d’expression des gènes, X, est issue d’une distribution N(µ, Σ) ; Quantité d’intérêt : Les corrélations partielles, i.e., πij = Cor(Xi , Xj |(Xk )k i,j) ; Sous H, πij = −wij √ wii wjj avec Σ−1 = (wij)i,j. Problème important : Estimation et inversion de Σ ! 8 / 27 Nathalie Villa-Vialaneix
  • 18. Principe général de construction d’un graphe d’interactions Estimation des corrélations partielles [Schäfer and Strimmer, 2005] Estimation des corrélations partielles par boostrap (package R “GeneNet”) : Répéter 1 Générer un échantillon bootstrap b∗ dans les données initiales ; 2 Déterminer la variance empirique sur l’échantillon boostrap, ˆΣb∗ ; 3 Calculer le pseudo-inverse de ˆΣb∗ , ˆWb∗ puis ˆΠb∗ ; 9 / 27 Nathalie Villa-Vialaneix
  • 19. Principe général de construction d’un graphe d’interactions Estimation des corrélations partielles [Schäfer and Strimmer, 2005] Estimation des corrélations partielles par boostrap (package R “GeneNet”) : Répéter 1 Générer un échantillon bootstrap b∗ dans les données initiales ; 2 Déterminer la variance empirique sur l’échantillon boostrap, ˆΣb∗ ; 3 Calculer le pseudo-inverse de ˆΣb∗ , ˆWb∗ puis ˆΠb∗ ; Estimer Π par la moyenne des ˆΠb∗ . 9 / 27 Nathalie Villa-Vialaneix
  • 20. Principe général de construction d’un graphe d’interactions Estimation des corrélations partielles [Schäfer and Strimmer, 2005] Estimation des corrélations partielles par boostrap (package R “GeneNet”) : Répéter 1 Générer un échantillon bootstrap b∗ dans les données initiales ; 2 Déterminer la variance empirique sur l’échantillon boostrap, ˆΣb∗ ; 3 Calculer le pseudo-inverse de ˆΣb∗ , ˆWb∗ puis ˆΠb∗ ; Estimer Π par la moyenne des ˆΠb∗ . Combien d’observations pour estimer correctement Π ? 9 / 27 Nathalie Villa-Vialaneix
  • 21. Principe général de construction d’un graphe d’interactions Mise en œuvre de la méthode La méthode a été mise en œuvre pour définir trois graphes : graphe d’interactions des gènes régulés par un eQTL (272 sommets) ; graphe d’interactions des gènes différentiellement exprimés pour le PH (23 sommets) ; graphe d’interactions des gènes régulés par un eQTL ou différentiellement exprimés pour le PH (293 sommets). 10 / 27 Nathalie Villa-Vialaneix
  • 22. Principe général de construction d’un graphe d’interactions Mise en œuvre de la méthode La méthode a été mise en œuvre pour définir trois graphes : graphe d’interactions des gènes régulés par un eQTL (272 sommets) ; graphe d’interactions des gènes différentiellement exprimés pour le PH (23 sommets) ; graphe d’interactions des gènes régulés par un eQTL ou différentiellement exprimés pour le PH (293 sommets). Une procédure de bootstrap (4 000 répétitions d’échantillons bootstrap de 20 cochons) a été programmée pour estimer les corrélations partielles (fonction ggm.estimate du package GeneNet). 10 / 27 Nathalie Villa-Vialaneix
  • 23. Principe général de construction d’un graphe d’interactions Mise en œuvre de la méthode La méthode a été mise en œuvre pour définir trois graphes : graphe d’interactions des gènes régulés par un eQTL (272 sommets) ; graphe d’interactions des gènes différentiellement exprimés pour le PH (23 sommets) ; graphe d’interactions des gènes régulés par un eQTL ou différentiellement exprimés pour le PH (293 sommets). Une procédure de bootstrap (4 000 répétitions d’échantillons bootstrap de 20 cochons) a été programmée pour estimer les corrélations partielles (fonction ggm.estimate du package GeneNet). Un graphe d’interactions est construit dans lequel les arêtes sont les corrélations partielles significatives (test de significativité de la fonction ggm.test.edges, basé sur une approche bayésienne). 10 / 27 Nathalie Villa-Vialaneix
  • 24. Analyse du graphe d’interactions des gènes régulés par un eQTL Sommaire 1 Les données 2 Principe général de construction d’un graphe d’interactions 3 Analyse du graphe d’interactions des gènes régulés par un eQTL Analyse descriptive Classification des sommets 4 Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale 11 / 27 Nathalie Villa-Vialaneix
  • 25. Analyse du graphe d’interactions des gènes régulés par un eQTL Description basique du graphe q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q 272 sommets (connexe) ; Densité : 6,4 % ; Transitivité : 25,4 % 12 / 27 Nathalie Villa-Vialaneix
  • 26. Analyse du graphe d’interactions des gènes régulés par un eQTL Analyse des degrés des sommets Degré d’un sommet : Nombre d’arêtes afférentes au sommet. Histogramme des degrés Degrés Frequency 5 10 15 20 25 30 010203040 13 / 27 Nathalie Villa-Vialaneix
  • 27. Analyse du graphe d’interactions des gènes régulés par un eQTL Analyse des degrés des sommets Degré d’un sommet : Nombre d’arêtes afférentes au sommet. Gènes de plus forts degrés : 21 gènes identifiés q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q PCBP2_MOUSE RPL7L1 N4BP2TRIAP1 SLA−1 TPM3 SLC39A14 SSR4 BX921641 BX672573AW359912 GPI BX915888 BMPR2 UTP23 SUZ12 FTH1 MGP DGKI PRDX4 BX670979 13 / 27 Nathalie Villa-Vialaneix
  • 28. Analyse du graphe d’interactions des gènes régulés par un eQTL Analyse des indices de centralité Centralité d’un sommet : Nombre de plus courts chemins entre deux sommets du graphe passant par le sommet d’intérêt ⇒ Mesure de l’importance du sommet dans la connectivité du graphe. Indices de centralité des degrés q q qq qqqqq qqqqqqqqqqqqq qqq qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq 0 50 100 150 200 250 0100200300400500 Rang Indicedecentralité 14 / 27 Nathalie Villa-Vialaneix
  • 29. Analyse du graphe d’interactions des gènes régulés par un eQTL Analyse des indices de centralité Gènes de plus fortes centralités : 25 gènes identifiés q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q BX922566 BX676386 CCAR1 BX676495 FAM151B TRIAP1 BX922608 SLC39A14 SSR4 CLTA BX921641 BX922995 GPI BI359863 SUZ12 FTH1 MGP BX914936 SON UBE2H FADD ROCK2 PRDX4RNASEK BX924180 14 / 27 Nathalie Villa-Vialaneix
  • 30. Analyse du graphe d’interactions des gènes régulés par un eQTL Comparaison entre les deux listes 8 gènes sont en commun dans les deux listes : BX921641 ; FTH1 ; TRIAP1 ; SLC9A14 ; GPI ; SUZ12 ; MGP ; PRDX4 Reconnaissez-vous des amis ? 15 / 27 Nathalie Villa-Vialaneix
  • 31. Analyse du graphe d’interactions des gènes régulés par un eQTL Principe de la classification de sommets But : Faire des groupes de sommets fortement connectés entre eux et faiblement connectés aux autres. 16 / 27 Nathalie Villa-Vialaneix
  • 32. Analyse du graphe d’interactions des gènes régulés par un eQTL Principe de la classification de sommets But : Faire des groupes de sommets fortement connectés entre eux et faiblement connectés aux autres. Méthode utilisée : Suite au travail d’Adrien, optimisation de la modularité par un algorithme de recuit simulé (comme dans [Villa et al., 2009]) car : la modularité est une mesure de la densité des classes qui tient compte du degré des sommets : il est moins exceptionnel d’être lié à un hub qu’à un sommet de faible degré donc le coût de “couper” une arête connecté à un hub doit être plus faible. l’algorithme de recuit simulé est très facile à mettre en œuvre même si il peut être long. Il est bien adapté à des graphes de cette taille. 16 / 27 Nathalie Villa-Vialaneix
  • 33. Analyse du graphe d’interactions des gènes régulés par un eQTL Méthodologie et résultats Plusieurs nombres de classes (de 4 à 12) ont été testées et la solution avec plus forte modularité a été conservée. Répartition du nombre de sommets dans les classes Numéro de classe 1 2 3 4 5 6 7 Nombre de sommets 33 44 58 28 41 28 40 modularité = 0,395 17 / 27 Nathalie Villa-Vialaneix
  • 34. Analyse du graphe d’interactions des gènes régulés par un eQTL Méthodologie et résultats q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q 1 2 3 4 5 6 7 17 / 27 Nathalie Villa-Vialaneix
  • 35. Analyse du graphe d’interactions des gènes régulés par un eQTL Méthodologie et résultats q q q qq q qq q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q 17 / 27 Nathalie Villa-Vialaneix
  • 36. Analyse du graphe d’interactions des gènes régulés par un eQTL Méthodologie et résultats q q q qq q q q q q q q q q q q q q q q q q q q q q q q CCDC56 RPL7L1 AGPS BF442271FBXL3 MYH2 N4BP2 BX674324 X91724 CCAR1 SLA−1 TPM3 SSR4 BX672573 AW359912 BX674550 BX915888 BMPR2 UTP23 FTH1 STC1 MGP BX671472 DGKI RPL27A ATP2A1 BX670979 BX674399 28 nodes 294 edges Density: 77.8% Transitivity: 85.6% 17 / 27 Nathalie Villa-Vialaneix
  • 37. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Sommaire 1 Les données 2 Principe général de construction d’un graphe d’interactions 3 Analyse du graphe d’interactions des gènes régulés par un eQTL Analyse descriptive Classification des sommets 4 Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale 18 / 27 Nathalie Villa-Vialaneix
  • 38. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Données, but But : Comprendre si et comment un phénotype d’intérêt (le PH de la viande) influence la manière dont des gènes, sélectionnés sur des caractéristiques génétiques, sont organisés entre eux. 19 / 27 Nathalie Villa-Vialaneix
  • 39. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Données, but But : Comprendre si et comment un phénotype d’intérêt (le PH de la viande) influence la manière dont des gènes, sélectionnés sur des caractéristiques génétiques, sont organisés entre eux. Données : Le réseau de co-expression de gènes étudié précédemment et, pour chacun des 272 sommets, sa corrélation (partielle) avec le PH. q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q 19 / 27 Nathalie Villa-Vialaneix
  • 40. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Relation entre PH et classification qq q q q q q q q qq q q q q q q 1 2 3 4 5 6 7 −0.02−0.010.000.010.020.03 Cluster PartialcorrelationwithPH 20 / 27 Nathalie Villa-Vialaneix
  • 41. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Relation entre PH et classification qq q q q q q q q qq q q q q q q 1 2 3 4 5 6 7 −0.02−0.010.000.010.020.03 Cluster PartialcorrelationwithPH ANOVA non significative mais test de Student pour le modèle linéaire donne un niveau de signification élevé pour le coefficient correspondant à la classe 4. 20 / 27 Nathalie Villa-Vialaneix
  • 42. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Relation entre PH et classes Deux exemples : q q q qq q qq q q q q q q q q q q q q q q q q q q q q q q q q q BX925971 RRAS BX922566 SEC24ABX671434 PATL1 BX671687BX672338 ACOX1 APITD1 BX923543 XRCC6 NUDT21 Neb CLTA BX667801 BX671017 BX674989 BX675907 BX665214 BX675319 CSDE1 BX671545 TACC1 BX915330 ALDH2 HIAT1 scaj0012.o.01 PPIA BX923052 SLA−1 FADD TMEM201 q q q q q q q q q q q q q q q q q q q q q q q q q q q q BX919092 PSMC3IP THRB XIAP ARHGAP8 X91721 BX917912 EAPP LSM2 BX922053 BX922491 H2AFY ENH_RAT LMF1 FTCD BX925690 B2M GPI BX667979 BX920538 BX671131 RNF2 BX673501 KPNA1 BX674063 BX918923 RPS11 UBE2H Classe 1 Classe 4 Remarque : Beaucoup des gènes avec une forte corrélation positive avec le PH se trouvent dans la classe 4. 21 / 27 Nathalie Villa-Vialaneix
  • 43. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Auto-corrélation spatiale dans le réseau pour la relation avec le PH : I de Moran [Moran, 1950] a introduit une mesure de corrélation spatiale nommée le I (de Moran): I = 1 2m i j wij¯ci¯cj 1 n i ¯c2 i où m = 1 2 i j wij (total des poids dans le réseau), ci est la corrélation partielle du gène i avec le PH et ¯ci = ci − ¯c avec ¯c = 1 n i ci. 22 / 27 Nathalie Villa-Vialaneix
  • 44. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Auto-corrélation spatiale dans le réseau pour la relation avec le PH : I de Moran [Moran, 1950] a introduit une mesure de corrélation spatiale nommée le I (de Moran): I = 1 2m i j wij¯ci¯cj 1 n i ¯c2 i où m = 1 2 i j wij (total des poids dans le réseau), ci est la corrélation partielle du gène i avec le PH et ¯ci = ci − ¯c avec ¯c = 1 n i ci. Interprétation : Quand I est “grand”, les sommets ont tendance à être reliés à des sommets dont la valeur de ci est similaire; quand I est “petit”, les sommets ont tendance à être reliés à des sommets dont la valeur de ci est très différente. Un I “moyen” signifie qu’il n’y a pas de relation entre les valeurs (ci)i et la structure du réseau. 22 / 27 Nathalie Villa-Vialaneix
  • 45. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Auto-corrélation spatiale dans le réseau pour la relation avec le PH : I de Moran [Moran, 1950] a introduit une mesure de corrélation spatiale nommée le I (de Moran): I = 1 2m i j wij¯ci¯cj 1 n i ¯c2 i où m = 1 2 i j wij (total des poids dans le réseau), ci est la corrélation partielle du gène i avec le PH et ¯ci = ci − ¯c avec ¯c = 1 n i ci. Interprétation : Quand I est “grand”, les sommets ont tendance à être reliés à des sommets dont la valeur de ci est similaire; quand I est “petit”, les sommets ont tendance à être reliés à des sommets dont la valeur de ci est très différente. Un I “moyen” signifie qu’il n’y a pas de relation entre les valeurs (ci)i et la structure du réseau. 22 / 27 Nathalie Villa-Vialaneix
  • 46. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Significativité de I Il existe un résultat de normalité asymptotique pour I (mais sous des conditions particulières et pour des réseaux assez grands). On utilise une simulation de Monte Carlo pour estimer la p-value de I. 23 / 27 Nathalie Villa-Vialaneix
  • 47. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Significativité de I Il existe un résultat de normalité asymptotique pour I (mais sous des conditions particulières et pour des réseaux assez grands). On utilise une simulation de Monte Carlo pour estimer la p-value de I. Méthode : permutation aléatoire des valeurs de ci entre les sommets du graphe, P fois (P grand) ; ⇒ calcul de P valeurs du I de Moran et détermination de la distribution empirique ; comparaison avec la valeur observée. 23 / 27 Nathalie Villa-Vialaneix
  • 48. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Résultat sur les données étudiées Moran's I Frequency −0.05 0.00 0.05 0.10 0.15 0.20 050100150 Le I de Moran est significativement élevé : les gènes ont tendance à être liés à des gènes pour lesquels la corrélation avec le PH est très similaire. 24 / 27 Nathalie Villa-Vialaneix
  • 49. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Résultat sur les données étudiées Moran's I Frequency −0.05 0.00 0.05 0.10 0.15 0.20 050100150 Interprétation possible : Les quelques gènes fortement corrélés positivement avec le PH sont tous dans la même classe (i.e., ils sont fortement liés). 24 / 27 Nathalie Villa-Vialaneix
  • 50. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Résultat sur les données étudiées Moran's I Frequency −0.05 0.00 0.05 0.10 0.15 0.20 050100150 Remarque, question : Peut-être qu’il serait plus pertinent de faire ce test avec (|ci|)i plutôt qu’avec (ci)i ??? 24 / 27 Nathalie Villa-Vialaneix
  • 51. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Avec la valeur absolue... Moran's I Frequency −0.05 0.00 0.05 0.10 0.15 050100150 Le I de Moran est également significativement élevé : les gènes ont tendance à être liés à des gènes pour lesquels la corrélation (en valeur absolue) avec le PH est très similaire (les gènes très corrélés sont liés à des gènes très corrélés et inversement). 25 / 27 Nathalie Villa-Vialaneix
  • 52. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Diagramme de Moran pour mettre en valeur les gènes influents pour la cor- rélation avec le PH q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q qqq q q q q q q q q q q q q q q q q q q q q q q qq q q q qq q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q −0.02 −0.01 0.00 0.01 0.02 0.03 −0.0050.0000.0050.010 CorPH AxCorPH H−H H−L L−L L−H Graphique des moyennes de la corrélation avec le PH dans le voisinage en fonction de la corrélation avec le PH. 26 / 27 Nathalie Villa-Vialaneix
  • 53. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Diagramme de Moran pour mettre en valeur les gènes influents pour la cor- rélation avec le PH q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q qqq q q q q q q q q q q q q q q q q q q q q q q qq q q q qq q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q −0.02 −0.01 0.00 0.01 0.02 0.03 −0.0050.0000.0050.010 CorPH AxCorPH H−H H−L L−L L−H Graphique des moyennes de la corrélation avec le PH dans le voisinage en fonction de la corrélation avec le PH. Tests de significativité pour déterminer les gènes “influents”. 26 / 27 Nathalie Villa-Vialaneix
  • 54. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Où sont les gènes influents ? q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q H−H H−L L−L L−H Réseau entier 27 / 27 Nathalie Villa-Vialaneix
  • 55. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Où sont les gènes influents ? q q q qq q qq q q q q q q q q q q q q q q q q q q q q q q q q q BX925971 RRAS BX922566 SEC24ABX671434 PATL1 BX671687BX672338 ACOX1 APITD1 BX923543 XRCC6 NUDT21 Neb CLTA BX667801 BX671017 BX674989 BX675907 BX665214 BX675319 CSDE1 BX671545 TACC1 BX915330 ALDH2 HIAT1 scaj0012.o.01 PPIA BX923052 SLA−1 FADD TMEM201 Cluster 1 27 / 27 Nathalie Villa-Vialaneix
  • 56. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Où sont les gènes influents ? q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q qq q q q q q q PLOD1 SEP15 CCDC47 C5H22orf32 LOC511599 BX921227 PDLIM7 SPARCL1 LDHA PRKG2 BX667797 B2M CR939574 BE033242 BX673681 OCLN BX915984 BX670104 ZYX BX922075 UBE2M TRIAP1 BX674839 BX926631 CCT2 BX668837 BX669337 BEX1 RPS15BX920987 IL8 BX671117BX665361 BX665356 C2 BI359863 BX665098SUZ12 ZRANB1 KIAA0152 BX920480 NFU1 TNNI1 KCTD1 Cluster 2 27 / 27 Nathalie Villa-Vialaneix
  • 57. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Où sont les gènes influents ? q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q EIF3C COMMD1 IK BX917871 CR940191 BX676386 C11orf59 BX671424 BX673689 SMARCC2 BX924343 CLPTM1L TRIM33 BX927037 BX917034 SEPW1 BX676495 CDKN2D BX924633 GLRX3 BX920718 PRPF40A SLC16A3 PARD3IL13RA2 SLN BX918744 BX671723 BX669206 ILKAP TREX1 ACTN2 BX668043 BX921641 BSG MTIF2 EMG1 CALM1 CENPE UBAP1 GNAI2 SLA−1 LOC777786 BX668068 SON LOC780405 X91330 PRDX4 BX924187 THYN1 HNRPA1 LOC733592 BX921514 PABPN1 MRPL41 GTF2E1 HSP90B1 BX924180 Cluster 3 27 / 27 Nathalie Villa-Vialaneix
  • 58. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Où sont les gènes influents ? q q q q q q q q q q q q q q q q q q q q q q q q q q q q BX919092 PSMC3IP THRB XIAP ARHGAP8 X91721 BX917912 EAPP LSM2 BX922053 BX922491 H2AFY ENH_RAT LMF1 FTCD BX925690 B2M GPI BX667979 BX920538 BX671131 RNF2 BX673501 KPNA1 BX674063 BX918923 RPS11 UBE2H Cluster 4 27 / 27 Nathalie Villa-Vialaneix
  • 59. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Où sont les gènes influents ? q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q APIP PRPF3 CREB3L3 SLC35B2 BX669670 CXCL12 scai0001.d.08 TMEM14C SELH_HUMAN ANXA7 FAM151B BX669689 BX923207 QIL1 BX922608 BX917123 C7H19orf62 TEC DDX3X ANKRD40 XBP1 BX672614 BX922943 CSNK1A1 BX668060 ODC1 PDE4DIP BX665674 LOC616632 BX914936 ARFIP1 DAPK1 CFL2 LPL BX669627 RNASEK SLC25A22 EEF1A1 MGST1_PIG COMT RPS5 Cluster 5 27 / 27 Nathalie Villa-Vialaneix
  • 60. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Où sont les gènes influents ? q q q qq q q q q q q q q q q q q q q q q q q q q q q q CCDC56 RPL7L1 AGPS BF442271FBXL3 MYH2 N4BP2 BX674324 X91724 CCAR1 SLA−1 TPM3 SSR4 BX672573 AW359912 BX674550 BX915888 BMPR2 UTP23 FTH1 STC1 MGP BX671472 DGKI RPL27A ATP2A1 BX670979 BX674399 Cluster 6 27 / 27 Nathalie Villa-Vialaneix
  • 61. Analyse de la corrélation avec le PH à l’aide d’outils de statistique spatiale Où sont les gènes influents ? q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q BX918989 BX916347 SNW1 PCBP2_MOUSE MTCH1 BG834885 PABPC1 CD81 BX918478 BX924513 BX926921 BX667806 RBM9 EEF1A1 BX926575 BX672767 EEF1A−2 KIAA494 SLA−1 SLC39A14 CCDC56 BX915803 CR939198 B2M FIT1 BX922995 AARS TMEM126B H3F3B SEPP1 GNG10 TJP3 BX915764 IMMT BX918369 ROCK2 BX919942 TYR BX676048 BX920880 Cluster 7 27 / 27 Nathalie Villa-Vialaneix
  • 62. Moran, P. (1950). Notes on continuous stochastic phenomena. Biometrika, 37:17–23. Schäfer, J. and Strimmer, K. (2005). An empirical bayes approach to inferring large-scale gene association networks. Bioinformatics, 21(6):754–764. Villa, N., Dkaki, T., Gadat, S., Inglebert, J., and Truong, Q. (2009). Recherche et représentation de communautés dans des grands graphes. In Actes du colloque Veille Stratégique, Scientifique et Technologique (VSST 2009), Nancy, France. 27 / 27 Nathalie Villa-Vialaneix