SlideShare una empresa de Scribd logo
1 de 8
Descargar para leer sin conexión
Régression Linéaire Multiple
Massih-Réza Amini
Techniques d’Analyse de Données et Théorie de l’Information
Master M2 IAD – Parcours Recherche
amini@poleia.lip6.fr
http://www-connex.lip6.fr/~amini Laboratoire d’Informatique de Paris 6 2Massih-Reza.Amini@lip6.fr
Plan
Définition,
Historique,
Interprétation géométrique de la solution,
Lien avec l’analyse de Corrélation Canonique,
Récapitulatif – solutions de VPG
Laboratoire d’Informatique de Paris 6 3Massih-Reza.Amini@lip6.fr
Régression Linéaire Multiple
Les modèles de régression tentent de trouver une
relation entre deux variables aléatoires x∈ℜp et y∈ℜ
On cherche à trouver une dépendance fonctionnelle entre les
sorties réelles comme fonction des entrées
De prévoir la valeur de y connaissant celle de x
En régression linéaire la forme de la dépendance
fonctionnelle est une droite: y=xtw+w0
Il s’agit ici d’estimer une variable réelle par une combinaison
linéaire des caractéristiques d’entrée
Cas particulier de la corrélation canonique avec q =1.
( )pw,...,w1
Laboratoire d’Informatique de Paris 6 4Massih-Reza.Amini@lip6.fr
Historique
Le premier travail sur la régression linéaire à été publié par Legendre en
1805.
La méthode des moindres carrés.
Gauss prétendait la connaissance de cette méthode depuis 1795.
Legendre et Gauss ont appliqué cette méthode pour prédire l’orbites des
planètes à partir des observations astronomiques
Gauss a publié en 1821 une théorie sur la méthode des moindres carrés
Incluant une version du théorème Gauss-Markov
D’autres études ont été menées tout le 19ème et le début de 20ème siècle
pour décrire des phénomènes biologiques et étendues à un contexte
statistique général par Pearson, Yule (1877,1885) et Fisher (1922).
Laboratoire d’Informatique de Paris 6 5Massih-Reza.Amini@lip6.fr
Régression au sens des moindres carrées
On cherche une fonction f :ℜp →ℜ qui prédit la
valeur de y connaissant x
On suppose qu’il existe une relation entre x et y à
travers une distribution de probabilité jointe p(x,y)
Pour trouver les paramètres de la fonction f on
définit une fonction de risque L(y,f(x)) qui pénalise
les erreurs de prédictions.
Laboratoire d’Informatique de Paris 6 6Massih-Reza.Amini@lip6.fr
Régression au sens des moindres carrées (2)
Au sens des moindres carrées la fonction de risque est
Pour trouver la fonction qui minimise cette expression il
suffit de minimiser ECM pour tout x
La solution est
( ) ( )( )
( )( ) ( )
( )( )[ ][ ]XXfYEE
dxdyy,xpxfy
XfYEfECM
X
X Y
2
2
2
−=
−=
−=
∫∫
( ) ( )[ ]xXcYEminargxf XY
c
=−= 2
( ) ( )XYExf =
Laboratoire d’Informatique de Paris 6 7Massih-Reza.Amini@lip6.fr
Interprétation géométrique
L’espace de toutes les variables aléatoires sur le même
expérimental forme un espace de Hilbert si on le munit du
produit scalaire
Dans ce cas pour des variables centrées
La norme des variables centrées est leur écart-type,
La covariance entre X et Y est le produit scalaire des variables.
Pour des variables centrées, l’espérance de X est la
projection orthogonale de X sur la droite des constantes.
( )XYEY,X =
Laboratoire d’Informatique de Paris 6 8Massih-Reza.Amini@lip6.fr
Interprétation géométrique (2)
Soit LX le sous-espace de Hilbert constitué des variables
aléatoires fonctions seulement de X.
On peut montrer que LX est fermé et contient la droite des
constante DC
L’opérateur qui associe à chaque variable aléatoire son
espérance conditionnelle à X est un opérateur linéaire
idempotent E(Y |X) est donc le projecteur orthogonal de
Y sur LX
Laboratoire d’Informatique de Paris 6 9Massih-Reza.Amini@lip6.fr
Interprétation géométrique (3)
E(Y |X) est une projection orthogonale sur LX, le minimum de
est atteint pour f(X)=E(Y|X).
( )( )[ ] ( ) 22
XfYXfYE −=−
0
Y
DC
LX
f(X)=E(Y|X)
||Y-f(X)||2
Laboratoire d’Informatique de Paris 6 10Massih-Reza.Amini@lip6.fr
Poids de la combinaison linéaire - Résolution analytique
Pour chaque entrée x ∈ℜp on cherche à prédire une sortie réelle
suivant un modèle linéaire.
f(x)=xtw
En supposant qu’on cherche à déterminer les paramètres w sur un
ensemble d’apprentissage (x1, y1) … (xn, yn).
Le critère d’optimisation est l’erreur carrée moyenne (ECM)
( )
( ) ( )XwYXwY
wxy)w(ECM
t
n
i
t
ii
−−=
−= ∑
=1
2
Laboratoire d’Informatique de Paris 6 11Massih-Reza.Amini@lip6.fr
Poids de la combinaison linéaire - Résolution analytique (2)
Les dérivées partielles d’ordre 1 et 2 de ECM en fonction de Β sont :
Si Xt.X est non singulière (i.e. det(Xt.X )≠0), il existe alors une solution
unique qui minimise ECM :
Pour une entrée X le modèle prédit la sortie :
( )
XX
ww
ECM
XwY.X.
w
ECM
t
t
t
2
2
2
=
∂∂
∂
−−=
∂
∂
( ) YXXXwˆ tt 1−
=
( ) YXXXXwˆXYˆ tt 1−
==
Laboratoire d’Informatique de Paris 6 12Massih-Reza.Amini@lip6.fr
Poids de la combinaison linéaire - Résolution analytique (3)
La solution de la régression vérifie
La réponse du modèle, est la projection orthogonale de Y sur
l’espace des données.
( ) ( ) 0=−=− YˆYXwˆXYX tt
wˆ
x1
x2
Y
Yˆ
Yˆ
( ) YXXXXwˆXYˆ tt 1−
==
Matrice de projection
Laboratoire d’Informatique de Paris 6 13Massih-Reza.Amini@lip6.fr
Poids de la combinaison linéaire - Résolution VPG
Pour des variables X et Y centrées la solution de la régression est
D’après la relation de Pythagore
xyxx CCwˆ 1−
=
Y
Yˆ
L
X
Yˆ
||Y||
YˆY −
222
YˆYˆYY +−=
Minimiser ⇔ Maximiser
2
YˆY −
2
Yˆ
⇔ Maximiser ( ) Y
Yˆ
Yˆ,Ycos =
Pour des variables centrées, cos(Y,f(X))=cor(Y,f(X)) ⇒ Lien avec l’ACC
Laboratoire d’Informatique de Paris 6 14Massih-Reza.Amini@lip6.fr
Poids de la combinaison linéaire - Résolution VPG (2)
Le but de la régression est donc de trouver w qui
maximise
La dérivée partielle de c par rapport à w
Et
( )
wCwY
Cw
XwXwY
YXw
Xw,Ycosc
xx
t
xy
t
tt
tt
===
( )wCC
wCwYw
c
xxwxy
xx
t
λ−=
∂
∂ 1
wCw
Cw
xx
t
xy
t
w =λ
xyxx CCwˆ 1−
∝
Laboratoire d’Informatique de Paris 6 15Massih-Reza.Amini@lip6.fr
Le cas où Y réel régression
xi
yi
ii yy −ˆ
iyˆ
Laboratoire d’Informatique de Paris 6 16Massih-Reza.Amini@lip6.fr
Le cas où Y∈{-1,1} classification
x
t.β2
+γO
=
0
x1
x2
y
x1
Laboratoire d’Informatique de Paris 6 17Massih-Reza.Amini@lip6.fr
Récapitulatif
Résolution de B-1Aw=λw
AFD
B = Sw
A = SB
Trouver la direction w
qui discrimine au mieux
les classes en projection
ACP
B = I
A = Cxx
Trouver les directions w qui
déforment le moins possible
les distances en projection
ACC
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
=
0
0
yx
xy
C
C
A
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
=
yy
xx
C
C
B
0
0
Trouver les directions wx et
wy qui maximisent le carré
de corrélation entre X et Y
RLMTrouver la combinaison
linéaire Xw la plus proche de
Y au sens ERM
Laboratoire d’Informatique de Paris 6 18Massih-Reza.Amini@lip6.fr
Clustering contrainte avec des
variétés géométriques
Laboratoire d’Informatique de Paris 6 19Massih-Reza.Amini@lip6.fr
Algorithmes de Clustering
But : Regrouper (ou segmenter) une collection de données en
différents ensembles, tel que les individus d’un groupe donné soient
plus liés les uns des autres (au sens d’une similarité) qu’avec ceux
d’autres groupes.
Un objet peut-être décrit par un ensemble de mesures ou par sa
relation à d’autres objets.
Deux étapes itératives :
Définition de la relation entre individus avec une mesure de similarité
(distance euclidienne, score, …)
Décision pour le partitionnement (entropie, …)
Laboratoire d’Informatique de Paris 6 20Massih-Reza.Amini@lip6.fr
Algorithme de Kmeans
Laboratoire d’Informatique de Paris 6 21Massih-Reza.Amini@lip6.fr
Clustering - Kmeans
20ème itération
-4 -2 0 2 4 6
-20246
Initialisation centroïdes
2ème itération
-4 -2 0 2 4 6
-20246-4 -2 0 2 4 6
-20246
Laboratoire d’Informatique de Paris 6 22Massih-Reza.Amini@lip6.fr
Algorithme CEM
∑ ∑∈
=
ui Xx k
iiki
u
kyxpt
X
),(log
1
Laboratoire d’Informatique de Paris 6 23Massih-Reza.Amini@lip6.fr
Nouveaux types d’algorithmes de clustering
Clustering par contraintes
On utilise l’a priori sur les classes des exemples
Clustering dans l’espace implicite
On utilise l’a priori sur l’espace avec les noyaux
Clustering structuré
On utilise l’a priori sur l’hiérarchie
Laboratoire d’Informatique de Paris 6 24Massih-Reza.Amini@lip6.fr
Clustering utilisant l’a priori de
classes et la structure des données
Idée nouvelle (2004)
On cherche un graphe sans boucle connectant les
exemples,
On fait propager les étiquettes des exemples
étiquetés sur ce graphe jusqu’à convergence.
Solution partielle
Si on a plusieurs classes, il faut appliquer l’algorithme
plusieurs fois à la suite sur chacune des classes.
Laboratoire d’Informatique de Paris 6 25Massih-Reza.Amini@lip6.fr
Problème jouet en 2D: clowns
Laboratoire d’Informatique de Paris 6 26Massih-Reza.Amini@lip6.fr
Méthode de clustering avec les variétés
géométriques (Zhou et al. ICML 2004)
Laboratoire d’Informatique de Paris 6 27Massih-Reza.Amini@lip6.fr
Méthode de clustering avec les variétés
géométriques (Zhou et al. ICML 2004)
Laboratoire d’Informatique de Paris 6 28Massih-Reza.Amini@lip6.fr
α=0.3
Laboratoire d’Informatique de Paris 6 29Massih-Reza.Amini@lip6.fr
α=0.6
Laboratoire d’Informatique de Paris 6 30Massih-Reza.Amini@lip6.fr
α=0.6, classe 2

Más contenido relacionado

La actualidad más candente

Analyse numérique interpolation
Analyse numérique interpolationAnalyse numérique interpolation
Analyse numérique interpolationJaouad Dabounou
 
Cac cong thuc tich phan
Cac cong thuc tich phanCac cong thuc tich phan
Cac cong thuc tich phanheocon19
 
Dérivation et Intégration numériques
Dérivation et Intégration numériquesDérivation et Intégration numériques
Dérivation et Intégration numériquesJaouad Dabounou
 
Projection sur les ensembles convexes fermés
Projection sur les ensembles convexes fermésProjection sur les ensembles convexes fermés
Projection sur les ensembles convexes fermésJaouad Dabounou
 
Analyse Convexe TD – Série 1 avec correction
Analyse Convexe TD – Série 1 avec correctionAnalyse Convexe TD – Série 1 avec correction
Analyse Convexe TD – Série 1 avec correctionJaouad Dabounou
 
Intérieurs relatifs d’ensembles convexes
Intérieurs relatifs d’ensembles convexesIntérieurs relatifs d’ensembles convexes
Intérieurs relatifs d’ensembles convexesJaouad Dabounou
 
Serie+d'exercices+ +math+-+translation+-+2ème+sciences
Serie+d'exercices+ +math+-+translation+-+2ème+sciencesSerie+d'exercices+ +math+-+translation+-+2ème+sciences
Serie+d'exercices+ +math+-+translation+-+2ème+sciencesArbi Grami
 
CAPES maths 2019 composition 2
CAPES maths 2019 composition 2CAPES maths 2019 composition 2
CAPES maths 2019 composition 2Dany-Jack Mercier
 
Topologie des ensembles convexes
Topologie des ensembles convexesTopologie des ensembles convexes
Topologie des ensembles convexesJaouad Dabounou
 
CAPES maths 2019 composition 1 (option informatique)
CAPES maths 2019 composition 1 (option informatique)CAPES maths 2019 composition 1 (option informatique)
CAPES maths 2019 composition 1 (option informatique)Dany-Jack Mercier
 
CAPES maths 2019 composition 1
CAPES maths 2019 composition 1CAPES maths 2019 composition 1
CAPES maths 2019 composition 1Dany-Jack Mercier
 
Math BAC 2010_Correction
Math BAC 2010_CorrectionMath BAC 2010_Correction
Math BAC 2010_CorrectionAchraf Frouja
 
4 sc ds2.1314-slahk-hallouli-alphamaths
4 sc ds2.1314-slahk-hallouli-alphamaths4 sc ds2.1314-slahk-hallouli-alphamaths
4 sc ds2.1314-slahk-hallouli-alphamathsSmaali Mondher
 
Fonction quadratique TS-4
Fonction quadratique TS-4Fonction quadratique TS-4
Fonction quadratique TS-4mathemathieu
 
Math Bac 2009_Correction Session principale
Math Bac 2009_Correction Session principaleMath Bac 2009_Correction Session principale
Math Bac 2009_Correction Session principaleAchraf Frouja
 
Les algorithmes d’approximation
Les algorithmes d’approximationLes algorithmes d’approximation
Les algorithmes d’approximationWael Ismail
 
Théorèmes de Carathéodory
Théorèmes de CarathéodoryThéorèmes de Carathéodory
Théorèmes de CarathéodoryJaouad Dabounou
 

La actualidad más candente (20)

Analyse numérique interpolation
Analyse numérique interpolationAnalyse numérique interpolation
Analyse numérique interpolation
 
Cac cong thuc tich phan
Cac cong thuc tich phanCac cong thuc tich phan
Cac cong thuc tich phan
 
Dérivation et Intégration numériques
Dérivation et Intégration numériquesDérivation et Intégration numériques
Dérivation et Intégration numériques
 
Projection sur les ensembles convexes fermés
Projection sur les ensembles convexes fermésProjection sur les ensembles convexes fermés
Projection sur les ensembles convexes fermés
 
Analyse Convexe TD – Série 1 avec correction
Analyse Convexe TD – Série 1 avec correctionAnalyse Convexe TD – Série 1 avec correction
Analyse Convexe TD – Série 1 avec correction
 
Intérieurs relatifs d’ensembles convexes
Intérieurs relatifs d’ensembles convexesIntérieurs relatifs d’ensembles convexes
Intérieurs relatifs d’ensembles convexes
 
Serie+d'exercices+ +math+-+translation+-+2ème+sciences
Serie+d'exercices+ +math+-+translation+-+2ème+sciencesSerie+d'exercices+ +math+-+translation+-+2ème+sciences
Serie+d'exercices+ +math+-+translation+-+2ème+sciences
 
05 exos fonction_exponentielle
05 exos fonction_exponentielle05 exos fonction_exponentielle
05 exos fonction_exponentielle
 
CAPES maths 2019 composition 2
CAPES maths 2019 composition 2CAPES maths 2019 composition 2
CAPES maths 2019 composition 2
 
Topologie des ensembles convexes
Topologie des ensembles convexesTopologie des ensembles convexes
Topologie des ensembles convexes
 
CAPES maths 2019 composition 1 (option informatique)
CAPES maths 2019 composition 1 (option informatique)CAPES maths 2019 composition 1 (option informatique)
CAPES maths 2019 composition 1 (option informatique)
 
CAPES maths 2019 composition 1
CAPES maths 2019 composition 1CAPES maths 2019 composition 1
CAPES maths 2019 composition 1
 
Math BAC 2010_Correction
Math BAC 2010_CorrectionMath BAC 2010_Correction
Math BAC 2010_Correction
 
4 sc ds2.1314-slahk-hallouli-alphamaths
4 sc ds2.1314-slahk-hallouli-alphamaths4 sc ds2.1314-slahk-hallouli-alphamaths
4 sc ds2.1314-slahk-hallouli-alphamaths
 
Fonction quadratique TS-4
Fonction quadratique TS-4Fonction quadratique TS-4
Fonction quadratique TS-4
 
Math Bac 2009_Correction Session principale
Math Bac 2009_Correction Session principaleMath Bac 2009_Correction Session principale
Math Bac 2009_Correction Session principale
 
Les algorithmes d’approximation
Les algorithmes d’approximationLes algorithmes d’approximation
Les algorithmes d’approximation
 
Slides ensae-2016-5
Slides ensae-2016-5Slides ensae-2016-5
Slides ensae-2016-5
 
Slides 2040-6
Slides 2040-6Slides 2040-6
Slides 2040-6
 
Théorèmes de Carathéodory
Théorèmes de CarathéodoryThéorèmes de Carathéodory
Théorèmes de Carathéodory
 

Destacado

Les personnages du Pays de Fouesnant - phpsfk won
Les personnages du Pays de Fouesnant - phpsfk wonLes personnages du Pays de Fouesnant - phpsfk won
Les personnages du Pays de Fouesnant - phpsfk wonFoenizella.com
 
Defensa 16 diciembre
Defensa 16 diciembreDefensa 16 diciembre
Defensa 16 diciembreAdalberto
 
Digitalisation d’un processus administratif
Digitalisation d’un processus administratifDigitalisation d’un processus administratif
Digitalisation d’un processus administratifeGov Innovation Center
 
Toponymie du Pays de Fouesnant - php s8oo7w
Toponymie du Pays de Fouesnant -  php s8oo7wToponymie du Pays de Fouesnant -  php s8oo7w
Toponymie du Pays de Fouesnant - php s8oo7wFoenizella.com
 
Chateau & seignerie de Fouesnant i3jf0j
Chateau &  seignerie de Fouesnant i3jf0jChateau &  seignerie de Fouesnant i3jf0j
Chateau & seignerie de Fouesnant i3jf0jFoenizella.com
 
Programme un printemps à béziers !
Programme un printemps à béziers !Programme un printemps à béziers !
Programme un printemps à béziers !Alice Doe
 
LES GRANDS AMOUREUX DE L'HISTOIRE: CLAUDEL et RODIN
LES GRANDS AMOUREUX DE L'HISTOIRE: CLAUDEL et RODINLES GRANDS AMOUREUX DE L'HISTOIRE: CLAUDEL et RODIN
LES GRANDS AMOUREUX DE L'HISTOIRE: CLAUDEL et RODINAna Bailo
 
Sommaire maroc-fhd-16juillet2014-4
Sommaire maroc-fhd-16juillet2014-4Sommaire maroc-fhd-16juillet2014-4
Sommaire maroc-fhd-16juillet2014-4Eldoux
 
Sommaire atlas-fhd-16juillet2014-2
Sommaire atlas-fhd-16juillet2014-2Sommaire atlas-fhd-16juillet2014-2
Sommaire atlas-fhd-16juillet2014-2Eldoux
 
Chroniques de Fouesnant - u-ej
Chroniques de Fouesnant -  u-ejChroniques de Fouesnant -  u-ej
Chroniques de Fouesnant - u-ejFoenizella.com
 
Débuter sur Abonnesciences
Débuter sur AbonnesciencesDébuter sur Abonnesciences
Débuter sur AbonnesciencesClaire Rafin
 
Chateau & seignerie de Fouesnant b8id-iu
Chateau &  seignerie de Fouesnant b8id-iuChateau &  seignerie de Fouesnant b8id-iu
Chateau & seignerie de Fouesnant b8id-iuFoenizella.com
 
Buscar socios a través de la red enterprise europe network (een)
Buscar socios a través de la red enterprise europe network (een)Buscar socios a través de la red enterprise europe network (een)
Buscar socios a través de la red enterprise europe network (een)Enrique Farez
 
Aprendizaje enseanza y propuesta pedaggica
Aprendizaje enseanza y propuesta pedaggicaAprendizaje enseanza y propuesta pedaggica
Aprendizaje enseanza y propuesta pedaggicaAdalberto
 
Curriculum creatif
Curriculum creatifCurriculum creatif
Curriculum creatifgabreauc
 

Destacado (20)

Les enfants de la mine
Les enfants de la mineLes enfants de la mine
Les enfants de la mine
 
Les personnages du Pays de Fouesnant - phpsfk won
Les personnages du Pays de Fouesnant - phpsfk wonLes personnages du Pays de Fouesnant - phpsfk won
Les personnages du Pays de Fouesnant - phpsfk won
 
Defensa 16 diciembre
Defensa 16 diciembreDefensa 16 diciembre
Defensa 16 diciembre
 
Digitalisation d’un processus administratif
Digitalisation d’un processus administratifDigitalisation d’un processus administratif
Digitalisation d’un processus administratif
 
Vous versez la taxe de 1%
Vous versez la taxe de 1%Vous versez la taxe de 1%
Vous versez la taxe de 1%
 
Postes ouverts 08 ocotobre
Postes ouverts  08 ocotobrePostes ouverts  08 ocotobre
Postes ouverts 08 ocotobre
 
Toponymie du Pays de Fouesnant - php s8oo7w
Toponymie du Pays de Fouesnant -  php s8oo7wToponymie du Pays de Fouesnant -  php s8oo7w
Toponymie du Pays de Fouesnant - php s8oo7w
 
Chateau & seignerie de Fouesnant i3jf0j
Chateau &  seignerie de Fouesnant i3jf0jChateau &  seignerie de Fouesnant i3jf0j
Chateau & seignerie de Fouesnant i3jf0j
 
Programme un printemps à béziers !
Programme un printemps à béziers !Programme un printemps à béziers !
Programme un printemps à béziers !
 
LES GRANDS AMOUREUX DE L'HISTOIRE: CLAUDEL et RODIN
LES GRANDS AMOUREUX DE L'HISTOIRE: CLAUDEL et RODINLES GRANDS AMOUREUX DE L'HISTOIRE: CLAUDEL et RODIN
LES GRANDS AMOUREUX DE L'HISTOIRE: CLAUDEL et RODIN
 
Sommaire maroc-fhd-16juillet2014-4
Sommaire maroc-fhd-16juillet2014-4Sommaire maroc-fhd-16juillet2014-4
Sommaire maroc-fhd-16juillet2014-4
 
Sommaire atlas-fhd-16juillet2014-2
Sommaire atlas-fhd-16juillet2014-2Sommaire atlas-fhd-16juillet2014-2
Sommaire atlas-fhd-16juillet2014-2
 
Chroniques de Fouesnant - u-ej
Chroniques de Fouesnant -  u-ejChroniques de Fouesnant -  u-ej
Chroniques de Fouesnant - u-ej
 
Débuter sur Abonnesciences
Débuter sur AbonnesciencesDébuter sur Abonnesciences
Débuter sur Abonnesciences
 
Chateau & seignerie de Fouesnant b8id-iu
Chateau &  seignerie de Fouesnant b8id-iuChateau &  seignerie de Fouesnant b8id-iu
Chateau & seignerie de Fouesnant b8id-iu
 
Buscar socios a través de la red enterprise europe network (een)
Buscar socios a través de la red enterprise europe network (een)Buscar socios a través de la red enterprise europe network (een)
Buscar socios a través de la red enterprise europe network (een)
 
PDF histoire impression
PDF histoire impressionPDF histoire impression
PDF histoire impression
 
Processus et Open Data
Processus et Open DataProcessus et Open Data
Processus et Open Data
 
Aprendizaje enseanza y propuesta pedaggica
Aprendizaje enseanza y propuesta pedaggicaAprendizaje enseanza y propuesta pedaggica
Aprendizaje enseanza y propuesta pedaggica
 
Curriculum creatif
Curriculum creatifCurriculum creatif
Curriculum creatif
 

Similar a Tadti crs3-n

slides statistique mathématique.pdf
slides statistique mathématique.pdfslides statistique mathématique.pdf
slides statistique mathématique.pdfFadwaZiani
 
Algebre_lineaire_GEOLOGIE-S1.pdf
Algebre_lineaire_GEOLOGIE-S1.pdfAlgebre_lineaire_GEOLOGIE-S1.pdf
Algebre_lineaire_GEOLOGIE-S1.pdfThierrySam1
 
Théorie de l’apprentissage et SVM : présentation rapide et premières idées da...
Théorie de l’apprentissage et SVM : présentation rapide et premières idées da...Théorie de l’apprentissage et SVM : présentation rapide et premières idées da...
Théorie de l’apprentissage et SVM : présentation rapide et premières idées da...tuxette
 
fr_Tanagra_Naive_Bayes_Classifier_Explained.pdf
fr_Tanagra_Naive_Bayes_Classifier_Explained.pdffr_Tanagra_Naive_Bayes_Classifier_Explained.pdf
fr_Tanagra_Naive_Bayes_Classifier_Explained.pdfSidiAbdallah1
 
FINAL.pptx
FINAL.pptxFINAL.pptx
FINAL.pptxsara6496
 
Performances dans la segmentation d’images médicales
Performances dans la segmentation d’images médicalesPerformances dans la segmentation d’images médicales
Performances dans la segmentation d’images médicalesEL-Hachemi Guerrout
 
Exercices corriges application_lineaire_et_determinants
Exercices corriges application_lineaire_et_determinantsExercices corriges application_lineaire_et_determinants
Exercices corriges application_lineaire_et_determinantssarah Benmerzouk
 
Minimal Submanifolds Z.C
Minimal Submanifolds Z.CMinimal Submanifolds Z.C
Minimal Submanifolds Z.CZahraa Cheaitou
 
Laffly regression multiple
Laffly regression multipleLaffly regression multiple
Laffly regression multipleafryma
 
Laffly regression multiple
Laffly regression multipleLaffly regression multiple
Laffly regression multipleafryma
 
(Statdes regression biv_ensta_21oct2010)
(Statdes regression biv_ensta_21oct2010)(Statdes regression biv_ensta_21oct2010)
(Statdes regression biv_ensta_21oct2010)mohamedchaouche
 
Cours rep etat
Cours rep etatCours rep etat
Cours rep etatLin Pepin
 
Aates ch08 lois-a-densite
Aates ch08 lois-a-densiteAates ch08 lois-a-densite
Aates ch08 lois-a-densiteManar Sefiane
 

Similar a Tadti crs3-n (20)

slides statistique mathématique.pdf
slides statistique mathématique.pdfslides statistique mathématique.pdf
slides statistique mathématique.pdf
 
transparents-Algo-correction.pdf
transparents-Algo-correction.pdftransparents-Algo-correction.pdf
transparents-Algo-correction.pdf
 
Algebre_lineaire_GEOLOGIE-S1.pdf
Algebre_lineaire_GEOLOGIE-S1.pdfAlgebre_lineaire_GEOLOGIE-S1.pdf
Algebre_lineaire_GEOLOGIE-S1.pdf
 
Regression logistque
Regression  logistqueRegression  logistque
Regression logistque
 
Théorie de l’apprentissage et SVM : présentation rapide et premières idées da...
Théorie de l’apprentissage et SVM : présentation rapide et premières idées da...Théorie de l’apprentissage et SVM : présentation rapide et premières idées da...
Théorie de l’apprentissage et SVM : présentation rapide et premières idées da...
 
fr_Tanagra_Naive_Bayes_Classifier_Explained.pdf
fr_Tanagra_Naive_Bayes_Classifier_Explained.pdffr_Tanagra_Naive_Bayes_Classifier_Explained.pdf
fr_Tanagra_Naive_Bayes_Classifier_Explained.pdf
 
Comparaison
ComparaisonComparaison
Comparaison
 
02systemediapo.pdf
02systemediapo.pdf02systemediapo.pdf
02systemediapo.pdf
 
FINAL.pptx
FINAL.pptxFINAL.pptx
FINAL.pptx
 
Performances dans la segmentation d’images médicales
Performances dans la segmentation d’images médicalesPerformances dans la segmentation d’images médicales
Performances dans la segmentation d’images médicales
 
Exercices corriges application_lineaire_et_determinants
Exercices corriges application_lineaire_et_determinantsExercices corriges application_lineaire_et_determinants
Exercices corriges application_lineaire_et_determinants
 
seance-07.pdf
seance-07.pdfseance-07.pdf
seance-07.pdf
 
Minimal Submanifolds Z.C
Minimal Submanifolds Z.CMinimal Submanifolds Z.C
Minimal Submanifolds Z.C
 
Quad-expo-stats
Quad-expo-statsQuad-expo-stats
Quad-expo-stats
 
Cours stat2-kharrat
Cours stat2-kharratCours stat2-kharrat
Cours stat2-kharrat
 
Laffly regression multiple
Laffly regression multipleLaffly regression multiple
Laffly regression multiple
 
Laffly regression multiple
Laffly regression multipleLaffly regression multiple
Laffly regression multiple
 
(Statdes regression biv_ensta_21oct2010)
(Statdes regression biv_ensta_21oct2010)(Statdes regression biv_ensta_21oct2010)
(Statdes regression biv_ensta_21oct2010)
 
Cours rep etat
Cours rep etatCours rep etat
Cours rep etat
 
Aates ch08 lois-a-densite
Aates ch08 lois-a-densiteAates ch08 lois-a-densite
Aates ch08 lois-a-densite
 

Más de mohamedchaouche

219146492 algebre-lineaire
219146492 algebre-lineaire219146492 algebre-lineaire
219146492 algebre-lineairemohamedchaouche
 
Bourbonnaiseconomtrie partie1-130207100401-phpapp02
Bourbonnaiseconomtrie partie1-130207100401-phpapp02Bourbonnaiseconomtrie partie1-130207100401-phpapp02
Bourbonnaiseconomtrie partie1-130207100401-phpapp02mohamedchaouche
 
Cours d econometrie_professeur_philippe_deschamps_edition_
Cours d econometrie_professeur_philippe_deschamps_edition_Cours d econometrie_professeur_philippe_deschamps_edition_
Cours d econometrie_professeur_philippe_deschamps_edition_mohamedchaouche
 
Introduction a l'econometrie luxembourg 2008 2009
Introduction a l'econometrie luxembourg 2008 2009Introduction a l'econometrie luxembourg 2008 2009
Introduction a l'econometrie luxembourg 2008 2009mohamedchaouche
 
Laffly regression multiple
Laffly regression multipleLaffly regression multiple
Laffly regression multiplemohamedchaouche
 
M1 l3-econom etrie-serien-2-reg-lin-mult
M1 l3-econom etrie-serien-2-reg-lin-multM1 l3-econom etrie-serien-2-reg-lin-mult
M1 l3-econom etrie-serien-2-reg-lin-multmohamedchaouche
 
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-unM1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-unmohamedchaouche
 
[Xin yan, xiao_gang_su]_linear_regression_analysis(book_fi.org)
[Xin yan, xiao_gang_su]_linear_regression_analysis(book_fi.org)[Xin yan, xiao_gang_su]_linear_regression_analysis(book_fi.org)
[Xin yan, xiao_gang_su]_linear_regression_analysis(book_fi.org)mohamedchaouche
 

Más de mohamedchaouche (17)

219146492 algebre-lineaire
219146492 algebre-lineaire219146492 algebre-lineaire
219146492 algebre-lineaire
 
Un
UnUn
Un
 
Correlation econometrie
Correlation econometrieCorrelation econometrie
Correlation econometrie
 
Bourbonnaiseconomtrie partie1-130207100401-phpapp02
Bourbonnaiseconomtrie partie1-130207100401-phpapp02Bourbonnaiseconomtrie partie1-130207100401-phpapp02
Bourbonnaiseconomtrie partie1-130207100401-phpapp02
 
Econometrie
EconometrieEconometrie
Econometrie
 
Cours d econometrie_professeur_philippe_deschamps_edition_
Cours d econometrie_professeur_philippe_deschamps_edition_Cours d econometrie_professeur_philippe_deschamps_edition_
Cours d econometrie_professeur_philippe_deschamps_edition_
 
Series temporelles
Series temporellesSeries temporelles
Series temporelles
 
Introduction a l'econometrie luxembourg 2008 2009
Introduction a l'econometrie luxembourg 2008 2009Introduction a l'econometrie luxembourg 2008 2009
Introduction a l'econometrie luxembourg 2008 2009
 
Laffly regression multiple
Laffly regression multipleLaffly regression multiple
Laffly regression multiple
 
M1 l3-econom etrie-serien-2-reg-lin-mult
M1 l3-econom etrie-serien-2-reg-lin-multM1 l3-econom etrie-serien-2-reg-lin-mult
M1 l3-econom etrie-serien-2-reg-lin-mult
 
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-unM1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
 
Ch02 seance01-diapos
Ch02 seance01-diaposCh02 seance01-diapos
Ch02 seance01-diapos
 
(Econometrie) done
(Econometrie) done(Econometrie) done
(Econometrie) done
 
Regsimple
RegsimpleRegsimple
Regsimple
 
[Xin yan, xiao_gang_su]_linear_regression_analysis(book_fi.org)
[Xin yan, xiao_gang_su]_linear_regression_analysis(book_fi.org)[Xin yan, xiao_gang_su]_linear_regression_analysis(book_fi.org)
[Xin yan, xiao_gang_su]_linear_regression_analysis(book_fi.org)
 
Cours regression 4
Cours regression 4Cours regression 4
Cours regression 4
 
(Cours régression)
(Cours régression)(Cours régression)
(Cours régression)
 

Último

ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel AttalELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attalcontact Elabe
 
Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023France Travail
 
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...France Travail
 
Bidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from TransformersBidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from Transformersbahija babzine
 
To_understand_transformers_together presentation
To_understand_transformers_together presentationTo_understand_transformers_together presentation
To_understand_transformers_together presentationbahija babzine
 
Recurrent neural network_PresentationRNN.pptx
Recurrent neural network_PresentationRNN.pptxRecurrent neural network_PresentationRNN.pptx
Recurrent neural network_PresentationRNN.pptxbahija babzine
 

Último (6)

ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel AttalELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
 
Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023
 
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
 
Bidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from TransformersBidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from Transformers
 
To_understand_transformers_together presentation
To_understand_transformers_together presentationTo_understand_transformers_together presentation
To_understand_transformers_together presentation
 
Recurrent neural network_PresentationRNN.pptx
Recurrent neural network_PresentationRNN.pptxRecurrent neural network_PresentationRNN.pptx
Recurrent neural network_PresentationRNN.pptx
 

Tadti crs3-n

  • 1. Régression Linéaire Multiple Massih-Réza Amini Techniques d’Analyse de Données et Théorie de l’Information Master M2 IAD – Parcours Recherche amini@poleia.lip6.fr http://www-connex.lip6.fr/~amini Laboratoire d’Informatique de Paris 6 2Massih-Reza.Amini@lip6.fr Plan Définition, Historique, Interprétation géométrique de la solution, Lien avec l’analyse de Corrélation Canonique, Récapitulatif – solutions de VPG Laboratoire d’Informatique de Paris 6 3Massih-Reza.Amini@lip6.fr Régression Linéaire Multiple Les modèles de régression tentent de trouver une relation entre deux variables aléatoires x∈ℜp et y∈ℜ On cherche à trouver une dépendance fonctionnelle entre les sorties réelles comme fonction des entrées De prévoir la valeur de y connaissant celle de x En régression linéaire la forme de la dépendance fonctionnelle est une droite: y=xtw+w0 Il s’agit ici d’estimer une variable réelle par une combinaison linéaire des caractéristiques d’entrée Cas particulier de la corrélation canonique avec q =1. ( )pw,...,w1 Laboratoire d’Informatique de Paris 6 4Massih-Reza.Amini@lip6.fr Historique Le premier travail sur la régression linéaire à été publié par Legendre en 1805. La méthode des moindres carrés. Gauss prétendait la connaissance de cette méthode depuis 1795. Legendre et Gauss ont appliqué cette méthode pour prédire l’orbites des planètes à partir des observations astronomiques Gauss a publié en 1821 une théorie sur la méthode des moindres carrés Incluant une version du théorème Gauss-Markov D’autres études ont été menées tout le 19ème et le début de 20ème siècle pour décrire des phénomènes biologiques et étendues à un contexte statistique général par Pearson, Yule (1877,1885) et Fisher (1922).
  • 2. Laboratoire d’Informatique de Paris 6 5Massih-Reza.Amini@lip6.fr Régression au sens des moindres carrées On cherche une fonction f :ℜp →ℜ qui prédit la valeur de y connaissant x On suppose qu’il existe une relation entre x et y à travers une distribution de probabilité jointe p(x,y) Pour trouver les paramètres de la fonction f on définit une fonction de risque L(y,f(x)) qui pénalise les erreurs de prédictions. Laboratoire d’Informatique de Paris 6 6Massih-Reza.Amini@lip6.fr Régression au sens des moindres carrées (2) Au sens des moindres carrées la fonction de risque est Pour trouver la fonction qui minimise cette expression il suffit de minimiser ECM pour tout x La solution est ( ) ( )( ) ( )( ) ( ) ( )( )[ ][ ]XXfYEE dxdyy,xpxfy XfYEfECM X X Y 2 2 2 −= −= −= ∫∫ ( ) ( )[ ]xXcYEminargxf XY c =−= 2 ( ) ( )XYExf = Laboratoire d’Informatique de Paris 6 7Massih-Reza.Amini@lip6.fr Interprétation géométrique L’espace de toutes les variables aléatoires sur le même expérimental forme un espace de Hilbert si on le munit du produit scalaire Dans ce cas pour des variables centrées La norme des variables centrées est leur écart-type, La covariance entre X et Y est le produit scalaire des variables. Pour des variables centrées, l’espérance de X est la projection orthogonale de X sur la droite des constantes. ( )XYEY,X = Laboratoire d’Informatique de Paris 6 8Massih-Reza.Amini@lip6.fr Interprétation géométrique (2) Soit LX le sous-espace de Hilbert constitué des variables aléatoires fonctions seulement de X. On peut montrer que LX est fermé et contient la droite des constante DC L’opérateur qui associe à chaque variable aléatoire son espérance conditionnelle à X est un opérateur linéaire idempotent E(Y |X) est donc le projecteur orthogonal de Y sur LX
  • 3. Laboratoire d’Informatique de Paris 6 9Massih-Reza.Amini@lip6.fr Interprétation géométrique (3) E(Y |X) est une projection orthogonale sur LX, le minimum de est atteint pour f(X)=E(Y|X). ( )( )[ ] ( ) 22 XfYXfYE −=− 0 Y DC LX f(X)=E(Y|X) ||Y-f(X)||2 Laboratoire d’Informatique de Paris 6 10Massih-Reza.Amini@lip6.fr Poids de la combinaison linéaire - Résolution analytique Pour chaque entrée x ∈ℜp on cherche à prédire une sortie réelle suivant un modèle linéaire. f(x)=xtw En supposant qu’on cherche à déterminer les paramètres w sur un ensemble d’apprentissage (x1, y1) … (xn, yn). Le critère d’optimisation est l’erreur carrée moyenne (ECM) ( ) ( ) ( )XwYXwY wxy)w(ECM t n i t ii −−= −= ∑ =1 2 Laboratoire d’Informatique de Paris 6 11Massih-Reza.Amini@lip6.fr Poids de la combinaison linéaire - Résolution analytique (2) Les dérivées partielles d’ordre 1 et 2 de ECM en fonction de Β sont : Si Xt.X est non singulière (i.e. det(Xt.X )≠0), il existe alors une solution unique qui minimise ECM : Pour une entrée X le modèle prédit la sortie : ( ) XX ww ECM XwY.X. w ECM t t t 2 2 2 = ∂∂ ∂ −−= ∂ ∂ ( ) YXXXwˆ tt 1− = ( ) YXXXXwˆXYˆ tt 1− == Laboratoire d’Informatique de Paris 6 12Massih-Reza.Amini@lip6.fr Poids de la combinaison linéaire - Résolution analytique (3) La solution de la régression vérifie La réponse du modèle, est la projection orthogonale de Y sur l’espace des données. ( ) ( ) 0=−=− YˆYXwˆXYX tt wˆ x1 x2 Y Yˆ Yˆ ( ) YXXXXwˆXYˆ tt 1− == Matrice de projection
  • 4. Laboratoire d’Informatique de Paris 6 13Massih-Reza.Amini@lip6.fr Poids de la combinaison linéaire - Résolution VPG Pour des variables X et Y centrées la solution de la régression est D’après la relation de Pythagore xyxx CCwˆ 1− = Y Yˆ L X Yˆ ||Y|| YˆY − 222 YˆYˆYY +−= Minimiser ⇔ Maximiser 2 YˆY − 2 Yˆ ⇔ Maximiser ( ) Y Yˆ Yˆ,Ycos = Pour des variables centrées, cos(Y,f(X))=cor(Y,f(X)) ⇒ Lien avec l’ACC Laboratoire d’Informatique de Paris 6 14Massih-Reza.Amini@lip6.fr Poids de la combinaison linéaire - Résolution VPG (2) Le but de la régression est donc de trouver w qui maximise La dérivée partielle de c par rapport à w Et ( ) wCwY Cw XwXwY YXw Xw,Ycosc xx t xy t tt tt === ( )wCC wCwYw c xxwxy xx t λ−= ∂ ∂ 1 wCw Cw xx t xy t w =λ xyxx CCwˆ 1− ∝ Laboratoire d’Informatique de Paris 6 15Massih-Reza.Amini@lip6.fr Le cas où Y réel régression xi yi ii yy −ˆ iyˆ Laboratoire d’Informatique de Paris 6 16Massih-Reza.Amini@lip6.fr Le cas où Y∈{-1,1} classification x t.β2 +γO = 0 x1 x2 y x1
  • 5. Laboratoire d’Informatique de Paris 6 17Massih-Reza.Amini@lip6.fr Récapitulatif Résolution de B-1Aw=λw AFD B = Sw A = SB Trouver la direction w qui discrimine au mieux les classes en projection ACP B = I A = Cxx Trouver les directions w qui déforment le moins possible les distances en projection ACC ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ = 0 0 yx xy C C A ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ = yy xx C C B 0 0 Trouver les directions wx et wy qui maximisent le carré de corrélation entre X et Y RLMTrouver la combinaison linéaire Xw la plus proche de Y au sens ERM Laboratoire d’Informatique de Paris 6 18Massih-Reza.Amini@lip6.fr Clustering contrainte avec des variétés géométriques Laboratoire d’Informatique de Paris 6 19Massih-Reza.Amini@lip6.fr Algorithmes de Clustering But : Regrouper (ou segmenter) une collection de données en différents ensembles, tel que les individus d’un groupe donné soient plus liés les uns des autres (au sens d’une similarité) qu’avec ceux d’autres groupes. Un objet peut-être décrit par un ensemble de mesures ou par sa relation à d’autres objets. Deux étapes itératives : Définition de la relation entre individus avec une mesure de similarité (distance euclidienne, score, …) Décision pour le partitionnement (entropie, …) Laboratoire d’Informatique de Paris 6 20Massih-Reza.Amini@lip6.fr Algorithme de Kmeans
  • 6. Laboratoire d’Informatique de Paris 6 21Massih-Reza.Amini@lip6.fr Clustering - Kmeans 20ème itération -4 -2 0 2 4 6 -20246 Initialisation centroïdes 2ème itération -4 -2 0 2 4 6 -20246-4 -2 0 2 4 6 -20246 Laboratoire d’Informatique de Paris 6 22Massih-Reza.Amini@lip6.fr Algorithme CEM ∑ ∑∈ = ui Xx k iiki u kyxpt X ),(log 1 Laboratoire d’Informatique de Paris 6 23Massih-Reza.Amini@lip6.fr Nouveaux types d’algorithmes de clustering Clustering par contraintes On utilise l’a priori sur les classes des exemples Clustering dans l’espace implicite On utilise l’a priori sur l’espace avec les noyaux Clustering structuré On utilise l’a priori sur l’hiérarchie Laboratoire d’Informatique de Paris 6 24Massih-Reza.Amini@lip6.fr Clustering utilisant l’a priori de classes et la structure des données Idée nouvelle (2004) On cherche un graphe sans boucle connectant les exemples, On fait propager les étiquettes des exemples étiquetés sur ce graphe jusqu’à convergence. Solution partielle Si on a plusieurs classes, il faut appliquer l’algorithme plusieurs fois à la suite sur chacune des classes.
  • 7. Laboratoire d’Informatique de Paris 6 25Massih-Reza.Amini@lip6.fr Problème jouet en 2D: clowns Laboratoire d’Informatique de Paris 6 26Massih-Reza.Amini@lip6.fr Méthode de clustering avec les variétés géométriques (Zhou et al. ICML 2004) Laboratoire d’Informatique de Paris 6 27Massih-Reza.Amini@lip6.fr Méthode de clustering avec les variétés géométriques (Zhou et al. ICML 2004) Laboratoire d’Informatique de Paris 6 28Massih-Reza.Amini@lip6.fr α=0.3
  • 8. Laboratoire d’Informatique de Paris 6 29Massih-Reza.Amini@lip6.fr α=0.6 Laboratoire d’Informatique de Paris 6 30Massih-Reza.Amini@lip6.fr α=0.6, classe 2