3. Population statistique :
Une population statistique est l'ensemble sur lequel on effectue des observations.
Individu (ou unités statistiques) :
Les individus sont les éléments de la population statistique étudiée.
Caractère statistique ou variable statistique :
C'est ce qui est observé ou mesuré sur les individus d'une population statistique.
INTRODUCTION L ’opérateur somme
Vocabulaire statistique
Vocabulaire statistique
VOCABULAIRE STATISTIQUE
4. VARIABLES QUANTITATIVES
Variable quantitative :
Une variable statistique est quantitative si ses valeurs sont des nombres exprimant
une quantité, sur lesquels les opérations arithmétiques (somme, etc...) ont un sens.
Variable quantitative discrète:
Une variable quantitative est discrète si elle
ne peut prendre que des valeurs isolées,
généralement entières.
Variable quantitative continue:
Une variable quantitative est continue si ses
valeurs peuvent être n'importe lesquelles
d'un intervalle réel.
INTRODUCTION L ’opérateur somme
Vocabulaire statistique
5. VARIABLES QUALITATIVES
Variable qualitative :
Une variable statistique est qualitative si ses valeurs, ou modalités, s'expriment de
façon littérale ou par un codage sur lequel les opérations arithmétiques telles que
moyenne, somme, ... , n'ont pas de sens.
Variable qualitative nominale :
C'est une variable qualitative dont les
modalités ne sont pas ordonnées.
Variable qualitative ordinale :
C'est une variable qualitative dont les
modalités sont naturellement ordonnées
INTRODUCTION L ’opérateur somme
Vocabulaire statistique
6. DEFINITION:
p et q étant 2 entiers relatifs
q
i
i p
x
p
x 1
p
x ...... q
x
REMARQUE 1: i est une variable muette
q q q
i j h
i p j p h p
x x x
1
n
i i i
i i
x x x
REMARQUE 2:
Quand il n’y a pas d’ambiguïté sur le domaine
de variation de i, celui-ci peut être omis
INTRODUCTION L ’opérateur somme
Vocabulaire statistique L ’opérateur somme
(1) UN OUTIL : L ’OPERATEUR SOMME S
7. (2) UN OUTIL : L ’OPERATEUR SOMME S
PROPRIETE 1: i i
i i
ka k a
1 1
...... ......
q q
i p p q p p q i
i p i p
ka ka ka ka k a a a k a
PROPRIETE2: i i i i
i i i
a b a b
1 1
1 1
.....
..... .....
q
i i p p p p q q
i p
q q
p p q p p q i i
i p i p
a b a b a b a b
a a a b b b a b
PROPRIETE3: i i i i
i i i
k a b k a k b
1
PROPRIETE4:
n
i
k nk
1
.....
n
i n
k k k k nk
PROPRIETE5: 1
q
i p
k q p k
INTRODUCTION L ’opérateur somme
Vocabulaire statistique
9. Modalités Effectifs Fréquences %
Bleu 60 0,200 20,0
Noir 160 0,533 53,3
Noisette 40 0,133 13,3
Vert 40 0,133 13,3
Total : 300 1 100
Noms Couleur des yeux
M. Alberro Vert
M. Hondarrague Noir
Mme Claverotte Noir
Melle Lopez Noisette
M. Paulien Bleu
M. Guillou Noir
M. Lahitette Noisette
Mme Vigouroux Noir
Melle Maleig Bleu
M. Duclos Vert
M. Carricaburu Bleu
Mme Vidal Noir
…. ….
Modalités Effectifs Fréquences %
modalité 1 n1 f1= n1/n 1
f ×100
… … …
modalité i ni fi= ni/n i
f ×100
… … …
modalité k nk fk= nk/n k
f ×100
Total : i
n =n
i
f =1
100
TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue
Qualitative nominale
(1) VARIABLES QUALITATIVES NOMINALES
Qualitative nominale
11. 10
25
40
32
23
0
5
10
15
20
25
30
35
40
45
A B C D E
Les
modalités
sont
présentées
dans l’ordre
TABLEAUX ET GRAPHIQUES
Modalités Effectifs = Nombre de personnes
Pas du tout (A) 10
Un peu (B) 25
Beaucoup (C) 40
Passionnément (D) 32
A la folie (E) 23
130 personnes ont été interrogées sur leur addiction au chocolat
Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue
Qualitative ordinale
VARIABLES QUALITATIVES ORDINALES
12. Nombre de
produits financiers
Nombre de clients
0 103
1 115
2 95
3 35
4 10
5 2
Clients Nombre de produits
financiers
Bredat 2
Gauguet 3
Leremboure 0
Coustere 0
Lalisou 1
Aussagne 0
Vittorello 1
Diaz 0
Etcheverry 2
Bernadet 4
Miramon 1
Jaime 3
Dartus 2
Domege 0
Train 0
Piquemal 1
Laffargue 2
…… …….
Valeurs de
la variable
Effectifs Fréquences %
x1 n1 f1= n1/n 1
f ×100
… … …
xi ni fi= ni/n i
f ×100
… … …
xk nk fk= nk/n k
f ×100
Total : i
n =n
i
f =1
100
TABLEAUX ET GRAPHIQUES Qualitative ordinale
Qualitative nominale Quantitative discrète Quantitative continue
Quantitative discrète
(1) VARIABLES QUANTITATIVES DISCRETES
EFFECTIFS ET FREQUENCES
13. (2) VARIABLES QUANTITATIVES DISCRETES
REPRESENTATION GRAPHIQUE DES EFFECTIFS ET FREQUENCES
Nbre de produits financiers
xi
Effectif
ni
Fréquence
fi
0 103 0,286
1 115 0,319
2 95 0,264
3 35 0,097
4 10 0,028
5 2 0,006
Diagramme en bâtons
0
20
40
60
80
100
120
140
0 1 2 3 4 5 6
TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue
14. (3) VARIABLES QUANTITATIVES DISCRETES
EFFECTIFS ET FREQUENCES CUMULES
Valeurs de la
variable
xi
Effectif
ni
Effectifs cumulés
croissants
Ni
Effectifs cumulés
décroissants
N’i
x1 n1 N1= n1 N’1= nk+ ….+ n1= n
x2 n2 N2= n1+ n2 N’2= nk+ ….+ n2
x3 n3 N3= n1+ n2+ n3 N’3= nk+ ….+ n3
… … …. ….
xk-1 nk-1 Nk-1= n1+ ….+ nk-1 N’k-1= nk+ nk-1
xk nk Nk= n1+ ….+ nk= n N’k= nk
Total : n
Effectifs cumulés croissants:
Nombre d'individus pour lesquels la
variable est inférieure ou égale à xi.
Résultat de l'addition, de proche en
proche, des effectifs d'une distribution
observée en commençant par le 1er.
Effectifs cumulés décroissants:
Nombre d'individus pour lesquels la
variable est supérieure ou égale à xi.
Résultat de l'addition, de proche en
proche, des effectifs d'une distribution
observée en commençant par le dernier.
TABLEAUX ET GRAPHIQUES
Nbre
produits
financiers
Nombre de
Clients
Effectifs cumulés
croissants
Effectifs cumulés
décroissants
0 103
1 115
2 95
3 35
4 10
5 2
Total : 360
360
142
257
47
103
218
313
348
358
360 2
12
Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue
15. (4) VARIABLES QUANTITATIVES DISCRETES
EFFECTIFS ET FREQUENCES CUMULES
Nombre de
produits
financiers
xi
Nombre de
clients
ni
Effectifs
cumulés
croissants
Ni
Effectifs
cumulés
décroissants
N’i
Fréquences
fi
Fréquences
cumulées
croissantes
Fi
Fréquences
cumulées
décroissantes
F’i
0 103 103 360 0,2861 0,2861 1
1 115 218 257 0,3194 0,6055 0,7139
2 95 313 142 0,2639 0,8694 0,3945
3 35 348 47 0,0972 0,9666 0,1306
4 10 358 12 0,0278 0,9944 0,0334
5 2 360 2 0,0056 1 0,0056
Total : 360 1
Il y a 313 clients possédant un nombre de produits financiers inférieur ou égal à 2
Il y a 47 clients possédant un nombre de pro. fin. supérieur ou égal à 3
La proportion de clients possédant un nombre de pro. fin. supérieur ou égal à 1 est de 71,39%
La proportion de clients possédant un nombre de pro. fin. inférieur ou égal à 4 est de 99,44%
TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue
16. (5) VARIABLES QUANTITATIVES DISCRETES
COURBES CUMULATIVES
On appelle courbe cumulative croissante le tracé de la fonction N (ou F pour les fréquences)
qui à tout réel x associe N( x ) = nombre d'observations inférieur ou égal à x.
TABLEAUX ET GRAPHIQUES
On appelle courbe cumulative décroissante le tracé de la fonction N' (ou F’ pour les fréquences)
qui a tout réel x associe N'( x ) = nombre d'observations supérieur strictement à x.
Les courbes cumulatives N(x) et N’(x) sont symétriques par rapport à n/2 : N(x) + N’(x) = n
Les courbes cumulatives F(x) et F’(x) sont symétriques par rapport à 0,5 : F(x) + F’(x) = 1
0
50
100
150
200
250
300
350
400
-2 -1 0 1 2 3 4 5 6
xi ni Ni
103 103
115 218
95 313
35 348
10 358
2 360
0
1
2
3
4
5
x
0
1
2
3
4
5
0
103
218
313
348
358
N(x)
360
N’i
360
257
142
47
12
2
N ’(x)
257
360
47
142
12
2
0
Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue
17. Remarque1 : la variable augmentation moyenne mensuelle peut
être considérée comme continue. En arrondissant à l’euro, on l’a
discrétisée.
Une augmentation de 10 € est en fait une augmentation comprise
entre 9,5 € et 10,5 €.
Remarque2 : Une variable continue ne prend pas des valeurs
isolées, mais des valeurs appartenant à des intervalles. C'est
pourquoi, au lieu de définir des effectifs par valeurs, on définira des
effectifs par intervalles, appelés classes.
Augmentation
(€)
Effectif
0 257
1 318
2 255
3 307
4 308
5 159
6 140
7 84
8 72
9 55
10 22
11 13
12 9
13 7
14 8
15 21
16 6
17 2
….. ….
Total 2125
Remarque3 : Une variable discrète comportant trop de valeurs est
aussi traitée comme une variable continue.
TABLEAUX ET GRAPHIQUES
18 38 10 35 0 4
4 11 27 2 41 16
2 25 43 22 26 11
34 34 1 28 5 5
21 0 2 30 1 8
9 37 22 39 11 0
36 16 6 42 42 1
8 33 31 33 4 4
9 19 15 2 21 0
12 18 …. …. …. ….
Variable observée: augmentation moyenne mensuelle du salaire, en €, des employés
d’une multinationale au cours de l’année 2005.
Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue
Quantitative continue
(1) VARIABLES QUANTITATIVES CONTINUES
18. (2) VARIABLES QUANTITATIVES CONTINUES
Augmentation (€) Effectifs
[0 – 3[ 830
[3 – 5[ 615
[5 – 10[ 510
[10 – 20[ 92
[20 – 30[ 63
[30 – 50[ 15
Classes Effectifs
[e1 – e2[ n1
[e2 – e3[ n2
…. ….
[ek – ek+1[ nk
Remarque 1: Le choix des classes et arbitraire, mais elles doivent être contigües
et recouvrir l’ensemble des valeurs.
Remarque 2: Il est préférable de prendre des classes d’amplitudes égales.
Remarque 3: Il ne faut prendre ni trop ni trop peu de classes.
Remarque 4: Le choix et le nombre de classes influent sur les représentations
graphiques.
TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue
20. Effectif rectifié
HISTOGRAMME
0
50
100
150
200
250
300
350
0
3
30
50
(4) VARIABLES QUANTITATIVES CONTINUES
REPRESENTATION GRAPHIQUE DES EFFECTIFS ET FREQUENCES
Dans un histogramme, ce sont les surfaces des rectangles (ce que l’œil voit), qui sont
proportionnelles aux effectifs, et non les hauteurs de ces rectangles
Classes Effectifs
ni
Amplitude
ai
Effectifs
rectifiés
ni /ai
[0 – 3[ 830 3 276,7
[3 – 5[ 615 2 307,5
[5 – 10[ 510 5 102,0
[10 – 20[ 92 10 9,2
[20 – 30[ 63 10 6,3
[30 – 50[ 15 20 0,75
Remarque: Le tracé de l’histogramme des fréquences est identique. Il suffit de porter
en ordonnées la fréquence rectifiée di = fi/ai, appelée densité.
TABLEAUX ET GRAPHIQUES
La surface = ai (ni/ai) est de 830 unités
×
La surface = ai (ni/ai) est de 615 unités
×
Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue
21. (5) VARIABLES QUANTITATIVES CONTINUES
EFFECTIFS ET FREQUENCES CUMULES
Variable observée:
augmentation moyenne
mensuelle du salaire, en
€, des employés d’une
multinationale au cours
de l’année 2005.
Classes
[ei – ei+1[
Effectifs
ni
Effectifs
cumulés
croissants
Ni
Effectifs
cumulés
décroissants
N’i
Fréquences
cumulées
croissantes
Fi
Fréquences
cumulées
décroissantes
F’i
[0 – 3[ 830 830 2125 0,391 1,000
[ 3 - 5 [ 615 1445 1295 0,680 0,609
[ 5 - 10 [ 510 1955 680 0,920 0,320
[10 - 20 [ 92 2047 170 0,963 0,080
[20 - 30 [ 63 2110 78 0,993 0,037
[30 – 50[ 15 2125 15 1,000 0,007
Total : 2125
Il y a 1445 employés dont l’augmentation est strictement inférieure à 5
Il y a 170 employés dont l’augmentation est supérieure ou égale à 10
Combien y-a-t-il d’employés dont l’augmentation est inférieure à 17 ?
TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue
22. (6) VARIABLES QUANTITATIVES CONTINUES
COURBES CUMULATIVES
TABLEAUX ET GRAPHIQUES
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
-10 0 10 20 30 40 50 60
Fi
F’i
[ei – ei+1[ Fi F’i
[ 0 - 3 [ 0,391 1,000
[ 3 - 5 [ 0,680 0,609
[ 5 - 10 [ 0,920 0,320
[10 - 20 [ 0,963 0,080
[20 - 30 [ 0,993 0,037
[30 - 50 [ 1,000 0,007
x
0
3
5
10
20
30
50
On appelle courbe cumulative croissante le tracé de la fonction F (N pour les effectifs) qui à tout réel x
associe F( x ) = nombre d'observations inférieur ou égal à x.
Remarque: Pour une variable continue, il est indifférent de dire « inférieur ou égal » ou
« strictement inférieur ». Il en est de même pour « supérieur ou égal » ou « strictement
supérieur ».
Il n’y a aucune chance qu’une observation tombe sur une borne. C’est l’imprécision de
l’instrument de mesure et un mauvais choix des bornes qui pourrait conduire à ce résultat.
F’i
1,000
0,609
0,320
0,080
0,037
0,007
F(x)
0
0,391
0,680
0,920
0,963
0,993
1
?
A l’intérieur
de chaque
classe, on fait
l’hypothèse
que la
répartition est
uniforme
? A l’intérieur
de chaque
classe, on fait
l’hypothèse
que la
répartition est
uniforme
?
On appelle courbe cumulative décroissante le tracé de la fonction F’ (N’ pour les effectifs) qui a tout réel
x associe F’( x ) = nombre d'observations supérieur strictement à x.
F’(x)
1
0,609
0,320
0,080
0,037
0,007
0
?
?
Les courbes cumulatives F(x) et F’(x) sont symétriques par rapport à 0,5 : F(x) + F’(x) = 1
Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue
24. RESUME
VARIABLE QUALITATIVE
TABLEAUX ET GRAPHIQUES
Nominale Ordinale
VARIABLE QUANTITATIVE
Discrète Continue
Effectifs ou Fréquences Effectifs ou Fréquences
Courbes cumulatives des effectifs ou des fréquences
Modalités dans
l ’ordre
Diagramme en barres
Diagramme en barres
Diagramme circulaire
Diagramme en bâtons Histogramme
26. PARAMETRES STATISTIQUES
Les représentations graphiques ont permis une première synthèse visuelle de la
distribution des observations
Un paramètre statistique permet de résumer par une seule quantité numérique une
information contenue dans une distribution d’observations.
! Les paramètres statistiques ne concernent que les variables quantitatives
0
500
1000
1500
2000
2500
3000
0 N° individu
Variable
Tendance centrale
0
500
1000
1500
2000
2500
3000
0 N° individu
Variable
Position
100 % - A %
A %
0
500
1000
1500
2000
2500
3000
0 N° individu
Variable
Dispersion
27. 0
20
40
60
80
100
120
140
0 1 2 3 4 5 6
0
10
20
30
40
50
60
70
80
90
100
900 1400 1900 2400 2900 3500 ou plus...
PARAMETRES STATISTIQUES
Une distribution est unimodale si elle présente un maximum marqué, et pas d'autres
maxima relatifs.
La lecture s’effectue sur le diagramme en bâtons ou l'histogramme.
Le mode correspond à l'abscisse du maximum, c.à.d. la valeur la plus fréquente
Mode Classe modale
Mode
Tendance centrale Position Dispersion
(1) PARAMETRES DE TENDANCE CENTRALE
LE MODE
Tendance centrale
28. (2) PARAMETRES DE TENDANCE CENTRALE
LE MODE
Si la distribution présente 2 ou plus maxima relatifs, on dit qu'elle est bimodale ou
plurimodale.
La population est composée de plusieurs sous-populations ayant des caractéristiques de
tendance centrale différentes.
0
10
20
30
40
50
60
70
80
90
900 1400 1900 2400 2900 3500 4000 4500 ou
plus...
0
20
40
60
80
100
120
140
0 1 2 3 4 5 6
Mode 1 Mode 2 Mode 1 Mode 2
PARAMETRES STATISTIQUES Tendance centrale Position Dispersion
29. (3) PARAMETRES DE TENDANCE CENTRALE
LA MEDIANE
Les valeurs observées doivent être rangées par ordre croissant.
La médiane M est la valeur du milieu de la série d’observations, c.à.d. telle qu'il y ait
autant d'observations "au-dessous" que "au-dessus".
M
3 4 4 5 6 8 8 9 10
Nombre impair d’observations Nombre pair d’observations
3 4 4 5 6 8 8 9
Intervalle médian
M = milieu = 5,5
4 valeurs 4 valeurs 4 valeurs 4 valeurs
PARAMETRES STATISTIQUES Tendance centrale Position Dispersion
30. (4) PARAMETRES DE TENDANCE CENTRALE
LA MEDIANE à partir d’une distribution discrète
xi ni Fi
0 103 0,286
1 115 0,606
2 95 0,869
3 35 0,967
4 10 0,994
5 2 1
0,5
xi ni Fi
0 103 0,286
1 77 0,500
2 95 0,764
3 35 0,861
4 10 0,889
5 40 1
0
0,5
1
-2 -1 0 1 2 3 4 5 6
0
0,5
1
-2 -1 0 1 2 3 4 5 6
M
0,5
Intervalle médian
M = milieu = 1,5
Intervalle médian
M = milieu = 1,5
F(x)
0
0,606
0,286
0,994
0,967
1
0,869
M
F(x)
0
0,500
0,286
0,889
0,861
1
0,764
PARAMETRES STATISTIQUES Tendance centrale Position Dispersion
31. 0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
-10 0 10 20 30 40 50 60
(5) PARAMETRES DE TENDANCE CENTRALE
LA MEDIANE à partir d’une distribution continue
0,5 0,391
D'où M 3 5 3 3,22
0,680 0,391
0,5-0,391
M - 3
0,5
3,22
M
5 - 3 0,680-0,391
0
3
5
10
20
30
50
x
0
0,391
0,680
0,920
0,963
0,993
1
F(x)
[ei – ei+1[ Fi
[ 0 - 3 [ 0,391
[ 3 - 5 [ 0,680
[ 5 - 10 [ 0,920
[10 - 20 [ 0,963
[20 - 30 [ 0,993
[30 - 50 [ 1
0,5
M
PARAMETRES STATISTIQUES Tendance centrale Position Dispersion
32. (6) PARAMETRES DE TENDANCE CENTRALE
LA MOYENNE ARITHMETIQUE
La moyenne arithmétique est notée x
Valeurs de
la variable
Effectifs Fréquences
x1 n1 f1= n1/n
… … …
xi ni fi= ni/n
… … …
xk nk fk= nk/n
n
i
i=1
1
x = x
n
k
i i
i=1
1
x = n x
n
k k
i i
i i
i=1 i=1
n x
= f x
n
Série groupée
Série brute x1, x2, … , xn
PARAMETRES STATISTIQUES Tendance centrale Position Dispersion
33. (7) PARAMETRES DE TENDANCE CENTRALE
LA MOYENNE ARITHMETIQUE
Classes Effectifs Fréquences
[e1 – e2[ n1 f1
[e2 – e3[ n2 f2
…. …. ….
[ek – ek+1[ nk fk
Série classée
k k
i i i i
i=1 i=1
1
x = n x f x
n
Centres de classe
x1= ( e1 + e2)/2
x2= ( e2 + e3)/2
….
xk= ( ek + ek+1)/2
PARAMETRES STATISTIQUES Tendance centrale Position Dispersion
34. (8) PARAMETRES DE TENDANCE CENTRALE
LA MOYENNE ARITHMETIQUE
Comment faire la moyenne de plusieurs populations ?
Population P1
Effectif n1
Moyenne 1
x
Population P2
Effectif n2
Moyenne 2
x
Population
Effectif n = n1+ n2
Moyenne
1 2
P = P P
x ?
1 1 2 2
n x + n x
x =
n
k
i i
i=1
n x
n
Moyenne globale = moyenne des moyennes
PARAMETRES STATISTIQUES Tendance centrale Position Dispersion
35. (9) PARAMETRES DE TENDANCE CENTRALE
PROPRIETES GENERALES
PARAMETRES STATISTIQUES Tendance centrale Position Dispersion
x
P (x) = moyenne, médiane, mode
y = a x
P (y) = a P (x)
z = a x + b
P (z) = a P (x) + b
36. (10) PARAMETRES DE TENDANCE CENTRALE
MOYENNES GEOMETRIQUE ET HARMONIQUE
Moyenne géométrique
1 2 k
n n n
n
1 2 k
G = x x .....x
Moyenne harmonique
k
i
i=1 i
n
H =
n
x
Utilisée dans le cas de phénomènes multiplicatifs (taux de croissance moyen)
Utilisée dans le cas où l’on combine 2 variables sous forme de rapport
(pièces/heure, km/litre,…)
PARAMETRES STATISTIQUES Tendance centrale Position Dispersion
37. PARAMETRES STATISTIQUES
On appelle fractiles ou quantiles d'ordre k les (k-1) valeurs qui divisent les observations
en k parties d'effectifs égaux.
1 médiane M qui divise les observations en 2 parties égales
3 quartiles Q1, Q2, Q3 qui divisent les observations en 4 parties égales
9 déciles D1, D2, …, D9 qui divisent les observations en 10 parties égales
99 centiles C1, C2, …, C99 qui divisent les observations en 100 parties égales
Position Dispersion
Tendance centrale
(1) PARAMETRES DE POSITION
LES FRACTILES OU QUANTILES
Position
38. 0,5
M
0,75
Q3
0,2
D2
(2) PARAMETRES DE POSITION
LES FRACTILES OU QUANTILES
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
-10 0 10 20 30 40 50 60
Variable continue
0
1
-2 -1 0 1 2 3 4 5 6
Variable discrète
PARAMETRES STATISTIQUES
Quartiles, déciles, centiles s’obtiennent de la même façon que la médiane.
0,5
M
Q3
0,75
0,9
D9
Tendance centrale Position Dispersion
39. (3) PARAMETRES DE POSITION
PROPRIETES GENERALES
PARAMETRES STATISTIQUES Tendance centrale Position Dispersion
x
Q (x) = quantile
A %
100 % - A %
y = a x
Q (y) = a Q (x)
A %
100 % - A %
z = a x + b
Q (z) = a Q (x) + b
A %
100 % - A %
40. PARAMETRES STATISTIQUES
Etendue : R = xmax - xmin
Intervalle interquartile : IQ = Q3 - Q1
Variance : Série brute :
n
2
i
i=1
1
V = x - x
n
Série groupée ou classée :
k k
2 2
i i i i
i=1 i=1
1
V = n x - x f x - x
n
k
2 2
i i
i=1
1
V = n x x
n
= Moyenne des carrés - Carré de la moyenne
Ecart-type : σ = V
Tendance centrale Position Dispersion
Dispersion
(1) PARAMETRES DE DISPERSION
41. (2) PARAMETRES DE DISPERSION
PARAMETRES STATISTIQUES
Comment faire la variance de plusieurs populations ?
Population P1
Effectif n1
Moyenne
Variance V1
1
x
Population P2
Effectif n2
Moyenne
Variance V2
2
x
1 2
P = P P
Population
Effectif n = n1+ n2
Moyenne
Variance V ?
x
k k
2
i i i i
i=1 i=1
1 1
V = n V + n x -x
n n
Variance globale = Moyenne des variances + Variance des moyennes
Tendance centrale Position Dispersion
42. (3) PARAMETRES DE DISPERSION
PROPRIETES GENERALES
PARAMETRES STATISTIQUES
x
P (x) = étendue, écart-type,
intervalle interquartile
Tendance centrale Position Dispersion
y = a x
z = a x + b
P (y) = a P (x) P (z) = a P (x)
43. PROPRIETES IMPORTANTES
DE LA MOYENNE ET DE LA VARIANCE
PARAMETRES STATISTIQUES
Comment se comportent la moyenne et la variance
lorsqu’on fait subir un changement de variable aux observations?
xi
yi = a xi + b
y = a x + b
Comment se comportent la moyenne et la variance
de la somme de deux séries d’observations?
xi
yi
zi = xi + yi
z = x + y
2
V(y) = a V(x) σ(y) = a σ(x)
V(z) V(x)+ V(y)
45. (1) MESURE DE LA LIAISON ENTRE 2
VARIABLES QUANTITATIVES
ETUDE DE 2 VARIABLES QUANTITATIVES
Nom Taille xi (cm) Poids yi (kg)
Pierre 175 73
Arantxa 168 56
….. ….. …..
Martin 185 87
50
55
60
65
70
75
80
85
90
95
150 160 170 180 190 200
Taille
Poids
La connaissance de la taille x apporte une certaine information sur le poids y
Il existe une relation de dépendance entre x et y
46. (2) MESURE DE LA LIAISON ENTRE 2
VARIABLES QUANTITATIVES
ETUDE DE 2 VARIABLES QUANTITATIVES
La connaissance de x n’apporte
aucune certaine information sur y
x et y sont indépendantes
La connaissance de x permet de
connaître exactement la valeur de y
Il existe une relation fonctionnelle
entre x et y
47. (3) MESURE DE LA LIAISON ENTRE 2
VARIABLES QUANTITATIVES
ETUDE DE 2 VARIABLES QUANTITATIVES
Covariance :
n
i i
i=1
1
Cov x,y = x -x y -y
n
Propriétés :
Cov x,y 0
x et y varient dans le même sens
Cov x,y 0
x et y varient en sens contraire
Cov x,y Cov y,x
Cov x,x V(x)
Cov a x + b y , z a Cov x,z b Cov y,z
48. (4) MESURE DE LA LIAISON ENTRE 2
VARIABLES QUANTITATIVES
ETUDE DE 2 VARIABLES QUANTITATIVES
Propriétés :
! Ne pas confondre causalité et corrélation
Corrélation linéaire:
cov(x,y)
ρ =
σ(x) σ(y)
1 ρ 1
ρ = 1 si a > 0
y = a x + b
ρ = -1 si a < 0
Il existe une relation fonctionnelle entre x et y
ρ 1
x et y sont indépendantes
ρ 0
Il existe une dépendance linéaire d’autant plus forte que |r| est grand
0 ρ 1
49. (1) AJUSTEMENT LINEAIRE
ETUDE DE 2 VARIABLES QUANTITATIVES
50
55
60
65
70
75
80
85
90
95
150 160 170 180 190 200
x = Taille
y = Poids
Est-il possible de trouver une fonction numérique f telle que y = f (x) ?
Si une telle fonction existe, on dit que f est un modèle du phénomène étudié.
x est la variable explicative.
y est la variable expliquée.
50. 50
55
60
65
70
75
80
85
90
95
150 160 170 180 190 200
x = Taille
y = Poids
(2) AJUSTEMENT LINEAIRE
ETUDE DE 2 VARIABLES QUANTITATIVES
On désire trouver la droite qui passe « au mieux » à l’intérieur du nuage de points
51. (3) AJUSTEMENT LINEAIRE
50
55
60
65
70
75
80
85
90
95
150 160 170 180 190 200
x = Taille
y = Poids
50
55
60
65
70
75
80
85
90
95
150 160 170 180 190 200
x = Taille
y = Poids
« au mieux »
ETUDE DE 2 VARIABLES QUANTITATIVES
Droite de régression de y en x Droite de régression de x en y
Minimiser
n
2
i
i=1
S = e
ei
n
2
i
i=1
S' = e'
Minimiser
i
e'
52. (4) AJUSTEMENT LINEAIRE
REGRESSION LINEAIRE DE Y EN X
ETUDE DE 2 VARIABLES QUANTITATIVES
50
55
60
65
70
75
80
85
90
95
150 160 170 180 190 200
x = Taille
y = Poids
Droite de régression
linéaire de y en x
y = f(x) = ax + b
La droite de régression linéaire de y en x, notée Dy/x , minimise
n n
2
2
i i i
i=1 i=1
S = e = y -ax -b
n
i i
i=1
n
2
i
i=1
x -x y -y
Cov x,y
a = =
V(x)
x -x
b = y - ax
Dy/x passe par le point moyen
x , y
f(x) = y = ax+b
xi
yi
axi+b ei = |yi-axi-b|
53. (5) AJUSTEMENT LINEAIRE
REGRESSION LINEAIRE DE Y EN X
ETUDE DE 2 VARIABLES QUANTITATIVES
50
55
60
65
70
75
80
85
90
95
150 160 170 180 190 200
x = Taille
y = Poids
Droite de régression
linéaire de y en x
y = f(x) = ax + b
f(x) = y = ax+b
xi
yi
axi+b ei = |yi-axi-b|
i i i
ˆ
r = y - y = résidu de la ième observation
y = a x + b définit un modèle affine
i i
ŷ = a x + b = valeur de yi prévue par le modèle
i i i i
e = r = y - a x - b = erreur due au modèle
54. (6) AJUSTEMENT LINEAIRE
REGRESSION LINEAIRE DE X EN Y
ETUDE DE 2 VARIABLES QUANTITATIVES
50
55
60
65
70
75
80
85
90
95
150 160 170 180 190 200
x = Taille
y = Poids
Droite de régression
linéaire de x en y
x = f(y) = a’y + b’
Dx/y passe par le point moyen
x , y
La droite de régression linéaire de x en y, notée Dx/y , minimise
n n
2
2
i i i
i=1 i=1
S' = e' = x -a'y -b'
n
i i
i=1
n
2
i
i=1
x -x y -y
Cov x,y
a' = =
V(y)
y -y
b' = x - a' y
yi
xi
f(y) = x = a’y+b’
a’yi+b’
ei’ = |xi-a’yi-b’|
55. LIENS ENTRE CORRELATION
ET DROITES DE REGRESSION
ETUDE DE 2 VARIABLES QUANTITATIVES
r² = a a’
r² = a a’ = 1
Liaison fonctionnelle linéaire
r² = a a’ = 0
Indépendance linéaire
Le degré de dépendance linéaire
se mesure à la proximité des
droites de régression
0 r² = a a’ < 1
σ(x) σ(y)
ρ = a = a'
σ(y) σ(x)
,
x y
,
x y
,
x y
Dy/x : y = ax + b
Cov x,y
a =
V(x)
b = y - ax
Dx/y : x = a’y + b’ b' = x - a' y
Cov x,y
a' =
V(y)
1 b'
y= x
a' a'
56. (1) AJUSTEMENT A UNE FONCTION EXPONENTIELLE
ETUDE DE 2 VARIABLES QUANTITATIVES
xi yi
2,8 0,8
4,3 1,2
2,7 1,5
4,2 1,9
4,1 2,3
…. ….
4,0 3,1
0,0
5,0
10,0
15,0
20,0
25,0
0 10 20 30 40 50 60
droite de régression linéaire
de y en x
Les résidus devraient se répartir
au hasard autour de l’axe des
abscisses:
le modèle affine ne convient pas
-3
-2
-1
0
1
2
3
4
5
0 10 20 30 40 50 60
Analyse des résidus
57. (2) AJUSTEMENT A UNE FONCTION EXPONENTIELLE
ETUDE DE 2 VARIABLES QUANTITATIVES
0,0
5,0
10,0
15,0
20,0
25,0
0 10 20 30 40 50 60
Modèle exponentiel
x
y = e exponentielle de base e
x
y = b a Forme exponentielle générale
exponentielle de base a
x
y = a
Changement de variable
ln y = ln b + x ln a
Y = A X + B avec Y = ln y
X = x
A = ln a
B = ln b
L’ajustement affine de Y en fonction de X donne A et B,
d ’où , , et le modèle
A
a = e B
b = e x
y = b a
58. (3) AJUSTEMENT A UNE FONCTION EXPONENTIELLE
ETUDE DE 2 VARIABLES QUANTITATIVES
0,00
5,00
10,00
15,00
20,00
25,00
0 10 20 30 40 50 60
Série initiale (xi,yi)
Série prévue par le modèle
i i
ˆ
x ,y
-1,50
-1,00
-0,50
0,00
0,50
1,00
1,50
0 10 20 30 40 50 60
Analyse des résidus
Le modèle exponentiel est mieux
adapté que le modèle affine
59. (1) AJUSTEMENT A UNE FONCTION PUISSANCE
ETUDE DE 2 VARIABLES QUANTITATIVES
Droite de régression linéaire de y en x
Le modèle affine ne
convient pas
Analyse des résidus
-150
-100
-50
0
50
100
150
0 10 20 30 40 50 60
0
100
200
300
400
500
600
700
800
900
0 20 40 60
60. (2) AJUSTEMENT A UNE FONCTION PUISSANCE
ETUDE DE 2 VARIABLES QUANTITATIVES
Changement de variable
ln y = ln b + a ln x
Y = A X + B avec Y = ln y
X = ln x
A = a
B = ln b
Modèle puissance
a
y = b x
L’ajustement affine de Y en fonction de X donne A et B,
d ’où a = A , , et le modèle
B
b = e a
y = b x
0
100
200
300
400
500
600
700
800
900
0 20 40 60
61. (3) AJUSTEMENT A UNE FONCTION PUISSANCE
ETUDE DE 2 VARIABLES QUANTITATIVES
Série initiale (xi,yi)
Série prévue par le modèle
i i
ˆ
x ,y
Le modèle puissance est mieux
adapté que le modèle affine
0
100
200
300
400
500
600
700
800
900
0 20 40 60
Analyse des résidus
-80
-60
-40
-20
0
20
40
60
80
0 10 20 30 40 50 60
62. QUALITE D’UN AJUSTEMENT
ETUDE DE 2 VARIABLES QUANTITATIVES
On montre que
2 2 2
i i i i
ˆ ˆ
y -y y -y y -y
SCM SCR
1
SCT SCT
L’ajustement est d’autant meilleur que SCR est proche de 0, c.à.d. que SCR/SCT est
proche de 0 ou SCM/SCT est proche de 1.
= proportion de la variation totale due à l'ajustement
0 R 1
SCT = SCM + SCR
Somme des carrés des
écarts à la moyenne
Somme des carrés des
écarts du modèle
Somme des
carrés des résidus
+
=
= Coefficient de détermination = r² = (coef. de corrélation)²
SCM
R
SCT
64. INDICES ELEMENTAIRES
LES INDICES
Un indice est le rapport d’une variable mesurée à deux instants différents.
Un indice est représentatif d’une évolution
y1 = valeur de la variable y à la date t1
y0 = valeur de la variable y à la date t0
1
1 0
0
y
i =
y
Indice élémentaire de la variable y à la date t1 par rapport
à la date de référence t0
1 0 1 0
I = i 100
Indice élémentaire de la variable y à la date t1 par rapport
à la date de référence t0, base 100.
Propriétés n/n
i = 1 Identité
2/1 1/2
i i = 1
Réversibilité
3/1 3/2 2/1
i i i
Circularité
65. INDICES ET TAUX DE VARIATION
LES INDICES
Taux de variation ou taux de croissance de la variable y
entre la date t0 et la date t1
1 0
1 0
0
y y
r =
y
1
1 0 1 0
0
y
r = 1 i 1
y
r = i - 1 i = 1 + r
1 1 0 0 1 1 0 0
y = (1+ r )y y = i y
i = 1 + r = coefficient multiplicateur
r = 0 i = 1
Pas d’évolution
r > 0 i > 1
Croissance
-100% = -1 < r < 0 0 i < 1
Décroissance
66. INDICES ET TAUX DE VARIATION MOYENS
LES INDICES
y0, y1, ….., yn les valeurs prises par une variable aux dates t0, t1, ….., tn
n n-1
y i y
i l’indice moyen
n n n-1
y i y
i1, i2, ….., in les indices élémentaires sur chacune des périodes
iG l’indice élémentaire global entre t0 et tn
n G 0
y i y
n
G n 2 1
i = i i ..... i i
i1, i2, ….., ik indices élémentaires sur des périodes de n1, n2, ….., nk unités (jour, mois, année…)
1 2 k
n n n
n
G 1 2 k
i = i i i ..... i
1 2 k
n n n
1 2 k
i i i ..... i
n
Moyenne géométrique des indices élémentaires
n 2 1 0
...... i ..... i i y
n n-1 n-2
i i y
n
0
... i y
2
n-2
i y
r1, r2, ….., rn les taux de croissance sur chacune des périodes
n n n-1 n n-1 n-2 n 2 1 0
y (1 r ) y (1 r ) (1 r ) y (1 r ) ..... (1 r ) (1 r ) y
rG le taux de croissance entre t0 et tn
n G 0
y (1 r ) y
r le taux de croissance moyen
2 n
n n-1 n-2 0
y (1 r) y (1 r) y ... (1 r) y
n
G n 2 1
(1+ r )= (1+ r) (1 r ) ..... (1 r ) (1 r )
r1, r2, ….., rk indices élémentaires sur des périodes de n1, n2, ….., nk unités (jour, mois, année…)
1 2 k
n n n
n
G 1 2 k
(1+r )= (1+r) (1 r ) (1 r ) ..... (1 r )
67. INDICES USUELS
LES INDICES
Indice élémentaire des prix 1
1 0
0
P
i P =
P
Indice élémentaire des quantités
(ou des volumes)
1
1 0
0
Q
i Q =
Q
Indice élémentaire de valeur
(ou de dépense)
1 1 1
1 0 1 0 1 0
0 0 0
V PQ
i V = i P i Q
V P Q
68. INDICES SYNTHETIQUES
LES INDICES
Un indice synthétique mesure l’évolution simultanée de plusieurs produits
Un indice synthétique est une moyenne pondérée des indices élémentaires
des différents produits
j,n j,n j,n
j,n n n
j,n j,n j,n
j=1 j=1
V P Q
α
V P Q
n
j,n
j=1
α 1
Remarque :
Coefficient de pondération (ou budgétaire) du produit j à la date tn
69. (1) INDICES SYNTHETIQUES DE LASPEYRES
LES INDICES
Indice de Laspeyres des prix
Dépense de la date courante avec les quantités de référence
Dépense de la date de référence
100
Moyenne arithmétique des indices élémentaires des prix, base 100,
pondérés par des coefficients de pondération relatifs à la date de référence t0
1 0
P
L =
n
j,0 j 1 0
j=1
α I P
1 0
P
L =
n
j,1 j,0
j=1
n
j,0 j,0
j=1
P Q
P Q
100
Comment s’en souvenir ?
Dépense de la date courante
Dépense de la date de référence
n
j,1 j,1
j=1
n
j,0 j,0
j=1
P Q
P Q
1 seul indice sur 4 doit être modifié
0
70. (2) INDICES SYNTHETIQUES DE LASPEYRES
LES INDICES
Indice de Laspeyres des quantités
n
j,0 j,1
j=1
n
j,0 j,0
j=1
P Q
P Q
100
Dépense de la date courante avec les prix de référence
Dépense de la date de référence
100
Moyenne arithmétique des indices élémentaires des quantités, base 100,
pondérés par des coefficients de pondération relatifs à la date de référence t0
1 0
Q
L =
n
j,0 j 1 0
j=1
α I Q
1 0
Q
L = Comment s’en souvenir ?
Dépense de la date courante
Dépense de la date de référence
n
j,1 j,1
j=1
n
j,0 j,0
j=1
P Q
P Q
1 seul indice sur 4 doit être modifié
0
71. (1) INDICES SYNTHETIQUES DE PAASCHE
LES INDICES
Indice de Paasche des prix
n
j,1 j,1
j=1
n
j,0 j,1
j=1
P Q
P Q
100
Dépense de la date courante
Dépense de la date de référence avec les quantités courantes
100
Moyenne harmonique des indices élémentaires des prix, base 100,
pondérés par des coefficients de pondération relatifs à la date courante t1
1 0
P
P =
1 0
P
P =
n
j,1
j=1
j 1 0
1
α
I P
Comment s’en souvenir ?
Dépense de la date courante
Dépense de la date de référence
n
j,1 j,1
j=1
n
j,0 j,0
j=1
P Q
P Q
1 seul indice sur 4 doit être modifié
1
72. (2) INDICES SYNTHETIQUES DE PAASCHE
LES INDICES
Indice de Paasche des quantités
n
j,1 j,1
j=1
n
j,1 j,0
j=1
P Q
P Q
100
Moyenne harmonique des indices élémentaires des quantités, base 100,
pondérés par des coefficients de pondération relatifs à la date courante t1
1 0
Q
P =
1 0
Q
P =
n
j,1
j=1
j 1 0
1
α
I Q
Dépense de la date courante
Dépense de la date de référence avec les prix courants
100
Comment s’en souvenir ?
Dépense de la date courante
Dépense de la date de référence
n
j,1 j,1
j=1
n
j,0 j,0
j=1
P Q
P Q
1 seul indice sur 4 doit être modifié
1
77. (1) DETERMINATION DE LA TENDANCE
REGRESSION LINEAIRE
Il s’agit de faire un lissage du nuage des points par une fonction connue.
Lorsque le nuage est linéaire on utilise la droite de régression de y en fonction du temps
T = tendance
Avantages:
Expression analytique
Inconvénients:
Un nuage ne se présente pas toujours sous une forme analytique simple
Le calcul de la tendance peut être affecté par des valeurs extrêmes ou par
les valeurs de début et de fin de série.
SERIES CHRONOLOGIQUES
78. t Y
1 y1
2 y2
3 y3
4 y4
….. …..
n yn
t mm(2)
-
……
……
-
t Y
1 y1
2 y2
3 y3
4 y4
….. …..
n yn
t mm(3)
-
……
……
-
(2) DETERMINATION DE LA TENDANCE
MOYENNES MOBILES
Moyennes mobiles
d’ordre impair
Moyennes mobiles
d’ordre pair.
On utilise une observation
supplémentaire
(y2+y3+y4)/3
(y1+y2+y3)/3
SERIES CHRONOLOGIQUES
2
Moy. Mobiles
d’ordre 3
3
Moy. Mobiles
d’ordre 2
2 (y1/2+y2+y3/2)/2
3 (y2/2+y3+y4/2)/2
79. (3) DETERMINATION DE LA TENDANCE
MOYENNES MOBILES
Choix de l’ordre des moyennes mobiles : égal au nombre de saisons
Avantages du lissage par moyennes mobiles :
Permet de se faire une idée de la tendance lorsque le nuage ne présente pas
une tendance algébrique claire
Inconvénients:
La tendance est estimée sur une partie de la période étudiée et non sur la totalité
Ne donne pas une expression analytique de la tendance en fonction du temps
Approximation pas très bonne lorsqu’il y a de fortes courbures
Sensible aux valeurs extrêmes
SERIES CHRONOLOGIQUES
80. DETERMINATION DES COMPOSANTES
SAISONNIERES
Modèle multiplicatif Y = T.S.A Modèle additif Y = T+S+A
SERIES CHRONOLOGIQUES
Rapports Y/T = S.A Différences Y-T = S+A
= Moyenne des rapports de la saison j
'
j
S = Moyenne des différences de la saison j
'
j
S
Coefficients saisonniers bruts '
j
S
' '
j j
S = S S
Coefficients saisonniers j
S
' '
j j
S = S - S
Rque: cette transformation permet de respecter le principe de conservation des aires
S 1 S 0
81. DETERMINATION DE LA COMPOSANTE
ALEATOIRE
SERIES CHRONOLOGIQUES
Modèle multiplicatif Y = T.S.A Modèle additif Y = T+S+A
Y
A =
T.S
A = Y - T - S
La composante aléatoire, ou résidu, permet d’analyser la qualité du modèle de
décomposition
82. DESAISONNALISATION
SERIES CHRONOLOGIQUES
YCVS = série désaisonnalisée ou Corrigée des Variations Saisonnières, exprime
ce qu’aurait été l’évolution du phénomène sans effet saisonnier.
Modèle multiplicatif Y = T.S.A Modèle additif Y = T+S+A
CVS
Y
Y =
S
CVS
Y = Y S
83. PREVISION
SERIES CHRONOLOGIQUES
Lissage obtenu par
T = droite de régression DY/t
- Régression linéaire de Y sur le temps t
- Moyennes mobiles (Moyennes mobiles = T provisoire)
Régression linéaire de sur le temps t
CVS
Y T = droite de régression CVS
Y t
D
Prévision à la date future t, correspondant à la saison j:
Modèle multiplicatif Y = T.S.A Modèle additif Y = T+S+A
j
Ŷ(t) = T(t) + S
j
Ŷ(t)= T(t) × S