SlideShare una empresa de Scribd logo
1 de 67
Descargar para leer sin conexión
1
Estadística
Alberto Vega Hernández
Consultoría de Servicios para Gobiernos y Estudios Legislativos
Apuntes de Investigación y divulgación científica
1
2
3
Estadística.
Apuntes de investigación y divulgación científica.
© Consultoría de Servicios para Gobiernos y Estudios Legislativos.
Prolongación Paseo de la Reforma No. 530, 2º piso,
Delegación Álvaro Obregón, C.P. 01219.
Ciudad de México, Distrito Federal.
Primera edición: marzo de 2007.
Autor: Alberto Vega Hernández.
Las opiniones vertidas de estos apuntes son responsabilidad del autor.
Manual de distribución gratuita, prohibida su venta.
Impreso en México.
4
5
Contenido
UNIDAD I
INTRODUCCIÓN A LA ESTADÍSTICA
1.1 Definición de Estadística.......................................................................................................................8
1.1.1 La Estadística Descritiva...........................................................................................................8
1.1.2 La Estadística Inferencial .........................................................................................................8
1.2 La encuesta ..................................................................................................................................................8
1.3 La población................................................................................................................................................8
1.4 La muestra....................................................................................................................................................9
1.5 La variable....................................................................................................................................................9
1.6 La variable discreta................................................................................................................................10
1.7 La variable continua..............................................................................................................................10
1.8 El dato y los datos...................................................................................................................................10
1.9 El experimento.........................................................................................................................................10
1.10 El parámetro...........................................................................................................................................10
UNIDAD II
REPRESENTACIÓN DE GRÁFICAS DE DATOS
2.1 La gráfica.....................................................................................................................................................11
2.2 Diagramas de pastel ..............................................................................................................................11
2.3 Graficas de barras...................................................................................................................................11
2.4 Diagramas de Pareto.............................................................................................................................12
2.5 Distribución de frecuencias...............................................................................................................13
a) Método simple...................................................................................................................................13
b) Método complejo..............................................................................................................................14
6
UNIDAD III
MEDIDAS DE TENDENCIA CENTRAL
3.1 La Media......................................................................................................................................................17
a) Datos simples.....................................................................................................................................17
b) Datos de frecuencia.........................................................................................................................18
c) Datos agrupados...............................................................................................................................19
3.2 La Mediana.................................................................................................................................................21
a) Datos simples.....................................................................................................................................21
b) Datos de frecuencia.........................................................................................................................22
c) Datos agrupados...............................................................................................................................23
3.3 La Moda.......................................................................................................................................................25
a) Datos simples.....................................................................................................................................25
b) Datos de frecuencia.........................................................................................................................26
c) Datos agrupados...............................................................................................................................27
3.3 Relación entre las medidas de tendencia central....................................................................28
UNIDAD IV
MEDIDAS DE DISPERSIÓN
4.1 La Desviación Media..............................................................................................................................29
a) Datos simples.....................................................................................................................................29
b) Datos de frecuencia.........................................................................................................................30
c) Datos agrupados...............................................................................................................................32
4.2 La Varianza ................................................................................................................................................33
a) Datos simples.....................................................................................................................................33
b) Datos de frecuencia.........................................................................................................................34
c) Datos agrupados...............................................................................................................................36
4.3 La Desviación Estandar........................................................................................................................37
a) Datos simples.....................................................................................................................................37
b) Datos de frecuencia.........................................................................................................................38
7
c) Datos agrupados...............................................................................................................................40
4.4 Coeficiente de Variación......................................................................................................................41
UNIDAD V
MEDIDAS DE POSICIÓN NO CENTRAL
5.1 Deciles..........................................................................................................................................................43
5.2 Cuartiles ......................................................................................................................................................43
5.3 Percentiles..................................................................................................................................................43
5.4 Cuartil medio ............................................................................................................................................45
UNIDAD VI
MEDIDAS DE FORMA
6.1 Concentración...........................................................................................................................................46
6.2 Asimetría.....................................................................................................................................................47
6.3 Curtosis........................................................................................................................................................49
6.4 El Teorema de Chebyshev ..................................................................................................................51
UNIDAD VII
LA CORRELACIÓN LINEAL
7.1 La Correlación Lineal............................................................................................................................53
7.2 El coeficinete de correlación lineal ................................................................................................55
7.3 Coeficinete de correlación de Pearson .........................................................................................56
7.4 La Regresión Lineal................................................................................................................................59
Bibliografía ............................................................................................................................66
8
UNIDAD I
INTRODUCCIÓN A LA ESTADÍSTICA
1.1 Definición de Estadística
Ciencia que se encarga de la recolección, descripción e interpretación datos. Nos
permite realizar gráficas y su fin es el análisis para tomar decisiones.
1.1.1 La Estadística Descriptiva
Conjunto de procedimientos secuenciales, recolección, organización y análisis de
información cuya finalidad es la presentación simplificada cuya mejor interpretación
ayude a tomar decisiones. La estadística descriptiva utiliza el método deductivo, que
va de la población a la muestra.
1.1.2 La Estadística Inferencial
Conjunto de procedimientos basados en la Teoría de la probabilidad permite hacer
inferencia sobre características de la población tomando en ella una muestra y así
ayuda a tomar decisiones en sistemas de incertidumbre. La estadística inferencial
utiliza el método deductivo.- Que va de la muestra a la población.
1.2 La encuesta
Es un cuestionario elaborado para obtener información, que se puede expresar
mediante números tabulares.
1.3 La población
Conjunto de individuos, objetos o medidas que tiene alguna característica.
9
1.4 La muestra
Subconjunto de la población.
 Marco muestral.- Es una lista de elementos que pertenecen a la población de
la cual se obtendrá una muestra.
 Muestra probabilística.- Son muestras en que los elementos a seleccionar se
obtienen con base en la probabilidad. Cada elemento de una población tiene
cierta probabilidad de ser elegido como parte importante.
 Muestra aleatoria simple.- Muestra seleccionada de modo que todos los
elementos de la población tienen la misma probabilidad de ser elegidos.
 Muestra sistemática.- Muestra en la cual se seleccionada todo k-ésimo
elemento del marco muestral, empezando como primer elemento que se elige
de manera aleatoria.
 Muestra aleatoria estratificada.- Muestra que se obtiene al estratificar el
marco muestral, y luego se selecciona un número fijo de elementos de cada uno
de los estratos por medio de una técnica de muestreo aleatorio simple.
1.5 La variable
Característica que al ser medida en diferentes individuos es susceptible de adoptar
diferentes valores. Existen diferentes tipos de variables:
 La variable cualitativa.- Variable que clasifica o describe un elemento de una
población. En esta no se pude medir numéricamente (color de un coche,
nacionalidad, color de la piel, sexo).
 La variable cuantitativa.- Variable que cuantifica un elemento de una
población. Tiene un valor numérico (como ejemplo: peso, longitud,
nacionalidad, etcétera).
 La variable nominal.- Variable cualitativa que describe o identifica un
elemento de una población. Para datos resultantes de variable nominal, las
operaciones aritméticas no sólo carecen de sentido: tampoco es posible asignar
un orden a las categorías.
10
 La variable ordinal.- Es una variable cualitativa que presenta una posición, o
clasificación ordenada.
1.6 La variable discreta
Sólo puede tomar valores enteros y exactos 1, 2, 3, 4. Ejemplo: número de hijos en una
familia, número de personas en una empresa.
1.7 La variable continua
Puede asumir cualquier valor. Sin importar el tamaño. Por ejemplo: ingreso, estaturas,
edades. La variable continua se divide en:
 Variable numérica.- Cuando los valores son números.
 Variable nominal.- Cuando los valores son palabras.
1.8 El dato y los datos
El dato se refiere al valor de la variable asociada a un elemento de una población o
muestra. Este valor puede ser un número, una palabra o un símbolo.
Los datos son el conjunto de valores recolectados para la variable de cada uno de los
elementos que pertenecen a la muestra.
1.9 El experimento
Actividad planeada cuyos resultados producen un conjunto de datos.
1.10 El parámetro
Valor numérico que resume todos los datos de una población.
11
UNIDAD II
REPRESENTACIÓN DE GRÁFICAS DE DATOS
2.1 La gráfica
Las gráficas son representaciones que producen los resultados de datos en estudio.
2.2 Diagramas de pastel
Gráficas que se utilizan para resumir datos cualitativos. El diagrama muestra la
cantidad de datos que pertenecen a cada categoría como una parte proporcional de un
círculo.
Corazón
Piel
Hígado
Riñones
Ojos
2.3 Gráficas de barras
Muestran la cantidad de datos que pertenecen a cada categoría como áreas
rectangulares.
12
0
2
4
6
operaciones
2.4 Diagrama de Pareto
El diagramad de Pareto se define como una gráfica a base de rectas que muestra los
porcentajes acumulados y la cantidad de datos representada por cada barra. El
diagrama puede ir de la más numerosa a la menos numerosa o viceversa.
.
4.3
2.5
3.5
4.5
2.4
4.4
1.8
2.8
2 2
3
5
13
2.5 Distribución de frecuencias
Distribución de frecuencias se define como el arreglo de datos en forma tabular,
donde una de las columnas representa la variable y la otra columna representa la
frecuencia absoluta o relativa. Listado, expresado en forma de diagrama que asocia
cada valor de una variable con la frecuencia.
a) Método simple
x1(f1) + x2(f2) + x3(f3) + … xn(fn)
Distribución de frecuencias = _______________________________________________
∑ f
Ejemplo:
De acuerdo con los siguientes datos:
X f
0 1
1 3
2 8
3 5
4 2
∑f = 20
D.f = 0(1) + 1(3) + 2(8) + 3(5) + 4(3)
_________________________________________
20
D.f = 2.3
14
b) Método complejo
Para este método se deben tener en cuenta las formulas siguientes:
Rango V máx – V mín
Amplitud = ________________ = ____________________
# Intervalos N
Li + Ls
Marca de clase (m) = ____________
2
f
Frecuencia relativa (f.r) = _____________
Total de f
Ejemplo:
De acuerdo con los siguientes datos:
Frecuencia relativa acumulada (f.r.a) = f.r + anterior
Dato Frecuencia
64 1
66 1
69 1
74 1
75 1
82 1
15
Rango V máx – V mín
Amplitud = --------------- = ----------------------
# Intervalos N
103 – 64 39
----------- = ---------- = 6.5 = 7
30 5.4772
Intervalo Frecuencia Marca de
clase
Frecuencia
relativa
Frecuencia
relativa
acumulada
64 – 70 3 67 0.1 0.1
71 – 77 2 74 0.06 0.16
78 - 84 3 81 0.1 0.26
85 – 91 7 88 0.23 0.49
92 – 98 2 95 0.06 0.55
83 1
84 1
85 2
86 1
88 1
89 1
90 2
98 2
100 3
101 3
102 4
103 3
16
99 - 105 13 102 0.43 0.98
Li Ls ∑f = 30 ∑fr = 1
Li + Ls 64 + 70
Marca de clase (m) = ____________ = _____________ = 67
2 2
f 3
Frecuencia relativa (f.r) = _____________ = ___________ = 0.1
∑ total de f 30
Frecuencia relativa acumulada (f.r.a) = f.r + anterior = 0.1 + 0.06 = 0.16
Frecuencia Frecuencia relativa acumulada
13 0.98
0.55
Histograma 0.49 Ojiva
7
0.26
3 0.16
2 0.1
64 70 77 84 91 98 105 Intervalos 67 74 81 88 95 102 Marca de clase
17
UNIDAD III
MEDIDAS DE TENDENCIA CENTRAL
3.1 La Media
Media o Media Aritmética (x) es el promedio de la serie, se puede presentar de
manera simple, frecuencia y agrupada.
a) Datos simples
∑ x
= ________
n
Donde:
= media
∑ = Sumatoria
x = dato
n = tamaño de la muestra
Ejemplo:
Un estudiante de vocacional desea conocer el promedio de sus calificaciones de quinto
semestre.
Matemáticas 7 Química 6
Biología 5 Filosofía 8
Física 9 Inglés 10
∑ x
= ________
n
18
7 + 5 + 9 +6 + 8 + 10 45
= ____________________________ = _____ = 7.5.
6 6
Interpretación.- El promedio del estudiante de vocacional en el quinto semestre es de 7.5
b) Datos de frecuencia
∑ f x
= _________
N
Donde:
= media
∑ = Sumatoria
x f = dato por frecuencia
N = tamaño de la frecuencia
Ejemplo:
Las calificaciones de inglés de 20 alumnos son:
1, 7, 9, 2, 5, 4, 5, 6, 7, 6, 2, 6, 8, 6, 5, 4, 5, 2, 4, 3
Calificaciones Frecuencia
1 1
2 3
3 1
4 3
5 4
6 4
19
∑ f = 20
∑ f x
= _________
N
1(1) + 2(3) + 3(1) + 4(3) + 5(4) + 6(4) + 7(2) + 8(1) + 9(1)
= _________________________________________________________________________
20
97
= _________ = 4.85
20
Interpretación.- 4.85 es el promedio de calificaciones de inglés de 20 alumnos. Es un
grupo con bajo aprovechamiento.
c) Datos agrupados
∑ f m
= ___________
N
7 2
8 1
9 1
20
Donde:
= media
∑ = Sumatoria
f m = frecuencia de la marca de clase
N = tamaño de los datos
Ejemplo:
Determina el promedio de calificaciones del grupo 3103 e interpreta los resultados.
Calificación Frecuencia (f) Marca de clase (m) f * m
7 – 7.6 1 7.3 7.3
7.7 – 8.3 9 8 72
8.4 – 9.0 12 8.7 104.4
9.1 – 9.8 11 9.47 103.95
∑ f = 33 ∑ fm = 287.65
∑ f m
= ___________
N
287.65
= ___________ = 8.71
33
Interpretación.- En un grupo de 33 personas con calificación de 7 a 9.8, el promedio del
semestre es de 8.71, lo que corresponde a un nivel considerable.
21
3.2 La Mediana
Mediana (x).- Datos que ocupan la posición central de la serie ya sea simple,
frecuencia o agrupada.
a) Datos simples
mitad de los 2 números de en medio
= ____________________________________________
2
Donde:
= mediana
Ejemplo:
En la siguiente numeración encuentre la media.
5, 6, 6, 7, 8, 9, 10, 11
mitad de los 2 números de en medio
= ____________________________________________
2
7 + 8
= ___________ = 7.5
2
Interpretación.- 7.5 es la mediana.
22
b) Datos de frecuencia
N + 1
= ___________
2
Donde:
= mediana
N + 1 = suma total de la frecuencia
Ejemplo:
En la siguiente tabla se muestra el número de hijos de 51 familias, por favor encuentre
la mediana.
Hijo (x) Número de familias (f) Frecuencia acumulada (fa)
0 7 7
1 10 17
2 15 32
3 10 42
4 7 49
5 2 51
∑ f = 51
N + 1 51 + 1
= ___________ = __________ = 26
2 2
Interpretación.- 26 corresponde a la mediana de los hijos de 51 familias.
23
c) Datos agrupados
= L1 + _(N+1/2 – S) C
f m
Donde:
= mediana
L1 = limite real inferior de la clase mediana
N = total de datos o frecuencia
f m = frecuencia de la clase mediana
C = longitud del intervalo de la clase
Ejemplo:
En la siguiente tabla, se muestran los coeficientes de 70 niños intelectuales, en una
escuela publica, por favor calcular la mediana.
Cociente intelectual (x) Frecuencia (f) Frecuencia acumulada (fa)
94 – 98 13 13
99 – 103 20 33
104 – 108 18 51
109 – 113 3 54
114 – 118 16 70
∑ f = 70
= 104 + 103 = 104 + 103 = 103.5
2 2
24
N + 1 = 70 + 1 = 71 = 35.5
2 2 2
S = 33
fm = 18
C = 4
= L1 + (N+1/2 – S) C
f m
= 103.5 + (35.5 – 33) 4
18
= 103.5 + (0.1388)4
= 104.2
Interpretación.- De los coeficientes intelectuales de 70 niños en una escuela pública, la
mediana corresponde a 104.2.
25
3.3 La Moda
Moda (x).- Número que más se repite de la serie ya sea simple, frecuencia o agrupada.
a) Datos simples
= número que más
veces se repite
Donde:
= moda
Ejemplo:
Encuentre la moda de un grupo de adolescentes, según el color de su camisa favorita.
Color de la camisa azul gris café verde
No, de
adolescentes
2 1 15 2
= número que más
veces se repite
= Café 15 veces
Interpretación.- 15 es el número que más veces se repite, lo que significa que le color
favorito de 15 adolescentes es el café.
26
b) Datos de frecuencia
= número que más
veces se repite
Donde:
= moda
Ejemplo:
Encuentre la moda de los datos de las estaturas de un grupo de 10 personas:
1.9, 1.9, 1.4, 1.5, 1.3, 1.4, 1.6, 1.2, 1.4, 1.9
∑ f = 10
= número que más
veces se repite
= 1.4 y 1.9
Interpretación.- La moda de datos en las estaturas de un grupo de 10 personas es
binominal, porque se presentan dos modas 1.4 y 1.9
Calificaciones Frecuencia
1.2 1
1.3 1
1.4 3
1.5 1
1.6 1
1.9 3
27
c) Datos agrupados
= L1 + _ ( d1 ) C
d1 + d2
Donde:
= moda
L1 = limite real inferior de la clase modal
d1 = frecuencia de la clase modal menos la frecuencia de la clase anterior
d2 = frecuencia de la clase modal menos la frecuencia de la clase siguiente
C = intervalo de la clase
Ejemplo:
Encuentre la moda de un grupo de personas de la tercera edad.
Edades (x) Frecuencia (f)
60 – 64 5
65 – 69 18
70 – 74 42
75 – 79 27
80 - 84 8
L1 = 69 + 70 = 69.5
2
C = 5
d1 = 42 – 18 = 24
d2 = 72 – 27 = 15
= L1 + _ ( d1 ) C
d1 + d2
28
= 69.5 + ( 24 ) 5
24+15
= 69.5 + ( 24 ) 5
39
= 69.5 + (0.61) 5
= 72.55
Interpretación.- La moda de las edades de un grupo de la tercera edad oscilan entre
72.55
3.4 Relación entre las medidas de tendencia central
Se relacionan la media, la mediana y la moda, coincidiendo en una sola gráfica.
Sesgo.- Es una medida que indica la forma de la curva a través del grado de asimetría
que presenta un polígono de frecuencia.
Sesgo + Sesgo -
Si el polígono esta cargado a la izquierda,
media esta más alejada al cero, esto se
llama positivamente sesgada.
Si el polígono esta cargada a la derecha, la
media está más cercana al cero, esto se
llama negativamente sesgada.
29
UNIDAD IV
MEDIDAS DE DISPERSIÓN
4.1 La Desviación Media
Desviación Media (DM/DMA) es la distancia promedio de los elementos respecto a
una medida de tendencia central como la media. La desviación media es la aritmética
de las desviaciones de los valores individuales con respecto al promedio de los datos.
a) Datos simples
∑ /x – /
DM = _______________
n
Donde:
DM = desviación media
∑ = sumatoria
/x – / = dato menos media (abs)
n = datos totales
Ejemplo:
Un comerciante compra cajas de dulces.
Chocolates 5 Chupirules 3
Tamarindos 7 Alegrías 2
Paletas 8 Cocadas 6
Dulces Cajas / x – /
Chocolates 5 5 – 5.16 =0.16
Tamarindos 7 7 – 5.16 = 1.84
30
Paletas 8 8 – 5.16 =2.84
Chupirules 3 3 – 5.16 = 2.16
Alegrías 2 2 – 5.16 = 3.16
cocadas 6 6 – 5.16 = 0.84
∑ = 11
5 + 7 + 8 + 3 + 2 + 6 11
= ____________________________ = _____ = 51.66
6 6
∑ /x – / 11
DM = _______________ = ___
N 6
DM = 1.83
Interpretación. La desviación media de un comerciante de cajas de dulces es de 1.83
b) Datos de frecuencia
∑ f /x – /
DM = _________________
N
Donde:
DM = desviación media
∑ f = sumatoria de frecuencia
/x – / = dato menos media (abs)
N = datos totales de frecuencia
31
Ejemplo:
Las calificaciones de un número de estudiantes se presentan a continuación.
Calificación (x) No alumnos (f) f * x / x – / f / x – /
5 2 10 ( –6.96)= 1.96 3.92
6 10 60 0.96 9.60
7 8 56 0.04 0.32
8 9 72 1.04 9.36
9 2 18 2.04 4.08
∑ f = 31 ∑ fx = 216 ∑f/x– / = 27.28
= 215 = 6.96
31
∑ f /x – /
DM = _________________
N
27.28
DM = _________
31
DM = 0.88
Interpretación.- La desviación media de las calificaciones de un número determinado de
alumnos es de 0.88
32
c) Datos agrupados
∑ f /m – /
DMA = _______________
N
Donde:
DMA = desviación media
∑ f = sumatoria de frecuencia
/m – / = marca de clase – media (abs)
N = datos totales de frecuencia
Ejemplo:
Encuentre la desviación media de las siguientes edades de un grupo de 180 personas
hospitalizadas por tener enfisema pulmonar.
Intervalos f m f * m / m – / f / x – /
42 – 46 2 44 88 (44-61.14) 17.14 34.28
47 – 51 9 49 441 12.14 109.26
52 – 56 31 54 1674 7.14 221.26
57 – 61 50 59 2950 2.14 107.00
62 – 66 51 64 3264 2.86 145.86
67 – 71 30 69 2070 7.86 235.80
72 - 76 7 74 518 12.86 90.02
∑f = 180 ∑fm = 11005 ∑f /x – / = 943.56
= 11005 = 61.14
180
33
∑ f /m – /
DMA = _______________
N
943.56
DMA = __________
180
DMA = 5.24
Interpretación.- La desviación media absoluta de 180 personas hospitalizadas por
tener enfisema pulmonar es de 5.24
4.2 La Varianza
La varianza (s2 / G2) mide la distancia existente entre los valores de la serie y la media.
Se usa s2 cuando se trabaja con la muestra. Se usa G2 cuando se trabaja con toda la
población.
a) Datos simples
∑ /x – /2
s2 = _______________
n
Donde:
s2 = Varianza
∑ = sumatoria
/x – /2 = (dato – media)2
n = datos totales
34
Ejemplo:
Hallar la varianza para el siguiente conjunto de datos.
30, 38, 59, 11, 15, 20, 21, 17, 12 y 22
∑ /x – /2
s2 = _______________
n
(30-245)2 + (38-245)2 + (59-245)2 + (11-245)2 + (15-245)2 + (20-245)2 +
(21-245)2 + (17-245)2
s2 = ____________________________________________________________________________________________
10
1926.5
s2 = _______________
10
s2 = 192.62
Interpretación.- La varianza de un conjunto de datos simples es de 192.62
b) Datos de frecuencia
∑ f /x – /2
s2 = _________________
N
Donde:
s2 = Varianza
∑ f = sumatoria de frecuencia
35
/x – /2 = (dato – media)2
N = datos totales de la frecuencia
Ejemplo:
Las edades de un grupo de 60 niños.
x f x * f x – /x – / /x – /2 f /x – /2
8 10 80 -3 3 9 90
10 16 160 -1 1 1 16
12 26 312 1 1 1 26
14 8 112 3 3 9 72
∑f = 60 ∑fx = 664 ∑ f /x – /2 = 204
= 664 = 11.06 = 11
60
∑ f /x – /2
s2 = _________________
N
204
s2 = ________
60
s2 = 3.4
Interpretación.- La varianza de un grupo de 60 niños es de 3.4
36
c) Datos agrupados
∑ f /x – /2
s2 = _______________
N
Donde:
s2 = Varianza
∑ f = sumatoria de frecuencia
/m – /2 = (marca de la clase – media)2
N = datos totales de la frecuencia
Ejemplo:
Hallar la varianza de un conjunto de elementos.
Datos f m f * m /m – / /m – /2 f /m – /2
1 – 20 17 10.5 178.5 34.88 1216.61 20682.37
21 – 40 7 30.5 213.5 14.88 221.41 1549.8
41 – 61 7 50.5 353.5 5.12 26.21 183.47
61 - 80 10 70.5 705 25.12 631.01 6310.1
81 - 100 9 90.5 814.5 45.12 2035.8 18322.2
∑f= 50 ∑fm=2269 ∑ f /m – /2 = 47,057.94
= 2269 = 45.38
50
∑ f /x – /2
s2 = _______________
N
37
47,057.94
s2 = _______________
50
s2 = 941.1588
Interpretación.- La varianza para datos agrupados es de 947.15
4.3 La Desviación Estándar
Desviación Media (S / G) es una medida de la fluctuación (dispersión). Es un tipo de
medida con la que se es posible comparar la variabilidad de un conjunto de datos con
otros.
a) Datos simples
√ ∑/x – /2
S = _______________
n
Donde:
S = desviación estándar
√ = raíz cuadrada
∑ = sumatoria
/x – /2 = (dato – media)2
n = datos totales
Ejemplo:
Calcular la desviación estándar para el siguiente conjunto de elementos.
5, 9, 12, 7, 15 y 3
38
= 5 + 9 + 12 + 7 + 15 +3 = 8.5
6
√ ∑/x – /2
S = _______________
N
√ (5-8.5)2 + (9-8.5)2 + (12-8.5)2 + (7-8.5)2 + (15-8.5)2 + (3-8.5)2
S = _______________________________________________________________________________
6
S = √ 16.58
S= 4.07
Interpretación.- La desviación estándar de un conjunto de datos es de 4.07
b) Datos de frecuencia
√ ∑f /x – /2
S = _________________
N
Donde:
S = desviación estándar
√ = raíz cuadrada
∑ f = sumatoria de la frecuencia
/x – /2 = (dato – media)2
N = datos totales de la frecuencia
39
Ejemplo:
De los siguientes datos de estaturas de un grupo de 60 niños calcule la desviación
estándar.
x f x * f /x – / /x – /2 f /x – /2
8 10 80 3 9 90
10 16 160 1 1 16
12 26 312 1 1 26
14 8 112 3 9 72
∑f= 60 ∑fx=664 ∑f/x – /2 = 204
= 664 = 11.06 = 11
60
√ ∑f /x – /2
S = _________________
N
√ 204
S = _________
60
S = √3.4
S = 1.84
Interpretación.- La desviación estándar para un conjunto de datos en estaturas de 60
alumnos es de 1.84
40
c) Datos agrupados
√ ∑f /m – /2
S = _________________
N
Donde:
S = desviación estándar
√ = raíz cuadrada
∑ f = sumatoria de la frecuencia
/m – /2 =(marca de la clase – media)2
N = datos totales de la frecuencia
Ejemplo:
Hallar la desviación estándar del siguiente conjunto de datos.
Datos f m f * m /m – / /m – /2 f /m – /2
1 – 20 17 10.5 178.5 34.88 1216.61 20682.37
21 – 40 7 30.5 213.5 14.88 221.41 1549.8
41 – 61 7 50.5 353.5 5.12 26.21 183.47
61 - 80 10 70.5 705 25.12 631.01 6310.1
81 - 100 9 90.5 814.5 45.12 2035.8 18322.2
∑f= 50 ∑fm=2269 ∑ f /m – /2 = 47,057.94
= 2269 = 45.38
50
√ ∑f /m – /2
S = ___________________
N
41
√ 47,057.94
S = _________________
50
S = √ 947.1588
S= 30.68
Interpretación.- La desviación estándar total de un conjunto de datos es 30.68
4.4 Coeficiente de Variación
Es un valor relativo de la desviación estándar con respecto a la medida aritmética y
nos dice que porcentaje de la media aritmética representa la desviación estándar.
S
V = ______ * 100
X
Ejemplo:
Calcular el coeficiente de variación para el siguiente conjunto de datos.
5, 9, 12, 7, 15, 3
= 5 + 9 + 12 + 7 + 15 + 3 = 8.5
6
√ (5-8.5)2 + (9-8.5)2 + (12-8.5)2 + (7-8.5)2 + (15-8.5)2 + (3-8.5)2
S = _______________________________________________________________________________
6
S = √16.58 = 4.07
S
42
V = ______ * 100
X
V = 4.07 * 100
8.5
V = 47.88 %
Interpretación.- La desviación estándar para este conjunto de datos representa el
47.88% de su media aritmética.
43
UNIDAD V
MEDIDAS DE POSICIÓN NO CENTRAL
5.1 Deciles
Son 9 valores en cada uno de ellos concentra el 10%.
5.2 Cuartiles
Son 3 valores que cada uno de ellos concentra el 25%
Son los valores de la variable que dividen en cuartos a los datos ordenados, cada
conjunto de datos posee tres cuartiles.
 El primer cuartil Q1 es un número tal que cuando mucho el 25% de los datos es
menor en valor que Q1 y cuando mucho el 75% de los datos es mayor que Q1.
 El segundo cuartil Q2 es la mediana.
 El tercer cuartil Q3 es un número tal que cuando mucho el 75% de los datos es
menor en valor que Q3 y cuando mucho el 25% de los datos es mayor de Q3.
Datos clasificados en orden decreciente
25% 25% 25% 25%
Q1 Q2 Q3
5.3 Percentiles
Son 99 el que cada uno de ellos concentra el 1%.
Son los valores de la variable que dividen a un conjunto de datos ordenados en 100
subconjuntos iguales, cada conjunto de datos tiene 99 percentiles.
El k-ésimo percentil es un valor tal que cuando mucho k% de los datos son más
pequeños en valor que pk y cuando mucho (100 – k)% de los datos es mayor.
44
 El primer cuartil y el 25avo percentil son iguales, es decir, Q1 = P25. También
Q3 = P75.
 La mediana, el segundo cuartil y el 50avo percentil son iguales
Datos clasificados en orden creciente
1% 1% 1% 1% 1% 1% 1% 1%
Mín P1 P2 P3 P4 P97 P98 P99 Máx
1. El primer cuartil y el 25vo percentil son iguales, es decir, Q1 = P25. También el
tercer cuartil y el 75vo percentil son iguales Q3 = P75.
2. La mediana, el segundo cuartil y el 50vo percentil son iguales, = Q2 = P50.
Así cuando se pida encontrar 50 o Q2 aplique el procedimiento de la mediana.
Ejemplo:
Con la muestra de 50 calificaciones del examen final del curso de estadística elemental que
se observa, determinar el primer cuartil Q1, el 58vo Percentil y el Tercer cuartil Q3, del
siguiente conjunto de datos.
60 47 82 95 88 72 67 66 68 98
90 77 86 58 84 95 74 72 88 74
77 39 90 63 68 97 70 64 70 70
58 78 89 44 55 85 82 83 72 77
72 86 50 94 920 80 91 75 76 78
Ordenación:
39 58 67 72 74 78 85 89 94
44 60 68 72 75 78 86 90 95
47 63 68 72 76 80 86 90 95
50 64 70 72 77 82 88 91 97
45
55 64 70 74 77 82 88 92 98
58 66 70 74 77 83
1) Primer cuartil
n= 50 y k=25; ya que Q1 = P25
n * k : (50)(25) = 12.5
100 100
2) Encontrar P58
n= 50 y k=58; P=58
n * k : (50)(58) = 29
100 100
3) Tercer cuartil
n= 50 y k=75; ya que Q3 = P75
Si k > 50 usar 100 – k
100-75 = 25
n * k : (50)(25) = 12.5
100 100
5.4 Cuartil medio
Es el valor numérico que está a la mitad del 1er y 3er cuartil.
Cuartil medio = Q1 + Q3 = 67 + 86 = 76.5
2 2
46
UNIDAD VI
MEDIDAS DE FORMA
6.1 Concentración
Mide si los valores de la variable están más o menos uniformemente repartidos a lo
largo de la muestra.
∑(p - q)
IG = ___________
∑ P
n1+n2+n3…
P = ___________ * 100
n
(x1n1)+(x2n2)
P = ___________________ * 100
(x1n1)+(x2n2)
El índice de Gini puede tomar valores de 0 y 1.
 IG = 0 Concentración mínima. La muestra está uniformemente repartida a todo
un rango.
 IG = 1 Concentración máxima. Un solo valor de la muestra acumulada es del
100% de los resultados.
Ejemplo:
Calcular el Índice de Gini de una serie de datos con los sueldos de una empresa en millones
de pesetas.
47
Sueldos
(x)
Frecuencia
absoluta
simple (n)
Frecuencia
acumulada
(f.a)
Frecuencia
relativa
simple (f.r)
Frecuencia
relativa
acumulada
x * n q p - q
3.5 10 10 25% 25% 35,0 13,6 10,83
4.5 12 22 30% 55% 89,0 34,6 18,97
6.0 8 30 20% 75% 147,0 57,2 19,53
8.0 5 35 12.5% 87.5% 187,0 74,8 15,84
10.0 3 38 7.5% 95% 217,0 84,4 11,19
15.0 1 39 2.5% 97.5% 232,0 90,3 7,62
20.0 1 40 2.5% 100% 257,0 100,0 0
∑ = 435,0 = 83,99
∑ (p - q)
IG = ___________
∑ P
83,99
IG = __________
435,0
IG = 0,19
Interpretación.- Indica que la muestra es bastante uniforme repartida en su nivel de
concentración no es excesivamente alto.
6.2 Asimetría
Mide si la curva tiene una forma simétrica, es decir, si respecto al centro de la misma
(centro de simetría) los segmentos de curva que quedan a la derecha e izquierda son
similares.
48
Eje de Eje de Eje de
Simetría asimetría + asimetría -
Curva simétrica Curva asimétrica negativa Curva asimétrica positiva
Para medir el nivel de asimetría utilizaos el coeficiente de Asimetría de Fisher.
(1/n) * ∑ (x – )3
P = _______________________
((1/n) * ∑ (x – )2 * n)3/2
g1 = 0 Distribución simétrica.- Existe la misma concentración de valores a la derecha y
a la izquierda de la media.
g1 > 0 Distribución asimétrica positiva.- Existe mayor concentración de valores a la
derecha de la media de la izquierda.
g1<0 Distribución asimétrica negativa.- Existe mayor concentración de valores a la
izquierda de la media que su derecha.
Ejemplo:
Calcular el coeficiente de Asimetría de Fisher en la serie de datos referidos a la estatura de
un grupo de alumnos.
x f.ab simple f.ab acumulada f.r simple f.r acumulada
1,20 1 1 3.3% 3.3%
1,21 4 5 13.3% 16.6%
1,22 4 9 13.3% 30.0%
1,23 2 11 6.6% 36.6%
49
1,24 1 12 3.3% 40.0%
1,25 2 14 6.6% 46.6%
1,26 3 17 10.0% 56.6%
1,27 3 20 10.0% 66.6%
1,28 4 24 13.3% 80.0%
1,29 3 27 10.0% 90.0%
1,30 3 30 10.0% 100.0%
Media= 1,253
(1/n) * ∑ (x – )3
P = ______________________________
((1/n) * ∑ (x – )2 * n)3/2
(1/30) * 0,000110
P = ______________________________
((1/30) * 0,030467))3/2
P = - 0,1586
Interpretación.- El coeficiente de Fisher muestra que el resultado -0,1586 representa la
distribución asimétrica negativa, lo que en la gráfica estará cargado a la izquierda.
6.3 Curtosis
Mide si los valores de distribución están más o menos concentrados alrededor.
Es el grado de alargamiento de una curva correspondiente a una distribución de
frecuencia (K). Existen 3 tipos de curva son:
1. Curva normal o curva de mesocúrtica.- Tiene um coeficiente de curtosis K igual
a 0.263.
50
2. Curva platicúrtica.- Tiene menor altura que la curva normal, su coeficiente de
curtosis es menor a 0.263.
3. Curva Leptocúrtica.- Tiene mayor altura que la altura normal, su coeficiente de
curtosis es mayor a 0.263.
Curva platicurtica Curva mesocurtica Curva leptocurtica
Reducida concentración Concentración media Concentración alta
Coeficiente de Curtosis.- Analiza el grado de concentración que representan los
valores alrededor de la zona central de distribución.
(1/n) * ∑ (x – )4 * n
P = _____________________________ -3
((1/n) * ∑ (x – )2 * n)3/2
gc = 0 Distribución mesocúrtica.
gc > 0 Distribución leptocúrtica.
gc < 0 Distribución platicúrtica.
x f.ab simple f.ab acumulada f.r simple f.r acumulada
1,20 1 1 3.3% 3.3%
1,21 4 5 13.3% 16.6%
1,22 4 9 13.3% 30.0%
1,23 2 11 6.6% 36.6%
51
1,24 1 12 3.3% 40.0%
1,25 2 14 6.6% 46.6%
1,26 3 17 10.0% 56.6%
1,27 3 20 10.0% 66.6%
1,28 4 24 13.3% 80.0%
1,29 3 27 10.0% 90.0%
1,30 3 30 10.0% 100.0%
(1/n) * ∑ (x – )4 * n
P = _____________________________ -3
((1/n) * ∑ (x – )2 * n)3/2
(1/30) * 0,00004967
P = _____________________________ -3
((1/30) * 0,3046667
P = -1,39
Interpretación.- Se trata de una distribución platicúrtica.
6.4 El Teorema de Chebyshev
Establece una relación entre el % mínimo de datos que se concentran alrededor de la
media tomando kG a la derecha y kG a la izquierda y se expresa:
Para cualquier serie de datos podemos establecer que el % mínimo de datos
comprendidos en el intervalo para cualquier serie de datos podemos establecer que el
% mínimo de datos comprendidos en el intervalo.
+ - KG
52
(1 – 1 ) %
K2
Para K = 2 este por ciento mínimo establecido es de 75%.
Para K = 3 este por ciento mínimo establecido es de 88%.
53
UNIDAD VII
LA CORRELACIÓN LINEAL
7.1 La Correlación lineal
El objetivo es medir la intensidad de una regresión lineal entre dos variables. Se
analizan algunos diagramas de dispersión que muestran diferentes relaciones entre
variables independientes (o de entrada) y variables dependientes (o de salida).
Si crece independiente (x), no cambia dependiente (y).- No hay correlación.
Si crece independiente (x), y crece dependiente (y).- Hay correlación.
 Correlación Positiva.- Significa que los individuos que obtienen puntuaciones
altas en una variable, tienden a obtener puntuaciones altas en la otra.
 Correlación Negativa.- Significa que los individuos que obtienen puntuación
baja en una variable tienden a obtener puntuación alta en la segunda variable.
No hay correlación Correlación positiva Correlación positiva alta
Correlación negativa Correlación negativa alta
54
Correlación positiva perfecta Correlación negativa perfecta
Horizontal: no hay correlación Vertical: no hay Correlación
No hay correlación lineal
55
Regresión curvilinea No hay relación
7.2 El coeficiente de correlación lineal
Es la medida numérica de la intensidad de la relación lineal entre dos variables.
El coeficiente refleja la consistencia del efecto que el cambio en una variable tiene
sobre la otra.
El valor del coeficiente de correlación lineal ayuda a responder a la pregunta ¿existe
una correlación lineal entre las dos variables en consideración?
El coeficiente de correlación lineal (r) siempre tiene un valor entre -1 y +1
Valor -1.- Indica una correlación negativa perfecta.
Valor +1.- Significa una correlación positiva perfecta.
Ejemplo:
Valor + de r.- Edad y altura de un niño, a medida que aumenta de edad se vuelve más
alto.
Valor – de r.- Antigüedad y valor de reventa de un automóvil, a media que envejece el
automóvil su reventa disminuye.
El valor de r está redefinido por la formula del coeficiente de Correlación de Pearson.
56
7.3 Coeficiente de correlación de Pearson
Se utiliza para medir la relación entre dos variables; se representa como r (para
muestras) y p (ro para la población).
Suma de cuadrados de XY
r = ______________________________________________________________
√(suma de cuadrados de X) (suma de cuadrados de Y)
(Suma de Y)2
Suma de cuadrados de y = ________________________________
n
(Suma de X) (Suma Y)
Suma de cuadrados de XY = suma de XY - ____________________________
n
El valor de r es un número que varia de -1 a 1
Ejemplo:
La siguiente tabla muestra las utilidades de una compañía en millones de dólares en
siete años de existencia, por lo que desea saber la relación que existe entre las
utilidades dela compañía y los años de antigüedad de ésta.
Año (x) Utilidades (y)
1 6.7
2 7.5
3 8.3
4 10.2
57
5 11.1
6 12.5
7 14.6
X Y X * Y X2 Y2
1 6.7 6.7 1 44.89
2 7.5 15.0 4 56.25
3 8.3 24.9 9 68.89
4 10.2 40.8 16 104.04
5 11.1 55.5 25 123.21
6 12.5 75.0 36 156.25
7 14.6 102.2 49 213.16
∑X=28 ∑Y=70.9 ∑XY= 319.9 ∑X2= 140 ∑Y2= 7696.69
Utilidades
15
12
9
6
1 2 3 4 5 6 7 8 Año
SCX = ∑x2 – (∑(X))2
n
SCX = 140 – (28)2 = 28
7
58
SCY = ∑Y2 – (∑(Y))2
n
SCX = 766.69 – (70.9)2 = 48.57
7
SC(XY) = ∑XY – (∑X∑Y)
n
SC(XY) = 319.9 – (28)(70.9)= 28
7
r = _____________ Suma de cuadrados de XY _____________________
√(suma de cuadrados de X) (suma de cuadrados de Y)
r = ___________36.3 _______
√(28) (48.57)
r = ____ ____36.3 _____
√1,359.96
r = _____36.3 ____
36.88
r = 0.98
Interpretación.- Este valor al ser muy cercano a uno, indica que existe una fuerte
correlación lineal, lo que significa que la utilidad de la Cía, depende casi en un 100% de
la antigüedad de esta.
59
7.4 La Regresión Lineal
La regresión estudia la relación entre dos variables (X, Y) restringiendo una de la otra,
la cual lleva el nombre de variable dependiente. El valor de la otra variable se llama
independiente.
La regresión lineal es un método estadístico que se emplea para predecir el valor de
una variable Y, en función de otra variable X o cuando X y Y están correlacionadas.
El análisis de la regresión lineal encuentra la ecuación de la recta que describe mejor
la relación entre dos variables, una aplicación de esta ecuación es hacer Predicciones.
El mejor ajuste, representa el valor estimado de Y corresponde a una partícula de X, el
método que se utiliza para obtener la recta de mejor ajuste es el de mínimos
cuadrados.
= mx + b
Suma de cuadrados de X-Y
m = ____________________________________________
Suma de cuadrados de X
SC (XY) SC (XY) ∑ XY - ∑(X) ∑(y)
n
60
m = __________ ______ = _______________ = _______________________
SC (X) SC (X) ∑X2 – (∑(n)2
n
(Suma de Y) - ((pendiente)(suma de x))
b = _________________________________________________
número
(S Y) – ((m) (S X))
b = __________________________________
#
Una manera para verificar el ejercicio, es trazando el diagrama de dispersión y
observar si los puntos en el diagrama sugerir si una relación lineal es procedente al
cálculo de la recta de mejor ajuste.
15
12
9
6
1 2 3 4 5 6 7 8
61
Recta de mejor ajuste.- Son los valores positivos que se encuentran en la línea azul y
los negativos en la verde, si la recta es la de mejor ajuste, la suma de los cuadrados de
estas y las diferencias, se minimizan, se hace lo más pequeña posible.
15
12
9
6
1 2 3 4 5 6 7 8
15
12
9
6
1 2 3 4 5 6 7 8
Recta de # del mejor ajuste.- Puntos distintivos
62
Ejemplo:
Con el fin de aplicar las formulas anteriores. A continuación se presentan los datos
correspondientes a las calificaciones obtenidas en un examen de ingreso
correspondiente a la universidad, en escala de cero al cien, y las calificaciones
promedio obtenidas en el primer semestre de la carrera de economía en la
universidad en una escala del cero al cuatro.
Examen de
ingreso (x)
Calificaciones
promedio (y)
x * y X2 (x * y)2
40 0.8 32.0 1600 1,024
48 1.2 57.6 2304 3,317.76
53 1.5 79.5 2809 6,320.25
55 1.6 88.0 3025 7,744
62 2.0 124.0 3844 15,376
65 2.7 175.5 4225 30,800.25
66 2.1 138.6 4356 19,209.96
68 2.4 163.2 4624 26,634.24
70 2.6 182.0 4900 33,124
72 2.0 144.0 5184 20,736
75 2.7 202.5 5625 41,006.25
75 3.2 240.0 5625 57,600
76 2.9 220.4 5776 48,576.16
80 3.0 240.0 6400 57,600
86 3.5 301.0 7396 90,601
∑x= 991 ∑y= 34.2 ∑xy= 2388.3 ∑xy= 67693
SC(XY) = ∑XY - ∑(X) ∑(Y)
n
SC(XY) = 2388.3 – (991)(34.2)
15
63
SC(XY) = 2388.3 – 2,259.48
SC(XY) = 128.82
SC(X) = ∑X2 - ∑(X)2
N
SC(X) = 67693 - (991)2
15
SC(X) = 67693 – 65,475.01
SC(X) = 2,220.93
SC (XY)
m = __________
S( X)
128.82
m = __________
2,220.93
m = 0.058 (TAMBIÉN SE CONOCE COMO PENDIENTE)
(S Y) – ((m) (S X))
b = _______________________
#
(34.2) – ((0.058) (991))
b = _____________________________
15
64
34.2 – 57.478
b = __________________
15
- 23.278
b = __________________
15
b = -1.55 (También se le conoce como Ordenada al origen o Intercepto).
= mx + b
= 0.058 X + (-1.55)
= 0.058 X - 1.55 recta del mejor ajuste
Supongamos que las calificaciones en el examen de ingreso fueron de 45, entonces:
= mx + b
= 0.058(45) + (-1.55)
= 2.61 – 1.55
= 1.06
Interpretación.- Se predice una calificación de 1.06, cualquier predicción basada en
rectas de mínimos cuadrados deberá considerarse promedio.
65
4
3 (85, 3.38)
(78, 2.97)
2
1 (45, 1.06)
40 45 55 60 65 70 75 80 85 90
66
BIBLIOGRAFÍA
BIBLIOGRAFÍA BÁSICA
Anderson Sweeney, Williams (2005). Estadística para Administración y Economía.
Editorial Thomson. México.
Chistensen (1990). Estadística Paso a Paso. 3ra edición. Editorial Trillas. México.
Kuby, Johnson (2001). Estadística Elemental. Editorial Math.
Quesada López, Isidoro (1989). Curso de Ejercicios de Estadística. Editorial Alhambra.
México.
Robles Almeraya, Gloria (1995). Estadística Descriptiva e Inferencial I. Teoría y
Práctica. Editorial McGraw-Hill. México.
Ruíz Camacho, Morcillo y García Galisteo, Julio (2000. Curso de Probabilidad y
Estadística. Editorial la Malaga. Manuales de España.
Mate Jimenez, Sarabia (1993). Estadística Descriptiva. Elementos teóricos, cuestiones
y aplicaciones. Editorial CLAGSA.
Sote, Arturo (S.F). Principios de Estadística. Caracas: Panapo de Venezuela.
BIBLIOGRAFÍA COMPLEMENTARIA
Conceptos básicos de Estadística (S.F). Texto completo en
http://www.gestiopolis.com/recursos/experto/catsexp/pagans/eco/44/estadistica.h
tm
67
Estadística.
Apuntes de investigación y divulgación científica.
© Consultoría de Servicios para Gobiernos y Estudios Legislativos.
Prolongación Paseo de la Reforma No. 530, 2º piso,
Delegación Álvaro Obregón, C.P. 01219.
Ciudad de México, Distrito Federal.
Primera edición: marzo de 2007.
Autor: Alberto Vega Hernández.
Las opiniones vertidas de estos apuntes son responsabilidad del autor.
Manual de distribución gratuita, prohibida su venta.
Impreso en México.

Más contenido relacionado

Similar a estadistica basica ejercicios y ejemplos basicos

SEGUNDA MEDICIÓN DEL ESTUDIO SOBRE TOLERANCIA SOCIAL E INSTITUCIONAL DE LAS V...
SEGUNDA MEDICIÓN DEL ESTUDIO SOBRE TOLERANCIA SOCIAL E INSTITUCIONAL DE LAS V...SEGUNDA MEDICIÓN DEL ESTUDIO SOBRE TOLERANCIA SOCIAL E INSTITUCIONAL DE LAS V...
SEGUNDA MEDICIÓN DEL ESTUDIO SOBRE TOLERANCIA SOCIAL E INSTITUCIONAL DE LAS V...Natalia G.
 
Principales Caracteristicas Demograficas de Galapagos
Principales Caracteristicas Demograficas de GalapagosPrincipales Caracteristicas Demograficas de Galapagos
Principales Caracteristicas Demograficas de GalapagosCarlos Mena
 
Tendencia Jurisprudencial Constitucionaly el debido proceso en materia de imp...
Tendencia Jurisprudencial Constitucionaly el debido proceso en materia de imp...Tendencia Jurisprudencial Constitucionaly el debido proceso en materia de imp...
Tendencia Jurisprudencial Constitucionaly el debido proceso en materia de imp...Ruperto1968
 
Argentina.nacimiento de un país
Argentina.nacimiento de un paísArgentina.nacimiento de un país
Argentina.nacimiento de un paísCecilia Franco
 
Funciones estadisticas y_analisis_de_datos
Funciones estadisticas y_analisis_de_datosFunciones estadisticas y_analisis_de_datos
Funciones estadisticas y_analisis_de_datossara sara
 
Politicas e instituciones ilpes
Politicas e instituciones  ilpesPoliticas e instituciones  ilpes
Politicas e instituciones ilpesConectaDEL
 
Modulo fisica 1_año
Modulo fisica 1_añoModulo fisica 1_año
Modulo fisica 1_añoraphot
 
HACIA UNA EVALUACIÓN RACIONAL DE LAS LEYES PENALES. DIRECTORES: Adán Nieto Ma...
HACIA UNA EVALUACIÓN RACIONAL DE LAS LEYES PENALES. DIRECTORES: Adán Nieto Ma...HACIA UNA EVALUACIÓN RACIONAL DE LAS LEYES PENALES. DIRECTORES: Adán Nieto Ma...
HACIA UNA EVALUACIÓN RACIONAL DE LAS LEYES PENALES. DIRECTORES: Adán Nieto Ma...Marcial Pons Argentina
 
Informe: infancias vulnerables
Informe: infancias vulnerablesInforme: infancias vulnerables
Informe: infancias vulnerablesAtir Orúa
 
Relatos-del-Corredor.pdf
Relatos-del-Corredor.pdfRelatos-del-Corredor.pdf
Relatos-del-Corredor.pdfEvaTaquia
 
El desafío hacia el gobierno abierto en la hora de igualdad. Cepal (2012).
El desafío hacia el gobierno abierto en la hora de igualdad. Cepal (2012).El desafío hacia el gobierno abierto en la hora de igualdad. Cepal (2012).
El desafío hacia el gobierno abierto en la hora de igualdad. Cepal (2012).Elizdee Burgos
 
Telefonia Movil Y Desarrollo Financiero En America Latina
Telefonia Movil Y Desarrollo Financiero En America LatinaTelefonia Movil Y Desarrollo Financiero En America Latina
Telefonia Movil Y Desarrollo Financiero En America LatinaDeepSmarts
 
3. linea base
3.  linea base3.  linea base
3. linea basecvillalva
 

Similar a estadistica basica ejercicios y ejemplos basicos (20)

SEGUNDA MEDICIÓN DEL ESTUDIO SOBRE TOLERANCIA SOCIAL E INSTITUCIONAL DE LAS V...
SEGUNDA MEDICIÓN DEL ESTUDIO SOBRE TOLERANCIA SOCIAL E INSTITUCIONAL DE LAS V...SEGUNDA MEDICIÓN DEL ESTUDIO SOBRE TOLERANCIA SOCIAL E INSTITUCIONAL DE LAS V...
SEGUNDA MEDICIÓN DEL ESTUDIO SOBRE TOLERANCIA SOCIAL E INSTITUCIONAL DE LAS V...
 
Principales Caracteristicas Demograficas de Galapagos
Principales Caracteristicas Demograficas de GalapagosPrincipales Caracteristicas Demograficas de Galapagos
Principales Caracteristicas Demograficas de Galapagos
 
Tendencia Jurisprudencial Constitucionaly el debido proceso en materia de imp...
Tendencia Jurisprudencial Constitucionaly el debido proceso en materia de imp...Tendencia Jurisprudencial Constitucionaly el debido proceso en materia de imp...
Tendencia Jurisprudencial Constitucionaly el debido proceso en materia de imp...
 
Iepds 2018
Iepds 2018Iepds 2018
Iepds 2018
 
Informe anual 2010
Informe anual 2010Informe anual 2010
Informe anual 2010
 
2 elementos de economía
2 elementos de economía2 elementos de economía
2 elementos de economía
 
Argentina.nacimiento de un país
Argentina.nacimiento de un paísArgentina.nacimiento de un país
Argentina.nacimiento de un país
 
Funciones estadisticas y_analisis_de_datos
Funciones estadisticas y_analisis_de_datosFunciones estadisticas y_analisis_de_datos
Funciones estadisticas y_analisis_de_datos
 
Politicas e instituciones ilpes
Politicas e instituciones  ilpesPoliticas e instituciones  ilpes
Politicas e instituciones ilpes
 
Modulo fisica 1_año
Modulo fisica 1_añoModulo fisica 1_año
Modulo fisica 1_año
 
HACIA UNA EVALUACIÓN RACIONAL DE LAS LEYES PENALES. DIRECTORES: Adán Nieto Ma...
HACIA UNA EVALUACIÓN RACIONAL DE LAS LEYES PENALES. DIRECTORES: Adán Nieto Ma...HACIA UNA EVALUACIÓN RACIONAL DE LAS LEYES PENALES. DIRECTORES: Adán Nieto Ma...
HACIA UNA EVALUACIÓN RACIONAL DE LAS LEYES PENALES. DIRECTORES: Adán Nieto Ma...
 
Caracteristicas chimaltenango 2013
Caracteristicas chimaltenango 2013Caracteristicas chimaltenango 2013
Caracteristicas chimaltenango 2013
 
Informe: infancias vulnerables
Informe: infancias vulnerablesInforme: infancias vulnerables
Informe: infancias vulnerables
 
Relatos-del-Corredor.pdf
Relatos-del-Corredor.pdfRelatos-del-Corredor.pdf
Relatos-del-Corredor.pdf
 
La Democracia del Nuevo Milenio
La Democracia del Nuevo MilenioLa Democracia del Nuevo Milenio
La Democracia del Nuevo Milenio
 
Enero_23.pdf
Enero_23.pdfEnero_23.pdf
Enero_23.pdf
 
Política de Gestión de Residuos
Política de Gestión de ResiduosPolítica de Gestión de Residuos
Política de Gestión de Residuos
 
El desafío hacia el gobierno abierto en la hora de igualdad. Cepal (2012).
El desafío hacia el gobierno abierto en la hora de igualdad. Cepal (2012).El desafío hacia el gobierno abierto en la hora de igualdad. Cepal (2012).
El desafío hacia el gobierno abierto en la hora de igualdad. Cepal (2012).
 
Telefonia Movil Y Desarrollo Financiero En America Latina
Telefonia Movil Y Desarrollo Financiero En America LatinaTelefonia Movil Y Desarrollo Financiero En America Latina
Telefonia Movil Y Desarrollo Financiero En America Latina
 
3. linea base
3.  linea base3.  linea base
3. linea base
 

Último

MARKETING SENSORIAL -GABRIELA ARDON .pptx
MARKETING SENSORIAL -GABRIELA ARDON .pptxMARKETING SENSORIAL -GABRIELA ARDON .pptx
MARKETING SENSORIAL -GABRIELA ARDON .pptxgabyardon485
 
Presentación de la empresa polar, estados financieros
Presentación de la empresa polar, estados financierosPresentación de la empresa polar, estados financieros
Presentación de la empresa polar, estados financierosmadaloga01
 
cuadro sinoptico tipos de organizaci.pdf
cuadro sinoptico tipos de organizaci.pdfcuadro sinoptico tipos de organizaci.pdf
cuadro sinoptico tipos de organizaci.pdfjesuseleazarcenuh
 
MARKETING SENSORIAL CONTENIDO, KARLA JANETH
MARKETING SENSORIAL CONTENIDO, KARLA JANETHMARKETING SENSORIAL CONTENIDO, KARLA JANETH
MARKETING SENSORIAL CONTENIDO, KARLA JANETHkarlinda198328
 
instrumentos de mercados financieros para estudiantes
instrumentos de mercados financieros  para estudiantesinstrumentos de mercados financieros  para estudiantes
instrumentos de mercados financieros para estudiantessuperamigo2014
 
diseño de redes en la cadena de suministro.pptx
diseño de redes en la cadena de suministro.pptxdiseño de redes en la cadena de suministro.pptx
diseño de redes en la cadena de suministro.pptxjuanleivagdf
 
ANÁLISIS CAME, DIAGNOSTICO PUERTO DEL CALLAO
ANÁLISIS CAME, DIAGNOSTICO  PUERTO DEL CALLAOANÁLISIS CAME, DIAGNOSTICO  PUERTO DEL CALLAO
ANÁLISIS CAME, DIAGNOSTICO PUERTO DEL CALLAOCarlosAlbertoVillafu3
 
1.- PLANIFICACIÓN PRELIMINAR DE AUDITORÍA.pptx
1.- PLANIFICACIÓN PRELIMINAR DE AUDITORÍA.pptx1.- PLANIFICACIÓN PRELIMINAR DE AUDITORÍA.pptx
1.- PLANIFICACIÓN PRELIMINAR DE AUDITORÍA.pptxCarlosQuionez42
 
Efectos del cambio climatico en huanuco.pptx
Efectos del cambio climatico en huanuco.pptxEfectos del cambio climatico en huanuco.pptx
Efectos del cambio climatico en huanuco.pptxCONSTRUCTORAEINVERSI3
 
TEMA 6.- MAXIMIZACION DE LA CONDUCTA DEL PRODUCTOR.pptx
TEMA 6.- MAXIMIZACION DE LA CONDUCTA DEL PRODUCTOR.pptxTEMA 6.- MAXIMIZACION DE LA CONDUCTA DEL PRODUCTOR.pptx
TEMA 6.- MAXIMIZACION DE LA CONDUCTA DEL PRODUCTOR.pptxFrancoSGonzales
 
COPASST Y COMITE DE CONVIVENCIA.pptx DE LA EMPRESA
COPASST Y COMITE DE CONVIVENCIA.pptx DE LA EMPRESACOPASST Y COMITE DE CONVIVENCIA.pptx DE LA EMPRESA
COPASST Y COMITE DE CONVIVENCIA.pptx DE LA EMPRESADanielAndresBrand
 
Presentación La mujer en la Esperanza AC.pptx
Presentación La mujer en la Esperanza AC.pptxPresentación La mujer en la Esperanza AC.pptx
Presentación La mujer en la Esperanza AC.pptxDanielFerreiraDuran1
 
Clima-laboral-estrategias-de-medicion-e-book-1.pdf
Clima-laboral-estrategias-de-medicion-e-book-1.pdfClima-laboral-estrategias-de-medicion-e-book-1.pdf
Clima-laboral-estrategias-de-medicion-e-book-1.pdfConstructiva
 
PLAN LECTOR JOSÉ MARÍA ARGUEDAS (1).docx
PLAN LECTOR JOSÉ MARÍA ARGUEDAS (1).docxPLAN LECTOR JOSÉ MARÍA ARGUEDAS (1).docx
PLAN LECTOR JOSÉ MARÍA ARGUEDAS (1).docxwilliamzaveltab
 
informacion-finanTFHHETHAETHciera-2022.pdf
informacion-finanTFHHETHAETHciera-2022.pdfinformacion-finanTFHHETHAETHciera-2022.pdf
informacion-finanTFHHETHAETHciera-2022.pdfPriscilaBermello
 
gua de docente para el curso de finanzas
gua de docente para el curso de finanzasgua de docente para el curso de finanzas
gua de docente para el curso de finanzassuperamigo2014
 
Continex para educación, Portafolio de servicios
Continex para educación, Portafolio de serviciosContinex para educación, Portafolio de servicios
Continex para educación, Portafolio de serviciosFundación YOD YOD
 
AUDITORIAS en enfermeria hospitalaria .pptx
AUDITORIAS en enfermeria hospitalaria .pptxAUDITORIAS en enfermeria hospitalaria .pptx
AUDITORIAS en enfermeria hospitalaria .pptxMatiasGodoy33
 
PPT DIAGNOSTICO DAFO Y CAME MEGAPUERTO CHANCAY
PPT DIAGNOSTICO DAFO Y CAME MEGAPUERTO CHANCAYPPT DIAGNOSTICO DAFO Y CAME MEGAPUERTO CHANCAY
PPT DIAGNOSTICO DAFO Y CAME MEGAPUERTO CHANCAYCarlosAlbertoVillafu3
 

Último (20)

MARKETING SENSORIAL -GABRIELA ARDON .pptx
MARKETING SENSORIAL -GABRIELA ARDON .pptxMARKETING SENSORIAL -GABRIELA ARDON .pptx
MARKETING SENSORIAL -GABRIELA ARDON .pptx
 
Presentación de la empresa polar, estados financieros
Presentación de la empresa polar, estados financierosPresentación de la empresa polar, estados financieros
Presentación de la empresa polar, estados financieros
 
cuadro sinoptico tipos de organizaci.pdf
cuadro sinoptico tipos de organizaci.pdfcuadro sinoptico tipos de organizaci.pdf
cuadro sinoptico tipos de organizaci.pdf
 
MARKETING SENSORIAL CONTENIDO, KARLA JANETH
MARKETING SENSORIAL CONTENIDO, KARLA JANETHMARKETING SENSORIAL CONTENIDO, KARLA JANETH
MARKETING SENSORIAL CONTENIDO, KARLA JANETH
 
instrumentos de mercados financieros para estudiantes
instrumentos de mercados financieros  para estudiantesinstrumentos de mercados financieros  para estudiantes
instrumentos de mercados financieros para estudiantes
 
diseño de redes en la cadena de suministro.pptx
diseño de redes en la cadena de suministro.pptxdiseño de redes en la cadena de suministro.pptx
diseño de redes en la cadena de suministro.pptx
 
ANÁLISIS CAME, DIAGNOSTICO PUERTO DEL CALLAO
ANÁLISIS CAME, DIAGNOSTICO  PUERTO DEL CALLAOANÁLISIS CAME, DIAGNOSTICO  PUERTO DEL CALLAO
ANÁLISIS CAME, DIAGNOSTICO PUERTO DEL CALLAO
 
1.- PLANIFICACIÓN PRELIMINAR DE AUDITORÍA.pptx
1.- PLANIFICACIÓN PRELIMINAR DE AUDITORÍA.pptx1.- PLANIFICACIÓN PRELIMINAR DE AUDITORÍA.pptx
1.- PLANIFICACIÓN PRELIMINAR DE AUDITORÍA.pptx
 
Efectos del cambio climatico en huanuco.pptx
Efectos del cambio climatico en huanuco.pptxEfectos del cambio climatico en huanuco.pptx
Efectos del cambio climatico en huanuco.pptx
 
Walmectratoresagricolas Trator NH TM7040.pdf
Walmectratoresagricolas Trator NH TM7040.pdfWalmectratoresagricolas Trator NH TM7040.pdf
Walmectratoresagricolas Trator NH TM7040.pdf
 
TEMA 6.- MAXIMIZACION DE LA CONDUCTA DEL PRODUCTOR.pptx
TEMA 6.- MAXIMIZACION DE LA CONDUCTA DEL PRODUCTOR.pptxTEMA 6.- MAXIMIZACION DE LA CONDUCTA DEL PRODUCTOR.pptx
TEMA 6.- MAXIMIZACION DE LA CONDUCTA DEL PRODUCTOR.pptx
 
COPASST Y COMITE DE CONVIVENCIA.pptx DE LA EMPRESA
COPASST Y COMITE DE CONVIVENCIA.pptx DE LA EMPRESACOPASST Y COMITE DE CONVIVENCIA.pptx DE LA EMPRESA
COPASST Y COMITE DE CONVIVENCIA.pptx DE LA EMPRESA
 
Presentación La mujer en la Esperanza AC.pptx
Presentación La mujer en la Esperanza AC.pptxPresentación La mujer en la Esperanza AC.pptx
Presentación La mujer en la Esperanza AC.pptx
 
Clima-laboral-estrategias-de-medicion-e-book-1.pdf
Clima-laboral-estrategias-de-medicion-e-book-1.pdfClima-laboral-estrategias-de-medicion-e-book-1.pdf
Clima-laboral-estrategias-de-medicion-e-book-1.pdf
 
PLAN LECTOR JOSÉ MARÍA ARGUEDAS (1).docx
PLAN LECTOR JOSÉ MARÍA ARGUEDAS (1).docxPLAN LECTOR JOSÉ MARÍA ARGUEDAS (1).docx
PLAN LECTOR JOSÉ MARÍA ARGUEDAS (1).docx
 
informacion-finanTFHHETHAETHciera-2022.pdf
informacion-finanTFHHETHAETHciera-2022.pdfinformacion-finanTFHHETHAETHciera-2022.pdf
informacion-finanTFHHETHAETHciera-2022.pdf
 
gua de docente para el curso de finanzas
gua de docente para el curso de finanzasgua de docente para el curso de finanzas
gua de docente para el curso de finanzas
 
Continex para educación, Portafolio de servicios
Continex para educación, Portafolio de serviciosContinex para educación, Portafolio de servicios
Continex para educación, Portafolio de servicios
 
AUDITORIAS en enfermeria hospitalaria .pptx
AUDITORIAS en enfermeria hospitalaria .pptxAUDITORIAS en enfermeria hospitalaria .pptx
AUDITORIAS en enfermeria hospitalaria .pptx
 
PPT DIAGNOSTICO DAFO Y CAME MEGAPUERTO CHANCAY
PPT DIAGNOSTICO DAFO Y CAME MEGAPUERTO CHANCAYPPT DIAGNOSTICO DAFO Y CAME MEGAPUERTO CHANCAY
PPT DIAGNOSTICO DAFO Y CAME MEGAPUERTO CHANCAY
 

estadistica basica ejercicios y ejemplos basicos

  • 1. 1 Estadística Alberto Vega Hernández Consultoría de Servicios para Gobiernos y Estudios Legislativos Apuntes de Investigación y divulgación científica 1
  • 2. 2
  • 3. 3 Estadística. Apuntes de investigación y divulgación científica. © Consultoría de Servicios para Gobiernos y Estudios Legislativos. Prolongación Paseo de la Reforma No. 530, 2º piso, Delegación Álvaro Obregón, C.P. 01219. Ciudad de México, Distrito Federal. Primera edición: marzo de 2007. Autor: Alberto Vega Hernández. Las opiniones vertidas de estos apuntes son responsabilidad del autor. Manual de distribución gratuita, prohibida su venta. Impreso en México.
  • 4. 4
  • 5. 5 Contenido UNIDAD I INTRODUCCIÓN A LA ESTADÍSTICA 1.1 Definición de Estadística.......................................................................................................................8 1.1.1 La Estadística Descritiva...........................................................................................................8 1.1.2 La Estadística Inferencial .........................................................................................................8 1.2 La encuesta ..................................................................................................................................................8 1.3 La población................................................................................................................................................8 1.4 La muestra....................................................................................................................................................9 1.5 La variable....................................................................................................................................................9 1.6 La variable discreta................................................................................................................................10 1.7 La variable continua..............................................................................................................................10 1.8 El dato y los datos...................................................................................................................................10 1.9 El experimento.........................................................................................................................................10 1.10 El parámetro...........................................................................................................................................10 UNIDAD II REPRESENTACIÓN DE GRÁFICAS DE DATOS 2.1 La gráfica.....................................................................................................................................................11 2.2 Diagramas de pastel ..............................................................................................................................11 2.3 Graficas de barras...................................................................................................................................11 2.4 Diagramas de Pareto.............................................................................................................................12 2.5 Distribución de frecuencias...............................................................................................................13 a) Método simple...................................................................................................................................13 b) Método complejo..............................................................................................................................14
  • 6. 6 UNIDAD III MEDIDAS DE TENDENCIA CENTRAL 3.1 La Media......................................................................................................................................................17 a) Datos simples.....................................................................................................................................17 b) Datos de frecuencia.........................................................................................................................18 c) Datos agrupados...............................................................................................................................19 3.2 La Mediana.................................................................................................................................................21 a) Datos simples.....................................................................................................................................21 b) Datos de frecuencia.........................................................................................................................22 c) Datos agrupados...............................................................................................................................23 3.3 La Moda.......................................................................................................................................................25 a) Datos simples.....................................................................................................................................25 b) Datos de frecuencia.........................................................................................................................26 c) Datos agrupados...............................................................................................................................27 3.3 Relación entre las medidas de tendencia central....................................................................28 UNIDAD IV MEDIDAS DE DISPERSIÓN 4.1 La Desviación Media..............................................................................................................................29 a) Datos simples.....................................................................................................................................29 b) Datos de frecuencia.........................................................................................................................30 c) Datos agrupados...............................................................................................................................32 4.2 La Varianza ................................................................................................................................................33 a) Datos simples.....................................................................................................................................33 b) Datos de frecuencia.........................................................................................................................34 c) Datos agrupados...............................................................................................................................36 4.3 La Desviación Estandar........................................................................................................................37 a) Datos simples.....................................................................................................................................37 b) Datos de frecuencia.........................................................................................................................38
  • 7. 7 c) Datos agrupados...............................................................................................................................40 4.4 Coeficiente de Variación......................................................................................................................41 UNIDAD V MEDIDAS DE POSICIÓN NO CENTRAL 5.1 Deciles..........................................................................................................................................................43 5.2 Cuartiles ......................................................................................................................................................43 5.3 Percentiles..................................................................................................................................................43 5.4 Cuartil medio ............................................................................................................................................45 UNIDAD VI MEDIDAS DE FORMA 6.1 Concentración...........................................................................................................................................46 6.2 Asimetría.....................................................................................................................................................47 6.3 Curtosis........................................................................................................................................................49 6.4 El Teorema de Chebyshev ..................................................................................................................51 UNIDAD VII LA CORRELACIÓN LINEAL 7.1 La Correlación Lineal............................................................................................................................53 7.2 El coeficinete de correlación lineal ................................................................................................55 7.3 Coeficinete de correlación de Pearson .........................................................................................56 7.4 La Regresión Lineal................................................................................................................................59 Bibliografía ............................................................................................................................66
  • 8. 8 UNIDAD I INTRODUCCIÓN A LA ESTADÍSTICA 1.1 Definición de Estadística Ciencia que se encarga de la recolección, descripción e interpretación datos. Nos permite realizar gráficas y su fin es el análisis para tomar decisiones. 1.1.1 La Estadística Descriptiva Conjunto de procedimientos secuenciales, recolección, organización y análisis de información cuya finalidad es la presentación simplificada cuya mejor interpretación ayude a tomar decisiones. La estadística descriptiva utiliza el método deductivo, que va de la población a la muestra. 1.1.2 La Estadística Inferencial Conjunto de procedimientos basados en la Teoría de la probabilidad permite hacer inferencia sobre características de la población tomando en ella una muestra y así ayuda a tomar decisiones en sistemas de incertidumbre. La estadística inferencial utiliza el método deductivo.- Que va de la muestra a la población. 1.2 La encuesta Es un cuestionario elaborado para obtener información, que se puede expresar mediante números tabulares. 1.3 La población Conjunto de individuos, objetos o medidas que tiene alguna característica.
  • 9. 9 1.4 La muestra Subconjunto de la población.  Marco muestral.- Es una lista de elementos que pertenecen a la población de la cual se obtendrá una muestra.  Muestra probabilística.- Son muestras en que los elementos a seleccionar se obtienen con base en la probabilidad. Cada elemento de una población tiene cierta probabilidad de ser elegido como parte importante.  Muestra aleatoria simple.- Muestra seleccionada de modo que todos los elementos de la población tienen la misma probabilidad de ser elegidos.  Muestra sistemática.- Muestra en la cual se seleccionada todo k-ésimo elemento del marco muestral, empezando como primer elemento que se elige de manera aleatoria.  Muestra aleatoria estratificada.- Muestra que se obtiene al estratificar el marco muestral, y luego se selecciona un número fijo de elementos de cada uno de los estratos por medio de una técnica de muestreo aleatorio simple. 1.5 La variable Característica que al ser medida en diferentes individuos es susceptible de adoptar diferentes valores. Existen diferentes tipos de variables:  La variable cualitativa.- Variable que clasifica o describe un elemento de una población. En esta no se pude medir numéricamente (color de un coche, nacionalidad, color de la piel, sexo).  La variable cuantitativa.- Variable que cuantifica un elemento de una población. Tiene un valor numérico (como ejemplo: peso, longitud, nacionalidad, etcétera).  La variable nominal.- Variable cualitativa que describe o identifica un elemento de una población. Para datos resultantes de variable nominal, las operaciones aritméticas no sólo carecen de sentido: tampoco es posible asignar un orden a las categorías.
  • 10. 10  La variable ordinal.- Es una variable cualitativa que presenta una posición, o clasificación ordenada. 1.6 La variable discreta Sólo puede tomar valores enteros y exactos 1, 2, 3, 4. Ejemplo: número de hijos en una familia, número de personas en una empresa. 1.7 La variable continua Puede asumir cualquier valor. Sin importar el tamaño. Por ejemplo: ingreso, estaturas, edades. La variable continua se divide en:  Variable numérica.- Cuando los valores son números.  Variable nominal.- Cuando los valores son palabras. 1.8 El dato y los datos El dato se refiere al valor de la variable asociada a un elemento de una población o muestra. Este valor puede ser un número, una palabra o un símbolo. Los datos son el conjunto de valores recolectados para la variable de cada uno de los elementos que pertenecen a la muestra. 1.9 El experimento Actividad planeada cuyos resultados producen un conjunto de datos. 1.10 El parámetro Valor numérico que resume todos los datos de una población.
  • 11. 11 UNIDAD II REPRESENTACIÓN DE GRÁFICAS DE DATOS 2.1 La gráfica Las gráficas son representaciones que producen los resultados de datos en estudio. 2.2 Diagramas de pastel Gráficas que se utilizan para resumir datos cualitativos. El diagrama muestra la cantidad de datos que pertenecen a cada categoría como una parte proporcional de un círculo. Corazón Piel Hígado Riñones Ojos 2.3 Gráficas de barras Muestran la cantidad de datos que pertenecen a cada categoría como áreas rectangulares.
  • 12. 12 0 2 4 6 operaciones 2.4 Diagrama de Pareto El diagramad de Pareto se define como una gráfica a base de rectas que muestra los porcentajes acumulados y la cantidad de datos representada por cada barra. El diagrama puede ir de la más numerosa a la menos numerosa o viceversa. . 4.3 2.5 3.5 4.5 2.4 4.4 1.8 2.8 2 2 3 5
  • 13. 13 2.5 Distribución de frecuencias Distribución de frecuencias se define como el arreglo de datos en forma tabular, donde una de las columnas representa la variable y la otra columna representa la frecuencia absoluta o relativa. Listado, expresado en forma de diagrama que asocia cada valor de una variable con la frecuencia. a) Método simple x1(f1) + x2(f2) + x3(f3) + … xn(fn) Distribución de frecuencias = _______________________________________________ ∑ f Ejemplo: De acuerdo con los siguientes datos: X f 0 1 1 3 2 8 3 5 4 2 ∑f = 20 D.f = 0(1) + 1(3) + 2(8) + 3(5) + 4(3) _________________________________________ 20 D.f = 2.3
  • 14. 14 b) Método complejo Para este método se deben tener en cuenta las formulas siguientes: Rango V máx – V mín Amplitud = ________________ = ____________________ # Intervalos N Li + Ls Marca de clase (m) = ____________ 2 f Frecuencia relativa (f.r) = _____________ Total de f Ejemplo: De acuerdo con los siguientes datos: Frecuencia relativa acumulada (f.r.a) = f.r + anterior Dato Frecuencia 64 1 66 1 69 1 74 1 75 1 82 1
  • 15. 15 Rango V máx – V mín Amplitud = --------------- = ---------------------- # Intervalos N 103 – 64 39 ----------- = ---------- = 6.5 = 7 30 5.4772 Intervalo Frecuencia Marca de clase Frecuencia relativa Frecuencia relativa acumulada 64 – 70 3 67 0.1 0.1 71 – 77 2 74 0.06 0.16 78 - 84 3 81 0.1 0.26 85 – 91 7 88 0.23 0.49 92 – 98 2 95 0.06 0.55 83 1 84 1 85 2 86 1 88 1 89 1 90 2 98 2 100 3 101 3 102 4 103 3
  • 16. 16 99 - 105 13 102 0.43 0.98 Li Ls ∑f = 30 ∑fr = 1 Li + Ls 64 + 70 Marca de clase (m) = ____________ = _____________ = 67 2 2 f 3 Frecuencia relativa (f.r) = _____________ = ___________ = 0.1 ∑ total de f 30 Frecuencia relativa acumulada (f.r.a) = f.r + anterior = 0.1 + 0.06 = 0.16 Frecuencia Frecuencia relativa acumulada 13 0.98 0.55 Histograma 0.49 Ojiva 7 0.26 3 0.16 2 0.1 64 70 77 84 91 98 105 Intervalos 67 74 81 88 95 102 Marca de clase
  • 17. 17 UNIDAD III MEDIDAS DE TENDENCIA CENTRAL 3.1 La Media Media o Media Aritmética (x) es el promedio de la serie, se puede presentar de manera simple, frecuencia y agrupada. a) Datos simples ∑ x = ________ n Donde: = media ∑ = Sumatoria x = dato n = tamaño de la muestra Ejemplo: Un estudiante de vocacional desea conocer el promedio de sus calificaciones de quinto semestre. Matemáticas 7 Química 6 Biología 5 Filosofía 8 Física 9 Inglés 10 ∑ x = ________ n
  • 18. 18 7 + 5 + 9 +6 + 8 + 10 45 = ____________________________ = _____ = 7.5. 6 6 Interpretación.- El promedio del estudiante de vocacional en el quinto semestre es de 7.5 b) Datos de frecuencia ∑ f x = _________ N Donde: = media ∑ = Sumatoria x f = dato por frecuencia N = tamaño de la frecuencia Ejemplo: Las calificaciones de inglés de 20 alumnos son: 1, 7, 9, 2, 5, 4, 5, 6, 7, 6, 2, 6, 8, 6, 5, 4, 5, 2, 4, 3 Calificaciones Frecuencia 1 1 2 3 3 1 4 3 5 4 6 4
  • 19. 19 ∑ f = 20 ∑ f x = _________ N 1(1) + 2(3) + 3(1) + 4(3) + 5(4) + 6(4) + 7(2) + 8(1) + 9(1) = _________________________________________________________________________ 20 97 = _________ = 4.85 20 Interpretación.- 4.85 es el promedio de calificaciones de inglés de 20 alumnos. Es un grupo con bajo aprovechamiento. c) Datos agrupados ∑ f m = ___________ N 7 2 8 1 9 1
  • 20. 20 Donde: = media ∑ = Sumatoria f m = frecuencia de la marca de clase N = tamaño de los datos Ejemplo: Determina el promedio de calificaciones del grupo 3103 e interpreta los resultados. Calificación Frecuencia (f) Marca de clase (m) f * m 7 – 7.6 1 7.3 7.3 7.7 – 8.3 9 8 72 8.4 – 9.0 12 8.7 104.4 9.1 – 9.8 11 9.47 103.95 ∑ f = 33 ∑ fm = 287.65 ∑ f m = ___________ N 287.65 = ___________ = 8.71 33 Interpretación.- En un grupo de 33 personas con calificación de 7 a 9.8, el promedio del semestre es de 8.71, lo que corresponde a un nivel considerable.
  • 21. 21 3.2 La Mediana Mediana (x).- Datos que ocupan la posición central de la serie ya sea simple, frecuencia o agrupada. a) Datos simples mitad de los 2 números de en medio = ____________________________________________ 2 Donde: = mediana Ejemplo: En la siguiente numeración encuentre la media. 5, 6, 6, 7, 8, 9, 10, 11 mitad de los 2 números de en medio = ____________________________________________ 2 7 + 8 = ___________ = 7.5 2 Interpretación.- 7.5 es la mediana.
  • 22. 22 b) Datos de frecuencia N + 1 = ___________ 2 Donde: = mediana N + 1 = suma total de la frecuencia Ejemplo: En la siguiente tabla se muestra el número de hijos de 51 familias, por favor encuentre la mediana. Hijo (x) Número de familias (f) Frecuencia acumulada (fa) 0 7 7 1 10 17 2 15 32 3 10 42 4 7 49 5 2 51 ∑ f = 51 N + 1 51 + 1 = ___________ = __________ = 26 2 2 Interpretación.- 26 corresponde a la mediana de los hijos de 51 familias.
  • 23. 23 c) Datos agrupados = L1 + _(N+1/2 – S) C f m Donde: = mediana L1 = limite real inferior de la clase mediana N = total de datos o frecuencia f m = frecuencia de la clase mediana C = longitud del intervalo de la clase Ejemplo: En la siguiente tabla, se muestran los coeficientes de 70 niños intelectuales, en una escuela publica, por favor calcular la mediana. Cociente intelectual (x) Frecuencia (f) Frecuencia acumulada (fa) 94 – 98 13 13 99 – 103 20 33 104 – 108 18 51 109 – 113 3 54 114 – 118 16 70 ∑ f = 70 = 104 + 103 = 104 + 103 = 103.5 2 2
  • 24. 24 N + 1 = 70 + 1 = 71 = 35.5 2 2 2 S = 33 fm = 18 C = 4 = L1 + (N+1/2 – S) C f m = 103.5 + (35.5 – 33) 4 18 = 103.5 + (0.1388)4 = 104.2 Interpretación.- De los coeficientes intelectuales de 70 niños en una escuela pública, la mediana corresponde a 104.2.
  • 25. 25 3.3 La Moda Moda (x).- Número que más se repite de la serie ya sea simple, frecuencia o agrupada. a) Datos simples = número que más veces se repite Donde: = moda Ejemplo: Encuentre la moda de un grupo de adolescentes, según el color de su camisa favorita. Color de la camisa azul gris café verde No, de adolescentes 2 1 15 2 = número que más veces se repite = Café 15 veces Interpretación.- 15 es el número que más veces se repite, lo que significa que le color favorito de 15 adolescentes es el café.
  • 26. 26 b) Datos de frecuencia = número que más veces se repite Donde: = moda Ejemplo: Encuentre la moda de los datos de las estaturas de un grupo de 10 personas: 1.9, 1.9, 1.4, 1.5, 1.3, 1.4, 1.6, 1.2, 1.4, 1.9 ∑ f = 10 = número que más veces se repite = 1.4 y 1.9 Interpretación.- La moda de datos en las estaturas de un grupo de 10 personas es binominal, porque se presentan dos modas 1.4 y 1.9 Calificaciones Frecuencia 1.2 1 1.3 1 1.4 3 1.5 1 1.6 1 1.9 3
  • 27. 27 c) Datos agrupados = L1 + _ ( d1 ) C d1 + d2 Donde: = moda L1 = limite real inferior de la clase modal d1 = frecuencia de la clase modal menos la frecuencia de la clase anterior d2 = frecuencia de la clase modal menos la frecuencia de la clase siguiente C = intervalo de la clase Ejemplo: Encuentre la moda de un grupo de personas de la tercera edad. Edades (x) Frecuencia (f) 60 – 64 5 65 – 69 18 70 – 74 42 75 – 79 27 80 - 84 8 L1 = 69 + 70 = 69.5 2 C = 5 d1 = 42 – 18 = 24 d2 = 72 – 27 = 15 = L1 + _ ( d1 ) C d1 + d2
  • 28. 28 = 69.5 + ( 24 ) 5 24+15 = 69.5 + ( 24 ) 5 39 = 69.5 + (0.61) 5 = 72.55 Interpretación.- La moda de las edades de un grupo de la tercera edad oscilan entre 72.55 3.4 Relación entre las medidas de tendencia central Se relacionan la media, la mediana y la moda, coincidiendo en una sola gráfica. Sesgo.- Es una medida que indica la forma de la curva a través del grado de asimetría que presenta un polígono de frecuencia. Sesgo + Sesgo - Si el polígono esta cargado a la izquierda, media esta más alejada al cero, esto se llama positivamente sesgada. Si el polígono esta cargada a la derecha, la media está más cercana al cero, esto se llama negativamente sesgada.
  • 29. 29 UNIDAD IV MEDIDAS DE DISPERSIÓN 4.1 La Desviación Media Desviación Media (DM/DMA) es la distancia promedio de los elementos respecto a una medida de tendencia central como la media. La desviación media es la aritmética de las desviaciones de los valores individuales con respecto al promedio de los datos. a) Datos simples ∑ /x – / DM = _______________ n Donde: DM = desviación media ∑ = sumatoria /x – / = dato menos media (abs) n = datos totales Ejemplo: Un comerciante compra cajas de dulces. Chocolates 5 Chupirules 3 Tamarindos 7 Alegrías 2 Paletas 8 Cocadas 6 Dulces Cajas / x – / Chocolates 5 5 – 5.16 =0.16 Tamarindos 7 7 – 5.16 = 1.84
  • 30. 30 Paletas 8 8 – 5.16 =2.84 Chupirules 3 3 – 5.16 = 2.16 Alegrías 2 2 – 5.16 = 3.16 cocadas 6 6 – 5.16 = 0.84 ∑ = 11 5 + 7 + 8 + 3 + 2 + 6 11 = ____________________________ = _____ = 51.66 6 6 ∑ /x – / 11 DM = _______________ = ___ N 6 DM = 1.83 Interpretación. La desviación media de un comerciante de cajas de dulces es de 1.83 b) Datos de frecuencia ∑ f /x – / DM = _________________ N Donde: DM = desviación media ∑ f = sumatoria de frecuencia /x – / = dato menos media (abs) N = datos totales de frecuencia
  • 31. 31 Ejemplo: Las calificaciones de un número de estudiantes se presentan a continuación. Calificación (x) No alumnos (f) f * x / x – / f / x – / 5 2 10 ( –6.96)= 1.96 3.92 6 10 60 0.96 9.60 7 8 56 0.04 0.32 8 9 72 1.04 9.36 9 2 18 2.04 4.08 ∑ f = 31 ∑ fx = 216 ∑f/x– / = 27.28 = 215 = 6.96 31 ∑ f /x – / DM = _________________ N 27.28 DM = _________ 31 DM = 0.88 Interpretación.- La desviación media de las calificaciones de un número determinado de alumnos es de 0.88
  • 32. 32 c) Datos agrupados ∑ f /m – / DMA = _______________ N Donde: DMA = desviación media ∑ f = sumatoria de frecuencia /m – / = marca de clase – media (abs) N = datos totales de frecuencia Ejemplo: Encuentre la desviación media de las siguientes edades de un grupo de 180 personas hospitalizadas por tener enfisema pulmonar. Intervalos f m f * m / m – / f / x – / 42 – 46 2 44 88 (44-61.14) 17.14 34.28 47 – 51 9 49 441 12.14 109.26 52 – 56 31 54 1674 7.14 221.26 57 – 61 50 59 2950 2.14 107.00 62 – 66 51 64 3264 2.86 145.86 67 – 71 30 69 2070 7.86 235.80 72 - 76 7 74 518 12.86 90.02 ∑f = 180 ∑fm = 11005 ∑f /x – / = 943.56 = 11005 = 61.14 180
  • 33. 33 ∑ f /m – / DMA = _______________ N 943.56 DMA = __________ 180 DMA = 5.24 Interpretación.- La desviación media absoluta de 180 personas hospitalizadas por tener enfisema pulmonar es de 5.24 4.2 La Varianza La varianza (s2 / G2) mide la distancia existente entre los valores de la serie y la media. Se usa s2 cuando se trabaja con la muestra. Se usa G2 cuando se trabaja con toda la población. a) Datos simples ∑ /x – /2 s2 = _______________ n Donde: s2 = Varianza ∑ = sumatoria /x – /2 = (dato – media)2 n = datos totales
  • 34. 34 Ejemplo: Hallar la varianza para el siguiente conjunto de datos. 30, 38, 59, 11, 15, 20, 21, 17, 12 y 22 ∑ /x – /2 s2 = _______________ n (30-245)2 + (38-245)2 + (59-245)2 + (11-245)2 + (15-245)2 + (20-245)2 + (21-245)2 + (17-245)2 s2 = ____________________________________________________________________________________________ 10 1926.5 s2 = _______________ 10 s2 = 192.62 Interpretación.- La varianza de un conjunto de datos simples es de 192.62 b) Datos de frecuencia ∑ f /x – /2 s2 = _________________ N Donde: s2 = Varianza ∑ f = sumatoria de frecuencia
  • 35. 35 /x – /2 = (dato – media)2 N = datos totales de la frecuencia Ejemplo: Las edades de un grupo de 60 niños. x f x * f x – /x – / /x – /2 f /x – /2 8 10 80 -3 3 9 90 10 16 160 -1 1 1 16 12 26 312 1 1 1 26 14 8 112 3 3 9 72 ∑f = 60 ∑fx = 664 ∑ f /x – /2 = 204 = 664 = 11.06 = 11 60 ∑ f /x – /2 s2 = _________________ N 204 s2 = ________ 60 s2 = 3.4 Interpretación.- La varianza de un grupo de 60 niños es de 3.4
  • 36. 36 c) Datos agrupados ∑ f /x – /2 s2 = _______________ N Donde: s2 = Varianza ∑ f = sumatoria de frecuencia /m – /2 = (marca de la clase – media)2 N = datos totales de la frecuencia Ejemplo: Hallar la varianza de un conjunto de elementos. Datos f m f * m /m – / /m – /2 f /m – /2 1 – 20 17 10.5 178.5 34.88 1216.61 20682.37 21 – 40 7 30.5 213.5 14.88 221.41 1549.8 41 – 61 7 50.5 353.5 5.12 26.21 183.47 61 - 80 10 70.5 705 25.12 631.01 6310.1 81 - 100 9 90.5 814.5 45.12 2035.8 18322.2 ∑f= 50 ∑fm=2269 ∑ f /m – /2 = 47,057.94 = 2269 = 45.38 50 ∑ f /x – /2 s2 = _______________ N
  • 37. 37 47,057.94 s2 = _______________ 50 s2 = 941.1588 Interpretación.- La varianza para datos agrupados es de 947.15 4.3 La Desviación Estándar Desviación Media (S / G) es una medida de la fluctuación (dispersión). Es un tipo de medida con la que se es posible comparar la variabilidad de un conjunto de datos con otros. a) Datos simples √ ∑/x – /2 S = _______________ n Donde: S = desviación estándar √ = raíz cuadrada ∑ = sumatoria /x – /2 = (dato – media)2 n = datos totales Ejemplo: Calcular la desviación estándar para el siguiente conjunto de elementos. 5, 9, 12, 7, 15 y 3
  • 38. 38 = 5 + 9 + 12 + 7 + 15 +3 = 8.5 6 √ ∑/x – /2 S = _______________ N √ (5-8.5)2 + (9-8.5)2 + (12-8.5)2 + (7-8.5)2 + (15-8.5)2 + (3-8.5)2 S = _______________________________________________________________________________ 6 S = √ 16.58 S= 4.07 Interpretación.- La desviación estándar de un conjunto de datos es de 4.07 b) Datos de frecuencia √ ∑f /x – /2 S = _________________ N Donde: S = desviación estándar √ = raíz cuadrada ∑ f = sumatoria de la frecuencia /x – /2 = (dato – media)2 N = datos totales de la frecuencia
  • 39. 39 Ejemplo: De los siguientes datos de estaturas de un grupo de 60 niños calcule la desviación estándar. x f x * f /x – / /x – /2 f /x – /2 8 10 80 3 9 90 10 16 160 1 1 16 12 26 312 1 1 26 14 8 112 3 9 72 ∑f= 60 ∑fx=664 ∑f/x – /2 = 204 = 664 = 11.06 = 11 60 √ ∑f /x – /2 S = _________________ N √ 204 S = _________ 60 S = √3.4 S = 1.84 Interpretación.- La desviación estándar para un conjunto de datos en estaturas de 60 alumnos es de 1.84
  • 40. 40 c) Datos agrupados √ ∑f /m – /2 S = _________________ N Donde: S = desviación estándar √ = raíz cuadrada ∑ f = sumatoria de la frecuencia /m – /2 =(marca de la clase – media)2 N = datos totales de la frecuencia Ejemplo: Hallar la desviación estándar del siguiente conjunto de datos. Datos f m f * m /m – / /m – /2 f /m – /2 1 – 20 17 10.5 178.5 34.88 1216.61 20682.37 21 – 40 7 30.5 213.5 14.88 221.41 1549.8 41 – 61 7 50.5 353.5 5.12 26.21 183.47 61 - 80 10 70.5 705 25.12 631.01 6310.1 81 - 100 9 90.5 814.5 45.12 2035.8 18322.2 ∑f= 50 ∑fm=2269 ∑ f /m – /2 = 47,057.94 = 2269 = 45.38 50 √ ∑f /m – /2 S = ___________________ N
  • 41. 41 √ 47,057.94 S = _________________ 50 S = √ 947.1588 S= 30.68 Interpretación.- La desviación estándar total de un conjunto de datos es 30.68 4.4 Coeficiente de Variación Es un valor relativo de la desviación estándar con respecto a la medida aritmética y nos dice que porcentaje de la media aritmética representa la desviación estándar. S V = ______ * 100 X Ejemplo: Calcular el coeficiente de variación para el siguiente conjunto de datos. 5, 9, 12, 7, 15, 3 = 5 + 9 + 12 + 7 + 15 + 3 = 8.5 6 √ (5-8.5)2 + (9-8.5)2 + (12-8.5)2 + (7-8.5)2 + (15-8.5)2 + (3-8.5)2 S = _______________________________________________________________________________ 6 S = √16.58 = 4.07 S
  • 42. 42 V = ______ * 100 X V = 4.07 * 100 8.5 V = 47.88 % Interpretación.- La desviación estándar para este conjunto de datos representa el 47.88% de su media aritmética.
  • 43. 43 UNIDAD V MEDIDAS DE POSICIÓN NO CENTRAL 5.1 Deciles Son 9 valores en cada uno de ellos concentra el 10%. 5.2 Cuartiles Son 3 valores que cada uno de ellos concentra el 25% Son los valores de la variable que dividen en cuartos a los datos ordenados, cada conjunto de datos posee tres cuartiles.  El primer cuartil Q1 es un número tal que cuando mucho el 25% de los datos es menor en valor que Q1 y cuando mucho el 75% de los datos es mayor que Q1.  El segundo cuartil Q2 es la mediana.  El tercer cuartil Q3 es un número tal que cuando mucho el 75% de los datos es menor en valor que Q3 y cuando mucho el 25% de los datos es mayor de Q3. Datos clasificados en orden decreciente 25% 25% 25% 25% Q1 Q2 Q3 5.3 Percentiles Son 99 el que cada uno de ellos concentra el 1%. Son los valores de la variable que dividen a un conjunto de datos ordenados en 100 subconjuntos iguales, cada conjunto de datos tiene 99 percentiles. El k-ésimo percentil es un valor tal que cuando mucho k% de los datos son más pequeños en valor que pk y cuando mucho (100 – k)% de los datos es mayor.
  • 44. 44  El primer cuartil y el 25avo percentil son iguales, es decir, Q1 = P25. También Q3 = P75.  La mediana, el segundo cuartil y el 50avo percentil son iguales Datos clasificados en orden creciente 1% 1% 1% 1% 1% 1% 1% 1% Mín P1 P2 P3 P4 P97 P98 P99 Máx 1. El primer cuartil y el 25vo percentil son iguales, es decir, Q1 = P25. También el tercer cuartil y el 75vo percentil son iguales Q3 = P75. 2. La mediana, el segundo cuartil y el 50vo percentil son iguales, = Q2 = P50. Así cuando se pida encontrar 50 o Q2 aplique el procedimiento de la mediana. Ejemplo: Con la muestra de 50 calificaciones del examen final del curso de estadística elemental que se observa, determinar el primer cuartil Q1, el 58vo Percentil y el Tercer cuartil Q3, del siguiente conjunto de datos. 60 47 82 95 88 72 67 66 68 98 90 77 86 58 84 95 74 72 88 74 77 39 90 63 68 97 70 64 70 70 58 78 89 44 55 85 82 83 72 77 72 86 50 94 920 80 91 75 76 78 Ordenación: 39 58 67 72 74 78 85 89 94 44 60 68 72 75 78 86 90 95 47 63 68 72 76 80 86 90 95 50 64 70 72 77 82 88 91 97
  • 45. 45 55 64 70 74 77 82 88 92 98 58 66 70 74 77 83 1) Primer cuartil n= 50 y k=25; ya que Q1 = P25 n * k : (50)(25) = 12.5 100 100 2) Encontrar P58 n= 50 y k=58; P=58 n * k : (50)(58) = 29 100 100 3) Tercer cuartil n= 50 y k=75; ya que Q3 = P75 Si k > 50 usar 100 – k 100-75 = 25 n * k : (50)(25) = 12.5 100 100 5.4 Cuartil medio Es el valor numérico que está a la mitad del 1er y 3er cuartil. Cuartil medio = Q1 + Q3 = 67 + 86 = 76.5 2 2
  • 46. 46 UNIDAD VI MEDIDAS DE FORMA 6.1 Concentración Mide si los valores de la variable están más o menos uniformemente repartidos a lo largo de la muestra. ∑(p - q) IG = ___________ ∑ P n1+n2+n3… P = ___________ * 100 n (x1n1)+(x2n2) P = ___________________ * 100 (x1n1)+(x2n2) El índice de Gini puede tomar valores de 0 y 1.  IG = 0 Concentración mínima. La muestra está uniformemente repartida a todo un rango.  IG = 1 Concentración máxima. Un solo valor de la muestra acumulada es del 100% de los resultados. Ejemplo: Calcular el Índice de Gini de una serie de datos con los sueldos de una empresa en millones de pesetas.
  • 47. 47 Sueldos (x) Frecuencia absoluta simple (n) Frecuencia acumulada (f.a) Frecuencia relativa simple (f.r) Frecuencia relativa acumulada x * n q p - q 3.5 10 10 25% 25% 35,0 13,6 10,83 4.5 12 22 30% 55% 89,0 34,6 18,97 6.0 8 30 20% 75% 147,0 57,2 19,53 8.0 5 35 12.5% 87.5% 187,0 74,8 15,84 10.0 3 38 7.5% 95% 217,0 84,4 11,19 15.0 1 39 2.5% 97.5% 232,0 90,3 7,62 20.0 1 40 2.5% 100% 257,0 100,0 0 ∑ = 435,0 = 83,99 ∑ (p - q) IG = ___________ ∑ P 83,99 IG = __________ 435,0 IG = 0,19 Interpretación.- Indica que la muestra es bastante uniforme repartida en su nivel de concentración no es excesivamente alto. 6.2 Asimetría Mide si la curva tiene una forma simétrica, es decir, si respecto al centro de la misma (centro de simetría) los segmentos de curva que quedan a la derecha e izquierda son similares.
  • 48. 48 Eje de Eje de Eje de Simetría asimetría + asimetría - Curva simétrica Curva asimétrica negativa Curva asimétrica positiva Para medir el nivel de asimetría utilizaos el coeficiente de Asimetría de Fisher. (1/n) * ∑ (x – )3 P = _______________________ ((1/n) * ∑ (x – )2 * n)3/2 g1 = 0 Distribución simétrica.- Existe la misma concentración de valores a la derecha y a la izquierda de la media. g1 > 0 Distribución asimétrica positiva.- Existe mayor concentración de valores a la derecha de la media de la izquierda. g1<0 Distribución asimétrica negativa.- Existe mayor concentración de valores a la izquierda de la media que su derecha. Ejemplo: Calcular el coeficiente de Asimetría de Fisher en la serie de datos referidos a la estatura de un grupo de alumnos. x f.ab simple f.ab acumulada f.r simple f.r acumulada 1,20 1 1 3.3% 3.3% 1,21 4 5 13.3% 16.6% 1,22 4 9 13.3% 30.0% 1,23 2 11 6.6% 36.6%
  • 49. 49 1,24 1 12 3.3% 40.0% 1,25 2 14 6.6% 46.6% 1,26 3 17 10.0% 56.6% 1,27 3 20 10.0% 66.6% 1,28 4 24 13.3% 80.0% 1,29 3 27 10.0% 90.0% 1,30 3 30 10.0% 100.0% Media= 1,253 (1/n) * ∑ (x – )3 P = ______________________________ ((1/n) * ∑ (x – )2 * n)3/2 (1/30) * 0,000110 P = ______________________________ ((1/30) * 0,030467))3/2 P = - 0,1586 Interpretación.- El coeficiente de Fisher muestra que el resultado -0,1586 representa la distribución asimétrica negativa, lo que en la gráfica estará cargado a la izquierda. 6.3 Curtosis Mide si los valores de distribución están más o menos concentrados alrededor. Es el grado de alargamiento de una curva correspondiente a una distribución de frecuencia (K). Existen 3 tipos de curva son: 1. Curva normal o curva de mesocúrtica.- Tiene um coeficiente de curtosis K igual a 0.263.
  • 50. 50 2. Curva platicúrtica.- Tiene menor altura que la curva normal, su coeficiente de curtosis es menor a 0.263. 3. Curva Leptocúrtica.- Tiene mayor altura que la altura normal, su coeficiente de curtosis es mayor a 0.263. Curva platicurtica Curva mesocurtica Curva leptocurtica Reducida concentración Concentración media Concentración alta Coeficiente de Curtosis.- Analiza el grado de concentración que representan los valores alrededor de la zona central de distribución. (1/n) * ∑ (x – )4 * n P = _____________________________ -3 ((1/n) * ∑ (x – )2 * n)3/2 gc = 0 Distribución mesocúrtica. gc > 0 Distribución leptocúrtica. gc < 0 Distribución platicúrtica. x f.ab simple f.ab acumulada f.r simple f.r acumulada 1,20 1 1 3.3% 3.3% 1,21 4 5 13.3% 16.6% 1,22 4 9 13.3% 30.0% 1,23 2 11 6.6% 36.6%
  • 51. 51 1,24 1 12 3.3% 40.0% 1,25 2 14 6.6% 46.6% 1,26 3 17 10.0% 56.6% 1,27 3 20 10.0% 66.6% 1,28 4 24 13.3% 80.0% 1,29 3 27 10.0% 90.0% 1,30 3 30 10.0% 100.0% (1/n) * ∑ (x – )4 * n P = _____________________________ -3 ((1/n) * ∑ (x – )2 * n)3/2 (1/30) * 0,00004967 P = _____________________________ -3 ((1/30) * 0,3046667 P = -1,39 Interpretación.- Se trata de una distribución platicúrtica. 6.4 El Teorema de Chebyshev Establece una relación entre el % mínimo de datos que se concentran alrededor de la media tomando kG a la derecha y kG a la izquierda y se expresa: Para cualquier serie de datos podemos establecer que el % mínimo de datos comprendidos en el intervalo para cualquier serie de datos podemos establecer que el % mínimo de datos comprendidos en el intervalo. + - KG
  • 52. 52 (1 – 1 ) % K2 Para K = 2 este por ciento mínimo establecido es de 75%. Para K = 3 este por ciento mínimo establecido es de 88%.
  • 53. 53 UNIDAD VII LA CORRELACIÓN LINEAL 7.1 La Correlación lineal El objetivo es medir la intensidad de una regresión lineal entre dos variables. Se analizan algunos diagramas de dispersión que muestran diferentes relaciones entre variables independientes (o de entrada) y variables dependientes (o de salida). Si crece independiente (x), no cambia dependiente (y).- No hay correlación. Si crece independiente (x), y crece dependiente (y).- Hay correlación.  Correlación Positiva.- Significa que los individuos que obtienen puntuaciones altas en una variable, tienden a obtener puntuaciones altas en la otra.  Correlación Negativa.- Significa que los individuos que obtienen puntuación baja en una variable tienden a obtener puntuación alta en la segunda variable. No hay correlación Correlación positiva Correlación positiva alta Correlación negativa Correlación negativa alta
  • 54. 54 Correlación positiva perfecta Correlación negativa perfecta Horizontal: no hay correlación Vertical: no hay Correlación No hay correlación lineal
  • 55. 55 Regresión curvilinea No hay relación 7.2 El coeficiente de correlación lineal Es la medida numérica de la intensidad de la relación lineal entre dos variables. El coeficiente refleja la consistencia del efecto que el cambio en una variable tiene sobre la otra. El valor del coeficiente de correlación lineal ayuda a responder a la pregunta ¿existe una correlación lineal entre las dos variables en consideración? El coeficiente de correlación lineal (r) siempre tiene un valor entre -1 y +1 Valor -1.- Indica una correlación negativa perfecta. Valor +1.- Significa una correlación positiva perfecta. Ejemplo: Valor + de r.- Edad y altura de un niño, a medida que aumenta de edad se vuelve más alto. Valor – de r.- Antigüedad y valor de reventa de un automóvil, a media que envejece el automóvil su reventa disminuye. El valor de r está redefinido por la formula del coeficiente de Correlación de Pearson.
  • 56. 56 7.3 Coeficiente de correlación de Pearson Se utiliza para medir la relación entre dos variables; se representa como r (para muestras) y p (ro para la población). Suma de cuadrados de XY r = ______________________________________________________________ √(suma de cuadrados de X) (suma de cuadrados de Y) (Suma de Y)2 Suma de cuadrados de y = ________________________________ n (Suma de X) (Suma Y) Suma de cuadrados de XY = suma de XY - ____________________________ n El valor de r es un número que varia de -1 a 1 Ejemplo: La siguiente tabla muestra las utilidades de una compañía en millones de dólares en siete años de existencia, por lo que desea saber la relación que existe entre las utilidades dela compañía y los años de antigüedad de ésta. Año (x) Utilidades (y) 1 6.7 2 7.5 3 8.3 4 10.2
  • 57. 57 5 11.1 6 12.5 7 14.6 X Y X * Y X2 Y2 1 6.7 6.7 1 44.89 2 7.5 15.0 4 56.25 3 8.3 24.9 9 68.89 4 10.2 40.8 16 104.04 5 11.1 55.5 25 123.21 6 12.5 75.0 36 156.25 7 14.6 102.2 49 213.16 ∑X=28 ∑Y=70.9 ∑XY= 319.9 ∑X2= 140 ∑Y2= 7696.69 Utilidades 15 12 9 6 1 2 3 4 5 6 7 8 Año SCX = ∑x2 – (∑(X))2 n SCX = 140 – (28)2 = 28 7
  • 58. 58 SCY = ∑Y2 – (∑(Y))2 n SCX = 766.69 – (70.9)2 = 48.57 7 SC(XY) = ∑XY – (∑X∑Y) n SC(XY) = 319.9 – (28)(70.9)= 28 7 r = _____________ Suma de cuadrados de XY _____________________ √(suma de cuadrados de X) (suma de cuadrados de Y) r = ___________36.3 _______ √(28) (48.57) r = ____ ____36.3 _____ √1,359.96 r = _____36.3 ____ 36.88 r = 0.98 Interpretación.- Este valor al ser muy cercano a uno, indica que existe una fuerte correlación lineal, lo que significa que la utilidad de la Cía, depende casi en un 100% de la antigüedad de esta.
  • 59. 59 7.4 La Regresión Lineal La regresión estudia la relación entre dos variables (X, Y) restringiendo una de la otra, la cual lleva el nombre de variable dependiente. El valor de la otra variable se llama independiente. La regresión lineal es un método estadístico que se emplea para predecir el valor de una variable Y, en función de otra variable X o cuando X y Y están correlacionadas. El análisis de la regresión lineal encuentra la ecuación de la recta que describe mejor la relación entre dos variables, una aplicación de esta ecuación es hacer Predicciones. El mejor ajuste, representa el valor estimado de Y corresponde a una partícula de X, el método que se utiliza para obtener la recta de mejor ajuste es el de mínimos cuadrados. = mx + b Suma de cuadrados de X-Y m = ____________________________________________ Suma de cuadrados de X SC (XY) SC (XY) ∑ XY - ∑(X) ∑(y) n
  • 60. 60 m = __________ ______ = _______________ = _______________________ SC (X) SC (X) ∑X2 – (∑(n)2 n (Suma de Y) - ((pendiente)(suma de x)) b = _________________________________________________ número (S Y) – ((m) (S X)) b = __________________________________ # Una manera para verificar el ejercicio, es trazando el diagrama de dispersión y observar si los puntos en el diagrama sugerir si una relación lineal es procedente al cálculo de la recta de mejor ajuste. 15 12 9 6 1 2 3 4 5 6 7 8
  • 61. 61 Recta de mejor ajuste.- Son los valores positivos que se encuentran en la línea azul y los negativos en la verde, si la recta es la de mejor ajuste, la suma de los cuadrados de estas y las diferencias, se minimizan, se hace lo más pequeña posible. 15 12 9 6 1 2 3 4 5 6 7 8 15 12 9 6 1 2 3 4 5 6 7 8 Recta de # del mejor ajuste.- Puntos distintivos
  • 62. 62 Ejemplo: Con el fin de aplicar las formulas anteriores. A continuación se presentan los datos correspondientes a las calificaciones obtenidas en un examen de ingreso correspondiente a la universidad, en escala de cero al cien, y las calificaciones promedio obtenidas en el primer semestre de la carrera de economía en la universidad en una escala del cero al cuatro. Examen de ingreso (x) Calificaciones promedio (y) x * y X2 (x * y)2 40 0.8 32.0 1600 1,024 48 1.2 57.6 2304 3,317.76 53 1.5 79.5 2809 6,320.25 55 1.6 88.0 3025 7,744 62 2.0 124.0 3844 15,376 65 2.7 175.5 4225 30,800.25 66 2.1 138.6 4356 19,209.96 68 2.4 163.2 4624 26,634.24 70 2.6 182.0 4900 33,124 72 2.0 144.0 5184 20,736 75 2.7 202.5 5625 41,006.25 75 3.2 240.0 5625 57,600 76 2.9 220.4 5776 48,576.16 80 3.0 240.0 6400 57,600 86 3.5 301.0 7396 90,601 ∑x= 991 ∑y= 34.2 ∑xy= 2388.3 ∑xy= 67693 SC(XY) = ∑XY - ∑(X) ∑(Y) n SC(XY) = 2388.3 – (991)(34.2) 15
  • 63. 63 SC(XY) = 2388.3 – 2,259.48 SC(XY) = 128.82 SC(X) = ∑X2 - ∑(X)2 N SC(X) = 67693 - (991)2 15 SC(X) = 67693 – 65,475.01 SC(X) = 2,220.93 SC (XY) m = __________ S( X) 128.82 m = __________ 2,220.93 m = 0.058 (TAMBIÉN SE CONOCE COMO PENDIENTE) (S Y) – ((m) (S X)) b = _______________________ # (34.2) – ((0.058) (991)) b = _____________________________ 15
  • 64. 64 34.2 – 57.478 b = __________________ 15 - 23.278 b = __________________ 15 b = -1.55 (También se le conoce como Ordenada al origen o Intercepto). = mx + b = 0.058 X + (-1.55) = 0.058 X - 1.55 recta del mejor ajuste Supongamos que las calificaciones en el examen de ingreso fueron de 45, entonces: = mx + b = 0.058(45) + (-1.55) = 2.61 – 1.55 = 1.06 Interpretación.- Se predice una calificación de 1.06, cualquier predicción basada en rectas de mínimos cuadrados deberá considerarse promedio.
  • 65. 65 4 3 (85, 3.38) (78, 2.97) 2 1 (45, 1.06) 40 45 55 60 65 70 75 80 85 90
  • 66. 66 BIBLIOGRAFÍA BIBLIOGRAFÍA BÁSICA Anderson Sweeney, Williams (2005). Estadística para Administración y Economía. Editorial Thomson. México. Chistensen (1990). Estadística Paso a Paso. 3ra edición. Editorial Trillas. México. Kuby, Johnson (2001). Estadística Elemental. Editorial Math. Quesada López, Isidoro (1989). Curso de Ejercicios de Estadística. Editorial Alhambra. México. Robles Almeraya, Gloria (1995). Estadística Descriptiva e Inferencial I. Teoría y Práctica. Editorial McGraw-Hill. México. Ruíz Camacho, Morcillo y García Galisteo, Julio (2000. Curso de Probabilidad y Estadística. Editorial la Malaga. Manuales de España. Mate Jimenez, Sarabia (1993). Estadística Descriptiva. Elementos teóricos, cuestiones y aplicaciones. Editorial CLAGSA. Sote, Arturo (S.F). Principios de Estadística. Caracas: Panapo de Venezuela. BIBLIOGRAFÍA COMPLEMENTARIA Conceptos básicos de Estadística (S.F). Texto completo en http://www.gestiopolis.com/recursos/experto/catsexp/pagans/eco/44/estadistica.h tm
  • 67. 67 Estadística. Apuntes de investigación y divulgación científica. © Consultoría de Servicios para Gobiernos y Estudios Legislativos. Prolongación Paseo de la Reforma No. 530, 2º piso, Delegación Álvaro Obregón, C.P. 01219. Ciudad de México, Distrito Federal. Primera edición: marzo de 2007. Autor: Alberto Vega Hernández. Las opiniones vertidas de estos apuntes son responsabilidad del autor. Manual de distribución gratuita, prohibida su venta. Impreso en México.