SlideShare una empresa de Scribd logo
1 de 54
Estadística
Estadística
• La estadística es la ciencia que se ocupa de la
recogida de datos, su organización y análisis.
• Según el método de estudio y el problema a
resolver se puede distinguir:
– Estadística descriptiva: Se encarga de recolectar
datos, organizarlos y en el cálculo de valores que
describan el conjunto objeto de estudio.
– Estadística inferencial: se encarga de elaborar
conclusiones para el conjunto estudiado a partir
del estudio de una muestra.
Conceptos estadísticos I
• Población: conjunto de elementos a estudiar.
• Individuo: cada uno de los elementos de la
población.
• Muestra: Subconjunto de la población que se
toma para representar a la población en el
estudio.
• Tamaño de la muestra: Número de elementos
que componen la muestra.
Conceptos estadísticos II
• Carácter estadístico: propiedad de los individuos
de una población que permite clasificarlos.
– Cualitativo: no pueden expresarse numéricamente.
– Cuantitativo: puede expresarse numéricamente.
• Variable estadística: conjunto de valores que
puede tomar un carácter estadístico cuantitativo.
– Discreta: la variable puede tomar un número finito de
valores
– Continua: la variable puede tomar un valor que se
encuentre dentro de un intervalo de números reales.
Estudio estadístico
Para realizar un estudio estadístico se siguen las
siguientes pautas:
• Extracción de una muestra de la población
Debe ser representativa de la población
• Recuento de datos
Proporciona la frecuencia absoluta de la tabla
• Elaboración de una tabla estadística
Recuento de datos
• El recuento de datos proporciona la frecuencia
absoluta para cada valor de la variable
estadística
• En la primera columna se disponen los
distintos valores que puede tomar la variable
estadística
• En la siguiente, tras contar los casos en los que
aparece cada valor de la variable, se calcula la
frecuencia absoluta.
Ejemplo I
A las 50 familias que viven en una calle se les ha realizado una encuesta
preguntando el número de personas que viven en su vivienda.
3 3 5 8 3
7 2 4 4 3
2 6 1 5 4
4 3 3 4 1
4 6 4 7 8
7 4 2 2 7
3 2 2 2 2
6 3 3 3 4
2 4 6 8 1
3 5 5 3 6
El carácter estadístico
se corresponde con el
número de personas
que viven juntas.
El tamaño de la
muestra es 50.
Ejemplo I (continuación)
Valor de la
variable
Frecuencia
absoluta
xi fi
1 3
2 9
3 12
4 10
5 4
6 5
7 4
8 3
Total 50
El rango de valores de la variable va de 1 a
8. La variable es discreta.
La frecuencia absoluta establece en este
caso el número de viviendas que está
ocupada por el número de inquilinos que
le corresponde al valor de la variable.
Hay 4 viviendas de las 50 ocupadas por 7
personas.
La suma de las frecuencias absolutas es el
tamaño de la muestra.
Intervalos o clases
• Cuando una variable estadística cuantitativa
puede tomar una gran cantidad de valores
distintos, se agruparán en intervalos.
• Normalmente se toman intervalos de igual
amplitud.
• Para realizar cálculos se utilizará la marca de
clase que no es más que el punto medio del
intervalo.
Ejemplo II
A los 100 empleados de una empresa , se les ha realizado una prueba sobre
resolución de problemas. En una escala de 0 a 100 se ha obtenido las
siguientes puntuaciones:
2 58 69 62 17 53 5 30 76 33
84 76 69 70 63 65 46 99 65 2
5 82 83 80 72 74 39 21 84 48
68 5 15 90 48 99 32 17 27 62
21 54 11 4 7 33 90 76 4 18
27 53 47 11 88 66 64 29 59 99
46 61 20 27 49 44 37 90 72 35
84 7 85 14 28 71 89 76 48 52
70 41 25 85 90 4 81 78 55 36
73 8 2 94 84 68 11 13 37 9
Ejemplo II (continuación)
Se ha decidido agrupar los valores en 5 clases, como el menor valor es 2 y el
mayor 100, la amplitud del intervalo será:
𝑀á𝑥𝑖𝑚𝑜 𝑣𝑎𝑙𝑜𝑟 − 𝑀í𝑛𝑖𝑚𝑜 𝑣𝑎𝑙𝑜𝑟
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠
=
100 − 2
5
= 19,6
Tomaremos para la longitud del intervalo 20, pues es más fácil de realizar
cálculos:
Intervalo Marca de clase Frecuencia Absoluta
(xi,xi+1] xi fi
(0,20] 10 23
(20,40] 30 17
(40,60] 50 16
(60,80] 70 25
(80,100] 90 19
Total 100
Frecuencias
Frecuencia absoluta: Número de individuos de la muestra que presenta
un valor de la variable estadística. Su suma debe ser el tamaño de la muestra.
Frecuencia relativa: Fracción que representa la frecuencia absoluta
respecto del tamaño de la muestra. Se calcula dividiendo la frecuencia
absoluta entre el tamaño de la muestra. La suma total debe ser 1.
Frecuencia porcentual: Porcentaje que representa cada frecuencia
absoluta respecto del tamaño de la muestra. La suma total debe ser 100.
Frecuencias acumuladas: se corresponde con la suma de las frecuencias
anteriores a las de un valor de la variable más la suya propia.
Ejemplo
Valor de la
variable
Frecuencia
absoluta
Frecuencia
relativa
Frecuencia
porcentual
Frecuencia
acumulada
xi fi hi pi Fi
1 3 0,06 6 3
2 9 0,18 18 12
3 12 0,24 24 24
4 10 0,2 20 34
5 4 0,08 8 38
6 5 0,1 10 43
7 4 0,08 8 47
8 3 0,06 6 50
Total 50 1 100
MÉTODOS GRÁFICOS PARA
DESCRIBIR DATOS
Diagrama de barras
El diagrama de barras se utiliza para representar variables
cualitativas o cuantitativas discretas.
A cada valor de la variable estadística o categoría, (que se
corresponde con en el eje OX), se le asocia un rectángulo de área
proporcional a la frecuencia absoluta o relativa que le
corresponde a la categoría.
El polígono de frecuencias se crea uniendo con segmentos los
puntos medios consecutivos del diagrama de barras.
Ejemplo: diagrama de barras
xi fi
Lunes 12
Martes 15
Miércoles 17
Jueves 20
Viernes 15
Sábado 18
Domingo 22 0
5
10
15
20
25
Lunes Martes Miércoles Jueves Viernes Sábado Domingo
Venta de barras de pan (en cientos de unidades)
Diagrama de sectores
Consiste en representar cada una de los valores de la variable estadística
mediante un sector circular proporcional a su valor.
Se utilizan cuando los valores de la variable estadística no son numerosos.
Para calcular el ángulo del sector que le corresponde a cada frecuencia
absoluta se utiliza la siguiente proporción:
𝐺𝑟𝑎𝑑𝑜𝑠 𝑑𝑒𝑙 𝑠𝑒𝑐𝑡𝑜𝑟
3600
=
𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎
𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
Si se desea utilizar la frecuencia relativa, la proporción es:
𝐺𝑟𝑎𝑑𝑜𝑠 𝑑𝑒𝑙 𝑠𝑒𝑐𝑡𝑜𝑟
3600
= 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎
Ejemplo: diagrama de sectores
xi fi hi
Lunes 38 0,1402214
Martes 56 0,20664207
Miércoles 120 0,44280443
Jueves 12 0,04428044
Viernes 45 0,16605166
Lunes
14%
Martes
21%
Miércoles
44%
Jueves
4%
Viernes
17%
Número de reparaciones por día
Lunes Martes Miércoles Jueves Viernes
El ángulo que le corresponde al miércoles es:
𝐺𝑟𝑎𝑑𝑜𝑠 𝑑𝑒𝑙 𝑠𝑒𝑐𝑡𝑜𝑟
3600 =
120
271
es decir aproximadamente 1590
Total: 271
Diagrama de tallo y hojas
Para realizar este tipo de diagramas se debe partir cada uno de los datos en
dos partes: un tallo y una hoja. Por ejemplo, 213 puede ser dividido en 2 y 13
o en 21 y 3 (tallo y hoja respectivamente).
Cada tallo dará lugar a una fila que estará alineada en horizontal con todas las
hojas ordenadas que comparten el mismo tallo. Estarán separadas por un
línea vertical.
Cada tallo, en orden se encontrará alineado en vertical y en orden.
Este tipo de gráfico permite mostrar la misma información que un diagrama
de barras a la vez que permite observar la distribución de los valores en cada
uno de los tallos.
Ejemplo: diagrama tallo/hoja
Diagrama tallo / hoja
14 | 0 0 1 1 1 2 3 4 5 8 8 9 9 9
15 | 0 1 2 2 4 4 4 4 4 5 7 8 8
16 | 0 1 2 2 4 4 5 7 8
17 | 0 2 3 4 4 5 6 8 8
18 | 0 1 1 1 2 2 4 6 6 7
19 | 0
160 181 190
178 162 152
181 165 140
154 158 182
154 157 180
151 174 158
173 145 150
168 152 141
148 184 176
170 186 181
161 149 162
187 154 186
154 144 154
143 172 141
154 167 141
178 182 175
164 142 164
149 174 149
148 155 140
Supongamos que la tabla incluye la medida, en
centímetros de los alumnos de una clase. El
tallo serán los dos dígitos más significativos y
las hojas el último número.
tallos
hojas
Histogramas
Un histograma para datos numéricos discretos es un gráfico de la frecuencia
absoluta o relativa, similar al diagrama de barras.
Cada frecuencia es representada por un rectángulo centrado sobre el valor
correspondiente.
El área del rectángulo es proporcional a la frecuencia que se desea
representar.
Se puede mostrar fácilmente:
El centro o valor típico
La variación de los valores
Su forma general, la presencia de huecos y las partes aisladas
Ejemplo: Histograma
PARÁMETROS DE CENTRALIZACIÓN
Distribuciones unidimensionales
Parámetros estadísticos
Permiten describir de forma resumida el
comportamiento de la variable estadística
Existen dos grandes grupos:
• Parámetros de centralización
• Moda, mediana y media
• Parámetros de dispersión
• Rango, varianza, desviación típica y coeficiente de
variación
Parámetros de centralización
La moda (Mo): de los valores de la variable estadística
el de mayor frecuencia.
La mediana (Me): tras haber ordenado los valores de la
variable (junto con sus frecuencias), aquel valor de la
variable que ocupa el lugar central.
La media ( 𝒙 ): valor que se obtiene al sumar los
productos de los valores de la variable estadística por la
frecuencia absoluta, dividido por el tamaño de la
muestra.
𝒙 =
𝒊=𝟏
𝒏
𝒙𝒊 · 𝒇𝒊
𝑵
Ejemplo
Valor de la
variable
Frecuencia
absoluta
xi fi
1 3
2 9
3 12
4 10
5 4
6 5
7 4
8 3
Total 50
La moda es 3, pues es el valor de la
variable que más frecuencia
absoluta tiene
La mediana es 4, pues contiene el
elemento 25 y 26 (mitad y mitad
mas uno del tamaño de la
población)
𝒙 =
𝒊=𝟏
𝒏
𝒙𝒊 · 𝒇𝒊
𝑵
=
=
𝟑 · 𝟏 + 𝟐 · 𝟗 + 𝟑 · 𝟏𝟐 + ⋯ . . +𝟖 · 𝟑
𝟓𝟎
= 𝟑, 𝟗𝟖
A tener en cuenta para calcular la
mediana
Cuando la variable estadística es discreta y el número de
elementos es par, para calcular la mediana se utilizan los dos
valores centrales y se realiza la media aritmética de los valores
centrales de la variable estadística.
Si la variable estadística se encuentra agrupada en intervalos el
que contiene el valor medio es el intervalo mediano pero la
mediana se calculará mediante la siguiente fórmula:
Me = Li + a
N
2
− Fi−1
fi
Donde:
Li Límite inferior del intervalo
mediano
Amplitud del intervaloa
Frecuencia absoluta de la
clase mediana
fi
Frecuencia absoluta acumulada de la clase
anterior
Fi−1 𝑁 Tamaño de la muestra
Ejemplo
Intervalo Marca de clase Frecuencia Absoluta
(xi,xi+1] xi fi
(0,20] 10 23
(20,40] 30 17
(40,60] 50 16
(60,80] 70 25
(80,100] 90 19
Total 100
El intervalo mediano es [40,60] que
acumula los datos 50 y 51
Me = Li + a
N
2
− Fi−1
fi
= 40 + 20
100
2
− 40
16
= 52,5
Medidas de orden o posición
Estas medidas indican el orden o posición de una observación
entre los valores de una variable cuantitativa.
Para realizar su cálculo es conveniente ordenar los valores de la
muestra.
El percentil al p% es el valor que cumple que el p% de las
observaciones de la muestra son inferiores a él.
Para el cálculo de la posición que ocupa el percentil, se utiliza la
fórmula:
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 = 𝑛 + 1
𝑝
100
Esta fórmula será válida cuando el valor obtenido sea entero.
Ejemplo
Calculemos el percentil a 25% y 75% de la siguiente muestra
ordenada:
1.48 1.56 1.56 1.59 1.60 1.61 1.63 1.64 1.64 1.67 1.68
1.68 1.68 1.68 1.69 1.70 1.71 1.72 1.72 1.75 1.76 1.76
1.77 1.77 1.79 1.81 1.81 1.84 1.84 1.88 1.94
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 = 31 + 1
25
100
=
32
4
= 8Percentil a 25%, Valor 1.64
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 = 31 + 1
75
100
=
2400
100
= 24Percentil a 75%, Valor 1.77
Percentiles (posición decimal)
Cuando al calcular un percentil no obtenemos una posición
entera, utilizaremos el valor entero obtenido:
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 = 𝑛 + 1
𝑝
100
Y después, utilizaremos el siguiente valor para calcular el
percentil:
𝐷𝑒𝑐 𝑃𝑜𝑠 · 𝑋 𝑃𝑜𝑠 +1 + 1 − 𝐷𝑒𝑐 𝑃𝑜𝑠 · 𝑋 𝑃𝑜𝑠
Donde:
𝐷𝑒𝑐 𝑃𝑜𝑠 es la parte decimal de la posición obtenida inicialmente
𝑋 𝑃𝑜𝑠 +1 es el valor que ocupa el lugar posición mas uno
𝑋 𝑃𝑜𝑠 es el valor que ocupa la posición obtenida
Ejemplo
Calculemos el percentil a 5% de la siguiente muestra ordenada:
1.48 1.56 1.56 1.59 1.60 1.61 1.63 1.64 1.64 1.67 1.68
1.68 1.68 1.68 1.69 1.70 1.71 1.72 1.72 1.75 1.76 1.76
1.77 1.77 1.79 1.81 1.81 1.84 1.84 1.88 1.94
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 = 31 + 1
5
100
=
160
100
=1,6Percentil a 5%,
Utilizamos la siguiente fórmula, pues el valor obtenido es decimal
𝐷𝑒𝑐 𝑃𝑜𝑠 · 𝑋 𝑃𝑜𝑠 +1 + 1 − 𝐷𝑒𝑐 𝑃𝑜𝑠 · 𝑋 𝑃𝑜𝑠
0,6 · 1,56 + ( 1 – 0,6 ) · 1,48 = 0,936 + 0,592 = 1,528
El percentil a 5% es 1,528
Cuartiles
Los percentiles al 25%, 50% y 75% se denominan primer, segundo
y tercer cuartil respectivamente.
Los cuartiles son importantes pues dividen la muestra en cuatro
partes que contienen el mismo número de individuos.
El cálculo de los cuartiles se realiza con los respectivos
percentiles.
La mediana es tanto el percentil al 50% como el segundo cuartil.
Los cuartiles permiten representar la información de un conjunto
de datos de una forma muy resumida: los diagramas de caja.
Diagrama de caja
Se compone de un rectángulo, cuyo lado superior representa el
primer cuartil y el lado inferior por el tercer cuartil.
En el centro del rectángulo se representa una línea que se
corresponde con la mediana (segundo cuartil).
Y dos segmentos verticales (llamados “bigotes”):
Uno nace del valor mínimo de los datos y termina en el lado
superior del rectángulo.
El otro nace del lado inferior del rectángulo y termina en el
mayor valor de los datos.
Ejemplo: diagrama de caja
El siguiente gráfico representa
un diagrama de caja para los
siguientes valores obtenidos
de una muestra:
Mínimo 43
Primer cuartil 71
Mediana 78
Tercer cuartil 86
Máximo 96
0
50
100
150
200
250
300
350
400
1
Diagrama de caja
Parámetros estadísticos de dispersión I
El rango (amplitud o recorrido): diferencia entre el mayor y
menor valor de la variable estadística.
La varianza: mide la distancia entre la media y los valores de la
variable estadística.
Las siguientes fórmulas permiten el cálculo de la varianza.
𝝈 𝟐 =
𝒊=𝟏
𝒏
𝒙𝒊 − 𝒙 𝟐 𝒇𝒊
𝑵
𝝈 𝟐 =
𝐢=𝟏
𝐧
𝐱𝐢
𝟐 𝐟𝐢
𝐍
− 𝐱 𝟐
Parámetros estadísticos de dispersión II
La desviación típica: mide si los datos se encuentran agrupados
en las proximidades de la media. Se mide en las mismas unidades
que los datos
𝛔 = 𝐢=𝟏
𝐧
𝐱 𝐢 − 𝐱 𝟐 𝐟𝐢
𝐍
= 𝐢=𝟏
𝐧
𝐱 𝐢
𝟐 𝐟𝐢
𝐍
− 𝐱 𝟐
La desviación típica es el parámetro de dispersión más utilizado
Si se suma una constante a cada uno de los valores de la variable,
la desviación típica no varía
Si se multiplica una constante a cada uno de los valores de la
variable, la desviación típica queda multiplicada por él.
Coeficiente de variación
Cuando se desea comparar dos variables aleatorias se utiliza el
coeficiente de variación, que no es más que la razón entre la
desviación típica y la media de la variable
𝑪𝑽 =
𝝈
𝒙
El coeficiente de variación siempre es positivo y no tiene
unidades.
Cuanto más pequeño es, los valores de la variable se encuentran
más concentrados alrededor de la media
Permite comparar dos variables aleatorias heterogéneas.
VARIABLES ESTADÍSTICAS
BIDIMENSIONALES
Variable estadística bidimensional
Cuando en una población se observan dos caracteres de los
individuos, se recurre a una variable estadística bidimensional
Cada individuo tendrá asociado dos valores, uno para cada uno
de los caracteres estadísticos estudiados.
El par ordenado (X,Y) se compone de dos variables estadísticas
unidimensionales. Si n es el tamaño de la muestra o población, el
par (xi,yi) representa los valores de cada una de las variables
estadísticas para el individuo i.
Relaciones funcionales y estadísticas
La relación entre dos variables podría ser funcional, si conocida
una de ellas se conoce la otra de forma unívoca. Este tipo de
relaciones no son estudiadas por la estadística.
Cuando en una relación puede obtenerse un valor aproximado si
se conoce el valor de la otra variable, se dice que hay una
relación estadística (correlación).
Ejemplos
La longitud de un niño conocidos los meses desde su
nacimiento
El peso y la altura de una persona
Tabla simple
Para organizar los datos de las variables bidimensionales se
pueden utilizar las tablas simples, donde para cada individuo de
la muestra aparece los valores de los dos caracteres estadísticos a
estudiar.
Ejemplo:
Supongamos que se estudia la puntuación de 10 estudiantes
en un test de expresión oral y escrita.
Expresión oral (X) 8 5 4 9 3 7 8 5 9 9
Expresión escrita (Y) 9 6 6 7 6 7 4 6 8 6
Cada columna representa la puntuación obtenida por cada
uno de los estudiantes (la frecuencia de cada par es 1).
Tabla simple con frecuencias
Para cada par de valores de las variables estadísticas se les asocia
la frecuencia.
Ejemplo:
Supongamos que se estudia la puntuación de 63 estudiantes
en una prueba de matemáticas y economía, recogiendo para
cada par distinto de valores obtenidos el número de alumnos
que lo obtienen:
Matemáticas (X) 3 4 5 5 6 7 7 8 8 9
Economía (Y) 4 4 4 5 7 7 8 8 9 9
Número de alumnos 4 5 6 7 9 9 8 6 6 3
Tablas de doble entrada
Para organizar los datos de las variables bidimensionales se
pueden utilizar las tablas de doble entrada:
[2.5,5) [5,6) [6,7) [7,9) [9,10) Total
[2.5,5) 2 3 2 2 1 10
[5,6) 1 5 6 6 2 20
[6,7) 7 7 14 5 5 38
[7,9) 1 2 9 3 6 21
Total 12 19 35 20 14 100
Nota de Física y Química X
NotadeMatemáticasY
Número total de alumnosHay 19 alumnos que han obtenido
una nota de física entre 5 y 6.
Distribuciones marginales
A partir de las tablas de doble entrada, es posible obtener las
distribuciones marginales de cada una de las variables:
[2.5,5) [5,6) [6,7) [7,9) [9,10) Total
[2.5,5) 2 3 2 2 1 10
[5,6) 1 5 6 6 2 20
[6,7) 7 7 14 5 5 38
[7,9) 1 2 9 3 6 21
Total 12 19 35 20 14 100
Nota de Física y Química
12 19 35 20 14
[2.5,5) [5,6) [6,7) [7,9) [9,10)
[2.5,5)
[5,6)
[6,7)
[7,9)
10
20
38
21
NotadeMatemáticas
Distribuciones marginales
Distribuciones condicionadas
En una distribución bidimensional podemos estudiar la
distribución que resulta de fijar un valor en una de las variables y
estudiar las frecuencias correspondientes a la otra.
A la distribución así formada se denomina distribución
condicionada.
[2.5,5) [5,6) [6,7) [7,9) [9,10)
[2.5,5) 2 3 2 2 1
Ejemplo:
Si fijamos la nota de matemáticas al intervalo [2.5,5), la
distribución condicionada para la nota de física es:
Esta distribución se notará por: 𝑿| 𝒀=[𝟐.𝟓,𝟓) siendo X la variable
asociada a la puntuación de física e Y la variable asociada a la
puntuación de matemáticas.
Diagrama de dispersión I
El diagrama de dispersión es la representación gráfica de los
pares de puntos (xi,yi) que forman la distribución
bidimensional.
Ejemplo:
Supongamos que se estudia la nota de 5 alumnos en
bachillerato (X) y en la PAU (Y).
xi yi
5,4 4,8
6,2 7,0
5,5 6,2
6,4 4,3
8,2 8,5 0
1
2
3
4
5
6
7
8
9
0 2 4 6 8 10
yi
Diagrama de dispersión II
Cuando se dispone de una tabla de doble entrada, la
frecuencia de cada punto no es uno, por lo que puede
representarse en las inmediaciones del punto representado
tantos puntos como frecuencia exista en la tabla, o bien, el
tamaño del “punto” representado sea proporcional, o
utilizando un gráfico de tridimensional.
1
2
3
4
5
6
0
1
2
3
4
1 2 3
Covarianza
Se define la covarianza de una variable bidimensional (X,Y) a
la media aritmética de los productos de las desviaciones de
cada una de las variables respecto a sus medias respectivas.
Para realizar el cálculo de la covarianza se utilizan las
siguientes fórmulas (son equivalentes):
Sxy =
i=1
n
xi − x yi − y
N
Sxy =
i=1
n
fixiyi
N
− xy
Interpretación de la covarianza
Dependiendo del signo de la covarianza:
• Positivo: Indica que los productos de xi e yi se
alejan en el mismo sentido de sus respectivas
medias
• Negativo (comportamiento recíproco al
anterior)
• Cero o próximo a cero: la covarianza indica que
no hay relación entre las variables.
Correlación
La correlación es la relación que existe entre las dos variables
que participan en una distribución bidimensional.
La representación que proporciona la nube de puntos puede
indicar el tipo de correlación:
Lineal: la nube de puntos se dispone alrededor de una
recta.
Positiva (directa): la pendiente de la recta es positiva
Negativa (inversa): la pendiente de la recta es
negativa
Curvilínea: la nube de puntos se distribuye alrededor de
una curva.
Nula: cuando no existe ninguna relación entre las
variables.
Ejemplos
Correlación lineal
positiva
Correlación lineal
negativa
Correlación nula Correlación
cuvilínea
Regresión lineal. Coeficiente de
Pearson
Para poder cuantificar la correlación lineal entre dos
variables se utiliza el coeficiente de correlación lineal de
Pearson (r).
𝑟 =
𝜎 𝑋𝑌
𝜎 𝑋 𝜎 𝑌
Este coeficiente tiene el mismo signo que la covarianza, y se
encuentre comprendido entre 0 y 1, y proporciona la
siguiente información:
-1 < r < 0, la correlación es negativa y es mas fuerte cuanto más se
acerque a -1.
r = 0, no existe correlación
0 < r < 1, la correlación es positiva y es mas fuerte cuanto mas se
acerque a 1.
r = 1 ó r = -1, existe dependencia funcional.
Rectas de regresión
Tras comprobar que existe correlación entre dos variables
estadísticas, es posible realizar el cálculo de las rectas que
mejor se ajustan a la nube de puntos:
Recta de regresión de Y sobre X.
Si deseamos calcular el valor estimado de Y, dependiendo del valor de X.
𝒚 − 𝒚 =
𝝈 𝑿𝒀
𝝈 𝑿
𝟐
(𝒙 − 𝒙)
Recta de regresión de X sobre Y.
Si deseamos calcular el valor estimado de X, dependiendo del valor de Y.
𝒙 − 𝒙 =
𝝈 𝑿𝒀
𝝈 𝒀
𝟐
(𝒚 − 𝒚)

Más contenido relacionado

La actualidad más candente

Media, Mediana Y Moda De Datos Agrupados
Media, Mediana Y Moda De Datos AgrupadosMedia, Mediana Y Moda De Datos Agrupados
Media, Mediana Y Moda De Datos AgrupadosCúmar Cueva
 
Percentiles para datos sin agrupar y Percentiles para datos agrupados
Percentiles para datos sin agrupar y Percentiles para datos agrupadosPercentiles para datos sin agrupar y Percentiles para datos agrupados
Percentiles para datos sin agrupar y Percentiles para datos agrupadosRodrigo Palomino
 
4. estadistica inferencial
4.  estadistica inferencial4.  estadistica inferencial
4. estadistica inferencialrbarriosm
 
577544365.u04 poisson - ejercicio resuelto
577544365.u04   poisson - ejercicio resuelto577544365.u04   poisson - ejercicio resuelto
577544365.u04 poisson - ejercicio resueltosaposapoloko
 
Medidas de tendencia central para datos agrupados
Medidas de tendencia central para datos agrupadosMedidas de tendencia central para datos agrupados
Medidas de tendencia central para datos agrupadoseduargom
 
Distribucion muestral de proporciones
Distribucion muestral de proporcionesDistribucion muestral de proporciones
Distribucion muestral de proporcioneseraperez
 
Ejercicios sobre muestreo
Ejercicios sobre muestreoEjercicios sobre muestreo
Ejercicios sobre muestreo216846
 
EJERCICIOS DE PERMUTACIONES, COMBINACIONES, VARIACIONES
EJERCICIOS DE PERMUTACIONES, COMBINACIONES, VARIACIONESEJERCICIOS DE PERMUTACIONES, COMBINACIONES, VARIACIONES
EJERCICIOS DE PERMUTACIONES, COMBINACIONES, VARIACIONESAlexander Flores Valencia
 
TRABAJO DE DISTRIBUCCION DE PROBABILIDAD
TRABAJO DE DISTRIBUCCION DE PROBABILIDADTRABAJO DE DISTRIBUCCION DE PROBABILIDAD
TRABAJO DE DISTRIBUCCION DE PROBABILIDADjorgemogollon49
 
Muestreo aleatorio simple
Muestreo aleatorio simpleMuestreo aleatorio simple
Muestreo aleatorio simplemilit
 
Moda, media y mediana
Moda, media y medianaModa, media y mediana
Moda, media y medianajoceda
 
Que es la estadistica
Que es la estadisticaQue es la estadistica
Que es la estadisticaDaday Rivas
 

La actualidad más candente (20)

Media, Mediana Y Moda De Datos Agrupados
Media, Mediana Y Moda De Datos AgrupadosMedia, Mediana Y Moda De Datos Agrupados
Media, Mediana Y Moda De Datos Agrupados
 
Percentiles para datos sin agrupar y Percentiles para datos agrupados
Percentiles para datos sin agrupar y Percentiles para datos agrupadosPercentiles para datos sin agrupar y Percentiles para datos agrupados
Percentiles para datos sin agrupar y Percentiles para datos agrupados
 
Ejercicios resueltos-de-estadistica
Ejercicios resueltos-de-estadisticaEjercicios resueltos-de-estadistica
Ejercicios resueltos-de-estadistica
 
4. estadistica inferencial
4.  estadistica inferencial4.  estadistica inferencial
4. estadistica inferencial
 
Estadistica
Estadistica Estadistica
Estadistica
 
577544365.u04 poisson - ejercicio resuelto
577544365.u04   poisson - ejercicio resuelto577544365.u04   poisson - ejercicio resuelto
577544365.u04 poisson - ejercicio resuelto
 
Medidas de tendencia central para datos agrupados
Medidas de tendencia central para datos agrupadosMedidas de tendencia central para datos agrupados
Medidas de tendencia central para datos agrupados
 
Distribucion muestral de proporciones
Distribucion muestral de proporcionesDistribucion muestral de proporciones
Distribucion muestral de proporciones
 
Ejercicios sobre muestreo
Ejercicios sobre muestreoEjercicios sobre muestreo
Ejercicios sobre muestreo
 
Regla sturges
Regla sturgesRegla sturges
Regla sturges
 
Medidas de Posición
Medidas de PosiciónMedidas de Posición
Medidas de Posición
 
EJERCICIOS DE PERMUTACIONES, COMBINACIONES, VARIACIONES
EJERCICIOS DE PERMUTACIONES, COMBINACIONES, VARIACIONESEJERCICIOS DE PERMUTACIONES, COMBINACIONES, VARIACIONES
EJERCICIOS DE PERMUTACIONES, COMBINACIONES, VARIACIONES
 
Estadística Básica
Estadística BásicaEstadística Básica
Estadística Básica
 
Mapa conceptual
Mapa conceptual Mapa conceptual
Mapa conceptual
 
Estadística. Medidas de tendencia central.
Estadística. Medidas de tendencia central.Estadística. Medidas de tendencia central.
Estadística. Medidas de tendencia central.
 
Varianza y covarianza
Varianza y covarianzaVarianza y covarianza
Varianza y covarianza
 
TRABAJO DE DISTRIBUCCION DE PROBABILIDAD
TRABAJO DE DISTRIBUCCION DE PROBABILIDADTRABAJO DE DISTRIBUCCION DE PROBABILIDAD
TRABAJO DE DISTRIBUCCION DE PROBABILIDAD
 
Muestreo aleatorio simple
Muestreo aleatorio simpleMuestreo aleatorio simple
Muestreo aleatorio simple
 
Moda, media y mediana
Moda, media y medianaModa, media y mediana
Moda, media y mediana
 
Que es la estadistica
Que es la estadisticaQue es la estadistica
Que es la estadistica
 

Destacado

Divisibiliad
DivisibiliadDivisibiliad
Divisibiliadjcremiro
 
Proporcionalidad
ProporcionalidadProporcionalidad
Proporcionalidadjcremiro
 
Semejanza teorema tales
Semejanza teorema talesSemejanza teorema tales
Semejanza teorema talesjcremiro
 
Numeros enteros
Numeros enterosNumeros enteros
Numeros enterosjcremiro
 
Numeros decimales
Numeros decimalesNumeros decimales
Numeros decimalesjcremiro
 
Numeros naturales
Numeros naturalesNumeros naturales
Numeros naturalesjcremiro
 
Cuerpos geometricos
Cuerpos geometricosCuerpos geometricos
Cuerpos geometricosjcremiro
 
Elementos básicos de geometría
Elementos básicos de geometríaElementos básicos de geometría
Elementos básicos de geometríajcremiro
 
Numeros racionales
Numeros racionalesNumeros racionales
Numeros racionalesjcremiro
 
Polinomios
PolinomiosPolinomios
Polinomiosjcremiro
 
Figuras planas
Figuras planasFiguras planas
Figuras planasjcremiro
 
Ecuaciones
EcuacionesEcuaciones
Ecuacionesjcremiro
 

Destacado (12)

Divisibiliad
DivisibiliadDivisibiliad
Divisibiliad
 
Proporcionalidad
ProporcionalidadProporcionalidad
Proporcionalidad
 
Semejanza teorema tales
Semejanza teorema talesSemejanza teorema tales
Semejanza teorema tales
 
Numeros enteros
Numeros enterosNumeros enteros
Numeros enteros
 
Numeros decimales
Numeros decimalesNumeros decimales
Numeros decimales
 
Numeros naturales
Numeros naturalesNumeros naturales
Numeros naturales
 
Cuerpos geometricos
Cuerpos geometricosCuerpos geometricos
Cuerpos geometricos
 
Elementos básicos de geometría
Elementos básicos de geometríaElementos básicos de geometría
Elementos básicos de geometría
 
Numeros racionales
Numeros racionalesNumeros racionales
Numeros racionales
 
Polinomios
PolinomiosPolinomios
Polinomios
 
Figuras planas
Figuras planasFiguras planas
Figuras planas
 
Ecuaciones
EcuacionesEcuaciones
Ecuaciones
 

Similar a Estadística

Similar a Estadística (20)

ESTADISTICA
ESTADISTICAESTADISTICA
ESTADISTICA
 
Estadistica y probabilidad
Estadistica y probabilidadEstadistica y probabilidad
Estadistica y probabilidad
 
Variables
VariablesVariables
Variables
 
Tema 8
Tema 8Tema 8
Tema 8
 
Clase de estadistica 1ºparcial
Clase de estadistica 1ºparcialClase de estadistica 1ºparcial
Clase de estadistica 1ºparcial
 
Calidad
CalidadCalidad
Calidad
 
Estadística descriptiva
Estadística descriptivaEstadística descriptiva
Estadística descriptiva
 
Introduccion a la Estadística y tablas de frecuencia
Introduccion a la Estadística y tablas de frecuenciaIntroduccion a la Estadística y tablas de frecuencia
Introduccion a la Estadística y tablas de frecuencia
 
Estadistica.pptx
Estadistica.pptxEstadistica.pptx
Estadistica.pptx
 
Estadística Descriptiva
Estadística DescriptivaEstadística Descriptiva
Estadística Descriptiva
 
3eso quincena11
3eso quincena113eso quincena11
3eso quincena11
 
dispersion.pdf
dispersion.pdfdispersion.pdf
dispersion.pdf
 
Medidas de tendencia NEPTALI AVILA
Medidas de tendencia NEPTALI AVILAMedidas de tendencia NEPTALI AVILA
Medidas de tendencia NEPTALI AVILA
 
Medidas de tendencia NEPTALI AVILA
Medidas de tendencia NEPTALI AVILAMedidas de tendencia NEPTALI AVILA
Medidas de tendencia NEPTALI AVILA
 
Estadistica lópez
Estadistica lópezEstadistica lópez
Estadistica lópez
 
Estadistica descriptiva
Estadistica descriptivaEstadistica descriptiva
Estadistica descriptiva
 
Actividad en equipo
Actividad en equipoActividad en equipo
Actividad en equipo
 
Mio
MioMio
Mio
 
Estadística
EstadísticaEstadística
Estadística
 
Apuntes estadistica 4_eso
Apuntes estadistica 4_esoApuntes estadistica 4_eso
Apuntes estadistica 4_eso
 

Más de jcremiro

Sucesiones: conceptos elementales
Sucesiones: conceptos elementalesSucesiones: conceptos elementales
Sucesiones: conceptos elementalesjcremiro
 
Combinatoria
CombinatoriaCombinatoria
Combinatoriajcremiro
 
Funciones: conceptos básicos
Funciones: conceptos básicosFunciones: conceptos básicos
Funciones: conceptos básicosjcremiro
 
Vectores en el epacio
Vectores en el epacioVectores en el epacio
Vectores en el epaciojcremiro
 
Geometría analítica plana
Geometría analítica planaGeometría analítica plana
Geometría analítica planajcremiro
 
Cálculo vectorial en el plano
Cálculo vectorial en el planoCálculo vectorial en el plano
Cálculo vectorial en el planojcremiro
 
Numeros complejos
Numeros complejosNumeros complejos
Numeros complejosjcremiro
 
Razones trigonométricas
Razones trigonométricasRazones trigonométricas
Razones trigonométricasjcremiro
 
Probabilidad
ProbabilidadProbabilidad
Probabilidadjcremiro
 
Razones trigonométricas
Razones trigonométricasRazones trigonométricas
Razones trigonométricasjcremiro
 
Inecuaciones. Programación lineal
Inecuaciones. Programación linealInecuaciones. Programación lineal
Inecuaciones. Programación linealjcremiro
 
Teoria de conjuntos
Teoria de conjuntosTeoria de conjuntos
Teoria de conjuntosjcremiro
 
Semejanza: Teorema tales
Semejanza: Teorema talesSemejanza: Teorema tales
Semejanza: Teorema talesjcremiro
 
Progresiones aritméticas y geométricas
Progresiones aritméticas y geométricasProgresiones aritméticas y geométricas
Progresiones aritméticas y geométricasjcremiro
 
Potencias y radicales
Potencias y radicalesPotencias y radicales
Potencias y radicalesjcremiro
 
Numeros reales
Numeros realesNumeros reales
Numeros realesjcremiro
 

Más de jcremiro (18)

Sucesiones: conceptos elementales
Sucesiones: conceptos elementalesSucesiones: conceptos elementales
Sucesiones: conceptos elementales
 
Combinatoria
CombinatoriaCombinatoria
Combinatoria
 
Funciones: conceptos básicos
Funciones: conceptos básicosFunciones: conceptos básicos
Funciones: conceptos básicos
 
Vectores en el epacio
Vectores en el epacioVectores en el epacio
Vectores en el epacio
 
Cónicas
CónicasCónicas
Cónicas
 
Geometría analítica plana
Geometría analítica planaGeometría analítica plana
Geometría analítica plana
 
Cálculo vectorial en el plano
Cálculo vectorial en el planoCálculo vectorial en el plano
Cálculo vectorial en el plano
 
Numeros complejos
Numeros complejosNumeros complejos
Numeros complejos
 
Razones trigonométricas
Razones trigonométricasRazones trigonométricas
Razones trigonométricas
 
Probabilidad
ProbabilidadProbabilidad
Probabilidad
 
Vectores
VectoresVectores
Vectores
 
Razones trigonométricas
Razones trigonométricasRazones trigonométricas
Razones trigonométricas
 
Inecuaciones. Programación lineal
Inecuaciones. Programación linealInecuaciones. Programación lineal
Inecuaciones. Programación lineal
 
Teoria de conjuntos
Teoria de conjuntosTeoria de conjuntos
Teoria de conjuntos
 
Semejanza: Teorema tales
Semejanza: Teorema talesSemejanza: Teorema tales
Semejanza: Teorema tales
 
Progresiones aritméticas y geométricas
Progresiones aritméticas y geométricasProgresiones aritméticas y geométricas
Progresiones aritméticas y geométricas
 
Potencias y radicales
Potencias y radicalesPotencias y radicales
Potencias y radicales
 
Numeros reales
Numeros realesNumeros reales
Numeros reales
 

Último

el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyzel CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyzprofefilete
 
VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMAL
VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMALVOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMAL
VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMALEDUCCUniversidadCatl
 
Cuadernillo de las sílabas trabadas.pdf
Cuadernillo de las sílabas trabadas.pdfCuadernillo de las sílabas trabadas.pdf
Cuadernillo de las sílabas trabadas.pdfBrandonsanchezdoming
 
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptx
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptxSINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptx
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptxlclcarmen
 
Identificación de componentes Hardware del PC
Identificación de componentes Hardware del PCIdentificación de componentes Hardware del PC
Identificación de componentes Hardware del PCCesarFernandez937857
 
programa dia de las madres 10 de mayo para evento
programa dia de las madres 10 de mayo  para eventoprograma dia de las madres 10 de mayo  para evento
programa dia de las madres 10 de mayo para eventoDiegoMtsS
 
RETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docxRETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docxAna Fernandez
 
Unidad II Doctrina de la Iglesia 1 parte
Unidad II Doctrina de la Iglesia 1 parteUnidad II Doctrina de la Iglesia 1 parte
Unidad II Doctrina de la Iglesia 1 parteJuan Hernandez
 
Movimientos Precursores de La Independencia en Venezuela
Movimientos Precursores de La Independencia en VenezuelaMovimientos Precursores de La Independencia en Venezuela
Movimientos Precursores de La Independencia en Venezuelacocuyelquemao
 
Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...
Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...
Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...fcastellanos3
 
Fundamentos y Principios de Psicopedagogía..pdf
Fundamentos y Principios de Psicopedagogía..pdfFundamentos y Principios de Psicopedagogía..pdf
Fundamentos y Principios de Psicopedagogía..pdfsamyarrocha1
 
Día de la Madre Tierra-1.pdf día mundial
Día de la Madre Tierra-1.pdf día mundialDía de la Madre Tierra-1.pdf día mundial
Día de la Madre Tierra-1.pdf día mundialpatriciaines1993
 
plan-de-trabajo-colegiado en una institucion educativa
plan-de-trabajo-colegiado en una institucion educativaplan-de-trabajo-colegiado en una institucion educativa
plan-de-trabajo-colegiado en una institucion educativafiorelachuctaya2
 
Factores ecosistemas: interacciones, energia y dinamica
Factores ecosistemas: interacciones, energia y dinamicaFactores ecosistemas: interacciones, energia y dinamica
Factores ecosistemas: interacciones, energia y dinamicaFlor Idalia Espinoza Ortega
 
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdfOswaldoGonzalezCruz
 
Tarea 5-Selección de herramientas digitales-Carol Eraso.pdf
Tarea 5-Selección de herramientas digitales-Carol Eraso.pdfTarea 5-Selección de herramientas digitales-Carol Eraso.pdf
Tarea 5-Selección de herramientas digitales-Carol Eraso.pdfCarol Andrea Eraso Guerrero
 
Informatica Generalidades - Conceptos Básicos
Informatica Generalidades - Conceptos BásicosInformatica Generalidades - Conceptos Básicos
Informatica Generalidades - Conceptos BásicosCesarFernandez937857
 
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...JAVIER SOLIS NOYOLA
 
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdfTarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdfManuel Molina
 

Último (20)

el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyzel CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
 
VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMAL
VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMALVOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMAL
VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMAL
 
Cuadernillo de las sílabas trabadas.pdf
Cuadernillo de las sílabas trabadas.pdfCuadernillo de las sílabas trabadas.pdf
Cuadernillo de las sílabas trabadas.pdf
 
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptx
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptxSINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptx
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptx
 
Sesión de clase: Defendamos la verdad.pdf
Sesión de clase: Defendamos la verdad.pdfSesión de clase: Defendamos la verdad.pdf
Sesión de clase: Defendamos la verdad.pdf
 
Identificación de componentes Hardware del PC
Identificación de componentes Hardware del PCIdentificación de componentes Hardware del PC
Identificación de componentes Hardware del PC
 
programa dia de las madres 10 de mayo para evento
programa dia de las madres 10 de mayo  para eventoprograma dia de las madres 10 de mayo  para evento
programa dia de las madres 10 de mayo para evento
 
RETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docxRETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docx
 
Unidad II Doctrina de la Iglesia 1 parte
Unidad II Doctrina de la Iglesia 1 parteUnidad II Doctrina de la Iglesia 1 parte
Unidad II Doctrina de la Iglesia 1 parte
 
Movimientos Precursores de La Independencia en Venezuela
Movimientos Precursores de La Independencia en VenezuelaMovimientos Precursores de La Independencia en Venezuela
Movimientos Precursores de La Independencia en Venezuela
 
Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...
Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...
Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...
 
Fundamentos y Principios de Psicopedagogía..pdf
Fundamentos y Principios de Psicopedagogía..pdfFundamentos y Principios de Psicopedagogía..pdf
Fundamentos y Principios de Psicopedagogía..pdf
 
Día de la Madre Tierra-1.pdf día mundial
Día de la Madre Tierra-1.pdf día mundialDía de la Madre Tierra-1.pdf día mundial
Día de la Madre Tierra-1.pdf día mundial
 
plan-de-trabajo-colegiado en una institucion educativa
plan-de-trabajo-colegiado en una institucion educativaplan-de-trabajo-colegiado en una institucion educativa
plan-de-trabajo-colegiado en una institucion educativa
 
Factores ecosistemas: interacciones, energia y dinamica
Factores ecosistemas: interacciones, energia y dinamicaFactores ecosistemas: interacciones, energia y dinamica
Factores ecosistemas: interacciones, energia y dinamica
 
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
 
Tarea 5-Selección de herramientas digitales-Carol Eraso.pdf
Tarea 5-Selección de herramientas digitales-Carol Eraso.pdfTarea 5-Selección de herramientas digitales-Carol Eraso.pdf
Tarea 5-Selección de herramientas digitales-Carol Eraso.pdf
 
Informatica Generalidades - Conceptos Básicos
Informatica Generalidades - Conceptos BásicosInformatica Generalidades - Conceptos Básicos
Informatica Generalidades - Conceptos Básicos
 
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
 
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdfTarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
 

Estadística

  • 2. Estadística • La estadística es la ciencia que se ocupa de la recogida de datos, su organización y análisis. • Según el método de estudio y el problema a resolver se puede distinguir: – Estadística descriptiva: Se encarga de recolectar datos, organizarlos y en el cálculo de valores que describan el conjunto objeto de estudio. – Estadística inferencial: se encarga de elaborar conclusiones para el conjunto estudiado a partir del estudio de una muestra.
  • 3. Conceptos estadísticos I • Población: conjunto de elementos a estudiar. • Individuo: cada uno de los elementos de la población. • Muestra: Subconjunto de la población que se toma para representar a la población en el estudio. • Tamaño de la muestra: Número de elementos que componen la muestra.
  • 4. Conceptos estadísticos II • Carácter estadístico: propiedad de los individuos de una población que permite clasificarlos. – Cualitativo: no pueden expresarse numéricamente. – Cuantitativo: puede expresarse numéricamente. • Variable estadística: conjunto de valores que puede tomar un carácter estadístico cuantitativo. – Discreta: la variable puede tomar un número finito de valores – Continua: la variable puede tomar un valor que se encuentre dentro de un intervalo de números reales.
  • 5. Estudio estadístico Para realizar un estudio estadístico se siguen las siguientes pautas: • Extracción de una muestra de la población Debe ser representativa de la población • Recuento de datos Proporciona la frecuencia absoluta de la tabla • Elaboración de una tabla estadística
  • 6. Recuento de datos • El recuento de datos proporciona la frecuencia absoluta para cada valor de la variable estadística • En la primera columna se disponen los distintos valores que puede tomar la variable estadística • En la siguiente, tras contar los casos en los que aparece cada valor de la variable, se calcula la frecuencia absoluta.
  • 7. Ejemplo I A las 50 familias que viven en una calle se les ha realizado una encuesta preguntando el número de personas que viven en su vivienda. 3 3 5 8 3 7 2 4 4 3 2 6 1 5 4 4 3 3 4 1 4 6 4 7 8 7 4 2 2 7 3 2 2 2 2 6 3 3 3 4 2 4 6 8 1 3 5 5 3 6 El carácter estadístico se corresponde con el número de personas que viven juntas. El tamaño de la muestra es 50.
  • 8. Ejemplo I (continuación) Valor de la variable Frecuencia absoluta xi fi 1 3 2 9 3 12 4 10 5 4 6 5 7 4 8 3 Total 50 El rango de valores de la variable va de 1 a 8. La variable es discreta. La frecuencia absoluta establece en este caso el número de viviendas que está ocupada por el número de inquilinos que le corresponde al valor de la variable. Hay 4 viviendas de las 50 ocupadas por 7 personas. La suma de las frecuencias absolutas es el tamaño de la muestra.
  • 9. Intervalos o clases • Cuando una variable estadística cuantitativa puede tomar una gran cantidad de valores distintos, se agruparán en intervalos. • Normalmente se toman intervalos de igual amplitud. • Para realizar cálculos se utilizará la marca de clase que no es más que el punto medio del intervalo.
  • 10. Ejemplo II A los 100 empleados de una empresa , se les ha realizado una prueba sobre resolución de problemas. En una escala de 0 a 100 se ha obtenido las siguientes puntuaciones: 2 58 69 62 17 53 5 30 76 33 84 76 69 70 63 65 46 99 65 2 5 82 83 80 72 74 39 21 84 48 68 5 15 90 48 99 32 17 27 62 21 54 11 4 7 33 90 76 4 18 27 53 47 11 88 66 64 29 59 99 46 61 20 27 49 44 37 90 72 35 84 7 85 14 28 71 89 76 48 52 70 41 25 85 90 4 81 78 55 36 73 8 2 94 84 68 11 13 37 9
  • 11. Ejemplo II (continuación) Se ha decidido agrupar los valores en 5 clases, como el menor valor es 2 y el mayor 100, la amplitud del intervalo será: 𝑀á𝑥𝑖𝑚𝑜 𝑣𝑎𝑙𝑜𝑟 − 𝑀í𝑛𝑖𝑚𝑜 𝑣𝑎𝑙𝑜𝑟 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠 = 100 − 2 5 = 19,6 Tomaremos para la longitud del intervalo 20, pues es más fácil de realizar cálculos: Intervalo Marca de clase Frecuencia Absoluta (xi,xi+1] xi fi (0,20] 10 23 (20,40] 30 17 (40,60] 50 16 (60,80] 70 25 (80,100] 90 19 Total 100
  • 12. Frecuencias Frecuencia absoluta: Número de individuos de la muestra que presenta un valor de la variable estadística. Su suma debe ser el tamaño de la muestra. Frecuencia relativa: Fracción que representa la frecuencia absoluta respecto del tamaño de la muestra. Se calcula dividiendo la frecuencia absoluta entre el tamaño de la muestra. La suma total debe ser 1. Frecuencia porcentual: Porcentaje que representa cada frecuencia absoluta respecto del tamaño de la muestra. La suma total debe ser 100. Frecuencias acumuladas: se corresponde con la suma de las frecuencias anteriores a las de un valor de la variable más la suya propia.
  • 13. Ejemplo Valor de la variable Frecuencia absoluta Frecuencia relativa Frecuencia porcentual Frecuencia acumulada xi fi hi pi Fi 1 3 0,06 6 3 2 9 0,18 18 12 3 12 0,24 24 24 4 10 0,2 20 34 5 4 0,08 8 38 6 5 0,1 10 43 7 4 0,08 8 47 8 3 0,06 6 50 Total 50 1 100
  • 15. Diagrama de barras El diagrama de barras se utiliza para representar variables cualitativas o cuantitativas discretas. A cada valor de la variable estadística o categoría, (que se corresponde con en el eje OX), se le asocia un rectángulo de área proporcional a la frecuencia absoluta o relativa que le corresponde a la categoría. El polígono de frecuencias se crea uniendo con segmentos los puntos medios consecutivos del diagrama de barras.
  • 16. Ejemplo: diagrama de barras xi fi Lunes 12 Martes 15 Miércoles 17 Jueves 20 Viernes 15 Sábado 18 Domingo 22 0 5 10 15 20 25 Lunes Martes Miércoles Jueves Viernes Sábado Domingo Venta de barras de pan (en cientos de unidades)
  • 17. Diagrama de sectores Consiste en representar cada una de los valores de la variable estadística mediante un sector circular proporcional a su valor. Se utilizan cuando los valores de la variable estadística no son numerosos. Para calcular el ángulo del sector que le corresponde a cada frecuencia absoluta se utiliza la siguiente proporción: 𝐺𝑟𝑎𝑑𝑜𝑠 𝑑𝑒𝑙 𝑠𝑒𝑐𝑡𝑜𝑟 3600 = 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 Si se desea utilizar la frecuencia relativa, la proporción es: 𝐺𝑟𝑎𝑑𝑜𝑠 𝑑𝑒𝑙 𝑠𝑒𝑐𝑡𝑜𝑟 3600 = 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎
  • 18. Ejemplo: diagrama de sectores xi fi hi Lunes 38 0,1402214 Martes 56 0,20664207 Miércoles 120 0,44280443 Jueves 12 0,04428044 Viernes 45 0,16605166 Lunes 14% Martes 21% Miércoles 44% Jueves 4% Viernes 17% Número de reparaciones por día Lunes Martes Miércoles Jueves Viernes El ángulo que le corresponde al miércoles es: 𝐺𝑟𝑎𝑑𝑜𝑠 𝑑𝑒𝑙 𝑠𝑒𝑐𝑡𝑜𝑟 3600 = 120 271 es decir aproximadamente 1590 Total: 271
  • 19. Diagrama de tallo y hojas Para realizar este tipo de diagramas se debe partir cada uno de los datos en dos partes: un tallo y una hoja. Por ejemplo, 213 puede ser dividido en 2 y 13 o en 21 y 3 (tallo y hoja respectivamente). Cada tallo dará lugar a una fila que estará alineada en horizontal con todas las hojas ordenadas que comparten el mismo tallo. Estarán separadas por un línea vertical. Cada tallo, en orden se encontrará alineado en vertical y en orden. Este tipo de gráfico permite mostrar la misma información que un diagrama de barras a la vez que permite observar la distribución de los valores en cada uno de los tallos.
  • 20. Ejemplo: diagrama tallo/hoja Diagrama tallo / hoja 14 | 0 0 1 1 1 2 3 4 5 8 8 9 9 9 15 | 0 1 2 2 4 4 4 4 4 5 7 8 8 16 | 0 1 2 2 4 4 5 7 8 17 | 0 2 3 4 4 5 6 8 8 18 | 0 1 1 1 2 2 4 6 6 7 19 | 0 160 181 190 178 162 152 181 165 140 154 158 182 154 157 180 151 174 158 173 145 150 168 152 141 148 184 176 170 186 181 161 149 162 187 154 186 154 144 154 143 172 141 154 167 141 178 182 175 164 142 164 149 174 149 148 155 140 Supongamos que la tabla incluye la medida, en centímetros de los alumnos de una clase. El tallo serán los dos dígitos más significativos y las hojas el último número. tallos hojas
  • 21. Histogramas Un histograma para datos numéricos discretos es un gráfico de la frecuencia absoluta o relativa, similar al diagrama de barras. Cada frecuencia es representada por un rectángulo centrado sobre el valor correspondiente. El área del rectángulo es proporcional a la frecuencia que se desea representar. Se puede mostrar fácilmente: El centro o valor típico La variación de los valores Su forma general, la presencia de huecos y las partes aisladas
  • 24. Parámetros estadísticos Permiten describir de forma resumida el comportamiento de la variable estadística Existen dos grandes grupos: • Parámetros de centralización • Moda, mediana y media • Parámetros de dispersión • Rango, varianza, desviación típica y coeficiente de variación
  • 25. Parámetros de centralización La moda (Mo): de los valores de la variable estadística el de mayor frecuencia. La mediana (Me): tras haber ordenado los valores de la variable (junto con sus frecuencias), aquel valor de la variable que ocupa el lugar central. La media ( 𝒙 ): valor que se obtiene al sumar los productos de los valores de la variable estadística por la frecuencia absoluta, dividido por el tamaño de la muestra. 𝒙 = 𝒊=𝟏 𝒏 𝒙𝒊 · 𝒇𝒊 𝑵
  • 26. Ejemplo Valor de la variable Frecuencia absoluta xi fi 1 3 2 9 3 12 4 10 5 4 6 5 7 4 8 3 Total 50 La moda es 3, pues es el valor de la variable que más frecuencia absoluta tiene La mediana es 4, pues contiene el elemento 25 y 26 (mitad y mitad mas uno del tamaño de la población) 𝒙 = 𝒊=𝟏 𝒏 𝒙𝒊 · 𝒇𝒊 𝑵 = = 𝟑 · 𝟏 + 𝟐 · 𝟗 + 𝟑 · 𝟏𝟐 + ⋯ . . +𝟖 · 𝟑 𝟓𝟎 = 𝟑, 𝟗𝟖
  • 27. A tener en cuenta para calcular la mediana Cuando la variable estadística es discreta y el número de elementos es par, para calcular la mediana se utilizan los dos valores centrales y se realiza la media aritmética de los valores centrales de la variable estadística. Si la variable estadística se encuentra agrupada en intervalos el que contiene el valor medio es el intervalo mediano pero la mediana se calculará mediante la siguiente fórmula: Me = Li + a N 2 − Fi−1 fi Donde: Li Límite inferior del intervalo mediano Amplitud del intervaloa Frecuencia absoluta de la clase mediana fi Frecuencia absoluta acumulada de la clase anterior Fi−1 𝑁 Tamaño de la muestra
  • 28. Ejemplo Intervalo Marca de clase Frecuencia Absoluta (xi,xi+1] xi fi (0,20] 10 23 (20,40] 30 17 (40,60] 50 16 (60,80] 70 25 (80,100] 90 19 Total 100 El intervalo mediano es [40,60] que acumula los datos 50 y 51 Me = Li + a N 2 − Fi−1 fi = 40 + 20 100 2 − 40 16 = 52,5
  • 29. Medidas de orden o posición Estas medidas indican el orden o posición de una observación entre los valores de una variable cuantitativa. Para realizar su cálculo es conveniente ordenar los valores de la muestra. El percentil al p% es el valor que cumple que el p% de las observaciones de la muestra son inferiores a él. Para el cálculo de la posición que ocupa el percentil, se utiliza la fórmula: 𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 = 𝑛 + 1 𝑝 100 Esta fórmula será válida cuando el valor obtenido sea entero.
  • 30. Ejemplo Calculemos el percentil a 25% y 75% de la siguiente muestra ordenada: 1.48 1.56 1.56 1.59 1.60 1.61 1.63 1.64 1.64 1.67 1.68 1.68 1.68 1.68 1.69 1.70 1.71 1.72 1.72 1.75 1.76 1.76 1.77 1.77 1.79 1.81 1.81 1.84 1.84 1.88 1.94 𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 = 31 + 1 25 100 = 32 4 = 8Percentil a 25%, Valor 1.64 𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 = 31 + 1 75 100 = 2400 100 = 24Percentil a 75%, Valor 1.77
  • 31. Percentiles (posición decimal) Cuando al calcular un percentil no obtenemos una posición entera, utilizaremos el valor entero obtenido: 𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 = 𝑛 + 1 𝑝 100 Y después, utilizaremos el siguiente valor para calcular el percentil: 𝐷𝑒𝑐 𝑃𝑜𝑠 · 𝑋 𝑃𝑜𝑠 +1 + 1 − 𝐷𝑒𝑐 𝑃𝑜𝑠 · 𝑋 𝑃𝑜𝑠 Donde: 𝐷𝑒𝑐 𝑃𝑜𝑠 es la parte decimal de la posición obtenida inicialmente 𝑋 𝑃𝑜𝑠 +1 es el valor que ocupa el lugar posición mas uno 𝑋 𝑃𝑜𝑠 es el valor que ocupa la posición obtenida
  • 32. Ejemplo Calculemos el percentil a 5% de la siguiente muestra ordenada: 1.48 1.56 1.56 1.59 1.60 1.61 1.63 1.64 1.64 1.67 1.68 1.68 1.68 1.68 1.69 1.70 1.71 1.72 1.72 1.75 1.76 1.76 1.77 1.77 1.79 1.81 1.81 1.84 1.84 1.88 1.94 𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 = 31 + 1 5 100 = 160 100 =1,6Percentil a 5%, Utilizamos la siguiente fórmula, pues el valor obtenido es decimal 𝐷𝑒𝑐 𝑃𝑜𝑠 · 𝑋 𝑃𝑜𝑠 +1 + 1 − 𝐷𝑒𝑐 𝑃𝑜𝑠 · 𝑋 𝑃𝑜𝑠 0,6 · 1,56 + ( 1 – 0,6 ) · 1,48 = 0,936 + 0,592 = 1,528 El percentil a 5% es 1,528
  • 33. Cuartiles Los percentiles al 25%, 50% y 75% se denominan primer, segundo y tercer cuartil respectivamente. Los cuartiles son importantes pues dividen la muestra en cuatro partes que contienen el mismo número de individuos. El cálculo de los cuartiles se realiza con los respectivos percentiles. La mediana es tanto el percentil al 50% como el segundo cuartil. Los cuartiles permiten representar la información de un conjunto de datos de una forma muy resumida: los diagramas de caja.
  • 34. Diagrama de caja Se compone de un rectángulo, cuyo lado superior representa el primer cuartil y el lado inferior por el tercer cuartil. En el centro del rectángulo se representa una línea que se corresponde con la mediana (segundo cuartil). Y dos segmentos verticales (llamados “bigotes”): Uno nace del valor mínimo de los datos y termina en el lado superior del rectángulo. El otro nace del lado inferior del rectángulo y termina en el mayor valor de los datos.
  • 35. Ejemplo: diagrama de caja El siguiente gráfico representa un diagrama de caja para los siguientes valores obtenidos de una muestra: Mínimo 43 Primer cuartil 71 Mediana 78 Tercer cuartil 86 Máximo 96 0 50 100 150 200 250 300 350 400 1 Diagrama de caja
  • 36. Parámetros estadísticos de dispersión I El rango (amplitud o recorrido): diferencia entre el mayor y menor valor de la variable estadística. La varianza: mide la distancia entre la media y los valores de la variable estadística. Las siguientes fórmulas permiten el cálculo de la varianza. 𝝈 𝟐 = 𝒊=𝟏 𝒏 𝒙𝒊 − 𝒙 𝟐 𝒇𝒊 𝑵 𝝈 𝟐 = 𝐢=𝟏 𝐧 𝐱𝐢 𝟐 𝐟𝐢 𝐍 − 𝐱 𝟐
  • 37. Parámetros estadísticos de dispersión II La desviación típica: mide si los datos se encuentran agrupados en las proximidades de la media. Se mide en las mismas unidades que los datos 𝛔 = 𝐢=𝟏 𝐧 𝐱 𝐢 − 𝐱 𝟐 𝐟𝐢 𝐍 = 𝐢=𝟏 𝐧 𝐱 𝐢 𝟐 𝐟𝐢 𝐍 − 𝐱 𝟐 La desviación típica es el parámetro de dispersión más utilizado Si se suma una constante a cada uno de los valores de la variable, la desviación típica no varía Si se multiplica una constante a cada uno de los valores de la variable, la desviación típica queda multiplicada por él.
  • 38. Coeficiente de variación Cuando se desea comparar dos variables aleatorias se utiliza el coeficiente de variación, que no es más que la razón entre la desviación típica y la media de la variable 𝑪𝑽 = 𝝈 𝒙 El coeficiente de variación siempre es positivo y no tiene unidades. Cuanto más pequeño es, los valores de la variable se encuentran más concentrados alrededor de la media Permite comparar dos variables aleatorias heterogéneas.
  • 40. Variable estadística bidimensional Cuando en una población se observan dos caracteres de los individuos, se recurre a una variable estadística bidimensional Cada individuo tendrá asociado dos valores, uno para cada uno de los caracteres estadísticos estudiados. El par ordenado (X,Y) se compone de dos variables estadísticas unidimensionales. Si n es el tamaño de la muestra o población, el par (xi,yi) representa los valores de cada una de las variables estadísticas para el individuo i.
  • 41. Relaciones funcionales y estadísticas La relación entre dos variables podría ser funcional, si conocida una de ellas se conoce la otra de forma unívoca. Este tipo de relaciones no son estudiadas por la estadística. Cuando en una relación puede obtenerse un valor aproximado si se conoce el valor de la otra variable, se dice que hay una relación estadística (correlación). Ejemplos La longitud de un niño conocidos los meses desde su nacimiento El peso y la altura de una persona
  • 42. Tabla simple Para organizar los datos de las variables bidimensionales se pueden utilizar las tablas simples, donde para cada individuo de la muestra aparece los valores de los dos caracteres estadísticos a estudiar. Ejemplo: Supongamos que se estudia la puntuación de 10 estudiantes en un test de expresión oral y escrita. Expresión oral (X) 8 5 4 9 3 7 8 5 9 9 Expresión escrita (Y) 9 6 6 7 6 7 4 6 8 6 Cada columna representa la puntuación obtenida por cada uno de los estudiantes (la frecuencia de cada par es 1).
  • 43. Tabla simple con frecuencias Para cada par de valores de las variables estadísticas se les asocia la frecuencia. Ejemplo: Supongamos que se estudia la puntuación de 63 estudiantes en una prueba de matemáticas y economía, recogiendo para cada par distinto de valores obtenidos el número de alumnos que lo obtienen: Matemáticas (X) 3 4 5 5 6 7 7 8 8 9 Economía (Y) 4 4 4 5 7 7 8 8 9 9 Número de alumnos 4 5 6 7 9 9 8 6 6 3
  • 44. Tablas de doble entrada Para organizar los datos de las variables bidimensionales se pueden utilizar las tablas de doble entrada: [2.5,5) [5,6) [6,7) [7,9) [9,10) Total [2.5,5) 2 3 2 2 1 10 [5,6) 1 5 6 6 2 20 [6,7) 7 7 14 5 5 38 [7,9) 1 2 9 3 6 21 Total 12 19 35 20 14 100 Nota de Física y Química X NotadeMatemáticasY Número total de alumnosHay 19 alumnos que han obtenido una nota de física entre 5 y 6.
  • 45. Distribuciones marginales A partir de las tablas de doble entrada, es posible obtener las distribuciones marginales de cada una de las variables: [2.5,5) [5,6) [6,7) [7,9) [9,10) Total [2.5,5) 2 3 2 2 1 10 [5,6) 1 5 6 6 2 20 [6,7) 7 7 14 5 5 38 [7,9) 1 2 9 3 6 21 Total 12 19 35 20 14 100 Nota de Física y Química 12 19 35 20 14 [2.5,5) [5,6) [6,7) [7,9) [9,10) [2.5,5) [5,6) [6,7) [7,9) 10 20 38 21 NotadeMatemáticas Distribuciones marginales
  • 46. Distribuciones condicionadas En una distribución bidimensional podemos estudiar la distribución que resulta de fijar un valor en una de las variables y estudiar las frecuencias correspondientes a la otra. A la distribución así formada se denomina distribución condicionada. [2.5,5) [5,6) [6,7) [7,9) [9,10) [2.5,5) 2 3 2 2 1 Ejemplo: Si fijamos la nota de matemáticas al intervalo [2.5,5), la distribución condicionada para la nota de física es: Esta distribución se notará por: 𝑿| 𝒀=[𝟐.𝟓,𝟓) siendo X la variable asociada a la puntuación de física e Y la variable asociada a la puntuación de matemáticas.
  • 47. Diagrama de dispersión I El diagrama de dispersión es la representación gráfica de los pares de puntos (xi,yi) que forman la distribución bidimensional. Ejemplo: Supongamos que se estudia la nota de 5 alumnos en bachillerato (X) y en la PAU (Y). xi yi 5,4 4,8 6,2 7,0 5,5 6,2 6,4 4,3 8,2 8,5 0 1 2 3 4 5 6 7 8 9 0 2 4 6 8 10 yi
  • 48. Diagrama de dispersión II Cuando se dispone de una tabla de doble entrada, la frecuencia de cada punto no es uno, por lo que puede representarse en las inmediaciones del punto representado tantos puntos como frecuencia exista en la tabla, o bien, el tamaño del “punto” representado sea proporcional, o utilizando un gráfico de tridimensional. 1 2 3 4 5 6 0 1 2 3 4 1 2 3
  • 49. Covarianza Se define la covarianza de una variable bidimensional (X,Y) a la media aritmética de los productos de las desviaciones de cada una de las variables respecto a sus medias respectivas. Para realizar el cálculo de la covarianza se utilizan las siguientes fórmulas (son equivalentes): Sxy = i=1 n xi − x yi − y N Sxy = i=1 n fixiyi N − xy
  • 50. Interpretación de la covarianza Dependiendo del signo de la covarianza: • Positivo: Indica que los productos de xi e yi se alejan en el mismo sentido de sus respectivas medias • Negativo (comportamiento recíproco al anterior) • Cero o próximo a cero: la covarianza indica que no hay relación entre las variables.
  • 51. Correlación La correlación es la relación que existe entre las dos variables que participan en una distribución bidimensional. La representación que proporciona la nube de puntos puede indicar el tipo de correlación: Lineal: la nube de puntos se dispone alrededor de una recta. Positiva (directa): la pendiente de la recta es positiva Negativa (inversa): la pendiente de la recta es negativa Curvilínea: la nube de puntos se distribuye alrededor de una curva. Nula: cuando no existe ninguna relación entre las variables.
  • 53. Regresión lineal. Coeficiente de Pearson Para poder cuantificar la correlación lineal entre dos variables se utiliza el coeficiente de correlación lineal de Pearson (r). 𝑟 = 𝜎 𝑋𝑌 𝜎 𝑋 𝜎 𝑌 Este coeficiente tiene el mismo signo que la covarianza, y se encuentre comprendido entre 0 y 1, y proporciona la siguiente información: -1 < r < 0, la correlación es negativa y es mas fuerte cuanto más se acerque a -1. r = 0, no existe correlación 0 < r < 1, la correlación es positiva y es mas fuerte cuanto mas se acerque a 1. r = 1 ó r = -1, existe dependencia funcional.
  • 54. Rectas de regresión Tras comprobar que existe correlación entre dos variables estadísticas, es posible realizar el cálculo de las rectas que mejor se ajustan a la nube de puntos: Recta de regresión de Y sobre X. Si deseamos calcular el valor estimado de Y, dependiendo del valor de X. 𝒚 − 𝒚 = 𝝈 𝑿𝒀 𝝈 𝑿 𝟐 (𝒙 − 𝒙) Recta de regresión de X sobre Y. Si deseamos calcular el valor estimado de X, dependiendo del valor de Y. 𝒙 − 𝒙 = 𝝈 𝑿𝒀 𝝈 𝒀 𝟐 (𝒚 − 𝒚)