3. Percentil y Cuartil
Percentil (0 < p < 1) es el valor de la variable en
donde hay una proporción p de valores de la
población menores o iguales.
Cuartiles: dividen poblacion en 4 cuantiles:
Q1(25%, 50% y 75%
Excel:
=CUARTIL(Datos,Cuartil)
=PERCENTIL(Datos,p%)
Rango intercuartílico IQR: rango entre el 50% de
elementos centrales de la distribución (Q3 – Q1)
4. Diagrama de Cajas
Tukey 1977: Box and whisker plot (diagrama de
caja y bigote)
Resumen de 5 numeros:
Centro: Mediana
Dispersión: IQR (Q3 – Q1)
Mayor y Menor
Puede incluir datos atipicos fuera del grafico
Excel No los crea directamente:
Data Desk XL add-in
Grafico de cotizaciones (incompleto)
Truco con Barras apiladas
Ejercicio08 - Diagrama de Cajas.xlsx
5. Diagrama de Cajas
Permiten apreciar de forma grafica
rapidamente la forma de la poblacion, su
tendencia, sesgo y distribucion.
Permiten comparar poblaciones.
6. Diagrama Dispersión
Se usa para ver la relación de dos variables cuantitativas
medidas en los mismos elementos.
Gráfico en el cual van a estar representados, mediante
puntos, los valores de nuestros pares de variables (x,y).
Sirve para darnos una idea visual del tipo de relación que
existe entre ambas variables, y debe de ser hecho antes
de iniciar cualquier cálculo para evitar trabajos
innecesarios
Dirección: Positiva, negativa o nula
Forma: Lineal, Exponencial, Logaritmica, etc
Fuerza: Baja, Moderada, Alta
Valores atipicos
Eje X: Variable independiente, Eje Y: V. Dependiente
Excel Grafico dispersión tiene herramientas para
evaluación interactiva de correlación.
7. Correlación
Al observar graficamente una serie de
pares de datos podemos tener una
apreciación errada.
La correlación es una medida numerica de
la fuerza de una asociacion lineal. Va de -1
a +1:
-1: asociacion lineal negativa perfecta
+1: asociacion lineal positiva perfecta
0: ninguna asociacion lineal
No distingue variable dependiente de
independiente
8. Regresion Lineal
Fijamos valores variable independiente (x), y
observamos variable dependiente (y) de ésta.
Lograr ecuación para describir comportamiento y
relacionado con x, dentro rango específico.
y = a + bx
Análisis correlación mide, para c/ muestra x y y.
Grafica pares para ver relaciones entre ellos.
Calcula algunos estadísticos para determinar la
fuerza de la relación
Regresión para experimentos reales
Correlación para estudios ex post facto
Puede ser usada como comparativa o predictiva.
9. Mínimos Cuadrados
Recta donde cuadrados de diferencias entre
puntos experimentales (x,y) y puntos calculados
(x',y') sea mínima.
y’ – y = residual
y = a + bx
a: intersección de la recta con el eje Y
b: pendiente de la recta.
x y
xy - y x
b=
(
N
x )2
a= -b
2
x -
N N N
a =INTERSECCION.EJE(rango Y,rango X)
b =PENDIENTE(rango Y,rango X)
Herramientas de Analisis
10.
11. Coeficiente Correlación
r: Coeficiente de correlación de Pearson
Mide la relación lineal entre las variables
A diferencia de covarianza no tiene unidades
Estimador parámetro coeficiente de correlación
poblacional .
Es la proporción entre la covarianza de XY y el
producto de sus desviaciones estándar
=COEF.DE.CORREL(rango Y,rango X)
=PEARSON(rango Y,rango X)
( x x)( y y)
r =
( x x) 2 (y y)2
12. Coeficiente Determinación r2
A menor varianza de residuales respecto a
varianza de y, mejor será la predicción.
No relación: Var(y’) / Var(y) = 1
Relación perfecta : Var(y’) / Var(y) = 0
1 - Var(y’) / Var(y) = r2
r2: Cuadrado de Coeficiente de Correlación
Mide ajuste a la regresión.
Proporción de variación en variable y que puede
ser atribuida a una regresión lineal con respecto a
la variable x. Resto falta por explicar
r2 ajustado: Toma en cuenta los gdl:
y = n-1
y' = n-2
13. Regresiones No Lineales
Existen otros tipos relaciones posibles entre x y y
Crecimiento poblacional común regresión exponencial:
x
y = ab
a : "índice de Falton“
B: índice de crecimiento relativo.
Grafico en papel semilogarítmico da una línea recta.
Datos se linealizan con:
log y = log a+ x log b
Luego es un caso de regresión lineal.
14.
15. Regresiones No Lineales
Hay otros casos regresiones no
lineales y mayoría se linealiza de
misma forma.
Excel presenta opción de
visualizar previamente alguns
tipos de regresiones visualmente
y calcular su ecuación y r2
mediante la opción Formato de
Linea de tendencia en los
graficos de dispersión.