4. Ciencia encargada de la Recolección,
Manipulación, Organización y
Presentación de información de
manera tal que ésta tenga una
Confiabilidad determinada
ESTADISTICA DESCRIPTIVA
Nociones Generales
10. ESTADISTICA DESCRIPTIVA
Nociones Generales
ESCALA NOMINAL
Se considera que los datos nominales son el tipo de datos más bajo o más débil, ya que
la identificación numérica se elige estrictamente por comodidad, no hay un orden. Los
valores de las variables nominales son palabras que describen las categorías o clases
de respuestas. Los valores de la variable sexo son hombre y mujer; los valores de «¿Ha
estado alguna vez en Oslo?» son «sí» y «no». Asignamos arbitrariamente un código o
un número a cada respuesta. Sin embargo, este número no se emplea más que para
clasificar. Por ejemplo, podríamos codificar las respuestas sobre el sexo o las
respuestas sí/no de la forma siguiente: 1% Hombres 1% Sí 2% Mujeres 2% No
ESCALA ORDINAL
Los datos ordinales indican el orden que ocupan los objetos y, al igual que en el caso
de los datos nominales, los valores son palabras que describen las respuestas. He aquí
algunos ejemplos de datos ordinales y de códigos posibles: 1. Valoración de la calidad
del producto (1: malo; 2: medio; 3: bueno). 2. Valoración de la satisfacción con el
servicio de comedor de la universidad (1: muy insatisfecho; 2: moderadamente
insatisfecho; 3: ninguna opinión; 4: moderadamente satisfecho; 5: muy satisfecho). 3.
Preferencia de los consumidores entre tres tipos de bebidas refrescantes (1: el que más
se prefiere; 2: segunda opción; 3: tercera opción)
11. ESTADISTICA DESCRIPTIVA
Nociones Generales
ESCALA DE INTERVALOS
El nivel de intervalo de medición es el nivel inmediato superior. Incluye todas las
características del nivel ordinal, pero, además, la diferencia entre valores constituye una
magnitud constante. Un ejemplo de nivel de intervalo de medición es la temperatura.
Suponga que las temperaturas altas durante tres días consecutivos de invierno en Quito
son de 10, 8 y 9 grados Celsius. El CERO es otro valor.
ESCALA DE RAZON
Los datos basados en una escala de razones sí indican tanto el orden como la distancia
con respecto a un cero natural, es decir el CERO tiene sentido y los cocientes entre
dos medidas tienen un significado. Una persona que pesa 80 kilos pesa el doble que
una que pesa 40; una persona que tiene 40 años es el doble de vieja que una que tiene
20
15. ESTADISTICA DESCRIPTIVA
Cuadro de Frecuencia
Edad
(años)
fi fr Fia Fra
15 1 8.3 1 8.3
16 2 16.7 3 25.0
17 2 16.7 5 41.7
18 4 33.3 9 75.0
19 1 8.3 10 83.3
20 1 8.3 11 91.7
21 1 8.3 12 100
Total 12 100
Cuadros de
Frecuencia
16. ESTADISTICA DESCRIPTIVA
Cuadro de Frecuencia
Lugar de realización del
Diplomado
n %
Extranjero 19 13.87
Universidad Objeto de Estudio 87 63.50
Otras universidades 31 22.63
Total 137 100
17. ESTADISTICA DESCRIPTIVA
Cuadro de Frecuencia
67.7 39.2 52.5 42.3 69.8 61.2
63.9 37.2 45.7 41.7 69.1 55.5
64.9 38.9 52.4 41.9 69.2 58.9
68.3 39.2 52.6 42.7 70.0 61.9
68.3 39.2 53.3 45.5 70.1 63.2
Cuadro de
Frecuencia
La Estadística ofrece otra
alternativa Tablas de Frecuencias
Absolutas y Relativas
18. ESTADISTICA DESCRIPTIVA
Tabla de Frecuencia
Procedimiento
Definir el Número de
Intervalos
K = 1 + 3.33* log n
K = √n
≥ 5 ó ≤ 20 ó 25
Tipo de Intervalos
(Li - LS]
A = R/k
R = Valor Máx.- Valor Mín.
R` = Ajustada
D= R`-R
R` = Ac*K > R
19. ESTADISTICA DESCRIPTIVA
Tabla de Frecuencia
Intervalos de Clases PMC fi fr Fia Fra
37.1 a 42.6 39.85 8 0.27 8 0.27
42.6 a 48.1 45.35 3 0.10 11 0.37
48.1 a 53.6 50.85 4 0.13 15 0.50
53.6 a 59.1 56.35 2 0.07 17 0.57
59.1 a 64.6 61.85 4 0.13 21 0.70
64.6 a 70.1 67.35 9 0.30 30 1
30 1
21. DIAGRAMA DE TALLO Y HOJAS
Un diagrama donde cada valor de datos es dividido en una "hoja"
(normalmente el último dígito) y un "tallo" (los otros dígitos). Por
ejemplo "32" sería dividido en "3" (tallo) y "2" (hoja).
Los valores del "tallo" se escriben hacia abajo y los valores "hoja"
van a la derecha (o izquierda) del los valores tallo.
El "tallo" es usado para agrupar los puntajes y cada "hoja" indica
los puntajes individuales dentro de cada grupo.
28. ESTADISTICA DESCRIPTIVA
Diagrama de Sectores
137-------360
19 ------- x
(19*360)
X= = 49.9
137
Lugar de realización de
estudios Postgraduales
n Grados
Extranjero 19 49.927
Universidad de Interés 87 228.613
Otras universidades
bolivianas 31 81.460
Total 137 360
29. ESTADISTICA DESCRIPTIVA
Diagrama de Sectores
Extranjero ,
49.92701
Universidad
de Interés ,
228.61314
Otras
universidades
bolivianas ,
81.45985
Diagrama de Sectores
30. ESTADISTICA DESCRIPTIVA
Métodos Numéricos (Medidas de Tendencia Central)
Cuando se desea comparar dos o más
poblaciones o bien muestras, y si las
variables de interés son de carácter
numérico …
Los métodos tabulares no son los más
recomendables
La Estadística oferta otra herramienta
llamada Métodos Numéricos
31. ESTADISTICA DESCRIPTIVA
Medidas de Tendencia Central
Métodos Numéricos
Medidas de Tendencia
Central
Medidas de Dispersión
Localizan el centro de
una base de datos
numéricas
Cuantifican cuánto se
dispersan los datos de una
medida de tendencia
central
33. ESTADISTICA DESCRIPTIVA
Medidas de Tendencia Central/Promedio
Promedio
Población
Muestra
Media µ
Poblacional
Es la sumatoria de las observaciones que
toma una variable dividido entre el total
de éstas
Se interpreta como el punto de equilibrio
de una base de datos numéricas
Media
Muestral
x
35. ESTADISTICA DESCRIPTIVA
Medidas de Tendencia Central
Media en datos tabulados
Si la tabla no presenta clases abierta es
posible hacer una estimación de la media
tomando en cuenta lo siguiente:
• PMC es el promedio de las observaciones de las
observaciones que caben dentro del intervalos.
• PMC*fi proporciona una estimación de la suma de las
observaciones que caben en el intervalo y como una
tabla tiene k-ésimo intervalos entonces:
36. ESTADISTICA DESCRIPTIVA
Medidas de Tendencia Central
Intervalos
de Clases
PMC fi
37.1 a 42.6 39.85 8
42.6 a 48.1 45.35 3
48.1 a 53.6 50.85 4
53.6 a 59.1 56.35 2
59.1 a 64.6 61.85 4
64.6 a 70.1 67.35 9
30
PMC*fi
318.8
136.05
203.4
112.7
247.4
606.15
1624.5
1624.5
= = 54.15
30
x
37. ESTADISTICA DESCRIPTIVA
Medidas de Tendencia Central
Cargo fi Salario
Rector 1 2000
Asesores 2 1200
Vic. Académico 1 1150
Vic. Administrativo 1 1250
Director de Carrera 2 1000
Coordinador de
Carrera 5 800
Administrativo 2 600
Secretarias 9 120
Cuando los datos tienen diferente peso dentro de la
base de datos, si desea obtener el promedio, la media
aritmética no es la más indicada
38. ESTADISTICA DESCRIPTIVA
Medidas de Tendencia Central
Cargo fi (wi)
Salario
(xi)
Rector 1 2000
Asesores 2 1200
Vic. Académico 1 1150
Vic. Administrativo 1 1250
Jefe de Carrera C.S 2 1000
Jefe de Carrera 5 800
Administrativo 2 600
Secretarias 9 120
Xiwi
2000
2400
1150
1250
2000
4000
1200
1080
15080
15080
= = 655.65
23
wx
39. ESTADISTICA DESCRIPTIVA
Medidas de Tendencia Central
Mediana (Me)
Datos sin tabular
Datos tabulados
Si los datos no se distribuyen
simétricamente (curva simétrica) el
promedio no es la mejor medida para
localizar el centro de los mismos
(b-a)(0.5- c)
Me = a +
d
Me = xn/2 + 0.5
•Ordenar
Impar
Par
n
Me = (xn/2 + x n/2 + 1 )/2
40. ESTADISTICA DESCRIPTIVA
Medidas de Tendencia Central
Tiempo
(minutos)
38.9
39.2
42.3
52.6
61.9
63.9
64.9
67.2
68.3
Tiempo
(minutos)
38.9
39.2
42.3
52.6
61.9
63.9
64.9
67.2
68.3
n es impar
Me
Me = xn/2 + 0.5
41. ESTADISTICA DESCRIPTIVA
Medidas de Tendencia Central
Tiempo
(minutos)
38.9
39.2
42.3
52.6
61.9
63.9
64.9
67.2
68.3
68.3
Tiempo
(minutos)
38.9
39.2
42.3
52.6
61.9
63.9
64.9
67.2
68.3
68.3
n es par
Me = (xn/2 + x n/2 + 1 )/2
61.9 + 63.9
Me = = 62.9
2
62.9
Mediana es aquella medida
de tendencia central que
antes y después de ella no
existe más del 50% de la
información
42. ESTADISTICA DESCRIPTIVA
Medidas de Tendencia Central
(b-a)(0.5- c)
Me = a +
d
a = Límite inferior de la
clase de la Me
b = Límite superior de la
clase de la Me
c = Fra una clase antes de
la clase de la Me (Nj-1)
d = fr de la clase de la Me
Clase de la Mediana
• Complete la columna Fia
• Localice la menor Fia >
n/2
• La clase a la que
pertenece esta frecuencia
es la clase de la mediana
(Nj)
• La Clase antes de Nj es
Nj -1
43. Intervalos
de Clases
PMC fi fr Fia Fra
37.1 a 42.6 39.85 8 0.27 8 0.27
42.6 a 48.1 45.35 3 0.10 11 0.37
48.1 a 53.6 50.85 4 0.13 15 0.50
53.6 a 59.1 56.35 2 0.07 17 0.57
59.1 a 64.6 61.85 4 0.13 21 0.70
64.6 a 70.1 67.35 9 0.30 30 1
ESTADISTICA DESCRIPTIVA
Medidas de Tendencia Central
(b-a)(0.5- c)
Me = a +
d
a = Límite inferior de la
clase de la Me
b = Límite superior de la clase de
la Me
c = Fra una clase antes de la
clase de la Me (Nj-1)
d = fr de la clase de la Me
n = 30
n/2 = 15
Nj = 17… (53.6 – 59.1)
Nj- 1 = (48.1 – 53.6)
(59.1-53.6)(0.5- 0.5)
Me = 53.6 + = 53.6
0.07
Ubicación de la
clase de la Me
44. ESTADISTICA DESCRIPTIVA
Medidas de Tendencia Central
Connotancia de Moda
(Mo) en Estadística
En caso de existir es la
(s) observación (nes)
que más se repiten en
una base de datos
Tiempo
(minutos)
38.9
39.2
42.3
52.6
61.9
63.9
64.9
67.2
68.3
68.3
Distribuciones:
Unimodales
Bimodales
Etc.
Mo
45. ESTADISTICA DESCRIPTIVA
Medidas de Tendencia Central
(ficmo- ficpremo)
Mo = Licmo + Acmo
(ficmo-ficpremo) + (ficmo – ficpostmo)
Donde:
Licmo: Límite inferior de la Clase Modal
Acmo: Ancho de clase de la Clase Modal
Ficmo: Frecuencia absoluta de la Clase Modal
Ficpremo: Frecuencia absoluta de la Clase Premodal
Ficpostmo: Frecuencia absoluta de la Clase Postmodal
Clase Modal es la (s) que tiene(n) la mayor (es) fi
46. Intervalos
de Clases
PMC fi
37.1 a 42.6 39.85 8
42.6 a 48.1 45.35 3
48.1 a 53.6 50.85 4
53.6 a 59.1 56.35 2
59.1 a 64.6 61.85 4
64.6 a 70.1 67.35 9
ESTADISTICA DESCRIPTIVA
Medidas de Tendencia Central
(ficmo- ficpremo)
Mo = Licmo + Acmo
(ficmo-ficpremo) + (ficmo – ficpostmo)
(9 - 4)
Mo = 64.6 + 5.5 = 66.56
(9 - 4) + (9 – 0)
48. ESTADISTICA DESCRIPTIVA
Deformación de Curvas Unimodales
Asimetría
Asimetría Negativa
Asimetría Positiva
Curvas Simétricas
> Me > Mox
< Me < Mox
= Me = Mox
49. ESTADISTICA DESCRIPTIVA
Medidas de Dispersión
Una medida de tendencia central por si sola no es tan
importante. Por esta razón debe estar acompañada de
una medida de dispersión
Medidas de dispersión: Son indicadores estadísticos
que muestran la distancia promedio que existe entre los
datos y la media aritmética.
En el estudio de las medidas de dispersión daremos un
vistazo a cuatro
indicadores básicos:
_ Desviación media
_ Varianza
_ Desviación estándar
_ Coeficiente de variación
50. MEDIDAS DE DISPERSION
DESVIACIÓN MEDIA
Para conocer con un solo indicador que tan disperso se encuentran un
conjunto de datos a un punto de concentración, debemos como
primera medida, calcular la distancia de cada dato respecto a una
medida de tendencia central.
51.
52. ESTADISTICA DESCRIPTIVA
Medidas de Dispersión
Rango Rango = Valor Máximo – Valor Mínimo
Varianza
Población ( σ²)
Muestra (S²)
Es el promedio de las desviaciones al
cuadrado de las observaciones que
toma una variable respecto a su media
2
12
N
xi
N
i
54. ESTADISTICA DESCRIPTIVA
Intervalos de
Clases
PMC fi
37.1 a 42.6 39.85 8
42.6 a 48.1 45.35 3
48.1 a 53.6 50.85 4
53.6 a 59.1 56.35 2
59.1 a 64.6 61.85 4
64.6 a 70.1 67.35 9
Si la tabla no presenta clases abierta es posible
hacer una estimación de la varianza de la siguiente
forma:
55. ESTADISTICA DESCRIPTIVA
Medidas de Dispersión
Intervalos de
Clases
PMC fi
37.1 a 42.6 39.85 8
42.6 a 48.1 45.35 3
48.1 a 53.6 50.85 4
53.6 a 59.1 56.35 2
59.1 a 64.6 61.85 4
64.6 a 70.1 67.35 9
PMC*fi PMC2*fi
318.8 12704.18
136.05 6169.8675
203.4 10342.89
112.7 6350.645
247.4 15301.69
606.15 40824.203
1624.5 91693.475
774.124
130
30
5.1624
475.91693
2
2
S
70.11774.124 S
56. ESTADISTICA DESCRIPTIVA
Medidas de Dispersión
Todas las medidas de dispersión expuestas
anteriormente son dimensionales (toman las unidades
de medidas de las variables)
Existe otra medida de dispersión pero adimensional
llamadas Coeficiente de Variación o Dispersión
Relativa
x
S
VC. 100*.
x
S
VC
57. ESTADISTICA DESCRIPTIVA
Medidas de Dispersión
Las medidas de dispersión cuantifican cuánto se
dispersan los datos alrededor de una medida de
tendencia central, pero, ¿Para donde se desvían los
datos?, a la izquierda de la media, a la derecha o se
distribuyen simétricamente.
Existen otras medidas aplicable solo a curvas
unimodales que tratan de las deformación de curvas
tanto de forma horizontal como vertical
58. Curtosis.
El coeficiente de Curtosis mide cuan 'puntiaguda' es
una distribución respecto de un estándar. Este estándar es
una forma acampanada denominada 'normal', y
corresponde a una curva de gran importancia en
estadística.
Mesocúrticos, con valores medianos para el coeficiente.
Platicúrticos, con valores pequeños para el coeficiente.
Leptocúrticos, con valores grandes para el coeficiente
Las siguientes figuras muestran gráficamente los tres tipos
de curvas de acuerdo a la definición anterior:
59. CURTOSIS
la curtosis es una medida de la forma.
Así, las medidas de curtosis tratan de
estudiar la proporción de la varianza que
se explica por la combinación de datos
extremos respecto a la media en
contraposición con datos poco alejados
de la misma. Una mayor curtosis implica
una mayor concentración de datos muy
cerca de la media de la distribución
coexistiendo al mismo tiempo con una
relativamente elevada frecuencia de
datos muy alejados de la misma. Esto
explica una forma de la distribución de
frecuencias con colas muy elevadas y un
con un centro muy apuntado.
62. Experimentos
Determinísticos
No Determinísticos
Sus resultados se conocen con
anticipación sin necesidad de
realizar el experimento
Sus resultados se conocen
una vez que el experimento
ha finalizado
Es un proceso planificado a
través del cual se obtiene
una observación (o una
medición) de un fenómeno
Se pueden describir los
posibles resultados pero no se
puede decir cuál de ellos
ocurrirá
Experimentos AleatoriosSon experimentos no
determinísticos cuyos resultados
están regidos por el azar
PROBABILIDADES
63. Supóngase que se lanzan dos monedas legales al mismo
tiempo y que a una cara de cada moneda se la llama
“Cara” a la otra “Sol” entonces:
={CC, CS, SC, SS}
Supóngase ahora que se lanza un
dado legal. Entonces:
={1, 2, 3, 4, 5, 6,}
Experimentos
Aleatorios
Son aquellos experimentos no determinísticos
cuyos resultados están regidos por la
casualidad (azar)
PROBABILIDADES
64. M = {CC, CS, SC, SS}
O bien en el caso del lanzamiento
del dado
M = {1, 2, 3, 4, 5, 6,}
Espacio Muestral
Retomando el caso del lanzamiento de las dos
monedas, ¿hay otro posible resultado en este
experimento?.
Son todos los resultados
que están asociados a un
experimento aleatorio
Supóngase que el lanzamiento del
dado se está interesado en la
ocurrencia de una cara impar
A = {1,3,5} Evento
Es subconjunto del espacio
muestral, es decir, sus
resultados pertenecen al
espacio muestral
PROBABILIDADES
66. Experimentos
Aleatorios
Simples
Compuestos
Un solo experimento aleatorio
Cuando ocurren dos o más
experimentos simples al mismo
tiempo o bien uno después del
otro
Unidos por la
partícula “ó” (v)
Unidos por la
partícula “y” ( )
Los experimentos simples que
lo componen ocurren de
forma sucesiva
Los experimentos simples que
lo componen ocurren al mismo
tiempo
M = {M1∩M2…Mi}M = {M1UM2U…Mi}
PROBABILIDADES
68. M2
M1
C S
C CC CS
S SC SS
M3
M1*
M2 C S
CC CCC CCS
CS CSC CSS
SC SCC SCS
SS SSC SSS
Experimentos compuestos
unidos por la partícula “y”
El espacio muestral es el
producto cartesiano de los
espacios muestrales simples
que lo conforman
PROBABILIDADES
69. De acuerdo a cómo ocurren los eventos se pueden
establecer algunas relaciones entre ellos tales como:
AUB
A B M
AUB
A B M
A 𝐵
A B M
M
A
A´
PROBABILIDADES
70. Experimentos compuestos
unidos por la partícula “y”
C
S
C
S
C
S
C
S
C
S
C
S
C
S
M
CCC
CCS
CSC
CSS
SCC
SCS
SSC
SSS
Diagrama del Árbol
Diagrama de Senderos
1ra Moneda
2da Moneda
3era Moneda
PROBABILIDADES
CONTEO DE ELEMENTOS
74. Teoremas Básicos de
Probabilidades
P[AUB] = P [A] + P [B]
P[AUB] = P [A] + P [B] – P[AΠB]
P[Ø] = 0
P[M] = 1
%1000/10 APAP
APAP c
1
PROBABILIDADES
75. Cuando la ocurrencia de un evento está en dependencia de otro
evento, se dice que éste es dependiente.
Sea A y B dos eventos en el espacio muestral “M”, se dice que A
es un evento dependiente de B sí;
o bien: 0; BP
B
APAP 0; AP
A
BPBP
Estas probabilidades se pueden calcular de dos formas:
• Respecto al espacio muestral original
• Respecto al espacio muestral del evento condicionante
0;
BPAP
BP
BAP
B
AP
0;
APBP
AP
ABP
A
BP
PROBABILIDADES
Eventos Dependientes
76. En una institución de Educación Superior se tiene 300 docentes,
de los cuales 100 son casados y 30 divorciados. En dicha
institución hay 200 hombres, 85 de los cuales son casados y 95
son solteros. Determinar cual es la probabilidad de seleccionar un
docente al azar:
a. Que sea mujer
b. Que sea soltero (a)
c. Que sea un hombre y esté casado (a)
d. Que sea una mujer divorciada
e. Dado que el docente es casado (a), ¿cuál es la probabilidad
que sea hombre?
f. Si el docente seleccionado es hombre, ¿cuál es la probabilidad
que sea casado?
PROBABILIDADES
77. En una universidad el 70% de los estudiantes son de Ciencias,
30% de Letras. De los estudiantes de Ciencias el 60% son
varones y los de Letras son varones el 40%. Si se elige al azar
un estudiante, calcule la probabilidad que:
a. Sea mujer
b. Se estudiante varón dado si es de Ciencias
c. Sea estudiante de Ciencias dado que es varón
d. Sea estudiante de Ciencias y varón.
PROBABILIDADES
78. Cuando la ocurrencia de un evento no está en dependencia de la
ocurrencia de otro evento, se dice que éstos son independientes.
Sea A y B dos eventos en el espacio muestral “M”, se dice que A
es un evento independiente de B sí se cumple con cualquiera de
las siguientes condiciones:
BPAPBAP *
0;
APBP
AP
ABP
A
BP
0;
BPAP
BP
BAP
B
AP
PROBABILIDADES
Eventos Independientes
79. Sea A1, A2, …, Ak, eventos que forman una partición del espacio
muestral M y sea B, un evento en M. Si las probabilidades P[A1],
P[A2], P[A3]…, P[Ak], si P[B/A1], P[B/A2], P[B/A3]…, P[B/Ak]
son probabilidades conocidas entonces:
]/[][...]2/[]2[1/1 AkBPAkPABPAPABPAPBP
Probabilidad Total = AkBPAkPBP
k
i
/1
PROBABILIDADES
Probabilidad Total
80. Sea A1, A2, …, Ak, eventos que forman una partición del espacio
muestral M y sea B, un evento en M. Si las probabilidades P[A1],
P[A2], P[A3]…, P[Ak], si P[B/A1], P[B/A2], P[B/A3]…, P[B/Ak].
Si B ya ha ocurrido y se está interesado en saber a cual de los
eventos que forman la partición muestral se ha debido su
ocurrencia, entonces se usa el denominado Teorema de Bayes
k
i Ak
BPAkP
Ak
BPAkP
B
AkP
1
PROBABILIDADES
Teorema de Bayes
81. ESTADISTICA DESCRIPTIVA
Regresión Lineal Simple
Y
X1
X2
.
.
.
Xi
En el desarrollo de los eventos,
puede ser que una variable sea
afectada por el comportamiento de
otra (s) variable (s)
Es de interés poder cuantificar
este tipo de relación de manera
que se pueda predecir una variable
en función de otra
En Regresión Lineal Simple es de
interés cuando una variable afecta
el comportamiento de otra variable
Y: Variable Dependiente
X: Variable Independiente
Y = f(X)
Propósito de la R.L.S: Predicción
82. ESTADISTICA DESCRIPTIVA
Regresión Lineal Simple/Diagrama de Dispersión
Llamado también Ploteo de Datos, tiene como propósito
mostrar la posible tendencia (en caso de existir) entre las
variables “X” y “Y”.
Consiste en llevar los pares de valores “x, y” a un sistema de
coordenadas (bidimensional)
Y
X
(x, y)
84. ESTADISTICA DESCRIPTIVA
Regresión Lineal Simple
Por análisis de regresión se entiende al conjunto de métodos
estadísticos que tratan con la formulación de modelos
matemáticos que describen la relación entre variables y el
uso de estas relaciones modeladas con el propósito de
predecir e inferir.
Por Regresión Lineal Simple se entiende …
Supuestos del Análisis
de Regresión Lineal
Simple
“Y” es una variable aleatoria cuya
distribución probabilística depende
de “X”
Modelo de la Línea Recta
Homogeneidad de Varianza
Normalidad
Independencia
86. ESTADISTICA DESCRIPTIVA
Regresión Lineal Simple/Métodos de Mínimos Cuadrados
El supuesto No 2 de RLS plantea que de existir una relación
entre “X” y “Y”, ésta es una línea recta, por lo tanto se puede
pensar en una ecuación de la siguiente forma:
De tal manera que se llegue a obtener una ecuación de la
siguiente naturaleza:
Parámetros
Estimación
87. ESTADISTICA DESCRIPTIVA
Regresión Lineal Simple/Métodos de Mínimos Cuadrados
Uso de la Técnica de
Mínimos Cuadrados (Carl
Gauss)
A partir de muestras (x1, y1), (x2, y2), …(xi, yi) de las variables
“X” y “Y”, se trata de obtener los estimadores . Para ello la
Técnica de Mínimos Cuadrados minimiza la suma de cuadrado de
las distancias entre los valores observados y los estimados de
tal manera que :
89. ESTADISTICA DESCRIPTIVA
Regresión Lineal Simple/Recta de Estimación
Estimada una vez la recta de Predicción y teniendo en cuenta
que el propósito de la R.L.S es la predicción, se hace
necesario estar seguro que la ecuación estimada es capaz de
predecir.
Por esta razón es necesario validar la ecuación estimada
90. ESTADISTICA DESCRIPTIVA
Regresión Lineal Simple/Validación de la Recta de Estimación
Validación
Cálculo de Coeficiente
de Determinación R²
Análisis de Varianza
de la Regresión “ANARE”
Cuantifica la cantidad de la
variabilidad de “Y” que
puede ser explicada por “X”
R² ≥ 70%
91. ESTADISTICA DESCRIPTIVA
Regresión Lineal Simple/Validación de la Recta de
Estimación/ANARE
Por análisis de Varianza se entiende, de forma general, a la
partición de la variación total en fuente de variación conocida
que en el caso de R.L.S son de acuerdo al siguiente modelo
aditivo lineal:
xi= Variación debida a Regresión
εi = Variación debida al Error
FV gl SC CM Fc Ft (Pr>F)
Regresión 1 SCRegresión CMRegresión
CMRegresión
/CMError
Error n-2 SCError CMError
Total n.1 SCTotales
Regla de Decisión
NRHo : Fc ≤ Ft
RHo : Fc > Ft
92. ESTADISTICA DESCRIPTIVA
Correlación Lineal Simple
Así como existen técnicas que cuantifican los cambios de una
variable dependiente por un único cambio de la variable
independiente, existen técnicas que cuantifican la asociación
lineal entre dos variables, esta técnica es llamada Correlación
Lineal Simple que se exprese como el coeficiente de
correlación (r)
Este coeficiente indica el sentido de la asociación como
también la magnitud de ésta, partiendo del hecho que el
coeficiente de correlación lineal simple toma valores en el
rango de: r es -1 ≤ r ≤ 1. Entre más se acerca a 1 el valor de
r mayor es la asociación entre dichas variables.
93. ESTADISTICA DESCRIPTIVA
Correlación Lineal Simple
-1 ≤ r < -0.8 Asociación
fuerte y
negativa
0 ≤ r < 0.4 No hay
asociación
-0.8 ≤ r < -0.4 Asociación
débil y
negativa
0.4 ≤ r < 0.8 Asociación
débil y
positiva
-0.4 ≤ r ≤ 0 No hay
asociación
0.8 ≤ r ≤ 1 Asociación
fuerte y
positiva
95. ESTADISTICA DESCRIPTIVA
Correlación Lineal Simple
Regresión Lineal Simple Correlación Lineal Simple
Mide la cantidad de cambios en “Y”
por un único cambio en “X”.
Mide asociación lineal
entre dos variables
Existe una variable dependiente y
otra independiente
Es indistinto x, y ó y, x
β1 puede tomar cualquier valor en la
recta numérica
El coeficiente de
correlación toma valores en
el intervalo -1 ≤ r ≤ 1