conceptos basicos de: Definición y Ejemplo de: Variable (tipos), Población y ...
Conceptos de probabilidad
1.
2. ¿Qué es la estadística? Métodos y procedimientos destinados a recoger, clasificar, resumir, hallar regularidades, analizar los datos y realizar inferencias con el fin de ayudar a la toma de decisiones y en su caso formular predicciones.
3. CLASIFICACIÓN ESTADÍSTICA INFERENCIAL ESTADÍSTICA DESCRIPTIVA A partir del cálculo de probabilidades y datos muestrales, efectúa estimaciones, decisiones, predicciones u otras generalizaciones sobre un conjunto mayor de datos. Describe, analiza y representa un grupo de datos utilizando métodos numéricos y gráficos que resumen y presentan la información contenida en ellos.
8. Se miden en escala Se representan en ESTADÍSTICA DESCRIPTIVA DATOS CUALITATIVOS Nominal Gráficos Diagramas de Barras Diagramas de Sectores Ordinal Contingencia Tablas Frecuencia
9. Se dividen en Se miden en escalas Se representan en Se resumen en medidas de DATOS CUANTITATIVOS Discretos Continuos Intervalos Razón ESTADÍSTICA DESCRIPTIVA Moda Mediana Media Diagramas de Dispersión Boxplot Histogramas Frecuencia no Agrupada Frecuencia Agrupada Variabilidad Centralidad Tablas Gráficos Coeficiente de Variación Rango Varianza
10.
11. si al aumentar o disminuir una de Correlación Positiva ellas, la otra varía en la misma forma. Correlación Negativa cuando varían en sentido inverso. REGRESIÓN LINEAL SIMPLE Si no existe ninguna relación o dependencia entre las variables se dice que ellas están incorrelacionadas.
12.
13. REGRESIÓN LINEAL SIMPLE … Consideraciones Importantes Vamos a considerar una relación funcional entre las variables X y Y Suponiendo que X toma valores asignados o controlados por el investigador y Y depende de X a través de la relación Y= f(X) Decimos que X es la variable independiente y Y la variable dependiente.
14. Ejemplo: Se desea conocer la relación entre la presión arterial y la edad en personas adultas. Se han obtenido los siguientes datos de 10 hombres a los cuales se les pregunto su edad y se les midió su presión sistólica. EDAD (Años) X PRESIÓN (mmHg) Y 19 122 25 125 30 126 42 129 46 130 49 132 52 135 57 138 62 142 70 145
15. los valores de Y aumentan a medida que aumenta la edad y los diferentes puntos tienden a colocarse en una línea recta. Esta información nos permite pensar que las dos variables están relacionadas linealmente. DIAGRAMA DE DISPERSIÓN
16. Si la relación entre X y Y es aproximadamente de la forma entonces se trata de una regresión lineal . (Nos interesa ) Debemos asumir que la relación entre X y Y no es una relación lineal perfecta ya que Y es una variable aleatoria cuyos valores exactos son impredecibles. Para una persona dada, el valor de Y puede expresarse como: En donde α y β son parámetros desconocidos y ε i es el error que cometemos al querer expresar el valor de Y mediante una relación lineal con X.
17. ESTIMACIÓN DE LA RECTA DE REGRESIÓN La recta de regresión estimada es obtenida por el método de los mínimos cuadrados y está dada por: Donde:
19. A) Error de Estimación Mediante la Recta Ajustada Ejemplo: El sujeto número 5 que tiene una de edad de 46 años . Su presión sistólica fue de 130 mmHg . Supongamos ahora que no se le midió la presión queremos estimarla mediante la ecuación de regresión. Entonces su presión será: Y 5 = 112.26 + 0.446X 5 Y 5 = 112.26 + (0.446) (46) Y 5 = 132.8 mmHg Error: 130mmHg – 132.8 mmHg = - 2.8 mmHg
20. B) Predicciones a Partir de la Recta Mediante la ecuación de regresión podemos predecir o pronosticar valores de la variable Y. Ejemplo: Si se sabe que la edad de un sujeto es 50 años, su presión sistólica puede pronosticarse mediante la recta de regresión ajustada como: Y= 112.26 + (0.446) (50) Y= 134.5 mmHg. Observación: La interpretación o cualquier otra inferencia basada en la regresión, es válida fundamentalmente dentro del rango de variación de X. Para nuestro ejemplo la variación de Y puede ser válida sólo para edades entre 19 y 70 años.
21. C) Interpretación de la Pendiente El coeficiente de regresión β , representa la pendiente de la recta. Este coeficiente indica la cantidad de variación (creciente o decreciente) de la variable Y por unidad de cambio de la variable X. Para nuestro ejemplo, la pendiente es 0.446, lo que indica que la presión sistólica aumenta 0.446 mmHg por cada año.
22. D) Coeficiente de Correlación de Pearson (Muestral) “r” Es un índice estadístico que mide la relación lineal entre dos variables cuantitativas y esta dado por Para nuestro ejemplo, r = 0.97
27. ¿Qué tamaño debe tener la muestra y cómo debe ser seleccionada para que la información extraída de ella sea representativa de la población objeto de estudio? MUESTREO
28.
29. MUESTREO CON REPOSICIÓN MUESTREO SIN REPOSICIÓN Las unidades se seleccionan sólo una vez Las unidades se seleccionan por lo menos una vez En una encuesta electoral, poco antes de una elección de voto de las personas entrevistadas, éstas deben ser escuchadas apenas una sola vez, pues, en una elección, el voto es individual. Cuando se desea saber cuánto tiempo gasta una persona haciendo cola en un banco, ésta puede ser observada una o más veces, cada vez que vuelve al banco. TIPOS DE MUESTREO
30.
31.
32.
33.
34. MUESTREO ESTRATIFICADO Ejemplo: En un estudio sobre salarios en una empresa, se tuvieron en cuenta tres estratos: directivas, empleados y obreros. Suponiendo que la empresa cuenta con 25 directivas, 130 empleados y 913 obreros, y el tamaño de la muestra que vamos a seleccionar es n = 120. Si la afijación es proporcional debemos repartir la muestra de la siguiente manera: Las 3 directivas, los 15 empleados y los 102 obreros los seleccionamos utilizando el muestreo aleatorio simple.
35.
36.
37. MUESTREO POR CONGLOMERADOS Ejemplo: supongamos que un economista desea estimar la cantidad promedio empleada en comida por vivienda en cierto barrio de la ciudad. Como es un barrio grande y no se cuenta con los recursos suficientes para hacer la encuesta en todo el barrio, el economista divide el barrio por manzanas (conglomerados) y extrae una muestra aleatoria de las mismas. Posteriormente procede a hacer la encuesta en cada una de las viviendas de las manzanas seleccionadas.
38.
39.
40.
41.
42.
43.
44. Muestreo Intencional Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras "representativas" mediante la inclusión en la muestra de grupos supuestamente típicos. Es muy frecuente su utilización en sondeos preelectorales de zonas que en anteriores votaciones han marcado tendencias de voto.
45. Muestreo Casual o Incidental. Se trata de un proceso en el que el investigador selecciona directa e intencionadamente los individuos de la población. El caso más frecuente de este procedimiento el utilizar como muestra los individuos a los que se tiene fácil acceso (los profesores de universidad emplean con mucha frecuencia a sus propios alumnos). Un caso particular es el de los voluntarios.
46. Bola de nieve. Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y así hasta conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos, etc.
47. ERROR DE ESTIMACIÓN Cuando la muestra se obtiene por métodos probabilísticos es posible hacer inferencias acerca de ciertas características numéricas de la población con base en las características numéricas de la muestra. MUESTRA POBLACIÓN La media, la proporción y la varianza muestral, son respectivamente estimadores de la media, la proporción y la varianza poblacional
48. ERROR DE ESTIMACIÓN Ejemplo: Supongamos que queremos estimar la edad promedio de los estudiantes de un colegio nocturno de 635 estudiantes y que para ello escogimos aleatoriamente 84 estudiantes. Si años, entonces podemos estimar en 21.7 años la edad promedio de los estudiantes del colegio nocturno. ¿ Qué tan precisas son estas estimaciones ? En general, si queremos estimar el parámetro θ por medio del estimador , el error de estimación estará dado por Un estimador es más preciso entre menor sea su error de estimación.
49. A) Error de Estimación para la Media Para un error aleatorio simple sin remplazo está dado por: En esta fórmula aparece la varianza poblacional que generalmente es desconocida. Esta varianza se estima usualmente con la varianza muestral , de modo que una estimación del error de muestreo para la media sería:
50. A) Error de Estimación para la Media Se puede mostrar que si la población es normal o aproximadamente normal el 95% de las estimaciones del parámetro µ caen el intervalo . Diremos entonces que el intervalo es un intervalo de confianza del 95% para estimar a µ.
51. A) Error de Estimación para la Media Ejemplo: El gobierno de cierta localidad desea estimar el consumo promedio de agua por vivienda con el fin de racionalizar dicho recurso. Selecciona al azar y sin reemplazo n = 180 viviendas y observa el medidor de agua durante un día. Se obtiene de esta muestra un consumo promedio 19.6 galones con una desviación estándar de 2.4 galones. El último censo en dicha localidad reportó 2350 viviendas. Esto significa que podemos estimar un consumo promedio de agua por vivienda entre 19.26 y 19.94 galones con una confiabilidad ≈ 95%.
52. TAMAÑO DE LA MUESTRA Llamemos B el error máximo que podemos admitir al estimar la media µ tomando una muestra de tamaño n. El error máximo se encuentra en los extremos del intervalo en otras palabras, con una probabilidad de 0.95 si la población tiene una distribución normal o aproximadamente normal. Despejamos n En la práctica, generalmente se desconoce . A veces es posible conocer la varianza mediante alguna investigación anterior o estimarla mediante una muestra piloto. En este caso, reemplazamos por .
53. TAMAÑO DE LA MUESTRA Ejemplo: Un investigador está interesado en estimar el peso promedio ganado por pollo entre 0 y 4 semanas, alimentados con una ración nueva. Se tienen 1000 pollos y se desea establecer el tamaño de la muestra para estimar µ con un error no mayor que 1 gramo. Usando estudios similares sobre nutrición de pollos, el investigador encontró que era aproximadamente 36. Según la fórmula el número de pollos que debe pesar es 126