1. Diplomado en Metodología de la Investigación UNIVERSIDAD EVANGÉLICA DEL PARAGUAY FACULTAD DE HUMANIDADES Y CIENCIAS DE LA EDUCACIÓN “ Estadística Descriptiva e Inferencial aplicada al proceso de la Investigación Científica” Prof. Eduardo Lysak 2011
7. Donde surgió Estadística ? La palabra Estadística procede del vocablo “Estado”, pues era función principal de los Gobiernos de los Estados establecer registros de población, nacimientos, defunciones, impuestos, cosechas. La necesidad de poseer datos cifrados sobre la población y sus condiciones materiales de existencia han debido hacerse sentir desde que se establecieron sociedades humanas organizadas.
8. Historia de la Estadística 2011 3100 aC los egipcios ya analizaban los datos de la población y la renta del país mucho antes de construir la pirámides observamos en uno de los libros del Pentateuco, bajo el nombre de Números, el censo que realizó Moisés después de la salida de Egipto. Textualmente dice: "Censo de las tribus: existían los censos chinos ordenados por el emperador Tao hacia el año 2.200 a.C. Se erigió la figura del censor, cuya misión consistía en controlar el número de habitantes y su distribución por los distintos territorios el paso de la estadística deductiva a la estadística inductiva 1830. 0
9. La Estadística se ocupa de los métodos y procedimientos para recoger , clasificar , resumir , hallar regularidades y analizar los datos , así como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones . ESTADÍSTICA
10.
11. ESTADÍSTICA DESCRIPTIVA INFERENCIAL comprende las técnicas que se emplean para resumir y describir datos numéricos El problema crucial de la estadística inferencial es llegar a proposiciones acerca de la población a partir de la observación efectuada en muestras bajo condiciones de incertidumbre Tablas, Gráficos, Medidas de Dispersión, Medidas de Centralización, etc. Muestreo, Estimación de parámetros, Contraste de Hipótesis
12.
13.
14. Esta formado por miembros “seleccionados” de la población (individuos, unidades experimentales).
17. VARIABLE Se llama variable a una característica que se observa en una población o muestra, y a la cual se desea estudiar. La variable puede tomar diferentes valores dependiendo de cada individuo. Una variable se puede clasificar de la siguiente manera. VARIABLE CUANTITATIVA CUALITATIVA toma valores numéricos describe cualidades DISCRETA CONTÍNUA
27. ESCALAS DE MEDICIÓN DE VARIABLES ESCALA NOMINAL ORDINAL DE INTERVALO DE RAZÓN CUALITATIVAS CUANTITATIVAS
28.
29. Los números asignados a estos objetos podrían ser sustituidos por letras o nombres sin que ello afecte al resultado de la medición. Ejemplo: si medimos la variable estado civil , (1) soltero/a (2) casado/a (3) viudo/a (4) divorciado/a
30. ESCALAS DE MEDICIÓN DE VARIABLES Escala Ordinal E s aquella que, además de relaciones de igualdad/desigualdad, nos permite establecer relaciones de orden entre los objetos que estamos midiendo. Ejemplo: El seleccionador de personal de una empresa establece un orden tras entrevistar a los candidatos a un puesto de trabajo . 1 2 3 4 no es posible afirmar que la distancia que separa a los candidatos
31. ESCALAS DE MEDICIÓN DE VARIABLES Escala de Intervalo Nos permite establecer relaciones de igualdad/desigualdad y de orden entre los objetos que medimos. Asimismo, los intervalos entre los números de la escala son iguales, por lo que podemos realizar operaciones de suma y resta Ejemplo: Para medir la temperatura utilizamos una escala de intervalo. Como la temperatura en celsius 0º es arbitraria, no implica ausencia de temperatura hace que no podamos afirmar por ejemplo que la mitad de 80º es 40º
32. ESCALAS DE MEDICIÓN DE VARIABLES Escala de Razón Es la que permite el nivel más alto de medición. En esta escala existe el 0 empírico, por lo que podemos realizar cualquier tipo de operación aritmética con los números de la escala. Ejemplo: la estatura de un grupo de estudiantes, nº de hijos, edad, tiempo de reacción, longitud.
35. Ser auto explicativos. No existen pautas uniformes de presentación de los cuadros estadísticos. Lo que se busca es que el usuario interprete la información dada. En la presentación de la información se deben tener en cuenta el sentido común y el punto de vista de los usuarios.
36.
37. Frecuencia relativa : f i /n Resulta de dividir la frecuencia absoluta entre el total de la población. Da el tanto por uno.
38. Frecuencia absoluta acumulada F i : Suma de las frecuencias relativas de los valores menores o iguales que él (sólo tiene sentido para variables estadísticas cuantitativas)
40. TABLAS DE FRECUENCIAS DE VARIABLES CUALITATIVAS Ejemplo: suponiendo que se ha recolectado la opinión de 10 estudiantes sobre la despenalización de la marihuana .
42. Opinión Indiferente En contra A favor f i 5 3 2 f i =10 n f i /n 5/10 = 0,5 3/10 = 0,3 2/10 = 0,2 1 f% 50% 30% 20% 100% Frecuencias Absolutas Frecuencias relativas Porcentajes categorías AGRUPAMOS
43. TABLAS DE FRECUENCIAS DE VARIABLES CUANTITATIVAS DISCRETAS Ejemplo: los datos siguientes corresponden al numero de intentos realizados para ingresar a la facultad de medicina de 20 estudiantes. ORDENAMOS LOS DATOS
44. intentos f i f i =20 f i /n 1 F i 1 2 3 4 5 4 5 6 2 3 0,20 0,25 0,30 0,10 0,15 4 9 15 17 20 Frecuencias Absolutas Frecuencias relativas Frecuencias acumuladas
45.
46.
47.
48. TABLAS DE FRECUENCIAS DE VARIABLES CUANTITATIVAS CONTÍNUAS Ingresos mensuales en miles de Gs. f i f i = n MARCA DE CLASE = (Li + Ls) / 2 1000 – 1990 2000 – 2990 3000 – 3990 4000 – 4990 5000 – 5990 12 16 8 4 2 X 1495 2495 3495 4495 5495 INTERVALOS Li (límite inferior) Ls (límite superior)
49. Gráficos Un gráfico es una representación pictórica, de figuras geométricas o de superficies con el fin de estudiar los cambios en una sola variable, o bien, para comparar diversas variables similares o relacionadas. Para un estudio estadístico no basta con la adecuada presentación del material numérico, sino que, además, es necesario un gráfico que ayude a facilitar su comprensión, pues, todo gráfico es la expresión de los números proporcionados por los cuadros estadísticos y es un complemento de este. Las cualidades esenciales del gráfico son: simplicidad, claridad y veracidad. Permite identificar con facilidad las características similares o diferenciadas de una variable.
50.
51. Agradable a la vista Los gráficos estadísticos pueden clasificarse según el método de representación empleado:
52. Gráfico 1. Cantidad de horas dedicadas por los alumnos a conectarse a Internet. 1- DIAGRAMA DE BARRAS: Aplicable en variables nominales, ordinales y discretas Gráficos
53. 2- DIAGRAMAS CIRCULARES Toda clase de variable, los datos deben estar en % Grafico 3. Redes Sociales utilizadas con mayor frecuencia. Gráficos
54.
55. Se utilizan para variables continuas o para variables discretas, con un gran número de datos, y que se han agrupado en clases. Gráficos
56. Los histogramas se obtiene a partir de tablas en las que hay intervalos de clases. Ingresos mensuales en miles de Gs. f i 1000 – 1990 2000 – 2990 3000 – 3990 4000 – 4990 5000 – 5990 12 16 8 4 2 X 1495 2495 3495 4495 5495 Gráficos
65. 1. Media Estadístico (media muestral) Parámetro (media poblacional) Calculo de la Media: Calcular el promedio de las siguientes edades: 25, 31, 28, 29, 30
66. intentos f i 1 2 3 4 5 4 5 6 2 3 ¿como calcular promedio cuando los datos están tabulados? Fórmula de la Media cuando los datos están agrupados. f i .x i 4 10 18 8 15
67. 2. Mediana (Me) “ Es una medida de centralización que divide a la distribución de una población en dos partes iguales” Calcular la Me de las siguientes edades: 25, 31, 28, 29, 30 25, 28, 29, 30, 31 n= 5 (impar) ORDENAR Posición de la mediana 1º 2º 3º 4º 5º Me=29
69. COMPARACIÓN ENTRE MEDIA Y MEDIANA: ROBUSTEZ Un rasgo que diferencia a media y mediana es su comportamiento frente a datos atípicos. EJEMPLO: Supongamos que tenemos las siguientes observaciones: 1,5 1,8 1,7 1,5 1,6 1,9 2,1 1,8 1,6
70. COMPARACIÓN ENTRE MEDIA Y MEDIANA: ROBUSTEZ Ahora, hagamos la suposición que nos equivocamos al escribir el valor 21 en vez de 2,1 1,5 1,8 1,7 1,5 1,6 1,9 21 1,8 1,6 x Dato atípico
72. CUARTÍLES Los cuartiles son medidas estadísticas de posición que tienen la propiedad de dividir la serie estadística en cuatro grupos de números iguales de términos.
73. Diagrama de Caja - Boxplot Los diagramas de Caja-Bigotes (boxplots) son una presentación visual que describe varias características importantes al mismo tiempo, tales como la dispersión y simetría . Para su realización se representan los tres cuartiles y los valores mínimo y máximo de los datos, sobre un rectángulo, alineado horizontal o verticalmente.
74. Diagrama de Caja - Boxplot O O - Valor Máximo - Valor Mínimo - Mediana - Q3 - Q1 Datos atípicos
75. Medidas de dispersión Mediante la media, la mediana y la moda conocemos una parte de la información acerca de las características de los datos, pero para completar esa información necesitaríamos saber si todos los están próximos o no a estas medidas. Para medir esta desviación respecto a los valores centrales utilizamos los parámetros de dispersión.
76. Medidas de dispersión PARA ENTENDER LAS MEDIDAS DE DISPERSIÓN CONSIDEREMOS EL SIGUIENTE EJEMPLO: GRUPO 1 GRUPO 2 EDAD = ¿SON IGUALES?
79. RANGO Algo que responde a la identificación de la dispersión de los datos de una muestra es el rango, el cual se define como la diferencia entre el dato mayor menos el dato menor de un conjunto de datos. 2 4 8 17 24 32 Rango = 32 – 2 = 30
80. VARIANZA y DESVIACIÓN TÍPICA Son las dos medidas de variabilidad mas importantes, tienen por objetivo medir en grado de variación de los datos respecto al valor de la media
81. Varianza Estadístico (varianza muestral) Parámetro (varianza poblacional) Desviación Típica: es la raíz cuadrada de la varianza
82. Propiedades de la varianza 1. La varianza será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales. 2. Si a todos los valores de la variable se les suma un número la varianza no varía. 3. Si todos los valores de la variable se multiplican por un número la varianza queda multiplicada por el cuadrado de dicho número. 4. Si tenemos varias distribuciones con la misma media y conocemos sus respectivas varianzas se puede calcular la varianza total.
83. Supongamos que un grupo de profesionales en un país A tienen un salario promedio de US$26.888 y varianza US$14.400. En un país B otro grupo de profesionales con iguales características reciben un salario promedio de US$8.570 con desviación estándar de US$80. ¿Cuál grupo de salarios presenta una menor variabilidad?