2. Tablas de frecuencias: En el ejemplo Frecuencia relativa: Para obtener la frecuencia relativa dexi, se divide la frecuenciafientre el tamaño de la muestran. 2
3. Tabla de Frecuencias 3 Frecuencia acumulada: Para obtener la frecuencia acumulada dexi, se suma la frecuenciaficontodas las anteriores.
4. Tablas de Frecuencia 4 Frecuencia relativa acumulada: Para obtener la frecuencia relativa acumulada dexi, se suma la frecuencia relativa dexicon todas las anteriores, o se divide la frecuencia acumulada dexientre el tamaño de la muestra n.
5. Trabajo para usted: En excel transporte la tabla anterior, con ella usando las opciones de grafico construya un grafico para Frecuencias, frecuencias relativas, frecuencias acumuladas y frecuencias acumuladas relativas. Practique y no tema el error ese archivo con sus graficas y tabla constituye el tercer ejercicio con el que continuaremos trabajando. 5
6. Medidas de localización: Percentiles Las medidas de localización sirven para clasificar a un individuo o elemento dentro de una determinada población. Los percentiles dividen a la población o muestra en 100 partes iguales. Los percentiles se denotan como Pi, con i=1,2,…,100 y se obtienen calculando (n+1)i% y localizando el correspondiente número de observación en los datos ordenados. En el ejemplo el percentil 5 (P5), de los datos de nuestra tabla de nacimientos, se obtiene calculando 26(.05)=1.3, como tanto la observación 1 como la 2 en los datos ordenados son 0, el percentil 5 es 0. 6 0 0 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 4 4 4 4 5 5 6 Esto nos indica que el 5% de las familias no tienen hijos, Nótese que el percentil 50 (P50) corresponde a la mediana.
7. Medidas de localización: Cuartiles Son las medidas de localización que dividen a la población o muestra en cuatro parte iguales. Los cuartiles se denotan como Ci, con i=1,2,3 y se obtienen calculando (n+1)25i% y localizando el correspondiente número de observación en los datos ordenados. En el ejemplo el cuartil 1 (C1), se obtiene calculando 26(.25)=6.5, como tanto la observación 6 como la 7 en los datos ordenados son 1, el cuartil 1 es 1. 7 0 0 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 4 4 4 4 5 5 6 Esto nos indica que el 25% de las familias tienen a lo más un hijo. Nótese que el cuartil 2 (C2) corresponde a la mediana.
8. Mas para usted Puede investigar que significan los deciles y como se calculan… Ahora que sabe como y que son los deciles ¿estime el decil 5 para la serie de datos de nacimientos (numero de hijos) y explique a cual de las medidas de tendencia central se parece? 8
9. Otras medidas de dispersión: Recorrido intercuartílico: Esta dado por la diferencia entre el tercer cuartil y el primer cuartil. Abarca el 50% de las observaciones. Recorrido interdecílico: Esta dado por la diferencia entre el noveno decil y el primer decil. Abarca el 80% de las observaciones. 9 RC= C3-C1 RC= 4 – 1 = 3 C1=1, C3= 4 RD= D9-D1 D1=0.6, D9= 5 RD= 5 – 0.6 = 4.4
10. Agrupamiento de datos (Variables discretas) Conforme el tamaño de la muestra aumenta y el número de elementos del espacio muestral es mayor, la construcción de la tabla de frecuencias se complica por el número de operaciones que deben efectuarse, por lo cual el agrupamiento de términos facilita el trabajo y proporciona una representación más clara de la información. 10
11. Agrupamiento de datos (Variables discretas) Se utilizará el siguiente ejemplo para ilustrar el desarrollo: Se desea estudiar el número de huevos de tortuga que se obtienen en cada desove. La tabla 3 muestra el número de huevos obtenidos en una muestra de 50 nidos de tortuga. 11
12. Agrupamiento de datos (Variables discretas) Para agrupar los datos se construye un intervalo que contenga todos los datos de la muestra, el cual se divide en subintervalos llamados intervalos de clase. El número de intervalos de clase y la longitud de los mismos puede ser arbitraria, esto es, el investigador puede establecer algún criterio de clasificación Cuando no se tiene un criterio determinado Sturges sugiere emplear la siguiente formula: donde k representa el número de intervalos de clase y n el número de valores 12
13. Aplicando esto en el ejemplo: 13 La longitud de los intervalos se calcula dividiendo el rango entre el número de intervalos que se desea construir, esto es:
14. Agrupamiento de datos (Variables discretas) El primer intervalo se construye iniciando en el dato menor y sumando l-1. El siguiente se inicia en el valor obtenido más 1, sumando nuevamente l-1. Esto se repite sucesivamente hasta obtener los k intervalos. 14 11-18 19-26 27-34 35-42 43-50 51-58 59-66
15. Agrupamiento de datos (Variables discretas) Los puntos medios de los intervalos de clase se denominan marcas de clase y se calculan promediando el límite inferior del intervalo correspondiente con el límite inferior del intervalo siguiente. 15 11-18 15 19-26 23 27-34 31 35-42 39 47 43-50 55 51-58 63 59-66
16. Agrupamiento de datos (Variables discretas) Frecuencias de clase: La frecuencia de clase es el número de valores que se encuentran en un intervalo de clase, la frecuencia relativa, la frecuencia acumulativa y la frecuencia relativa acumulativa se calculan de la misma forma que para datos no agrupados. 16
17. Ahora le toca a usted Haga la representación gráfica de la tabla de frecuencias, es decir el histograma de frecuencias, el histograma de frecuencias acumuladas, etc… Claro que para ello debe de vaciar los datos en una hoja de excel. Como ya es un experto use su macro para determinar un diagrama de bigotes para los datos de número de hijos y de los huevos de tortuga… 17
18. Sitios para consulta y ayuda http://www.estadisticaparatodos.es/taller/graficas/cajas.html http://www.rieoei.org/experiencias93.htm 18