Descripción de muestras

157 visualizaciones

Publicado el

La presentación es construida a partir del libro: Fundamentos de estadisticas para la ciencias de la vida, de Myra Samuels y otros.
Solo con fines educativos

Publicado en: Educación
0 comentarios
0 recomendaciones
Estadísticas
Notas
  • Sé el primero en comentar

  • Sé el primero en recomendar esto

Sin descargas
Visualizaciones
Visualizaciones totales
157
En SlideShare
0
De insertados
0
Número de insertados
2
Acciones
Compartido
0
Descargas
0
Comentarios
0
Recomendaciones
0
Insertados 0
No insertados

No hay notas en la diapositiva.

Descripción de muestras

  1. 1. Descripción de muestras y poblaciones ParteI MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística I 2016 MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 1 / 21
  2. 2. Distribución de frecuencias Denición Una distribución de frecuencia es simplemente una presentación de la frecuencia. Puede ser presentada en forma de tabla y/o mediante un gráco. Denición (Diagrama de Barras (barplot)) Este diagrama se emplea cuando la variable de estudio es categórica, está conformado por barras rectangulares de longitudes proporcionales a los valores representados. Los grácos de barras son usados para comparar dos o más valores. Las barras pueden orientarse vertical u horizontalmente. MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 2 / 21
  3. 3. Distribución de frecuencias Denición Una distribución de frecuencia es simplemente una presentación de la frecuencia. Puede ser presentada en forma de tabla y/o mediante un gráco. Denición (Diagrama de Barras (barplot)) Este diagrama se emplea cuando la variable de estudio es categórica, está conformado por barras rectangulares de longitudes proporcionales a los valores representados. Los grácos de barras son usados para comparar dos o más valores. Las barras pueden orientarse vertical u horizontalmente. MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 2 / 21
  4. 4. Distribución de frecuencias Denición Una distribución de frecuencia es simplemente una presentación de la frecuencia. Puede ser presentada en forma de tabla y/o mediante un gráco. Denición (Diagrama de Barras (barplot)) Este diagrama se emplea cuando la variable de estudio es categórica, está conformado por barras rectangulares de longitudes proporcionales a los valores representados. Los grácos de barras son usados para comparar dos o más valores. Las barras pueden orientarse vertical u horizontalmente. MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 2 / 21
  5. 5. Ejemplo Canis lupus En la siguiente tabla se muestran las tres razas de perros más comunes en nuestro municipio: Raza de perros Raza Frecuencia Labrador 40 Dóberman 25 Chaw Chaw 18 Total 83 MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 3 / 21
  6. 6. Figure: Diagrama de Barras MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 4 / 21
  7. 7. Figure: Diagrama de Pastel MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 5 / 21
  8. 8. Denición (Diagramas de puntos) Es un gráco sencillo que se puede utilizar para mostrar la distribución de una variable numérica cuando el tamaño de la muestra es pequeño. Para realizar un diagrama de puntos, se dibuja una recta numérica que abarque el intervalo de los datos y después se pone un punto sobre la línea numérica en el lugar correspondiente a cada observación. Cuando dos o más observaciones tienen el mismo valor, se sitúan los puntos del diagrama de barras uno encima de otro. Esto produce un efecto similar al de las barras en un diagrama de barras. MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 5 / 21
  9. 9. Denición (Diagramas de puntos) Es un gráco sencillo que se puede utilizar para mostrar la distribución de una variable numérica cuando el tamaño de la muestra es pequeño. Para realizar un diagrama de puntos, se dibuja una recta numérica que abarque el intervalo de los datos y después se pone un punto sobre la línea numérica en el lugar correspondiente a cada observación. Cuando dos o más observaciones tienen el mismo valor, se sitúan los puntos del diagrama de barras uno encima de otro. Esto produce un efecto similar al de las barras en un diagrama de barras. MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 5 / 21
  10. 10. Denición (Diagramas de puntos) Es un gráco sencillo que se puede utilizar para mostrar la distribución de una variable numérica cuando el tamaño de la muestra es pequeño. Para realizar un diagrama de puntos, se dibuja una recta numérica que abarque el intervalo de los datos y después se pone un punto sobre la línea numérica en el lugar correspondiente a cada observación. Cuando dos o más observaciones tienen el mismo valor, se sitúan los puntos del diagrama de barras uno encima de otro. Esto produce un efecto similar al de las barras en un diagrama de barras. MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 5 / 21
  11. 11. Ejemplo La Tabla 2.2.3 muestra la tasa de mortalidad infantil (muertes infantiles por cada 100 nacimientos vivos) en 12 países de Sudamérica en 2009. La distribución se muestra en la Figura MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 6 / 21
  12. 12. Denición (Histograma) Si creamos barras en vez de pilas de puntos, entonces tenemos un histograma. Un histograma es como un diagrama de barras, excepto porque un histograma muestra una variable numérica, lo que signica que hay un orden natural y una escala para la variable. En un diagrama de barras el espacio entre las barras (si existe) es arbitrario, ya que los datos que se muestran son categóricos. En un histograma, la escala de la variable determina la situación de las barras. El ejemplo que sigue muestra un diagrama de puntos y un histograma de una distribución de frecuencias. MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 7 / 21
  13. 13. Denición (Histograma) Si creamos barras en vez de pilas de puntos, entonces tenemos un histograma. Un histograma es como un diagrama de barras, excepto porque un histograma muestra una variable numérica, lo que signica que hay un orden natural y una escala para la variable. En un diagrama de barras el espacio entre las barras (si existe) es arbitrario, ya que los datos que se muestran son categóricos. En un histograma, la escala de la variable determina la situación de las barras. El ejemplo que sigue muestra un diagrama de puntos y un histograma de una distribución de frecuencias. MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 7 / 21
  14. 14. Denición (Histograma) Si creamos barras en vez de pilas de puntos, entonces tenemos un histograma. Un histograma es como un diagrama de barras, excepto porque un histograma muestra una variable numérica, lo que signica que hay un orden natural y una escala para la variable. En un diagrama de barras el espacio entre las barras (si existe) es arbitrario, ya que los datos que se muestran son categóricos. En un histograma, la escala de la variable determina la situación de las barras. El ejemplo que sigue muestra un diagrama de puntos y un histograma de una distribución de frecuencias. MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 7 / 21
  15. 15. Denición (Histograma) Si creamos barras en vez de pilas de puntos, entonces tenemos un histograma. Un histograma es como un diagrama de barras, excepto porque un histograma muestra una variable numérica, lo que signica que hay un orden natural y una escala para la variable. En un diagrama de barras el espacio entre las barras (si existe) es arbitrario, ya que los datos que se muestran son categóricos. En un histograma, la escala de la variable determina la situación de las barras. El ejemplo que sigue muestra un diagrama de puntos y un histograma de una distribución de frecuencias. MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 7 / 21
  16. 16. Ejemplo (Tamaño de camada de cerdas) Un grupo de 32 cerdas de 2 años de edad de la misma raza (3/4 Duroc, 1/4 Yorkshire) se aparearon con cerdos Yorkshire. Se apuntó el número de cochinillos supervivientes de cada cerda tras 21 días. Los resultados se muestran en la Tabla 2.2.4 y en forma gráca MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 8 / 21
  17. 17. Denición (Frecuencia relativa) A veces es conveniente utilizar una escala de frecuencia relativa frecuencia relativa = Frecuencia n Ejemplo (Color de ores) Color Frecuencia F relativa % Rojo 108 Rosa 34 Blanco 40 Total MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 9 / 21
  18. 18. Denición (Frecuencia relativa) A veces es conveniente utilizar una escala de frecuencia relativa frecuencia relativa = Frecuencia n Ejemplo (Color de ores) Color Frecuencia F relativa % Rojo 108 Rosa 34 Blanco 40 Total MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 9 / 21
  19. 19. En los ejemplos anteriores, las distribuciones de frecuencia simples sin agrupar han proporcionado resúmenes concisos de los datos. En muchos conjuntos de datos, es necesario agrupar dichos datos para condensar la información adecuadamente. (Generalmente, esto sucede en el caso de variables continuas). El ejemplo que sigue muestra una distribución de frecuencias agrupadas. Ejemplo (CFK en el suero) La creatina fosfoquinasa es una enzima relacionada con las funciones de los músculos y del cerebro. Como parte de un estudio para determinar la variación natural de concentración de CFK, se extrajo sangre de 36 voluntarios varones. La Tabla 2.2.6 muestra sus concentraciones en suero de CFK (medidas en U/l). MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 10 / 21
  20. 20. En los ejemplos anteriores, las distribuciones de frecuencia simples sin agrupar han proporcionado resúmenes concisos de los datos. En muchos conjuntos de datos, es necesario agrupar dichos datos para condensar la información adecuadamente. (Generalmente, esto sucede en el caso de variables continuas). El ejemplo que sigue muestra una distribución de frecuencias agrupadas. Ejemplo (CFK en el suero) La creatina fosfoquinasa es una enzima relacionada con las funciones de los músculos y del cerebro. Como parte de un estudio para determinar la variación natural de concentración de CFK, se extrajo sangre de 36 voluntarios varones. La Tabla 2.2.6 muestra sus concentraciones en suero de CFK (medidas en U/l). MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 10 / 21
  21. 21. MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 11 / 21
  22. 22. MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 12 / 21
  23. 23. Interpretación de las áreas en un histograma Un histograma se puede ver de dos formas. La parte superior de las barras esboza la forma de la distribución. Pero las áreas dentro de las barras tienen también un signicado. El área de cada barra es proporcional a la correspondiente frecuencia. Por tanto, el área de una o varias barras se puede interpretar que expresa el número de observaciones en las clases representadas por las barras. MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 13 / 21
  24. 24. Interpretación de las áreas en un histograma Un histograma se puede ver de dos formas. La parte superior de las barras esboza la forma de la distribución. Pero las áreas dentro de las barras tienen también un signicado. El área de cada barra es proporcional a la correspondiente frecuencia. Por tanto, el área de una o varias barras se puede interpretar que expresa el número de observaciones en las clases representadas por las barras. MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 13 / 21
  25. 25. Interpretación de las áreas en un histograma Un histograma se puede ver de dos formas. La parte superior de las barras esboza la forma de la distribución. Pero las áreas dentro de las barras tienen también un signicado. El área de cada barra es proporcional a la correspondiente frecuencia. Por tanto, el área de una o varias barras se puede interpretar que expresa el número de observaciones en las clases representadas por las barras. MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 13 / 21
  26. 26. Interpretación de las áreas en un histograma Un histograma se puede ver de dos formas. La parte superior de las barras esboza la forma de la distribución. Pero las áreas dentro de las barras tienen también un signicado. El área de cada barra es proporcional a la correspondiente frecuencia. Por tanto, el área de una o varias barras se puede interpretar que expresa el número de observaciones en las clases representadas por las barras. MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 13 / 21
  27. 27. Interpretación de las áreas en un histograma Un histograma se puede ver de dos formas. La parte superior de las barras esboza la forma de la distribución. Pero las áreas dentro de las barras tienen también un signicado. El área de cada barra es proporcional a la correspondiente frecuencia. Por tanto, el área de una o varias barras se puede interpretar que expresa el número de observaciones en las clases representadas por las barras. MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 13 / 21
  28. 28. Ejemplo Por ejemplo, la Figura 4 muestra un histograma de la distribución de CFK. El área sombreada es el 42% del área total de todas las barras. De acuerdo con esto, el 42% de los valores de CFK están en las clases correspondientes. Es decir, 15 de 36 o el 42% de los valores están entre 60 U/l y 100 U/l. Figure: 4 MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 14 / 21
  29. 29. Ejemplo Por ejemplo, la Figura 4 muestra un histograma de la distribución de CFK. El área sombreada es el 42% del área total de todas las barras. De acuerdo con esto, el 42% de los valores de CFK están en las clases correspondientes. Es decir, 15 de 36 o el 42% de los valores están entre 60 U/l y 100 U/l. Figure: 4 MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 14 / 21
  30. 30. Formas de distribuciones La forma de una distribución se puede indicar mediante una curva suave que se aproxime al histograma, como se muestra en la Figura 5. Figure: 5 Aproximación al histograma mediante una curva suave MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 15 / 21
  31. 31. Una forma común para datos biológicos es la unimodal, y está sesgada a la derecha Figure: 6 Unimodal sesgada a la derecha MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 16 / 21
  32. 32. Aparecen también distribuciones con forma aproximada de campana, Figure: 7 Simétrica acampanada MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 17 / 21
  33. 33. Algunas veces una distribución es simétrica, pero se diferencia de una campana porque tiene colas largas, Figure: 8 Simétrica pero no acampanada MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 18 / 21
  34. 34. Las formas sesgadas hacia la izquierda (g. 9) y exponencial (g. 10) son menos comunes. Figure: 9. Sesgada a la izquierda Figure: 10. Exponencial MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 19 / 21
  35. 35. La bimodalidad. como en (11), puede indicar la existencia de dos subgrupos distintos de unidades observacionales. Figure: 11. Bimodal MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 20 / 21
  36. 36. Ejemplo (Peso del cerebro) En 1888, P. Topinard publicó datos sobre los pesos de los cerebros de cientos de hombres y mujeres franceses. MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 21 / 21
  37. 37. Figure: 13 MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 22 / 21
  38. 38. Figure: 14 MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 23 / 21

×