Estadística Descriptiva
Ing. Luis Fernando Aguas B.
Organización de los datos
 Una vez que se ha
realizado la
recolección de los
datos, se obtienen
datos en bruto,
los cuale...
Organización de los datos
 Formas de organizar los datos:
 Un arreglo: es la forma más sencilla de
organizar los datos e...
Organización de los datos
 Una distribución de frecuencias: es un
arreglo de los datos que permite expresar
la frecuencia...
Organización de los datos
 La Distribución de Frecuencias:
 Se recomienda su uso cuando se
tienen grandes cantidades de ...
Organización de los datos
 La cantidad de clases no puede ser tan
pequeño (menos de 5) o tan grande (más
de 20), que la v...
Organización de los datos
 Determinar:
 Punto medio = (Li+Ls)/2.
 Frecuencia absoluta de la clase (fi).
 Frecuencia ac...
A continuación se presentan
las calificaciones de 60
estudiantes
Ejemplos de Distribución de
Frecuencias
23 60 79 32 57 74 52 70 82 36
80 77 81 95 41 65 92 85 55 76
52 10 64 75 78 25 80 98 81 67
41 71 83 54 64 72 88 62 74 43
60...
Representación gráfica de los datos
 Los gráficos permiten visualizar en forma
global y rápida el comportamiento de los
d...
Representación gráfica de los datos
Histograma
Representación gráfica de los datos
Histograma y Polígono de Frecuencias
Ojiva
Representación gráfica de los datos
Representación gráfica de los datos
 Para datos cualitativos se usan:
 Curvas
 Barras
 Sectores
Barras
Representación gráfica de los datos
Barras
Representación gráfica de los datos
Curvas
Representación gráfica de los datos
Sectores, torta o circular
Ejemplos de construcción
de gráficos
Medidas de tendencia central o
posición
 Corresponden a valores que
generalmente se ubican en la parte
central de un conj...
Medidas de tendencia central o
posición
 Las medidas de tendencia central
más importantes son:
 Media: Aritmética y Arit...
Media Aritmética
 Es la suma de todas las observaciones dividida entre
el número total de observaciones.
 Expresada de f...
Cálculo de la media aritmética
 Para datos no agrupados:
n
x
X
n
i
i
 1
 Para datos agrupados:
n
fm
X
k
i
ii
 1
Do...
Mediana
 Es el valor que ocupa la posición
central de un conjunto de
observaciones, una vez que han
sido ordenados en for...
Cálculo de la mediana
 Para datos no agrupados:
 Si n es impar: posición donde se ubica
la mediana es igual a (n+1)/2.
...
Cálculo de la mediana
 Datos agrupados: clase mediana es la
que contiene a la observación que
ocupa la posición n/2.
Cm
x...
Moda
 Observación o clase que tiene la
mayor frecuencia en un conjunto de
observaciones.
 Un conjunto de datos puede ser...
Cálculo de la moda
 Para datos no agrupados: es simplemente
la observación que más se repite.
 Para datos agrupados:
CmL...
Relación entre la media, la mediana y
la moda
Cuando los datos son sesgados es mejor emplear la Md
Propiedades, ventajas y desventajas
de la media
Propiedades:
 La suma de las diferencias entre las
media muestral y el va...
Propiedades, ventajas y desventajas
de la media
 Si se somete a una variable
estadística X a un cambio de origen
y escala...
Propiedades, ventajas y desventajas
de la media
Ventajas:
 Emplea en su cálculo toda la
información disponible.
 Se expr...
Propiedades, ventajas y desventajas
de la media
 Se trata de un concepto familiar
para la mayoría de las personas.
 Es ú...
Propiedades, ventajas y desventajas
de la media
Desventajas:
 Se ve adversamente afectada por valores
extremos, perdiendo...
Ventajas y desventajas de la mediana
Ventajas:
 Fácil de calcular si el número de
observaciones no es muy grande.
 No se...
Ventajas y desventajas de la mediana
 Se puede calcular para cualquier
tipos de datos cuantitativos, incluso
los datos co...
Ventajas y desventajas de la mediana
Desventajas:
 No utiliza en su “cálculo” toda la
información disponible.
 No ponder...
Ventajas y desventajas de la moda
Ventajas:
 No requiere cálculos.
 Puede usarse para datos tanto
cuantitativos como cua...
Ventajas y desventajas de la moda
Desventajas:
 Para conjuntos pequeños de datos su
valor no tiene casi utilidad, si es q...
Ventajas y desventajas de la moda
 En ocasiones, el azar hace que una
sola observación se no
representativa se el valor m...
Medidas de dispersión, variación o
variabilidad.
 Son valores numéricos que indican
o describen la forma en que las
obser...
Medidas de dispersión, variación o
variabilidad.
 Son importantes debido a que dos
muestras de observaciones con el
mismo...
Medidas de dispersión, variación o
variabilidad.
 Rango.
 Varianza.
 Desviación Típica.
 Coeficiente de variación.
Medidas de dispersión: Rango
Rango (amplitud o recorrido):
 Está determinado por los dos
valores extremos de los datos
mu...
Medidas de dispersión: Rango
 Casi no se emplea debido a que
depende únicamente de dos
valores.
 No proporciona una medi...
Medidas de dispersión: Varianza
 Es un valor numérico que mide el
grado de dispersión relativa porque
depende de la posic...
Medidas de dispersión: Varianza
 Si la varianza de un conjunto de
observaciones es grande se dice que los
datos tiene una...
Para datos agrupados en una
distribución de frecuencias:
Medidas de dispersión: Varianza
 
 21
2
2
1
2
2
x
n
fm
s
n
fx...
Medidas de dispersión: Desviación
Típica
 Es la raíz cuadrada de la varianza.
 Notación: s, .
2
ss 
Medidas de dispersión: Coeficiente de
Variación
 Es una medida de dispersión relativa que
permite comparar el nivel de di...
Ventajas y Desventajas del Rango
Ventajas:
 Útil cuando se quiere conocer la
extensión de las variaciones
extremas (valor...
Ventajas y Desventajas del Rango
Desventajas:
 No es una MD con respecto al
centro de la distribución.
 Solo emplea dos ...
Propiedades, Ventajas y Desventajas
de la Varianza
Propiedades:
1. Siempre es mayor o igual a cero y
menor que infinito.
2...
Propiedades, Ventajas y Desventajas
de la Varianza
Ventajas:
 Es útil cuando se compara la variabilidad
de dos o más conj...
Ventajas y Desventajas de la
Desviación Típica
Ventajas:
 Esta expresada en las mismas
unidades que la variable en estudi...
Ventajas y Desventajas del Coeficiente
de Variación
Ventajas:
 Es la única MD que permite
comparar el nivel de dispersión...
Ventajas y Desventajas del Coeficiente
de Variación
Desventaja:
 No es una MD con respecto al
centro de la distribución d...
Medidas de Forma
 Son medidas numéricas que
permiten determinar la forma que
tiene la curva de los datos, por lo
tanto, s...
Medidas de Forma: Asimetría
 Permiten estudiar la forma de la
curva, dependiendo de cómo se
agrupan los datos.
Medidas de Forma: Asimetría
Coeficiente de Asimetría de Pearson:
 Fácil de calcular e interpretar.
 Cálculo:
 
s
MdX
A...
Medidas de Forma: Asimetría
Coeficiente de Asimetría de Fisher:
 No es de fácil cálculo, pero si su
interpretación.
 
...
Medidas de Forma: Asimetría
o Interpretación:
ASF
= 0, Simétrica
> 0, Asimétrica Positiva
< 0, Asimétrica Negativa
Medidas de Forma: Kurtosis
 Miden si los valores de la
distribución están más o menos
concentrados alrededor de los
valor...
Medidas de Forma: Kurtosis
 Mesocúrtica: grado de concentración
medio alrededor de los valores
centrales de la variable.
...
Medidas de Forma: Kurtosis
 
 
3
3
4
1
4
4
1
4










ns
fXM
CK
ns
Xx
CK
k
i
ii
n
i
i
Datos No Agrupados...
Referencias:
 Wikipedia(http://es.wikipedia.org/wi
ki/Wikipedia:Portada)
 Walpole y Myers. Probabilidad y
Estadística. M...
Próxima SlideShare
Cargando en…5
×

11 Estadistica Descriptiva

1.250 visualizaciones

Publicado el

Publicado en: Educación
0 comentarios
0 recomendaciones
Estadísticas
Notas
  • Sé el primero en comentar

  • Sé el primero en recomendar esto

Sin descargas
Visualizaciones
Visualizaciones totales
1.250
En SlideShare
0
De insertados
0
Número de insertados
2
Acciones
Compartido
0
Descargas
21
Comentarios
0
Recomendaciones
0
Insertados 0
No insertados

No hay notas en la diapositiva.

11 Estadistica Descriptiva

  1. 1. Estadística Descriptiva Ing. Luis Fernando Aguas B.
  2. 2. Organización de los datos  Una vez que se ha realizado la recolección de los datos, se obtienen datos en bruto, los cuales rara vez son significativos sin una organización y tabulación.
  3. 3. Organización de los datos  Formas de organizar los datos:  Un arreglo: es la forma más sencilla de organizar los datos en bruto, consiste en colocar las observaciones en orden según su magnitud: ascendente o descendente.  Poco práctica cuando se tiene una gran cantidad de datos.
  4. 4. Organización de los datos  Una distribución de frecuencias: es un arreglo de los datos que permite expresar la frecuencia de ocurrencias de las observaciones en cada una de las clases, mostrando el patrón de la distribución de manera más significativa. Clase Pto. Medio fi Fi fri FRi
  5. 5. Organización de los datos  La Distribución de Frecuencias:  Se recomienda su uso cuando se tienen grandes cantidades de datos (n).  Su construcción requiere, en primer lugar, la selección de los límites de los intervalos de clase.  Para definir la cantidad de intervalos de clase (k), se puede usar:  La regla de Sturges: k = 1 + 3.3log(n)  k = n
  6. 6. Organización de los datos  La cantidad de clases no puede ser tan pequeño (menos de 5) o tan grande (más de 20), que la verdadera naturaleza de la distribución sea imposible de visualizar.  La amplitud de todas las clases deberá ser la misma. Se recomienda que sea impar y que los puntos medios tengan la misma cantidad de cifras significativas que los datos en bruto.  Los límites de las clases deben tener una cifra significativa más que los datos en bruto.
  7. 7. Organización de los datos  Determinar:  Punto medio = (Li+Ls)/2.  Frecuencia absoluta de la clase (fi).  Frecuencia acumulada de la clase (Fi).  Frecuencia relativa de la clase (fri):  fri = fi/n  Frecuencia relativa acumulada de la clase (FRi).
  8. 8. A continuación se presentan las calificaciones de 60 estudiantes Ejemplos de Distribución de Frecuencias
  9. 9. 23 60 79 32 57 74 52 70 82 36 80 77 81 95 41 65 92 85 55 76 52 10 64 75 78 25 80 98 81 67 41 71 83 54 64 72 88 62 74 43 60 78 89 76 84 48 84 90 15 79 34 67 17 82 69 74 63 80 85 61 a) Construya una distribución de frecuencias. b) Qué puede concluir de estos datos. Ejemplos de Distribución de Frecuencias
  10. 10. Representación gráfica de los datos  Los gráficos permiten visualizar en forma global y rápida el comportamiento de los datos.  Para datos cuantitativos agrupados en clases, comúnmente se utilizan tres gráficos:  Histogramas.  Polígono de frecuencias.  Ojiva o Polígono de frecuencias acumuladas.
  11. 11. Representación gráfica de los datos Histograma
  12. 12. Representación gráfica de los datos Histograma y Polígono de Frecuencias
  13. 13. Ojiva Representación gráfica de los datos
  14. 14. Representación gráfica de los datos  Para datos cualitativos se usan:  Curvas  Barras  Sectores
  15. 15. Barras Representación gráfica de los datos Barras
  16. 16. Representación gráfica de los datos Curvas
  17. 17. Representación gráfica de los datos Sectores, torta o circular
  18. 18. Ejemplos de construcción de gráficos
  19. 19. Medidas de tendencia central o posición  Corresponden a valores que generalmente se ubican en la parte central de un conjunto de datos.  Forma como los datos pueden condensarse en un solo valor central alrededor del cual todos los datos muestrales se distribuyen.
  20. 20. Medidas de tendencia central o posición  Las medidas de tendencia central más importantes son:  Media: Aritmética y Aritmética ponderada.  Mediana.  Moda.
  21. 21. Media Aritmética  Es la suma de todas las observaciones dividida entre el número total de observaciones.  Expresada de forma más intuitiva, podemos decir que la media aritmética es la cantidad total de la variable distribuida a partes iguales entre cada observación. (wikipedia)  Por ejemplo, si en una habitación hay tres personas, la media de dinero que tienen en sus bolsillos sería el resultado de tomar todo el dinero de los tres y dividirlo a partes iguales entre cada uno de ellos. Es decir, la media es una forma de resumir la información de una distribución (dinero en el bolsillo) suponiendo que cada observación (persona) tendría la misma cantidad de la variable. (wikipedia)
  22. 22. Cálculo de la media aritmética  Para datos no agrupados: n x X n i i  1  Para datos agrupados: n fm X k i ii  1 Donde: mi: punto medio de la clase i fi: frecuencia absoluta de la clase i k: cantidad de clases
  23. 23. Mediana  Es el valor que ocupa la posición central de un conjunto de observaciones, una vez que han sido ordenados en forma ascendente o descendente.  Divide al conjunto de datos en dos partes iguales. Tema2.EstadísticaDescriptiva
  24. 24. Cálculo de la mediana  Para datos no agrupados:  Si n es impar: posición donde se ubica la mediana es igual a (n+1)/2.  Si n es par: (n+1)/2 no es entero, por lo tanto la mediana será igual al promedio de las dos posiciones centrales.
  25. 25. Cálculo de la mediana  Datos agrupados: clase mediana es la que contiene a la observación que ocupa la posición n/2. Cm xf xF n LmMd m m )( )( 2 1 1   Donde: Lm: límite inferior de la clase mediana. F(xm-1): frecuencia acumulada de la clase anterior a la clase mediana. f(xm): frecuencia absoluta de la clase mediana. Cm: amplitud de la clase mediana.
  26. 26. Moda  Observación o clase que tiene la mayor frecuencia en un conjunto de observaciones.  Un conjunto de datos puede ser unimodal, bimodal o multimodal.  Es la única medida de tendencia central que se puede determinar para datos de tipo cualitativo.
  27. 27. Cálculo de la moda  Para datos no agrupados: es simplemente la observación que más se repite.  Para datos agrupados: CmLimMo 21 1    Donde: Lim: límite inferior de la clase modal. 1: diferencia entre fi de la clase modal y la anterior. 2: diferencia entre fi de la clase modal y la posterior. Cm: amplitud de la clase modal (clase de mayor frecuencia).
  28. 28. Relación entre la media, la mediana y la moda Cuando los datos son sesgados es mejor emplear la Md
  29. 29. Propiedades, ventajas y desventajas de la media Propiedades:  La suma de las diferencias entre las media muestral y el valor de cada observación es cero.  La media de una constante es la constante.  Si todas las observaciones xi se multiplican por una constante a, la X también se debe multiplicar por ese mismo valor constante.
  30. 30. Propiedades, ventajas y desventajas de la media  Si se somete a una variable estadística X a un cambio de origen y escala, Y = a + bX, la media aritmética de dicha variable X varía en la misma proporción.  La media de la suma de dos variables es igual a la suma de sus medias.
  31. 31. Propiedades, ventajas y desventajas de la media Ventajas:  Emplea en su cálculo toda la información disponible.  Se expresa en las mismas unidades que la variable en estudio.  Es el centro de gravedad de toda la distribución, representando a todos los valores observados.  Es una valor único.
  32. 32. Propiedades, ventajas y desventajas de la media  Se trata de un concepto familiar para la mayoría de las personas.  Es útil para llevar a cabo procedimientos estadísticos como la comparación de medias de varios conjuntos de datos.
  33. 33. Propiedades, ventajas y desventajas de la media Desventajas:  Se ve adversamente afectada por valores extremos, perdiendo representatividad.  Si el conjunto de datos es muy grande puede ser tedioso su cálculo manual.  No se puede calcular para datos cualitativos.  No se puede calcular para datos que tengan clases de extremo abierto, tanto superior como inferior.
  34. 34. Ventajas y desventajas de la mediana Ventajas:  Fácil de calcular si el número de observaciones no es muy grande.  No se ve influenciada por valores extremos, ya que solo influyen los valores centrales.  Fácil de entender.
  35. 35. Ventajas y desventajas de la mediana  Se puede calcular para cualquier tipos de datos cuantitativos, incluso los datos con clase de extremo abierto.  Es la medida de tendencia central más representativa en el caso de variables que solo admiten la escala ordinal.
  36. 36. Ventajas y desventajas de la mediana Desventajas:  No utiliza en su “cálculo” toda la información disponible.  No pondera cada valor por el número de veces que se ha repetido.  Hay que ordenar los datos antes de determinarla.
  37. 37. Ventajas y desventajas de la moda Ventajas:  No requiere cálculos.  Puede usarse para datos tanto cuantitativos como cualitativos.  Fácil de interpretar.  No se ve influenciada por valores extremos.  Se puede calcular en clases de extremo abierto.
  38. 38. Ventajas y desventajas de la moda Desventajas:  Para conjuntos pequeños de datos su valor no tiene casi utilidad, si es que de hecho existe. Solo tiene significado en el caso de una gran cantidad de datos.  No utiliza toda la información disponible.  No siempre existe, si los datos no se repiten.
  39. 39. Ventajas y desventajas de la moda  En ocasiones, el azar hace que una sola observación se no representativa se el valor más frecuente del conjunto de datos.  Difícil de interpretar si los datos tiene 3 o más modas.
  40. 40. Medidas de dispersión, variación o variabilidad.  Son valores numéricos que indican o describen la forma en que las observaciones están dispersas o diseminadas, con respecto al valor central.
  41. 41. Medidas de dispersión, variación o variabilidad.  Son importantes debido a que dos muestras de observaciones con el mismo valor central pueden tener una variabilidad muy distinta.
  42. 42. Medidas de dispersión, variación o variabilidad.  Rango.  Varianza.  Desviación Típica.  Coeficiente de variación.
  43. 43. Medidas de dispersión: Rango Rango (amplitud o recorrido):  Está determinado por los dos valores extremos de los datos muestrales, es simplemente la diferencia entre la mayor y menor observación.  Es una medida de dispersión absoluta, ya que depende solamente de los datos y permite conocer la máxima dispersión.
  44. 44. Medidas de dispersión: Rango  Casi no se emplea debido a que depende únicamente de dos valores.  No proporciona una medida de variabilidad de las observaciones con respecto al centro de la distribución.  Notación: R
  45. 45. Medidas de dispersión: Varianza  Es un valor numérico que mide el grado de dispersión relativa porque depende de la posición de los datos x1,x2,…,xn con respecto a la media.  Es el promedio al cuadrado de las desviaciones de cada observación con respecto a la media.  Notación: s2, 2, var(X)
  46. 46. Medidas de dispersión: Varianza  Si la varianza de un conjunto de observaciones es grande se dice que los datos tiene una mayor variabilidad que un conjunto de datos que tenga un varianza menor.   2 1 2 2 1 2 2 x n x s n xx s n i i n i i        Para datos NO agrupados:
  47. 47. Para datos agrupados en una distribución de frecuencias: Medidas de dispersión: Varianza    21 2 2 1 2 2 x n fm s n fxm s k i ii k i ii         
  48. 48. Medidas de dispersión: Desviación Típica  Es la raíz cuadrada de la varianza.  Notación: s, . 2 ss 
  49. 49. Medidas de dispersión: Coeficiente de Variación  Es una medida de dispersión relativa que permite comparar el nivel de dispersión de dos muestras de variables estadísticas diferentes.  No tiene dimensiones.  Notación: CV %100 x s CV
  50. 50. Ventajas y Desventajas del Rango Ventajas:  Útil cuando se quiere conocer la extensión de las variaciones extremas (valor máximo de la dispersión).  Fácil de calcular.
  51. 51. Ventajas y Desventajas del Rango Desventajas:  No es una MD con respecto al centro de la distribución.  Solo emplea dos valores en su cálculo.  No se puede calcular en distribuciones de límite de clase abierto.
  52. 52. Propiedades, Ventajas y Desventajas de la Varianza Propiedades: 1. Siempre es mayor o igual a cero y menor que infinito. 2. La varianza de una constante es cero. 3. Si a una variable X la sometemos a Y=a+bX, la varianza de Y será Var(Y) = b2Var(X)
  53. 53. Propiedades, Ventajas y Desventajas de la Varianza Ventajas:  Es útil cuando se compara la variabilidad de dos o más conjuntos de datos.  Utiliza toda la información disponible. Desventajas:  No proporciona ayuda inmediata cuando se estudia la dispersión de un solo conjunto de datos.  Difícil de interpretar por tener sus unidades elevadas al cuadrado.
  54. 54. Ventajas y Desventajas de la Desviación Típica Ventajas:  Esta expresada en las mismas unidades que la variable en estudio.  Utiliza todas las observaciones en su cálculo.  Fácil de interpretar. Desventajas:  No tiene.
  55. 55. Ventajas y Desventajas del Coeficiente de Variación Ventajas:  Es la única MD que permite comparar el nivel de dispersión de dos muestras de variables diferentes.  Emplea toda la información disponible en su cálculo.  Fácil de calcular.
  56. 56. Ventajas y Desventajas del Coeficiente de Variación Desventaja:  No es una MD con respecto al centro de la distribución de los datos.
  57. 57. Medidas de Forma  Son medidas numéricas que permiten determinar la forma que tiene la curva de los datos, por lo tanto, sirven para corroborar lo que los gráficos muestran. Medidas de forma -Asimetría -Kurtosis o apuntamiento Coeficiente de Pearson Coeficiente de Fisher
  58. 58. Medidas de Forma: Asimetría  Permiten estudiar la forma de la curva, dependiendo de cómo se agrupan los datos.
  59. 59. Medidas de Forma: Asimetría Coeficiente de Asimetría de Pearson:  Fácil de calcular e interpretar.  Cálculo:   s MdX ASP   3 o Interpretación: ASP = 0, X=Md Simétrica > 0, X>Md Asimétrica Positiva < 0, X<Md Asimétrica Negativa
  60. 60. Medidas de Forma: Asimetría Coeficiente de Asimetría de Fisher:  No es de fácil cálculo, pero si su interpretación.     3 1 3 3 1 3 ns fxM ASF ns Xx ASF k i ii n i i         Datos NO agrupados Datos Agrupados
  61. 61. Medidas de Forma: Asimetría o Interpretación: ASF = 0, Simétrica > 0, Asimétrica Positiva < 0, Asimétrica Negativa
  62. 62. Medidas de Forma: Kurtosis  Miden si los valores de la distribución están más o menos concentrados alrededor de los valores medios de la muestra (zona central de la distribución).  Se definen tres tipos de distribución según su grado de Kurtosis:
  63. 63. Medidas de Forma: Kurtosis  Mesocúrtica: grado de concentración medio alrededor de los valores centrales de la variable.  Leptocúrtica: grado de concentración elevado.  Platicúrtica: grado de concentración reducido.
  64. 64. Medidas de Forma: Kurtosis     3 3 4 1 4 4 1 4           ns fXM CK ns Xx CK k i ii n i i Datos No Agrupados Datos Agrupados Interpretación: CK =0 Mesocúrtica >0 Leptocúrtica <0 Platicúrtica
  65. 65. Referencias:  Wikipedia(http://es.wikipedia.org/wi ki/Wikipedia:Portada)  Walpole y Myers. Probabilidad y Estadística. Mc Graw-Hill.  Triola, Mario F. Estadística. Pearson.

×