ESTADÍSTICA

Historia, concepto y utilidad
HISTORIA
Se cree que los orígenes de la estadística están ligados al
antiguo Egipto y a los censos chinos hace unos 4000 años,
aproximadamente.
Desde esa época, diversos estados realizaron estudios
sobre algunas características de sus poblaciones, sus
riquezas, posesiones, etc.
En 1662, John Graunt, un mercader Inglés, publicó un libro
sobre los nacimientos y defunciones ocurridos en Londres; el
libro tenia conclusiones acerca de ciertos aspectos
relacionados con estos acontecimientos. Esta obra es
considerada como el punto de partida de la estadística
moderna.
La palabra estadística comenzó a usarse en el siglo XVIII, en
Alemania, en relación a estudios donde los grandes números, que
representaban datos, eran de importancia para el estado. Sin
embargo, la estadística moderna se desarrolló en el siglo XX a
partir de los estudios de Karl Pearson.
Hoy la estadística tiene gran importancia, no sólo por que presenta
información, sino que además permite inferir y y predecir lo que va
a ocurrir, y por lo tanto, es una herramienta fundamental a la hora
de tomar decisiones de importancia
En muchas ocasiones, para
llevar a cabo una
investigación se hacen
encuestas, las cuales son
dirigidas a una muestra
representativa de la
población. Para comprender
mejor este tipo de estudios
es importante que conozcas
los siguientes términos
básicos
Población:
Es un conjunto de personas, eventos o cosas de las cuales se
desea hacer un estudio, y tienen una característica en común.

Muestra:
Es un subconjunto cualquiera de la población; es importante escoger la muestra en forma
aleatoria (al azar), pues así se logra que sea representativa y se puedan obtener
conclusiones más afines acerca de las características de la población
Para estudiar alguna característica especifica de la población se
         pueden definir los siguientes tipos de variables:

Variables Cualitativas:              Variables Cuantitativas:
Relacionadas con
características no numéricas         Relacionadas         con       las
de un individuo.                     características numéricas del
por ejemplo:                         individuo.      Las      variables
                                     cuantitativas se dividen en
Atributos de una persona             Discretas (aquellas que no
                      Estado civil   admiten otro valor entre 2
de una persona                       valores distintos y consecutivos)
                                     o Continuas (aquellas que
               etc.                  pueden tomar una infinidad de
                                     valores entre dos de ellos)
ORDENANDO LA INFORMACIÓN

Al ordenar datos muy numerosos, es usual agruparlos en clases o
categorías. Al determinar cuantos pertenecen a cada clase,
establecemos la frecuencia. Construimos así una tabla de datos
llamada Tabla de frecuencias.
Ejemplo:
Los siguientes datos corresponden a las notas obtenidas por un
curso de 24 alumnos en un trabajo de matemática:
4.2   5.0   5.6   5.0

3.2   4.2   5.6   6.0   2.8

3.9   4.2   4.2   50    50

3.9   3.9   3.2   3.2   4.2

5.6   6.0   6.0   3.2   6.0
ORDENEMOS ESTOS DATOS EN LA
      SIGUIENTE TABLA:
 Nota    Frecuencia       Frecuencia        Frecuencia
        Absoluta (f i)   Relativa (h i)       relativa
                                          porcentual (%)
 2.8          1              1/24               4.2

 3.2          4              4/24              16.7

 3.9          3              3/24              12.5

 4.2          5              5/24              20.8
 5.0          4              4/24              16.7

 5.6          3              3/24              12.5

 6.0          4              4/24              16.7
La frecuencia absoluta de una clase es el
numero de datos que forma dicha clase,
mientras que la frecuencia relativa corresponde
a la razón entre la frecuencia absoluta y el total
de datos, la cual se puede expresar mediante
el uso de porcentajes.
Tabla de frecuencia de datos agrupados

En ocasiones, el agrupar los datos en intervalos, nos puede
ayudar para realizar un mejor análisis de ellos.
Consideremos los siguientes datos, expresados en
metros, correspondientes a las estaturas de 80
estudiantes de cuarto año de educación media
Notamos que la estatura mayor es 1,93 m y la estatura menor es 1,66m; El
rango es de 0,27m = 27 cm. Formaremos 6 intervalos. Para calcular el tamaño
          de cada uno dividimos 27 : 6 = 4,5 lo aproximamos a 5.
1,67 1,72 1,81 1,72 1,74 1,83 1,84 1,88 1,92 1,75

1,84 1,86 1,73 1,84 1,87 1,83 1,81 1,77 1,73 1,75

1,78 1,77 1,67 1,83 1,83 1,72 1,71 1,85 1,84 1,93

1,82 1,69 1,70 1,81 1,66 1,76 1,75 1,80 1,79 1,84

1,86 1,80 1,77 1,80 1,76 1,88 1,75 1,79 1,87 1,79

1,77 1,67 1,74 1,75 1,78 1,77 1,74 1,73 1,83 1,76

1,83 1,77 1,75 1,77 1,77 1,84 1,83 1,79 1,82 1,76

1,76 1,76 1,79 1,88 1,66 1,80 1,72 1,75 1,79 1,77
Nos queda la siguiente tabla:

 Intervalos    Frecuencia Absoluta
1,65 – 1,69              6
1,70 – 1,74              12
1,75 – 1,79              30
1,80 – 1,84              22
1,85 – 1,89              8
1,90 – 1,94              2
              Total : 80
Para construir una tabla de frecuencias para datos agrupados,
determinamos el tamaño de cada intervalo, dividiendo el valor del
    rango por la cantidad de intervalos que se desea obtener.



 El rango, está dado por la diferencia entre el máximo y el
 mínimo valor de la variable.
 El tamaño del intervalo se aproxima al impar más
 cercano.
 La Marca de clase es el representante de un intervalo, y
 corresponde al promedio entre los extremos
Gráficos

  Ventas




           1er trim.
           2º trim.
           3er trim.
           4º trim.
Histograma
6

5

4

3                                             Serie 1
                                              Serie 2
2                                             Serie 3

1

0
    Categoría Categoría Categoría Categoría
        1         2         3         4
Curvas
6

5

4

3                                             Serie 1
                                              Serie 2
2
                                              Serie 3
1

0
    Categoría Categoría Categoría Categoría
        1         2         3         4
Dispersíon
              Valores Y
3.5
 3
2.5
 2
1.5                           Valores Y
 1
0.5
 0
      0   1        2      3
Medidas estadísticas
Medidas de tendencia central: Media, Mediana, Moda
Supóngase que un determinado alumno obtiene 35 puntos en
una prueba de matemática. Este puntaje, por sí mismo tiene muy
poco significado a menos que podamos conocer el total de
puntos que obtiene una persona promedio al participar en esa
prueba, saber cuál es la calificación menor y mayor que se
obtiene, y cuán variadas son esas calificaciones.
En otras palabras, para que una calificación tenga significado
hay que contar con elementos de referencia generalmente
relacionados con ciertos criterios estadísticos.
Sirven como puntos de referencia para interpretar las
calificaciones que se obtienen en una prueba.
Medidas de posición no central



Los Cuartiles, que dividen a la distribución en cuatro partes
(corresponden a los cuantiles 0.25, 0.50 y 0.75);
Los Quintiles, que dividen a la distribución en cinco partes
(corresponden a los cuantiles 0.20, 0.40, 0.60 y 0.80) ;
Los Deciles, que dividen a la distribución en diez partes;
Los Percentiles, que dividen a la distribución en cien partes.
Los cuantiles 0.25, 0.50 y 0.75 de la distribución normal. Más
conocidos como los cuartiles Q_1, Q_2 y Q_3, dividen la
distribución en cuatro bloques, cada uno de los cuales contiene el
25% de los datos.
Medidas de dispersión
Las medidas de dispersión, también llamadas
medidas de variabilidad, muestran la variabilidad de
una distribución, indicando por medio de un
número, si las diferentes puntuaciones de una
variable están muy alejadas de la mediana media.
Cuanto mayor sea ese valor, mayor será la
variabilidad, cuanto menor sea, más homogénea será
a la mediana media. Así se sabe si todos los casos
son parecidos o varían mucho entre ellos.

Estadística

  • 1.
  • 2.
    HISTORIA Se cree quelos orígenes de la estadística están ligados al antiguo Egipto y a los censos chinos hace unos 4000 años, aproximadamente. Desde esa época, diversos estados realizaron estudios sobre algunas características de sus poblaciones, sus riquezas, posesiones, etc. En 1662, John Graunt, un mercader Inglés, publicó un libro sobre los nacimientos y defunciones ocurridos en Londres; el libro tenia conclusiones acerca de ciertos aspectos relacionados con estos acontecimientos. Esta obra es considerada como el punto de partida de la estadística moderna.
  • 3.
    La palabra estadísticacomenzó a usarse en el siglo XVIII, en Alemania, en relación a estudios donde los grandes números, que representaban datos, eran de importancia para el estado. Sin embargo, la estadística moderna se desarrolló en el siglo XX a partir de los estudios de Karl Pearson. Hoy la estadística tiene gran importancia, no sólo por que presenta información, sino que además permite inferir y y predecir lo que va a ocurrir, y por lo tanto, es una herramienta fundamental a la hora de tomar decisiones de importancia
  • 4.
    En muchas ocasiones,para llevar a cabo una investigación se hacen encuestas, las cuales son dirigidas a una muestra representativa de la población. Para comprender mejor este tipo de estudios es importante que conozcas los siguientes términos básicos
  • 5.
    Población: Es un conjuntode personas, eventos o cosas de las cuales se desea hacer un estudio, y tienen una característica en común. Muestra: Es un subconjunto cualquiera de la población; es importante escoger la muestra en forma aleatoria (al azar), pues así se logra que sea representativa y se puedan obtener conclusiones más afines acerca de las características de la población
  • 6.
    Para estudiar algunacaracterística especifica de la población se pueden definir los siguientes tipos de variables: Variables Cualitativas: Variables Cuantitativas: Relacionadas con características no numéricas Relacionadas con las de un individuo. características numéricas del por ejemplo: individuo. Las variables cuantitativas se dividen en Atributos de una persona Discretas (aquellas que no Estado civil admiten otro valor entre 2 de una persona valores distintos y consecutivos) o Continuas (aquellas que etc. pueden tomar una infinidad de valores entre dos de ellos)
  • 8.
    ORDENANDO LA INFORMACIÓN Alordenar datos muy numerosos, es usual agruparlos en clases o categorías. Al determinar cuantos pertenecen a cada clase, establecemos la frecuencia. Construimos así una tabla de datos llamada Tabla de frecuencias.
  • 9.
    Ejemplo: Los siguientes datoscorresponden a las notas obtenidas por un curso de 24 alumnos en un trabajo de matemática:
  • 10.
    4.2 5.0 5.6 5.0 3.2 4.2 5.6 6.0 2.8 3.9 4.2 4.2 50 50 3.9 3.9 3.2 3.2 4.2 5.6 6.0 6.0 3.2 6.0
  • 12.
    ORDENEMOS ESTOS DATOSEN LA SIGUIENTE TABLA: Nota Frecuencia Frecuencia Frecuencia Absoluta (f i) Relativa (h i) relativa porcentual (%) 2.8 1 1/24 4.2 3.2 4 4/24 16.7 3.9 3 3/24 12.5 4.2 5 5/24 20.8 5.0 4 4/24 16.7 5.6 3 3/24 12.5 6.0 4 4/24 16.7
  • 13.
    La frecuencia absolutade una clase es el numero de datos que forma dicha clase, mientras que la frecuencia relativa corresponde a la razón entre la frecuencia absoluta y el total de datos, la cual se puede expresar mediante el uso de porcentajes.
  • 15.
    Tabla de frecuenciade datos agrupados En ocasiones, el agrupar los datos en intervalos, nos puede ayudar para realizar un mejor análisis de ellos.
  • 16.
    Consideremos los siguientesdatos, expresados en metros, correspondientes a las estaturas de 80 estudiantes de cuarto año de educación media
  • 17.
    Notamos que laestatura mayor es 1,93 m y la estatura menor es 1,66m; El rango es de 0,27m = 27 cm. Formaremos 6 intervalos. Para calcular el tamaño de cada uno dividimos 27 : 6 = 4,5 lo aproximamos a 5.
  • 18.
    1,67 1,72 1,811,72 1,74 1,83 1,84 1,88 1,92 1,75 1,84 1,86 1,73 1,84 1,87 1,83 1,81 1,77 1,73 1,75 1,78 1,77 1,67 1,83 1,83 1,72 1,71 1,85 1,84 1,93 1,82 1,69 1,70 1,81 1,66 1,76 1,75 1,80 1,79 1,84 1,86 1,80 1,77 1,80 1,76 1,88 1,75 1,79 1,87 1,79 1,77 1,67 1,74 1,75 1,78 1,77 1,74 1,73 1,83 1,76 1,83 1,77 1,75 1,77 1,77 1,84 1,83 1,79 1,82 1,76 1,76 1,76 1,79 1,88 1,66 1,80 1,72 1,75 1,79 1,77
  • 20.
    Nos queda lasiguiente tabla: Intervalos Frecuencia Absoluta 1,65 – 1,69 6 1,70 – 1,74 12 1,75 – 1,79 30 1,80 – 1,84 22 1,85 – 1,89 8 1,90 – 1,94 2 Total : 80
  • 21.
    Para construir unatabla de frecuencias para datos agrupados, determinamos el tamaño de cada intervalo, dividiendo el valor del rango por la cantidad de intervalos que se desea obtener. El rango, está dado por la diferencia entre el máximo y el mínimo valor de la variable. El tamaño del intervalo se aproxima al impar más cercano. La Marca de clase es el representante de un intervalo, y corresponde al promedio entre los extremos
  • 22.
    Gráficos Ventas 1er trim. 2º trim. 3er trim. 4º trim.
  • 23.
    Histograma 6 5 4 3 Serie 1 Serie 2 2 Serie 3 1 0 Categoría Categoría Categoría Categoría 1 2 3 4
  • 24.
    Curvas 6 5 4 3 Serie 1 Serie 2 2 Serie 3 1 0 Categoría Categoría Categoría Categoría 1 2 3 4
  • 25.
    Dispersíon Valores Y 3.5 3 2.5 2 1.5 Valores Y 1 0.5 0 0 1 2 3
  • 26.
    Medidas estadísticas Medidas detendencia central: Media, Mediana, Moda Supóngase que un determinado alumno obtiene 35 puntos en una prueba de matemática. Este puntaje, por sí mismo tiene muy poco significado a menos que podamos conocer el total de puntos que obtiene una persona promedio al participar en esa prueba, saber cuál es la calificación menor y mayor que se obtiene, y cuán variadas son esas calificaciones. En otras palabras, para que una calificación tenga significado hay que contar con elementos de referencia generalmente relacionados con ciertos criterios estadísticos. Sirven como puntos de referencia para interpretar las calificaciones que se obtienen en una prueba.
  • 27.
    Medidas de posiciónno central Los Cuartiles, que dividen a la distribución en cuatro partes (corresponden a los cuantiles 0.25, 0.50 y 0.75); Los Quintiles, que dividen a la distribución en cinco partes (corresponden a los cuantiles 0.20, 0.40, 0.60 y 0.80) ; Los Deciles, que dividen a la distribución en diez partes; Los Percentiles, que dividen a la distribución en cien partes.
  • 28.
    Los cuantiles 0.25,0.50 y 0.75 de la distribución normal. Más conocidos como los cuartiles Q_1, Q_2 y Q_3, dividen la distribución en cuatro bloques, cada uno de los cuales contiene el 25% de los datos.
  • 29.
    Medidas de dispersión Lasmedidas de dispersión, también llamadas medidas de variabilidad, muestran la variabilidad de una distribución, indicando por medio de un número, si las diferentes puntuaciones de una variable están muy alejadas de la mediana media. Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más homogénea será a la mediana media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos.