Estadística Descriptiva
                   2ª Clase
Ing. José Ramón Pérez Hernández
           00105716@red.unid.mx
   joseramon4225.wordpress.com



                      Septiembre 2012
FUENTES DE DATOS
Los datos estadísticos necesarios para la comprensión de los hechos
pueden obtenerse a través de fuentes primarias y fuentes secundarias.
Las fuentes primarias son las efectuadas por oficinas gubernamentales
encargadas de tal fin.
Es aconsejable utilizar fuentes de datos primarias y en última
instancia cuando estas no existan, usar estadísticas de fuentes
secundarias. Con este último tipo no debemos pasar por alto que la
calidad de las conclusiones estadísticas dependen en grado sumo de la
exactitud de los datos que se recaben.
METODOS DE RECOLECCION DE DATOS

•   La entrevista personal
•   Cuestionario
•   Cuestionarios por correo
•   Entrevista por teléfono
TIPOS DE VARIABLES

Una variable estadística es cada una de las características o cualidades
que poseen los individuos de una población.

Tipos de variables estadísticas

Variable cualitativa
Las variables cualitativas se refieren a características o cualidades
que no pueden ser medidas con números. Ejemplo:
La nota en un examen: reprobado, aprobado, notable, sobresaliente.
Puesto conseguido en una prueba deportiva: 1º, 2º, 3º.
Medallas de una prueba deportiva: oro, plata, bronce.
Una variable cuantitativa es la que se expresa mediante un
número, por tanto se pueden realizar operaciones aritméticas con el la.
Podemos distinguir dos tipos:

Variable discreta
Una variable discreta es aquel la que toma valores aislados, es decir
no admite valores intermedios entre dos valores específicos. Por
ejemplo:

El número de hermanos de 5 amigos: 2, 1, 0, 1, 3.
Variable continúa.

Una variable continua es aquel la que puede tomar valores
comprendidos entre dos números. Por ejemplo:
La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75.
Se caracterizan por el hecho de que estos valores siempre se puede
encontrar un valor intermedio, (el peso, la estatura, el tiempo
empleado para realizar un trabajo, etc.)
REPRESENTACION GRAFICA Y TABULAR DE LA
                  INFORMACION

GRAFICAS: BARRAS, PASTEL, PUNTOS

La presentación de datos estadísticos por medio de gráficos es
considerada una tarea importante en el proceso de comunicación de
los datos. Usualmente cuando alguien recibe en sus manos un
documento con gráficos, la primer mirada se dirige a estos. A pesar de
la reconocida importancia este proceso no siempre se realiza de la
mejor manera.
• Gráfica de Barras.
Los gráficos de barras ilustran comparaciones entre elementos
individuales y cuentan con los siguientes subtipos:
Barra agrupada Este tipo de grafico compara valores de distintas
categorías.




Barra apilada Este tipo de grafico muestra la relación de los
elementos individuales con el todo.
• Gráfica de Pastel o Circular

Los gráficos circulares muestran el tamaño proporcional de los
elementos que conforman una serie de datos, en función de la suma de
los elementos. Siempre mostrara una única serie de datos y es útil
cuando se desea destacar un elemento significativo.

Circular Este tipo de grafico muestra la contribución de cada valor al
total.
• Gráfica de Puntos

El denominado grafico de puntos permite mostrar apropiadamente a
pequeños conjuntos de datos y tiene la gran ventaja de ser fácilmente
construido a mano. En este tipo de grafico, la abscisa representa los
valores de la variable estudiada y la ordenada la frecuencia de
aparición de un valor en el conjunto de datos estudiado.
• Gráfica de Columnas

Un grafico de columnas muestra los cambios que han sufrido los datos
en el transcurso de un periodo de tiempo determinado o ilustra las
comparaciones entre elementos.
• Gráfica de Líneas

Los gráficos de líneas muestran las tendencias en los datos a intervalos
idénticos a lo largo del tiempo o entre categorías. También esta
disponible con marcadores en cada valor de datos.
• Gráfica de Dispersión

Los gráficos XY (Dispersión) muestran la relación entre los valores
numéricos de varias series de datos o trazan dos grupos de números
como una única serie de coordenadas XY.
Este tipo de grafico se suele usar para datos científicos y consta de los
siguientes subtipos
• Gráfica de Áreas

Los gráficos de área destacan la magnitud de los cambios con el
transcurso del tiempo.
• Gráfica de Anillos
Al igual que un grafico circular, un grafico de anillos muestra la
relación de las partes con un todo, aunque puede contener mas de una
única serie de datos.




• Gráfica Radial
Los gráficos radiales muestran cambios de valores con relación a un
punto central. Pueden presentarse con marcadores en cada punto de
datos.
• Grafica de Superficie.

Los gráficos de superficie son útiles cuando se desea buscar las
combinaciones optimas entre dos conjuntos de datos. Como en un
mapa topográfico, los colores y los diseños indican las áreas que se
encuentran dentro del mismo rango de valores.
• Grafica de Burbujas.

Un gráfico de burbujas es un tipo de gráfico XY (Dispersión), que
compara series de tres valores y puede presentarse con efecto visual
3D. El tamaño de la burbuja o marcador de datos indica el valor de
una tercera variable.
• Grafica de Cotizaciones.

Este tipo de gráficos suele utilizarse para ilustrar datos de cotización
de acciones, aunque también se pueden utilizar para presentar datos
científicos, (por ejemplo, para indicar cambios de temperatura). Para
crear gráficos de cotizaciones debe organizar los datos en el orden
correcto.
• Pictogramas.

También llamada gráfica de imágenes o pictografía. Es un diagrama
que utiliza imágenes o símbolos para mostrar datos para una rápida
comprensión. En un pictograma, se utiliza una imagen o un símbolo
para representar una cantidad específica.
• Histogramas.
Un histograma es una representación gráfica de una variable en forma
de barras, donde la superficie de cada barra es proporcional a la
frecuencia de los valores representados. En el eje vertical se
representan las frecuencias, y en el eje horizontal los valores de las
variables, normalmente señalando las marcas de clase, es decir, la
mitad del intervalo en el que están agrupados los datos.


• Polígono de Frecuencias.
Es un gráfico que se realiza a través de la unión de los puntos más
altos de las columnas en un histograma de frecuencia
• Ojiva Porcentual.

Es un gráfico acumulativo, el cual es muy útil cuando se quiere
representar el rango porcentual de cada valor en una distribución de
frecuencias.
Tabla de Distribución de
Frecuencias
      Unid Septiembre 2012
                 1er Parcial
Tabla de Distribución de Frecuencias
Una distribución de frecuencias es una tabla en la cual se agrupan los
valores posibles para una variable y se registra el número de valores
observados que corresponde a cada clase. Los datos organizados en
una distribución de frecuencias se denominan datos agrupados.

• Distribución de frecuencias: Procedimiento mediante el cual se
  realiza el conteo para así determinar el número de veces que cada
  variable se repite, también recibe el nombre de tabulación.

• Frecuencias absolutas (fi): Número de                elementos    u
  observaciones pertenecientes a una misma clase.
• Ejemplo:
Se le pregunta a un grupo de alumnos ¿Cuántas materias reprobaron
el cuatrimestre pasado?




Se ordenan los datos recopilados y se obtiene la siguiente disposición.
Se realiza la tabla de distribución de frecuencias:
• Frecuencia Relativa.

Denota la importancia de la clase, al expresarse en términos
porcentuales. Se obtiene dividiendo la frecuencia absoluta por el
número de observaciones.
Facilitan el análisis de los datos, en especial para comparar
distribuciones de frecuencias basadas en diferente número de
observaciones.
Si se divide la frecuencia de un intervalo de clase entre el total de
frecuencias y se multiplica por 100 se obtiene la frecuencia relativa en
porcentaje, es decir.
Continuando con el ejemplo:


              Xi              Fi            F r (%)
               0              10              25
               1              7               17.5
               2              12              30
               3              6               15
               4              3               7.5
               5              2                5

                              40              100




                                   Operaciones Pizarrón
• Distribución de Frecuencias Acumuladas.

Al conjunto de sumas acumuladas de frecuencias de cada clase se
anterior se le llama distribución de frecuencias acumuladas. Se
obtiene sumando las frecuencias (absolutas o relativas) en sentido
descendente, para lo cual se utiliza la formula.
Continuando con el ejemplo:


           Xi        Fi       F r (%)      Fa       F r a (%)
           0         10         25          10         25
           1          7        17.5         17        42.5
           2         12         30          29        72.5
           3          6         15          35        87.5
           4          3         7.5         38         95
           5          2         5           40        100

                     40        100




                                        Operaciones Pizarrón
CUESTIONARIO
1. ¿Cuál es la población?
2. Indique ¿Cuál es la variable?
3. ¿Qué tipo de variable representa?
4. ¿Cuántos alumnos reprobaron 2 materias?
5. ¿Qué porcentaje de alumnos reprobaron 4 materias?
6. ¿Cuántos alumnos reprobaron 3 materias o menos?
7. ¿Qué porcentaje de alumnos reprobó 1 materia o
menos?
8. ¿Cuántos alumnos no reprobaron materias?
9. ¿Qué porcentaje reprobó 5 materias?
10. ¿Cuántos alumnos reprobaron más de 3 materias?
• Ejemplo:
Durante el mes de julio, en una ciudad se han registrado las siguientes
temperaturas máximas




Se ordenan los datos recopilados y se obtiene la siguiente disposición.
• Se realiza la tabla de distribución de frecuencias
CUESTIONARIO
• 1. ¿Cual es la variable?

• 2. ¿Cual es la población?

• 3. ¿Cuantos días presentaron una máxima de 30°C?

• 4. ¿Que tipo de variable representa?

• 5. ¿Que porcentaje de días tuvo una temperatura máxima de 28°C?

• 6. ¿Cuantos días presentaron 33°C o menos de temperatura máxima?

• 7. ¿Que porcentaje en días tuvo 31°C o menos?

• 8. ¿Cuantos días presentaron mas de 30°C de temperatura máxima?

• 9. ¿Que porcentaje en días tuvo mas de 33°C de temperatura máxima?

• 10. ¿Cuantos días presentaron 31°C?
Representación Gráfica
           Gráfico de barras
• Frecuencia Absoluta
• Frecuencia Relativa
• Ojiva menor que

Estadística descriptiva 2a clase

  • 1.
    Estadística Descriptiva 2ª Clase Ing. José Ramón Pérez Hernández 00105716@red.unid.mx joseramon4225.wordpress.com Septiembre 2012
  • 2.
    FUENTES DE DATOS Losdatos estadísticos necesarios para la comprensión de los hechos pueden obtenerse a través de fuentes primarias y fuentes secundarias. Las fuentes primarias son las efectuadas por oficinas gubernamentales encargadas de tal fin. Es aconsejable utilizar fuentes de datos primarias y en última instancia cuando estas no existan, usar estadísticas de fuentes secundarias. Con este último tipo no debemos pasar por alto que la calidad de las conclusiones estadísticas dependen en grado sumo de la exactitud de los datos que se recaben.
  • 3.
    METODOS DE RECOLECCIONDE DATOS • La entrevista personal • Cuestionario • Cuestionarios por correo • Entrevista por teléfono
  • 4.
    TIPOS DE VARIABLES Unavariable estadística es cada una de las características o cualidades que poseen los individuos de una población. Tipos de variables estadísticas Variable cualitativa Las variables cualitativas se refieren a características o cualidades que no pueden ser medidas con números. Ejemplo: La nota en un examen: reprobado, aprobado, notable, sobresaliente. Puesto conseguido en una prueba deportiva: 1º, 2º, 3º. Medallas de una prueba deportiva: oro, plata, bronce.
  • 5.
    Una variable cuantitativaes la que se expresa mediante un número, por tanto se pueden realizar operaciones aritméticas con el la. Podemos distinguir dos tipos: Variable discreta Una variable discreta es aquel la que toma valores aislados, es decir no admite valores intermedios entre dos valores específicos. Por ejemplo: El número de hermanos de 5 amigos: 2, 1, 0, 1, 3.
  • 6.
    Variable continúa. Una variablecontinua es aquel la que puede tomar valores comprendidos entre dos números. Por ejemplo: La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75. Se caracterizan por el hecho de que estos valores siempre se puede encontrar un valor intermedio, (el peso, la estatura, el tiempo empleado para realizar un trabajo, etc.)
  • 7.
    REPRESENTACION GRAFICA YTABULAR DE LA INFORMACION GRAFICAS: BARRAS, PASTEL, PUNTOS La presentación de datos estadísticos por medio de gráficos es considerada una tarea importante en el proceso de comunicación de los datos. Usualmente cuando alguien recibe en sus manos un documento con gráficos, la primer mirada se dirige a estos. A pesar de la reconocida importancia este proceso no siempre se realiza de la mejor manera.
  • 8.
    • Gráfica deBarras. Los gráficos de barras ilustran comparaciones entre elementos individuales y cuentan con los siguientes subtipos: Barra agrupada Este tipo de grafico compara valores de distintas categorías. Barra apilada Este tipo de grafico muestra la relación de los elementos individuales con el todo.
  • 9.
    • Gráfica dePastel o Circular Los gráficos circulares muestran el tamaño proporcional de los elementos que conforman una serie de datos, en función de la suma de los elementos. Siempre mostrara una única serie de datos y es útil cuando se desea destacar un elemento significativo. Circular Este tipo de grafico muestra la contribución de cada valor al total.
  • 10.
    • Gráfica dePuntos El denominado grafico de puntos permite mostrar apropiadamente a pequeños conjuntos de datos y tiene la gran ventaja de ser fácilmente construido a mano. En este tipo de grafico, la abscisa representa los valores de la variable estudiada y la ordenada la frecuencia de aparición de un valor en el conjunto de datos estudiado.
  • 11.
    • Gráfica deColumnas Un grafico de columnas muestra los cambios que han sufrido los datos en el transcurso de un periodo de tiempo determinado o ilustra las comparaciones entre elementos.
  • 12.
    • Gráfica deLíneas Los gráficos de líneas muestran las tendencias en los datos a intervalos idénticos a lo largo del tiempo o entre categorías. También esta disponible con marcadores en cada valor de datos.
  • 13.
    • Gráfica deDispersión Los gráficos XY (Dispersión) muestran la relación entre los valores numéricos de varias series de datos o trazan dos grupos de números como una única serie de coordenadas XY. Este tipo de grafico se suele usar para datos científicos y consta de los siguientes subtipos
  • 14.
    • Gráfica deÁreas Los gráficos de área destacan la magnitud de los cambios con el transcurso del tiempo.
  • 15.
    • Gráfica deAnillos Al igual que un grafico circular, un grafico de anillos muestra la relación de las partes con un todo, aunque puede contener mas de una única serie de datos. • Gráfica Radial Los gráficos radiales muestran cambios de valores con relación a un punto central. Pueden presentarse con marcadores en cada punto de datos.
  • 16.
    • Grafica deSuperficie. Los gráficos de superficie son útiles cuando se desea buscar las combinaciones optimas entre dos conjuntos de datos. Como en un mapa topográfico, los colores y los diseños indican las áreas que se encuentran dentro del mismo rango de valores.
  • 17.
    • Grafica deBurbujas. Un gráfico de burbujas es un tipo de gráfico XY (Dispersión), que compara series de tres valores y puede presentarse con efecto visual 3D. El tamaño de la burbuja o marcador de datos indica el valor de una tercera variable.
  • 18.
    • Grafica deCotizaciones. Este tipo de gráficos suele utilizarse para ilustrar datos de cotización de acciones, aunque también se pueden utilizar para presentar datos científicos, (por ejemplo, para indicar cambios de temperatura). Para crear gráficos de cotizaciones debe organizar los datos en el orden correcto.
  • 19.
    • Pictogramas. También llamadagráfica de imágenes o pictografía. Es un diagrama que utiliza imágenes o símbolos para mostrar datos para una rápida comprensión. En un pictograma, se utiliza una imagen o un símbolo para representar una cantidad específica.
  • 20.
    • Histogramas. Un histogramaes una representación gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. En el eje vertical se representan las frecuencias, y en el eje horizontal los valores de las variables, normalmente señalando las marcas de clase, es decir, la mitad del intervalo en el que están agrupados los datos. • Polígono de Frecuencias. Es un gráfico que se realiza a través de la unión de los puntos más altos de las columnas en un histograma de frecuencia
  • 21.
    • Ojiva Porcentual. Esun gráfico acumulativo, el cual es muy útil cuando se quiere representar el rango porcentual de cada valor en una distribución de frecuencias.
  • 22.
    Tabla de Distribuciónde Frecuencias Unid Septiembre 2012 1er Parcial
  • 23.
    Tabla de Distribuciónde Frecuencias Una distribución de frecuencias es una tabla en la cual se agrupan los valores posibles para una variable y se registra el número de valores observados que corresponde a cada clase. Los datos organizados en una distribución de frecuencias se denominan datos agrupados. • Distribución de frecuencias: Procedimiento mediante el cual se realiza el conteo para así determinar el número de veces que cada variable se repite, también recibe el nombre de tabulación. • Frecuencias absolutas (fi): Número de elementos u observaciones pertenecientes a una misma clase.
  • 24.
    • Ejemplo: Se lepregunta a un grupo de alumnos ¿Cuántas materias reprobaron el cuatrimestre pasado? Se ordenan los datos recopilados y se obtiene la siguiente disposición.
  • 25.
    Se realiza latabla de distribución de frecuencias:
  • 26.
    • Frecuencia Relativa. Denotala importancia de la clase, al expresarse en términos porcentuales. Se obtiene dividiendo la frecuencia absoluta por el número de observaciones. Facilitan el análisis de los datos, en especial para comparar distribuciones de frecuencias basadas en diferente número de observaciones. Si se divide la frecuencia de un intervalo de clase entre el total de frecuencias y se multiplica por 100 se obtiene la frecuencia relativa en porcentaje, es decir.
  • 27.
    Continuando con elejemplo: Xi Fi F r (%) 0 10 25 1 7 17.5 2 12 30 3 6 15 4 3 7.5 5 2 5 40 100 Operaciones Pizarrón
  • 28.
    • Distribución deFrecuencias Acumuladas. Al conjunto de sumas acumuladas de frecuencias de cada clase se anterior se le llama distribución de frecuencias acumuladas. Se obtiene sumando las frecuencias (absolutas o relativas) en sentido descendente, para lo cual se utiliza la formula.
  • 29.
    Continuando con elejemplo: Xi Fi F r (%) Fa F r a (%) 0 10 25 10 25 1 7 17.5 17 42.5 2 12 30 29 72.5 3 6 15 35 87.5 4 3 7.5 38 95 5 2 5 40 100 40 100 Operaciones Pizarrón
  • 30.
    CUESTIONARIO 1. ¿Cuál esla población? 2. Indique ¿Cuál es la variable? 3. ¿Qué tipo de variable representa? 4. ¿Cuántos alumnos reprobaron 2 materias? 5. ¿Qué porcentaje de alumnos reprobaron 4 materias? 6. ¿Cuántos alumnos reprobaron 3 materias o menos? 7. ¿Qué porcentaje de alumnos reprobó 1 materia o menos? 8. ¿Cuántos alumnos no reprobaron materias? 9. ¿Qué porcentaje reprobó 5 materias? 10. ¿Cuántos alumnos reprobaron más de 3 materias?
  • 31.
    • Ejemplo: Durante elmes de julio, en una ciudad se han registrado las siguientes temperaturas máximas Se ordenan los datos recopilados y se obtiene la siguiente disposición.
  • 32.
    • Se realizala tabla de distribución de frecuencias
  • 33.
    CUESTIONARIO • 1. ¿Cuales la variable? • 2. ¿Cual es la población? • 3. ¿Cuantos días presentaron una máxima de 30°C? • 4. ¿Que tipo de variable representa? • 5. ¿Que porcentaje de días tuvo una temperatura máxima de 28°C? • 6. ¿Cuantos días presentaron 33°C o menos de temperatura máxima? • 7. ¿Que porcentaje en días tuvo 31°C o menos? • 8. ¿Cuantos días presentaron mas de 30°C de temperatura máxima? • 9. ¿Que porcentaje en días tuvo mas de 33°C de temperatura máxima? • 10. ¿Cuantos días presentaron 31°C?
  • 34.
    Representación Gráfica Gráfico de barras • Frecuencia Absoluta
  • 35.
  • 36.