ESTADÍSTICA DESCRIPTIVASandra Machado
DefinicionesUna POBLACIÓN es el conjunto total de objetos que son de interés para un problema dado. Los objetos pueden ser personas, animales, producto fabricados, etc. Cada uno de ellos recibe el nombre de elemento o individuo Una MUESTRA es un subconjunto de la población.Los DATOS u Observaciones son números o denominaciones que podemos asignar a un individuo o elemento de la población.Un PARÁMETRO es cualquier característica medible de una población.Un ESTADÍSTICO es cualquier característica medible de una muestra.
Un CENSO (palabra derivada del latín censere, que significa "valuar o tasar") es la enumeración completa de la población.La ESTADÍSTICA DESCRIPTIVA se compone de aquellos métodos que incluyen técnicas- para recolectar, presentar, analizar e interpretar datos.La ESTADÍSTICA INFERENCIAL abarca aquellos métodos y conjuntos de técnicas que se utilizan para obtener conclusiones sóbrelas leyes de comportamiento de una población basándose en los datos de muestras tornadas de esa población.
Organización de datos de acuerdo al tipoComo se ilustra en la figura, existen dos tipos de datos: categóricos (o cualitativos) y numéricos  (cuantitativos).
1. Los datos CATEGÓRICOS O CUALITATIVOS representan categorías o atributos (como, por ejemplo, "sí" o "no") que pueden clasificarse como un criterio o cualidad.2. Los datos NUMÉRICOS O CUANTITATIVOS producen respuestas numéricas, como el peso en kilogramos o el número de universidades que hay en la Costa Atlántica. Estos datos son de dos tipos; discretos y continuos.	Los DATOS DISCRETOS producen respuestas numéricas 	que surgen de un conteo.
	Los DATOS CONTINUOS producen respuestas numéricas 	que surgen de  proceso de medición, donde la 	característica de que se mide puede tomar cualquier 	valor numérico en un intervalo. Organización de datos mediante tablasEn esta forma de organización de datos es importante el concepto de frecuencia de un dato.Ejemplo: En el conjunto de datos 4 5 5 3 2 6 7 7 7 2, el cuatro sólo aparece una vez (por lo tanto, tiene frecuencia f= 1), el cinco aparece dos veces (o sea, frecuencia f= 2), el 7 tiene frecuencia f = 3, etc.La frecuencia (absoluta) de un dato, simbolizado con la letra f, es el número de veces que aparece ese dato en una colección de datos.
Tabla de frecuencias no agrupadasEjemplo:	Se clasificó a los estudiantes de un programa universitario de acuerdo con el semestre que cursan y sus preferencias deportivas. Los resultados están registrados en la siguiente tabla:
¿Qué porcentaje de los estudiantes de primer semestre prefieren el fútbol?¿Qué porcentaje de los aficionados a la natación son de segundo semestre?¿Qué porcentaje del total de los estudiantes prefieren el basquetbol?¿Qué porcentaje de los estudiantes son de cuarto semestre?¿Qué porcentaje del total de estudiantes son de tercero o cuarto semestre?¿Qué porcentaje prefiere la natación, el voleibol o el béisbol?
Tabla de frecuencias agrupadasEjemplo: La tabla es un ejemplo de una tabla de frecuencias agrupada y 10-14 y 15-19 son ejemplos de clases. En ella se presentan las distribuciones de frecuencia para los datos de tiempo de auditorías de fin de año.Intervalo de Clase o ClaseFrecuencias de ClaseLimite inferior de ClaseLimite superior de ClaseDatos AgrupadosAMPLITUDES
LÍMITES DE CLASES TEÓRICOSL ÍMITES REALES DE CLASE O FRONTERA DE CLASE	Distribución de frecuencias para los datos de tiempo de auditoría:
Diagrama de tallo y hoja Un TALLO es el primer dígito o parte del numeral, mientras que una HOJA está formada por el o los dígitos restantes.	Por ejemplo, el numeral 534 se puede descomponer en dos formas:	  5       |      34                          53      |       4	tallo         hoja                       tallo         hoja
EjemploConstruye una tabla de frecuencias agrupadas considerando los siguientes datos:Paso 1. Organizamos los datos en un diagrama de tallo y hoja Paso 2. Primero determinamos el rango R. Como la medida mayor menos la medida menor.
Paso 3. El ejemplo no nos dice con cuántas clases debemos construir la tabla de frecuencias agrupadas. Podemos seleccionar esta cantidad arbitrariamente (entre 5 y 20) o aplicar la regla de Sturgesc = 3, 3 (logn) + 1donde n es el número de medidas y log n es el logaritmo de n en base 10. El valor de c es común redondearlo al entero más cercano. Otra regla razonable para el número de clase es: c = √n
Paso 4. Ahora, determinamos w, la amplitud de cada clase. En este caso,Paso 5: A continuación se construye la primera clase con un ancho de w = 3. Para ello, primero, tenemos que encontrar las fronteras inferior y superior de esta clase. Como la unidad de medida es 1 (porque todos los datos son enteros) y como el "punto medio" de cada unidad de medida esPaso 6. Para obtener cada una de las clases siguientes a esta primera, tenemos en cuenta que la frontera inferior de la clase siguiente coincide con la frontera superior de la clase anterior y que la amplitud del intervalo es w = 3.
Paso 7. Para determinar la frecuencia de cada clase usamos una columna de marcas de cuenta. Si uno de los datos cae en una clase, anotamos una marca (\) en la columna correspondiente a esa clase.Paso 8. Calculamos la frecuencia relativa, Frecuencia acumulada y frecuencia acumulada relativa.
TALLER1. Clasifique los datos siguientes en cuantitativos (numéricos) y cualitativos (categóricos). En caso de ser numérico, como discretos o continuos:Estaturas en centímetros de cuatro jugadores de fútbol.El número de goles anotados por un futbolista en toda su carrera deportiva.Los sueldos ganados por unos profesores universitarios,Las temperaturas promedios diarias en el último mes.Clasificación étnica de 30 empleados.Números telefónicos de ciertas personas.Calificaciones del primer parcial de Estadística de unos estudiantes universitarios. Distancia (en metros) recorrido por un atleta en una temporada.Peso perdido (en kilogramos) por 10 personas debido a una dieta.Fecha de cumpleaños de determinadas personas.Calificaciones (E, S, A, D, I) de unos estudiantes de bachillerato.Rango militar.
	2. Los siguientes datos representan los totales, en miles de pesos, gastados en fotocopias por una muestra de 25 estudiantes durante un semestre:	Construya una tabla de frecuencias agrupadas usando la regla de Sturges.
3. Los datos adjuntos representan una muestra del aumento de precios (en pesos) de la gasolina extra en una cierta ciudad a lo largo de un año en particular:	Mediante cinco clases construya una tabla de frecuencias relativas acumuladas agrupadas,

Estadística descriptiva

  • 1.
  • 2.
    DefinicionesUna POBLACIÓN esel conjunto total de objetos que son de interés para un problema dado. Los objetos pueden ser personas, animales, producto fabricados, etc. Cada uno de ellos recibe el nombre de elemento o individuo Una MUESTRA es un subconjunto de la población.Los DATOS u Observaciones son números o denominaciones que podemos asignar a un individuo o elemento de la población.Un PARÁMETRO es cualquier característica medible de una población.Un ESTADÍSTICO es cualquier característica medible de una muestra.
  • 3.
    Un CENSO (palabraderivada del latín censere, que significa "valuar o tasar") es la enumeración completa de la población.La ESTADÍSTICA DESCRIPTIVA se compone de aquellos métodos que incluyen técnicas- para recolectar, presentar, analizar e interpretar datos.La ESTADÍSTICA INFERENCIAL abarca aquellos métodos y conjuntos de técnicas que se utilizan para obtener conclusiones sóbrelas leyes de comportamiento de una población basándose en los datos de muestras tornadas de esa población.
  • 5.
    Organización de datosde acuerdo al tipoComo se ilustra en la figura, existen dos tipos de datos: categóricos (o cualitativos) y numéricos (cuantitativos).
  • 6.
    1. Los datosCATEGÓRICOS O CUALITATIVOS representan categorías o atributos (como, por ejemplo, "sí" o "no") que pueden clasificarse como un criterio o cualidad.2. Los datos NUMÉRICOS O CUANTITATIVOS producen respuestas numéricas, como el peso en kilogramos o el número de universidades que hay en la Costa Atlántica. Estos datos son de dos tipos; discretos y continuos. Los DATOS DISCRETOS producen respuestas numéricas que surgen de un conteo.
  • 7.
    Los DATOS CONTINUOSproducen respuestas numéricas que surgen de proceso de medición, donde la característica de que se mide puede tomar cualquier valor numérico en un intervalo. Organización de datos mediante tablasEn esta forma de organización de datos es importante el concepto de frecuencia de un dato.Ejemplo: En el conjunto de datos 4 5 5 3 2 6 7 7 7 2, el cuatro sólo aparece una vez (por lo tanto, tiene frecuencia f= 1), el cinco aparece dos veces (o sea, frecuencia f= 2), el 7 tiene frecuencia f = 3, etc.La frecuencia (absoluta) de un dato, simbolizado con la letra f, es el número de veces que aparece ese dato en una colección de datos.
  • 9.
    Tabla de frecuenciasno agrupadasEjemplo: Se clasificó a los estudiantes de un programa universitario de acuerdo con el semestre que cursan y sus preferencias deportivas. Los resultados están registrados en la siguiente tabla:
  • 10.
    ¿Qué porcentaje delos estudiantes de primer semestre prefieren el fútbol?¿Qué porcentaje de los aficionados a la natación son de segundo semestre?¿Qué porcentaje del total de los estudiantes prefieren el basquetbol?¿Qué porcentaje de los estudiantes son de cuarto semestre?¿Qué porcentaje del total de estudiantes son de tercero o cuarto semestre?¿Qué porcentaje prefiere la natación, el voleibol o el béisbol?
  • 11.
    Tabla de frecuenciasagrupadasEjemplo: La tabla es un ejemplo de una tabla de frecuencias agrupada y 10-14 y 15-19 son ejemplos de clases. En ella se presentan las distribuciones de frecuencia para los datos de tiempo de auditorías de fin de año.Intervalo de Clase o ClaseFrecuencias de ClaseLimite inferior de ClaseLimite superior de ClaseDatos AgrupadosAMPLITUDES
  • 12.
    LÍMITES DE CLASESTEÓRICOSL ÍMITES REALES DE CLASE O FRONTERA DE CLASE Distribución de frecuencias para los datos de tiempo de auditoría:
  • 13.
    Diagrama de talloy hoja Un TALLO es el primer dígito o parte del numeral, mientras que una HOJA está formada por el o los dígitos restantes. Por ejemplo, el numeral 534 se puede descomponer en dos formas: 5 | 34 53 | 4 tallo hoja tallo hoja
  • 14.
    EjemploConstruye una tablade frecuencias agrupadas considerando los siguientes datos:Paso 1. Organizamos los datos en un diagrama de tallo y hoja Paso 2. Primero determinamos el rango R. Como la medida mayor menos la medida menor.
  • 15.
    Paso 3. Elejemplo no nos dice con cuántas clases debemos construir la tabla de frecuencias agrupadas. Podemos seleccionar esta cantidad arbitrariamente (entre 5 y 20) o aplicar la regla de Sturgesc = 3, 3 (logn) + 1donde n es el número de medidas y log n es el logaritmo de n en base 10. El valor de c es común redondearlo al entero más cercano. Otra regla razonable para el número de clase es: c = √n
  • 16.
    Paso 4. Ahora,determinamos w, la amplitud de cada clase. En este caso,Paso 5: A continuación se construye la primera clase con un ancho de w = 3. Para ello, primero, tenemos que encontrar las fronteras inferior y superior de esta clase. Como la unidad de medida es 1 (porque todos los datos son enteros) y como el "punto medio" de cada unidad de medida esPaso 6. Para obtener cada una de las clases siguientes a esta primera, tenemos en cuenta que la frontera inferior de la clase siguiente coincide con la frontera superior de la clase anterior y que la amplitud del intervalo es w = 3.
  • 17.
    Paso 7. Paradeterminar la frecuencia de cada clase usamos una columna de marcas de cuenta. Si uno de los datos cae en una clase, anotamos una marca (\) en la columna correspondiente a esa clase.Paso 8. Calculamos la frecuencia relativa, Frecuencia acumulada y frecuencia acumulada relativa.
  • 18.
    TALLER1. Clasifique losdatos siguientes en cuantitativos (numéricos) y cualitativos (categóricos). En caso de ser numérico, como discretos o continuos:Estaturas en centímetros de cuatro jugadores de fútbol.El número de goles anotados por un futbolista en toda su carrera deportiva.Los sueldos ganados por unos profesores universitarios,Las temperaturas promedios diarias en el último mes.Clasificación étnica de 30 empleados.Números telefónicos de ciertas personas.Calificaciones del primer parcial de Estadística de unos estudiantes universitarios. Distancia (en metros) recorrido por un atleta en una temporada.Peso perdido (en kilogramos) por 10 personas debido a una dieta.Fecha de cumpleaños de determinadas personas.Calificaciones (E, S, A, D, I) de unos estudiantes de bachillerato.Rango militar.
  • 19.
    2. Los siguientesdatos representan los totales, en miles de pesos, gastados en fotocopias por una muestra de 25 estudiantes durante un semestre: Construya una tabla de frecuencias agrupadas usando la regla de Sturges.
  • 20.
    3. Los datosadjuntos representan una muestra del aumento de precios (en pesos) de la gasolina extra en una cierta ciudad a lo largo de un año en particular: Mediante cinco clases construya una tabla de frecuencias relativas acumuladas agrupadas,