PRINCIPIOS DE ESTADISTICA
M. en C. Francisco Hurtado Rico
Definición de Estadística
Estadística es la ciencia cuyo objetivo es reunir una información cuantitativa
concerniente a individuos, grupos, series de hechos, etc. y deducir de ello
gracias al análisis de estos datos unos significados precisos o unas previsiones
para el futuro.
La estadística, en general, es la ciencia que trata de la recopilación,
organización presentación, análisis e interpretación de datos numéricos con e
fin de realizar una toma de decisión más efectiva.
La estadística es una ciencia de aplicación práctica casi universal en todos los
campos científicos:
 En las ciencias naturales: se emplea con profusión en la descripción
de modelos termodinámicos complejos (mecánica estadística), en física
cuántica, en mecánica de fluidos o en la teoría cinética de los gases,
entre otros muchos campos.
 En las ciencias sociales y económicas: es un pilar básico del
desarrollo de la demografía y la sociología aplicada.
 En economía: suministra los valores que ayudan a descubrir
interrelaciones entre múltiples parámetros macro y micro económicos.
 En las ciencias médicas: permite establecer pautas sobre la evolución
de las enfermedades y los enfermos, los índices de mortalidad asociados
a procesos morbosos, el grado de eficacia de un medicamento, etcétera.
Tipos de estadísticas
Estadística descriptiva: consiste sobre todo en la presentación de datos en
forma de tablas y gráficas, se refiere a aquella parte del estudio
Ejemplo 1: un sondeo de opinión encontró que 89% de las personas en una
encuesta sabían el nombre del jugador de football Maradona. La estadística
“89” describe el número de cada 100 personas que saben la respuesta.
Ejemplo 2. Un gerente de personal desea conocer las aptitudes de 5 oficinistas
que trabajan en la compañía. Se aplica una prueba de aptitudes a los cinco
empleados y las calificaciones son: 82, 85, 95, 92 y 91. La medida estadística
que emplea el gerente de personal es la aptitud promedio o media aritmética,
la cuál es la suma de los valores obtenidos dividida entre el número de
observaciones. Entonces la calificación promedio es:
89
5
445
5
9192958582


El resultado se limita a los resultados obtenidos en este caso particular y no
implica ninguna inferencia o generalización acerca de las aptitudes de otros
PRINCIPIOS DE ESTADISTICA
M. en C. Francisco Hurtado Rico
oficinistas. Este método es de naturaleza descriptiva, debido a que el promedio
condensa y describe la información obtenida.
Estadística inferencial: se deriva de muestras, de observaciones hechas sólo
acerca de una parte de un conjunto numeroso de elementos y esto implica que
su análisis requiere de generalizaciones que van más allá de los datos. Es una
técnica mediante la cuál se obtienen generalizaciones o se toman decisiones en
base a una información parcial o incompleta obtenida mediante técnicas
descriptivas. La Estadística Inferencial investiga o analiza una población
partiendo de una muestra tomada.
Ejemplo 1. Un fabricante de medicinas afirma que una nueva vacuna
desarrollada contra el catarro por su compañía tiene una efectividad del 90%;
esto es, en promedio 90 de cada 100 personas que emplean la vacuna pasaran
el invierno sin contagiarse. Resulta prácticamente imposible probar la vacuna
en todas las personas. Consideremos que 30 personas han recibido la vacuna,
y que de las 30, 25 no se contagiaron de catarro. Si la afirmación del
fabricante es correcta, se esperaría que 27 personas (30 x 0.9 = 27) pasarán
el invierno sin catarro. Ya que el número observado es 25, lo cuál es inferior al
27 esperado. ¿Debería rechazarse la afirmación del fabricante en base a la
evidencia?.
Ejemplo 2. Considere el problema de decidir si aceptar o rechazar un
embarque de artículos comprados. Se inspeccionan una parte del embarque
para determinar si debería aceptarse. Si se inspeccionan 20 unidades y se
encuentra que dos unidades son defectuosas, ¿debería la planta rechazar el
embarque y devolverlo al proveedor?.
Estas y muchas otras preguntas semejantes implican una decisión o una
elección entre acciones alternativas frente a la incertidumbre.
Una población es un conjunto de todos los posibles individuos, objetos o
medidas de interés.
Ejemplo 1. Si el problema consiste en evaluar el IQ promedio de todos los
alumnos de 1er cuatrimestre de las universidades de México, entonces los IQ
de todos estos alumnos constituyen la población.
Población finita: Es aquella que incluye un número limitado de medidas y
observaciones.
Población infinita: Es aquella que incluye un gran conjunto de medidas u
observaciones que no pueden alcanzarse por conteo.
Parámetro: Es la característica medible de una población.
Valor verdadero: Son los valores de un parámetro de una población.
PRINCIPIOS DE ESTADISTICA
M. en C. Francisco Hurtado Rico
Una muestra estadística es un subconjunto de casos o individuos de una
población estadística.
Proporción en la población: Es la proporción de la característica a analizar
respecto a la población.
Proporción en la muestra: Es la proporción de la característica a analizar en
la muestra.
Ejemplo 1. Si en un lote de 200 partes producidas en cierto proceso, el
ingeniero de control de calidad encontró 30 partes defectuosas, entonces la
proporción de la muestra será 30/200 = 0.15.
Ejemplo 2. Si en una muestra de 200 tiradas de moneda se presentaron 80
caras, la proporción de la muestra es 80/200 = 0.40.
Representatividad de la muestra
La muestra debe reproducir la características del universo, por lo tanto surgen
dos preguntas, sobre la cantidad de elementos que debe incluir la muestra y
hasta que punto pueden generalizarse a la población. Ambas preguntas
convergen en un problema de exactitud o precisión cuya finalidad es no incurrir
en errores a la hora de obtener los resultados, no obstante los errores son
inevitables, lo importante entonces es minimizarlos.
Existen dos tipos de errores: a) los sistemáticos o distorsiones, que son
causados por factores externos a la muestra y que se pueden producir en
cualquier momento de la investigación, y b) el error de muestreo, de azar o de
estimación, inevitable, ya que siempre habrá diferencia entre los valores
medios de la muestra y los valores medios del universo, la magnitud de este
error depende del tamaño de la muestra (a mayor tamaño de muestra menor
error) y de la dispersión o desviación (a mayor dispersión mayor error). Se
concluye entonces que para que una muestra sea representativa debe estar
dentro de ciertos límites y proporciones establecidas por la estadística.
Etapas en la selección de una muestra
1. Definición de la población objetivo: en términos de contenido,
unidades, extensión y tiempo.
2. Identificar el marco muestral: normalmente es imposible
confeccionar una lista que no excluya a algunos miembros de la
población.
3. Determinar el método de muestreo: si la unidad de muestreo es
diferente del elemento es necesario especificar también cómo se deben
seleccionar los elementos dentro de la unidad de muestreo.
4. Determinar el tamaño de la muestra: se deben considerar los
siguientes factores cualitativos:
PRINCIPIOS DE ESTADISTICA
M. en C. Francisco Hurtado Rico
 Importancia de la decisión.
 Naturaleza de la investigación.
 Número de variables.
 Naturaleza del análisis.
 Tamaños de muestra utilizados en estudios similares.
 Restricciones de recursos.
5. Selección material de la muestra: elegir los componentes de la
muestra y localizar materialmente la muestra, es decir, localización física
de las unidades.
6. Decidir el trato que se ha de dar a la falta de respuestas: se niega
a responder, no se localiza, no sabe contestar o no es accesible. Para
reducir este riesgo de no respuesta hay varios procedimientos:
 Mejorar el diseño de la investigación para reducir las negativas.
 Repetir los intentos.
 Estimar los efectos de la falta de respuesta en lo que respecta a la
calidad de la información.
Censo: Se entiende por censo aquella numeración que se efectúa a todos y
cada uno de los caracteres componentes de una población.
Variable: Es una característica que varia de elemento a elemento en una
población de estudio.
Variable cualitativa o de atributos: la característica o variable que se
estudia no es numérica.
EJEMPLOS: sexo, afiliación religiosa, tipo de automóvil que se posee, lugar de
nacimiento, color de los ojos.
Variable cuantitativa: la variable se puede registrar numéricamente.
EJEMPLO: saldo en una cuenta de cheques, minutos que faltan para que
termine la clase, número de niños en una familia.
Variables discretas: sólo pueden adquirir ciertos valores y casi siempre hay
“huecos” entre esos valores.
EJEMPLO: el número de habitaciones en un hotel (1,2,3,....).
Variables continuas: pueden tomar cualquier valor dentro de un intervalo
específico.
EJEMPLO: el tiempo que toma volar de Buenos Aires a Bogotá.
PRINCIPIOS DE ESTADISTICA
M. en C. Francisco Hurtado Rico
Dato: Cada uno de los individuos, cosas, entes abstractos que integran una
población o universo determinado. Dicho de otra forma, cada valor observado
de la variable.
Existen varios tipos de datos estadísticos, que se agrupan en dos
clasificaciones: datos de características cuantitativas y cualitativas.
Datos cuantitativos: son aquellos que se pueden expresar numéricamente y
se obtienen a través de mediciones y conteos. Un dato cuantitativo se puede
encontrar en cualquier disciplina; sicología, contabilidad, economía, publicidad,
etc.
Datos cualitativos: Los datos de características cualitativas son aquellos que
no se pueden expresar numéricamente. Estos datos se deben convertir a
valores numéricos antes de que se trabaje con ellos.
Distribución de frecuencia
Se llama distribución de frecuencias al agrupamiento y clasificación de los
datos, de una población o de una muestra, de acuerdo con una o dos
características, o variables, que se han obtenido de las unidades de estudio.
Este agrupamiento muestra las relaciones entre los datos de un conjunto y
facilita el análisis.
Dicho de otra manera, la distribución de frecuencia es una serie de datos
agrupados en categorías, en las cuales se muestra el número de observaciones
que contiene cada categoría.
Ejemplo 1. Una tabla que lista un conjunto de puntajes y su frecuencia
(cuántas veces ocurre cada uno).
PRINCIPIOS DE ESTADISTICA
M. en C. Francisco Hurtado Rico
Construcción de una distribución de frecuencias
Ejemplo. Los siguientes datos son el número de meses de duración de una
muestra de 40 baterías para coche.
22 41 35 45 32 37 30 26
34 16 31 33 38 31 47 37
25 43 34 36 29 33 39 31
33 31 37 44 32 41 19 34
47 38 32 26 39 30 42 35
1. El rango
Rango = Dato mayor – Dato menor = 47 – 16 = 31
2. Número tentativo de los intervalos de clase
El número de intervalos (nic) puede ser como mínimo 5 y como máximo 15 de
acuerdo a la fórmula 2 nic
Número de intervalos (nic)Número máximo de datos ( 2 nic
)
5 32
6 64
7 128
8 256
9 512
10 1024
En este ejercicio, puesto que tenemos 40 datos el NIC sería de 6.
3. Tamaño de los Intervalos de Clase (tic)
TIC =
Rango
=
31
= 5.16 se redondea a 5
NIC 6
PRINCIPIOS DE ESTADISTICA
M. en C. Francisco Hurtado Rico
Para facilitar la clasificación de los datos, el Tic se redondea a una cifra mas o
menos cerrada.
4. Límite inferior
Usualmente, el límite inferior del primer intervalo de clase es un múltiplo del
tamaño del intervalo (tic) igual o menor que el dato más chico. Si el tic es más
grande que el dato menor, el primer límite inferior es cero. En este problema el
tic es de 5, entonces el primer límite inferior será el mayor múltiplo de 5 pero
inferior o igual al dato menor, el 15.
El límite inferior de los siguientes intervalos se calcula sumando el tic al límite
inferior del intervalo anterior hasta llegar a un número no mayor al dato mas
grande.
5. Límite superior
El límite suprior se calcula con la siguiente fórmula LS = LI + TIC – 1
6. Límite Superior Real
Los límites anteriores son los límites nominales pero no son los reales. Los
límites reales son el punto medio entre el límite superior y el límite inferior del
siguiente intervalo.
LI LS
15 19
20 24
25 29
30 34
35 39
40 44
45 49
PRINCIPIOS DE ESTADISTICA
M. en C. Francisco Hurtado Rico
LI LS LSR
15 19 19.5
20 24 24.5
25 29 29.5
30 34 34.5
35 39 39.5
40 44 44.5
45 49 49.5
7. Marca de clase (x)
La marca de clase, también llamada punto medio del intervalo es la mitad de la
distancia entre los límites inferior y superior de cada intervalo. La marca de
clase es el valor más representativo de los valores del intervalo.
LI LS LSR X
15 19 19.5 17
20 24 24.5 22
25 29 29.5 27
30 34 34.5 32
35 39 39.5 37
40 44 44.5 42
45 49 49.5 47
8. Clasificación de los datos y conteo de frecuencias
Clasificar las observaciones en los intervalos. La práctica usual es marcar con
una línea ( / ) que representa una observación. En el ejemplo la observación
22 se clasifica en el intervalo 20 – 24 porque se encuentra entre el 20 y el 24
LSR =
LS + LIsig
2
X =
LI + LS
2
PRINCIPIOS DE ESTADISTICA
M. en C. Francisco Hurtado Rico
inclusive. Una vez clasificados todos los datos se cuentan las líneas de cada
intervalo y el resultado es la frecuencia de cada intervalo de clase.
LI LS LSR X cuenta F
15 19 19.5 17 // 2
20 24 24.5 22 / 1
25 29 29.5 27 //// 4
30 34 34.5 32 ///// ///// ///// 15
35 39 39.5 37 ///// ///// 10
40 44 44.5 42 ///// 5
45 49 49.5 47 /// 3
9. Distribución de frecuencia relativa
Se pueden convertir las frecuencias de clase en frecuencias relativas de clase
para mostrar los porcentajes de observaciones en cada intervalo de clase. Para
convertir una distribución de frecuencia en una distribución de frecuencia
relativa cada una de las frecuencias de clase se dividen entre el número total
de observaciones.
LI LS LSR X cuenta F FR
15 19 19.5 17 // 2 2/40=.05
20 24 24.5 22 / 1 1/40=.025
25 29 29.5 27 //// 4 4/40=.1
30 34 34.5 32 ///// ///// ///// 15 15/40=.375
35 39 39.5 37 ///// ///// 10 10/40=.25
40 44 44.5 42 ///// 5 5/40=.125
45 49 49.5 47 /// 3 3/40=.075
n= 40
FR =
F
n
PRINCIPIOS DE ESTADISTICA
M. en C. Francisco Hurtado Rico
10.Distribuciones de frecuencia acumulada
Las distribuciones de frecuencia acumulada se usan cuando queremos
determinar cuantas observaciones, o que porcentaje de observaciones están
debajo de cierto valor.
La distribución de frecuencia acumulada de cierto intervalo se calcula sumando
las frecuencias de clase desde el primer intervalo hasta la frecuencia de clase
del intervalo de interés. Si queremos la frecuencia acumulada del intervalo 25
– 29, sumamos las frecuencias de clase 2 + 1 + 4 = 7.
La distribución de frecuencia relativa acumulada de cierto intervalo se calcula
dividiendo la frecuencia acumulada entre el número total de observaciones.
LI LS LSR X cuenta F FR FA FRA
15 19 19.5 17 // 2 .05 2 .05
20 24 24.5 22 / 1 .025 3 .075
25 29 29.5 27 //// 4 .1 7 .175
30 34 34.5 32 ///// ///// ///// 15 .375 22 .55
35 39 39.5 37 ///// ///// 10 .25 32 .8
40 44 44.5 42 ///// 5 .125 37 .925
45 49 49.5 47 /// 3 .075 40 1
n= 40
FRA =
FA
n

Organización de datos

  • 1.
    PRINCIPIOS DE ESTADISTICA M.en C. Francisco Hurtado Rico Definición de Estadística Estadística es la ciencia cuyo objetivo es reunir una información cuantitativa concerniente a individuos, grupos, series de hechos, etc. y deducir de ello gracias al análisis de estos datos unos significados precisos o unas previsiones para el futuro. La estadística, en general, es la ciencia que trata de la recopilación, organización presentación, análisis e interpretación de datos numéricos con e fin de realizar una toma de decisión más efectiva. La estadística es una ciencia de aplicación práctica casi universal en todos los campos científicos:  En las ciencias naturales: se emplea con profusión en la descripción de modelos termodinámicos complejos (mecánica estadística), en física cuántica, en mecánica de fluidos o en la teoría cinética de los gases, entre otros muchos campos.  En las ciencias sociales y económicas: es un pilar básico del desarrollo de la demografía y la sociología aplicada.  En economía: suministra los valores que ayudan a descubrir interrelaciones entre múltiples parámetros macro y micro económicos.  En las ciencias médicas: permite establecer pautas sobre la evolución de las enfermedades y los enfermos, los índices de mortalidad asociados a procesos morbosos, el grado de eficacia de un medicamento, etcétera. Tipos de estadísticas Estadística descriptiva: consiste sobre todo en la presentación de datos en forma de tablas y gráficas, se refiere a aquella parte del estudio Ejemplo 1: un sondeo de opinión encontró que 89% de las personas en una encuesta sabían el nombre del jugador de football Maradona. La estadística “89” describe el número de cada 100 personas que saben la respuesta. Ejemplo 2. Un gerente de personal desea conocer las aptitudes de 5 oficinistas que trabajan en la compañía. Se aplica una prueba de aptitudes a los cinco empleados y las calificaciones son: 82, 85, 95, 92 y 91. La medida estadística que emplea el gerente de personal es la aptitud promedio o media aritmética, la cuál es la suma de los valores obtenidos dividida entre el número de observaciones. Entonces la calificación promedio es: 89 5 445 5 9192958582   El resultado se limita a los resultados obtenidos en este caso particular y no implica ninguna inferencia o generalización acerca de las aptitudes de otros
  • 2.
    PRINCIPIOS DE ESTADISTICA M.en C. Francisco Hurtado Rico oficinistas. Este método es de naturaleza descriptiva, debido a que el promedio condensa y describe la información obtenida. Estadística inferencial: se deriva de muestras, de observaciones hechas sólo acerca de una parte de un conjunto numeroso de elementos y esto implica que su análisis requiere de generalizaciones que van más allá de los datos. Es una técnica mediante la cuál se obtienen generalizaciones o se toman decisiones en base a una información parcial o incompleta obtenida mediante técnicas descriptivas. La Estadística Inferencial investiga o analiza una población partiendo de una muestra tomada. Ejemplo 1. Un fabricante de medicinas afirma que una nueva vacuna desarrollada contra el catarro por su compañía tiene una efectividad del 90%; esto es, en promedio 90 de cada 100 personas que emplean la vacuna pasaran el invierno sin contagiarse. Resulta prácticamente imposible probar la vacuna en todas las personas. Consideremos que 30 personas han recibido la vacuna, y que de las 30, 25 no se contagiaron de catarro. Si la afirmación del fabricante es correcta, se esperaría que 27 personas (30 x 0.9 = 27) pasarán el invierno sin catarro. Ya que el número observado es 25, lo cuál es inferior al 27 esperado. ¿Debería rechazarse la afirmación del fabricante en base a la evidencia?. Ejemplo 2. Considere el problema de decidir si aceptar o rechazar un embarque de artículos comprados. Se inspeccionan una parte del embarque para determinar si debería aceptarse. Si se inspeccionan 20 unidades y se encuentra que dos unidades son defectuosas, ¿debería la planta rechazar el embarque y devolverlo al proveedor?. Estas y muchas otras preguntas semejantes implican una decisión o una elección entre acciones alternativas frente a la incertidumbre. Una población es un conjunto de todos los posibles individuos, objetos o medidas de interés. Ejemplo 1. Si el problema consiste en evaluar el IQ promedio de todos los alumnos de 1er cuatrimestre de las universidades de México, entonces los IQ de todos estos alumnos constituyen la población. Población finita: Es aquella que incluye un número limitado de medidas y observaciones. Población infinita: Es aquella que incluye un gran conjunto de medidas u observaciones que no pueden alcanzarse por conteo. Parámetro: Es la característica medible de una población. Valor verdadero: Son los valores de un parámetro de una población.
  • 3.
    PRINCIPIOS DE ESTADISTICA M.en C. Francisco Hurtado Rico Una muestra estadística es un subconjunto de casos o individuos de una población estadística. Proporción en la población: Es la proporción de la característica a analizar respecto a la población. Proporción en la muestra: Es la proporción de la característica a analizar en la muestra. Ejemplo 1. Si en un lote de 200 partes producidas en cierto proceso, el ingeniero de control de calidad encontró 30 partes defectuosas, entonces la proporción de la muestra será 30/200 = 0.15. Ejemplo 2. Si en una muestra de 200 tiradas de moneda se presentaron 80 caras, la proporción de la muestra es 80/200 = 0.40. Representatividad de la muestra La muestra debe reproducir la características del universo, por lo tanto surgen dos preguntas, sobre la cantidad de elementos que debe incluir la muestra y hasta que punto pueden generalizarse a la población. Ambas preguntas convergen en un problema de exactitud o precisión cuya finalidad es no incurrir en errores a la hora de obtener los resultados, no obstante los errores son inevitables, lo importante entonces es minimizarlos. Existen dos tipos de errores: a) los sistemáticos o distorsiones, que son causados por factores externos a la muestra y que se pueden producir en cualquier momento de la investigación, y b) el error de muestreo, de azar o de estimación, inevitable, ya que siempre habrá diferencia entre los valores medios de la muestra y los valores medios del universo, la magnitud de este error depende del tamaño de la muestra (a mayor tamaño de muestra menor error) y de la dispersión o desviación (a mayor dispersión mayor error). Se concluye entonces que para que una muestra sea representativa debe estar dentro de ciertos límites y proporciones establecidas por la estadística. Etapas en la selección de una muestra 1. Definición de la población objetivo: en términos de contenido, unidades, extensión y tiempo. 2. Identificar el marco muestral: normalmente es imposible confeccionar una lista que no excluya a algunos miembros de la población. 3. Determinar el método de muestreo: si la unidad de muestreo es diferente del elemento es necesario especificar también cómo se deben seleccionar los elementos dentro de la unidad de muestreo. 4. Determinar el tamaño de la muestra: se deben considerar los siguientes factores cualitativos:
  • 4.
    PRINCIPIOS DE ESTADISTICA M.en C. Francisco Hurtado Rico  Importancia de la decisión.  Naturaleza de la investigación.  Número de variables.  Naturaleza del análisis.  Tamaños de muestra utilizados en estudios similares.  Restricciones de recursos. 5. Selección material de la muestra: elegir los componentes de la muestra y localizar materialmente la muestra, es decir, localización física de las unidades. 6. Decidir el trato que se ha de dar a la falta de respuestas: se niega a responder, no se localiza, no sabe contestar o no es accesible. Para reducir este riesgo de no respuesta hay varios procedimientos:  Mejorar el diseño de la investigación para reducir las negativas.  Repetir los intentos.  Estimar los efectos de la falta de respuesta en lo que respecta a la calidad de la información. Censo: Se entiende por censo aquella numeración que se efectúa a todos y cada uno de los caracteres componentes de una población. Variable: Es una característica que varia de elemento a elemento en una población de estudio. Variable cualitativa o de atributos: la característica o variable que se estudia no es numérica. EJEMPLOS: sexo, afiliación religiosa, tipo de automóvil que se posee, lugar de nacimiento, color de los ojos. Variable cuantitativa: la variable se puede registrar numéricamente. EJEMPLO: saldo en una cuenta de cheques, minutos que faltan para que termine la clase, número de niños en una familia. Variables discretas: sólo pueden adquirir ciertos valores y casi siempre hay “huecos” entre esos valores. EJEMPLO: el número de habitaciones en un hotel (1,2,3,....). Variables continuas: pueden tomar cualquier valor dentro de un intervalo específico. EJEMPLO: el tiempo que toma volar de Buenos Aires a Bogotá.
  • 5.
    PRINCIPIOS DE ESTADISTICA M.en C. Francisco Hurtado Rico Dato: Cada uno de los individuos, cosas, entes abstractos que integran una población o universo determinado. Dicho de otra forma, cada valor observado de la variable. Existen varios tipos de datos estadísticos, que se agrupan en dos clasificaciones: datos de características cuantitativas y cualitativas. Datos cuantitativos: son aquellos que se pueden expresar numéricamente y se obtienen a través de mediciones y conteos. Un dato cuantitativo se puede encontrar en cualquier disciplina; sicología, contabilidad, economía, publicidad, etc. Datos cualitativos: Los datos de características cualitativas son aquellos que no se pueden expresar numéricamente. Estos datos se deben convertir a valores numéricos antes de que se trabaje con ellos. Distribución de frecuencia Se llama distribución de frecuencias al agrupamiento y clasificación de los datos, de una población o de una muestra, de acuerdo con una o dos características, o variables, que se han obtenido de las unidades de estudio. Este agrupamiento muestra las relaciones entre los datos de un conjunto y facilita el análisis. Dicho de otra manera, la distribución de frecuencia es una serie de datos agrupados en categorías, en las cuales se muestra el número de observaciones que contiene cada categoría. Ejemplo 1. Una tabla que lista un conjunto de puntajes y su frecuencia (cuántas veces ocurre cada uno).
  • 6.
    PRINCIPIOS DE ESTADISTICA M.en C. Francisco Hurtado Rico Construcción de una distribución de frecuencias Ejemplo. Los siguientes datos son el número de meses de duración de una muestra de 40 baterías para coche. 22 41 35 45 32 37 30 26 34 16 31 33 38 31 47 37 25 43 34 36 29 33 39 31 33 31 37 44 32 41 19 34 47 38 32 26 39 30 42 35 1. El rango Rango = Dato mayor – Dato menor = 47 – 16 = 31 2. Número tentativo de los intervalos de clase El número de intervalos (nic) puede ser como mínimo 5 y como máximo 15 de acuerdo a la fórmula 2 nic Número de intervalos (nic)Número máximo de datos ( 2 nic ) 5 32 6 64 7 128 8 256 9 512 10 1024 En este ejercicio, puesto que tenemos 40 datos el NIC sería de 6. 3. Tamaño de los Intervalos de Clase (tic) TIC = Rango = 31 = 5.16 se redondea a 5 NIC 6
  • 7.
    PRINCIPIOS DE ESTADISTICA M.en C. Francisco Hurtado Rico Para facilitar la clasificación de los datos, el Tic se redondea a una cifra mas o menos cerrada. 4. Límite inferior Usualmente, el límite inferior del primer intervalo de clase es un múltiplo del tamaño del intervalo (tic) igual o menor que el dato más chico. Si el tic es más grande que el dato menor, el primer límite inferior es cero. En este problema el tic es de 5, entonces el primer límite inferior será el mayor múltiplo de 5 pero inferior o igual al dato menor, el 15. El límite inferior de los siguientes intervalos se calcula sumando el tic al límite inferior del intervalo anterior hasta llegar a un número no mayor al dato mas grande. 5. Límite superior El límite suprior se calcula con la siguiente fórmula LS = LI + TIC – 1 6. Límite Superior Real Los límites anteriores son los límites nominales pero no son los reales. Los límites reales son el punto medio entre el límite superior y el límite inferior del siguiente intervalo. LI LS 15 19 20 24 25 29 30 34 35 39 40 44 45 49
  • 8.
    PRINCIPIOS DE ESTADISTICA M.en C. Francisco Hurtado Rico LI LS LSR 15 19 19.5 20 24 24.5 25 29 29.5 30 34 34.5 35 39 39.5 40 44 44.5 45 49 49.5 7. Marca de clase (x) La marca de clase, también llamada punto medio del intervalo es la mitad de la distancia entre los límites inferior y superior de cada intervalo. La marca de clase es el valor más representativo de los valores del intervalo. LI LS LSR X 15 19 19.5 17 20 24 24.5 22 25 29 29.5 27 30 34 34.5 32 35 39 39.5 37 40 44 44.5 42 45 49 49.5 47 8. Clasificación de los datos y conteo de frecuencias Clasificar las observaciones en los intervalos. La práctica usual es marcar con una línea ( / ) que representa una observación. En el ejemplo la observación 22 se clasifica en el intervalo 20 – 24 porque se encuentra entre el 20 y el 24 LSR = LS + LIsig 2 X = LI + LS 2
  • 9.
    PRINCIPIOS DE ESTADISTICA M.en C. Francisco Hurtado Rico inclusive. Una vez clasificados todos los datos se cuentan las líneas de cada intervalo y el resultado es la frecuencia de cada intervalo de clase. LI LS LSR X cuenta F 15 19 19.5 17 // 2 20 24 24.5 22 / 1 25 29 29.5 27 //// 4 30 34 34.5 32 ///// ///// ///// 15 35 39 39.5 37 ///// ///// 10 40 44 44.5 42 ///// 5 45 49 49.5 47 /// 3 9. Distribución de frecuencia relativa Se pueden convertir las frecuencias de clase en frecuencias relativas de clase para mostrar los porcentajes de observaciones en cada intervalo de clase. Para convertir una distribución de frecuencia en una distribución de frecuencia relativa cada una de las frecuencias de clase se dividen entre el número total de observaciones. LI LS LSR X cuenta F FR 15 19 19.5 17 // 2 2/40=.05 20 24 24.5 22 / 1 1/40=.025 25 29 29.5 27 //// 4 4/40=.1 30 34 34.5 32 ///// ///// ///// 15 15/40=.375 35 39 39.5 37 ///// ///// 10 10/40=.25 40 44 44.5 42 ///// 5 5/40=.125 45 49 49.5 47 /// 3 3/40=.075 n= 40 FR = F n
  • 10.
    PRINCIPIOS DE ESTADISTICA M.en C. Francisco Hurtado Rico 10.Distribuciones de frecuencia acumulada Las distribuciones de frecuencia acumulada se usan cuando queremos determinar cuantas observaciones, o que porcentaje de observaciones están debajo de cierto valor. La distribución de frecuencia acumulada de cierto intervalo se calcula sumando las frecuencias de clase desde el primer intervalo hasta la frecuencia de clase del intervalo de interés. Si queremos la frecuencia acumulada del intervalo 25 – 29, sumamos las frecuencias de clase 2 + 1 + 4 = 7. La distribución de frecuencia relativa acumulada de cierto intervalo se calcula dividiendo la frecuencia acumulada entre el número total de observaciones. LI LS LSR X cuenta F FR FA FRA 15 19 19.5 17 // 2 .05 2 .05 20 24 24.5 22 / 1 .025 3 .075 25 29 29.5 27 //// 4 .1 7 .175 30 34 34.5 32 ///// ///// ///// 15 .375 22 .55 35 39 39.5 37 ///// ///// 10 .25 32 .8 40 44 44.5 42 ///// 5 .125 37 .925 45 49 49.5 47 /// 3 .075 40 1 n= 40 FRA = FA n