Dr. Arle Sevilla
Medidas descriptivas
Notas
Variable discreta:
• Variable continua: Una variable discreta es aquella que solo puede tomar un número finito
de valores entre dos valores cuales quiera de una característica.
El número de hermanos de 5 amigos: 2, 1, 0, 1, 3.
• Una variable continua: es aquella que puede tomar un número infinito de valores entre
dos valores cualesquiera de una característica.
La altura de los 5 amigos: 1.73 m , 1.82 m , 1.77 m , 1.69 m , 1.75 m.
Porción de una población
Una muestra en la elaboración de 400 termómetros de mercurio, se encontraron
20 defectuosos. Encontrar el intervalo de confianza para los termómetros de
mercurio, utilizar un nivel de confianza del 95%, y determinar la proporción de
los termómetros defectuosos.
• Procedimiento:
1. Datos:
n= 400 termómetros de mercurio.
x= (No. De aciertos = al numero de termómetros defectuosos)
• Operación:
P = x / n = 200/400 = 0.05 = 5%
1 – α = 0.95 (nivel de confianza)
q = 1 – p = 1 – 0.05 = 0.95 x 100% = 95%
Porcentaje
Es la relación que se establece entre cada una de las partes que forman
un todo, entre todo o total multiplicado por 100; en otras palabras, es
una relación que se establece entre un subconjunto, dividido entre
todos los elementos que forman el conjunto de un estudio multiplicado
por 100. Este porcentaje se representa por un %.
El todo o total se representa por 100 por ciento.
E
J
E
M
P
L
O
La suma de todos los porcentajes de los subconjuntos
mutuamente excluyentes que forman el conjunto ser a siempre
100. El principal objetivo de los porcientos es que se pueden
establecer comparaciones.
Tabladedistribución.
Esunadistribucióndeprobabilidadparavariablescontinuas.
Tabla de distribución
• Distribución t de student
• Distribución x2
• Distribucion F de Fisher
Histograma
Es una representación grafica de una variable en forma de barra.
Se utilizan para variables continuas o para variables discretas, con un
gran número de datos, y que se han agrupado. En el eje abscisas se
construyen unos rectángulos que tienen por base la amplitud del
intervalo, y por altura, la frecuencia absoluta de cada intervalo
en clases.
Ejemplo
• El peso de 65 personas adultas viene dado de la siguiente forma
Polígono de frecuencia.
Un polígono de frecuencias se forma uniendo los extremos de
las barras de un diagrama de barras mediante segmentos.
También se puede realizar trazando los puntos que representan
las frecuencias y uniéndolos mediante segmentos.
Diagrama de tallo y hoja
Es una representación grafica que permite ordenar los datos.
• Procedimiento
1. Ordenar los datos
2. Establecer el tallo (Tomar las cifras enteras únicas)
3. Establecer las hojas (Tomar las cifras en decimales)
4. No se aceptan repeticiones
Ejemplo
Graficas para datos cualitativos
Los diagramas para datos
cualitativos son los que se
usan para representar
datos que no son
contables o datos no
cuantitativos.
Diagrama de sector circular o pastel
Se utiliza con todo tipo de variables, los datos se representan en un
circulo, de como que cada sector es proporcional a la frecuencia
absoluta correspondiente.
Ejemplo
En una sala de emergencia
hay 30 pacientes, 12 son
niños, 3 son niñas, 9 son
adolescentes y el resto son
adultos.
Niños
Niñas
Adolescentes
Adultos
Niños
Adolescentes
Niñas
Diagrama de barras simples
Se representa la frecuencia simple (absoluta o relativa) de cada
modalidad o categoría de la variable mediante la altura de una barra,
donde la altura de una barra es proporcional a la frecuencia simple de
una categoría que se representa.
Ejemplo
Un estudio hecho al conjunto de los 20 alumnos de una clase para
determinar su grupo sanguíneo ha dado el siguiente resultado:
Grupo sanguíneo fi
A 6
B 4
AB 1
0 9
Total 20
Diagrama de Pareto o curva 80/20
Grafica de barras que ilustra las causas de los problemas por orden de
importancia y frecuencia (porcentaje) de aparición, costo o actuación.
Donde la regla de Pareto establece que el 80% de las consecuencias
están ligadas al 20% de las causas. Por medio de un diagrama de barra
de orden descendente se determina cual es el 80% que causa el
problema (determinar prioridades de problemas) para trabajar en su
mejora.
Procedimiento:
1. Conocer el problema.
2. Ordenar el problema de mayor a menor
3. Obtener el porcentaje de cada problema según la frecuencia
4. Colocar los resultados en la tabla de problemas.
5. No necesariamente tiene que ser 100% pero si aproximado, 98 +
6. Establecer el porcentaje acumulado (frecuencia absoluta acumulada)
7. Realizar una grafica con el eje x y dos ejes y (derecho he izquierdo)
8. Establecer rangos en la grafica (eje y derecho: porcentaje)
9. Eje de la x: problemas
10.Graficar las barras según los datos (de manera separada según el eje de las y
izquierdo)
11.Graficar un polígono de frecuencia según el eje y
Ejemplo
En la sala de emergencia del hospital María de la Concepción se coloco
una caja de quejas y sugerencias, los usuarios hicieron uso de ella. El
personal administrativo recolecto las siguientes quejas.
Paso 1: Determinar el problema
- Enfermeras groseras: 10
- Doctores desconcentrados: 7
- Higiene inadecuada en los baños: 20
- Carencia de insumos: 65
Ejemplo
Paso 2: Ordenar los datos
- Carencia de insumos: 65
- Higiene inadecuada en
los baños: 20
- Enfermeras groseras: 10
- Doctores
desconcentrados: 7
Queja Frecuencia Porcentaje Porcentaje
acumulado
Carencia de insumos 65 65% 65%
Higiene inadecuado en los
baños
20 20% 85%
Enfermeras groseras 10 10% 95%
Doctores desconcentrados 5 5% 100%
Total 100 100%
Paso 3: Ordenarlos en una tabla
Ejemplo
50
30
70
90
30%
50%
70%
90%
Carencia de
Insumos
H. inadecuada Enfermeras g. Doc. Desconcentrados
Medidas de variación
Medidas de dispersión.
Las medidas de dispersión nos informan sobre cuánto se alejan del centro los valores de la distribución.
Las medidas de dispersión son:
Rango o recorrido
El rango es la diferencia entre el mayor y el menor de los datos de una distribución estadística.
Desviación media
La desviación respecto a la media es la diferencia entre cada valor de la variable estadística y la media
aritmética. La desviación media es la media aritmética de los valores absolutos de las desviaciones
respecto a la media.
La desviación media para datos agrupados es:
xi fi xi · fi |x - x| |x - x| · fi
[10, 15) 12.5 3 37.5 9.286 27.858
[15, 20) 17.5 5 87.5 4.286 21.43
[20, 25) 22.5 7 157.5 0.714 4.998
[25, 30) 27.5 4 110 5.714 22.856
[30, 35) 32.5 2 65 10.174 21.428
21 457.5 98.57
Varianza
Varianza para datos agrupados
Varianza para datos agrupados
La varianza es la media aritmética del cuadrado de las desviaciones
respecto a la media de una distribución estadística.
Para simplificar el cálculo de la varianza vamos o utilizar las siguientes
expresiones que son equivalentes a las anteriores.
Ejemplo
Calcular la varianza de la distribución:
9, 3, 8, 8, 9, 8, 9, 18
Ejemplo
xi fi xi · fi xi
2 · fi
[10, 20) 15 1 15 225
[20, 30) 25 8 200 5000
[30,40) 35 10 350 12 250
[40, 50) 45 9 405 18 225
[50, 60 55 8 440 24 200
[60,70) 65 4 260 16 900
[70, 80) 75 2 150 11 250
42 1 820 88 050
Rango o recorrido
El rango es la diferencia entre el mayor y el menor de los datos de una distribución
estadística.

Mio

  • 1.
  • 2.
  • 3.
    Notas Variable discreta: • Variablecontinua: Una variable discreta es aquella que solo puede tomar un número finito de valores entre dos valores cuales quiera de una característica. El número de hermanos de 5 amigos: 2, 1, 0, 1, 3. • Una variable continua: es aquella que puede tomar un número infinito de valores entre dos valores cualesquiera de una característica. La altura de los 5 amigos: 1.73 m , 1.82 m , 1.77 m , 1.69 m , 1.75 m.
  • 4.
    Porción de unapoblación Una muestra en la elaboración de 400 termómetros de mercurio, se encontraron 20 defectuosos. Encontrar el intervalo de confianza para los termómetros de mercurio, utilizar un nivel de confianza del 95%, y determinar la proporción de los termómetros defectuosos. • Procedimiento: 1. Datos: n= 400 termómetros de mercurio. x= (No. De aciertos = al numero de termómetros defectuosos)
  • 5.
    • Operación: P =x / n = 200/400 = 0.05 = 5% 1 – α = 0.95 (nivel de confianza) q = 1 – p = 1 – 0.05 = 0.95 x 100% = 95%
  • 6.
    Porcentaje Es la relaciónque se establece entre cada una de las partes que forman un todo, entre todo o total multiplicado por 100; en otras palabras, es una relación que se establece entre un subconjunto, dividido entre todos los elementos que forman el conjunto de un estudio multiplicado por 100. Este porcentaje se representa por un %. El todo o total se representa por 100 por ciento.
  • 7.
  • 8.
    La suma detodos los porcentajes de los subconjuntos mutuamente excluyentes que forman el conjunto ser a siempre 100. El principal objetivo de los porcientos es que se pueden establecer comparaciones.
  • 9.
  • 10.
    Tabla de distribución •Distribución t de student • Distribución x2 • Distribucion F de Fisher
  • 11.
    Histograma Es una representacióngrafica de una variable en forma de barra. Se utilizan para variables continuas o para variables discretas, con un gran número de datos, y que se han agrupado. En el eje abscisas se construyen unos rectángulos que tienen por base la amplitud del intervalo, y por altura, la frecuencia absoluta de cada intervalo en clases.
  • 12.
    Ejemplo • El pesode 65 personas adultas viene dado de la siguiente forma
  • 13.
    Polígono de frecuencia. Unpolígono de frecuencias se forma uniendo los extremos de las barras de un diagrama de barras mediante segmentos. También se puede realizar trazando los puntos que representan las frecuencias y uniéndolos mediante segmentos.
  • 14.
    Diagrama de talloy hoja Es una representación grafica que permite ordenar los datos. • Procedimiento 1. Ordenar los datos 2. Establecer el tallo (Tomar las cifras enteras únicas) 3. Establecer las hojas (Tomar las cifras en decimales) 4. No se aceptan repeticiones
  • 15.
  • 16.
    Graficas para datoscualitativos Los diagramas para datos cualitativos son los que se usan para representar datos que no son contables o datos no cuantitativos.
  • 17.
    Diagrama de sectorcircular o pastel Se utiliza con todo tipo de variables, los datos se representan en un circulo, de como que cada sector es proporcional a la frecuencia absoluta correspondiente.
  • 18.
    Ejemplo En una salade emergencia hay 30 pacientes, 12 son niños, 3 son niñas, 9 son adolescentes y el resto son adultos. Niños Niñas Adolescentes Adultos Niños Adolescentes Niñas
  • 19.
    Diagrama de barrassimples Se representa la frecuencia simple (absoluta o relativa) de cada modalidad o categoría de la variable mediante la altura de una barra, donde la altura de una barra es proporcional a la frecuencia simple de una categoría que se representa.
  • 20.
    Ejemplo Un estudio hechoal conjunto de los 20 alumnos de una clase para determinar su grupo sanguíneo ha dado el siguiente resultado: Grupo sanguíneo fi A 6 B 4 AB 1 0 9 Total 20
  • 21.
    Diagrama de Paretoo curva 80/20 Grafica de barras que ilustra las causas de los problemas por orden de importancia y frecuencia (porcentaje) de aparición, costo o actuación. Donde la regla de Pareto establece que el 80% de las consecuencias están ligadas al 20% de las causas. Por medio de un diagrama de barra de orden descendente se determina cual es el 80% que causa el problema (determinar prioridades de problemas) para trabajar en su mejora.
  • 22.
    Procedimiento: 1. Conocer elproblema. 2. Ordenar el problema de mayor a menor 3. Obtener el porcentaje de cada problema según la frecuencia 4. Colocar los resultados en la tabla de problemas. 5. No necesariamente tiene que ser 100% pero si aproximado, 98 + 6. Establecer el porcentaje acumulado (frecuencia absoluta acumulada) 7. Realizar una grafica con el eje x y dos ejes y (derecho he izquierdo) 8. Establecer rangos en la grafica (eje y derecho: porcentaje) 9. Eje de la x: problemas 10.Graficar las barras según los datos (de manera separada según el eje de las y izquierdo) 11.Graficar un polígono de frecuencia según el eje y
  • 24.
    Ejemplo En la salade emergencia del hospital María de la Concepción se coloco una caja de quejas y sugerencias, los usuarios hicieron uso de ella. El personal administrativo recolecto las siguientes quejas. Paso 1: Determinar el problema - Enfermeras groseras: 10 - Doctores desconcentrados: 7 - Higiene inadecuada en los baños: 20 - Carencia de insumos: 65
  • 25.
    Ejemplo Paso 2: Ordenarlos datos - Carencia de insumos: 65 - Higiene inadecuada en los baños: 20 - Enfermeras groseras: 10 - Doctores desconcentrados: 7 Queja Frecuencia Porcentaje Porcentaje acumulado Carencia de insumos 65 65% 65% Higiene inadecuado en los baños 20 20% 85% Enfermeras groseras 10 10% 95% Doctores desconcentrados 5 5% 100% Total 100 100% Paso 3: Ordenarlos en una tabla
  • 26.
  • 27.
    Medidas de variación Medidasde dispersión. Las medidas de dispersión nos informan sobre cuánto se alejan del centro los valores de la distribución. Las medidas de dispersión son: Rango o recorrido El rango es la diferencia entre el mayor y el menor de los datos de una distribución estadística. Desviación media La desviación respecto a la media es la diferencia entre cada valor de la variable estadística y la media aritmética. La desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a la media.
  • 28.
    La desviación mediapara datos agrupados es: xi fi xi · fi |x - x| |x - x| · fi [10, 15) 12.5 3 37.5 9.286 27.858 [15, 20) 17.5 5 87.5 4.286 21.43 [20, 25) 22.5 7 157.5 0.714 4.998 [25, 30) 27.5 4 110 5.714 22.856 [30, 35) 32.5 2 65 10.174 21.428 21 457.5 98.57
  • 29.
    Varianza Varianza para datosagrupados Varianza para datos agrupados La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística. Para simplificar el cálculo de la varianza vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.
  • 30.
    Ejemplo Calcular la varianzade la distribución: 9, 3, 8, 8, 9, 8, 9, 18
  • 31.
    Ejemplo xi fi xi· fi xi 2 · fi [10, 20) 15 1 15 225 [20, 30) 25 8 200 5000 [30,40) 35 10 350 12 250 [40, 50) 45 9 405 18 225 [50, 60 55 8 440 24 200 [60,70) 65 4 260 16 900 [70, 80) 75 2 150 11 250 42 1 820 88 050
  • 32.
    Rango o recorrido Elrango es la diferencia entre el mayor y el menor de los datos de una distribución estadística.