2. UNIDAD I: CONCEPTOS BASICOS.
• ESTADISTICA: Rama de las
matemáticas que examina las
formas de recolectar, transformar,
procesar y analizar datos, de
manera que sean útiles para la
toma de decisiones.
• VARIABLES: Son características
que pueden cambiar de acuerdo a
circunstancias, de los individuos u
objetos, sujetos a análisis.
3. UNIDAD I: CONCEPTOS BASICOS.
• POBLACION (UNIVERSO): Conjunto
de individuos de una misma
especie, de los cuales se desea
realizar un análisis y obtener
parámetros para una conclusión
estadística.
• MUESTRA: Parte seleccionada de
una población, para realizar un
análisis y obtener una conclusión
estadística.
• RANGO: Es la diferencia entre el
VALOR MAYOR y el VALOR
MENOR de la muestra o universo
4. • PARAMETRO: Medida
numérica, que describe una
característica de una población.
• ESTADISTICO: Medida numérica
que describe alguna
característica de una muestra.
• ESTADISTICA APLICADA:
Resultados del estudio de una
población analizada, que sea
universalmente aceptado de
todos aquellos individuos
relacionados en el análisis.
UNIDAD I: CONCEPTOS BASICOS.
5. UNIDAD I: CONCEPTOS BASICOS.
• DISTRIBUCION DE FRECUENCIAS: Tabla que
resume los datos obtenidos, de manera
organizada, en clases o grupos numéricamente
organizados.
CIUDADES
INDUSTRIALIZADAS
HOTELES DE
5 A 3 Estrellas
MEXICO 283 a 270
GUADALAJARA 270 a 260
MONTERREY 260 a 250
QUERETARO 190 a 177
AGUASCALIENTES 150 a 130
LEON 110 a 90
HERMOSILLO 90 a 70
6. UNIDAD I: CONCEPTOS BASICOS.
• AMPLITUD O ANCHO DE INTERVALO:
Numero adecuado de agrupación
(clase) de individuos, para organizar la
distribución de frecuencias.
• Amplitud (w) = Rango / Nº de clase
deseado
• CLASE: Grupo de valores semejantes.
Por lo general un numero de clase
adecuado debe de estar variando
entre 5 mínimo y 15 máximo, para
evitar traslapes. Una manera práctica
para obtener el numero de clase, es el
de sacar la raíz cuadrada del total del
universo o muestra ( V n ).
7. UNIDAD I: CONCEPTOS BASICOS.
• HISTOGRAMA: Grafica de
barras para datos numéricos
agrupados en los que las
frecuencias de cada grupo de
datos, están representados
por barras individuales.
• POLIGONO DE
PORCENTAJES: Se crea al
hacer que por el punto medio
de cada barra del histograma,
pase una línea que una todos
los puntos medios de cada
barra.
8. UNIDAD I: CONCEPTOS BASICOS.
• TENDENCIA CENTRAL: Medida
que describe como todos los
valores de los datos se
agrupan en torno a un valor
central.
• VARIACION: Dispersión de los
valores con respecto a un
valor central.
• MEDIA ARITMETICA ( X ):
Medida mas común de
tendencia central. X = Suma
de los valores / numero de
valores.
X
9. UNIDAD I: CONCEPTOS BASICOS
• MEDIA MUESTRAL: Es la suma de los valores (tamaño
de la muestra) entre el numero de valores de la
muestra. X = ∑ Xi / n. Ejemplo edades de 6 jovenes:
Muestra = 21, 22, 25, 27, 28, 30
X = (21+22+25+27+28+30) / 6 = (153 / 6 ) = 25.5
10. UNIDAD I: CONCEPTOS BASICOS
• MEDIANA: Valor medio de un conjunto de datos
ordenados de menor a mayor, si el conjunto de datos
(n) es impar, la mediana es el numero que se
encuentra al centro de esos valores, si el conjunto de
datos es par, entonces la mediana es el valor promedio
de los dos valores colocados en medio.
Ejemplo edades:
21, 22, 25, 27, 28, 30
Mediana = (25 + 27)/ 2
Mediana = 26
11. UNIDAD I: CONCEPTOS BASICOS
• MODA: Es el valor de los datos, que se repite o
aparece con mayor frecuencia:
Muestra: (21, 23, 24, 25, 27, 27 27, 28, 29, 29)
• RANGO: Es el valor MAYOR, menos el valor
MENOR. 29 – 21 = 8
12. UNIDAD I: CONCEPTOS BASICOS
• VARIANZA (S2): Es la media de las desviaciones
cuadráticas de una variable de carácter aleatorio,
considerando el valor media de esta.
De una población S2 = ∑ (Xi – X)2 / N
• VARIANZA
De una muestra S2 = ∑ (Xi – X)2 / n-1
EJEMPLO: Muestra: 21, 23, 25, 27
Media calculada = 24
S2 = {(21-24)2 + (22-24)2 + (25-24)2 + (27- 24)2} / (4-1)
S2 = { 32 + 22 + 12 + 32} / 3 = {9 + 4 + 1 + 9} / 3 = 23
S2 = 23 / 3 = 7.7
13. UNIDAD I: CONCEPTOS BASICOS
• DESVIACION ESTANDAR (S,σ): La desviación
estándar es un promedio de las desviaciones
individuales de cada observación con respecto a
la media de una distribución, la desviación
estándar mide el grado de dispersión o
variabilidad, es la raíz cuadrada de la varianza. σ
= vS2 = v∑ (Xi – X)2 / N o (n-1) dependiendo
si es de población o es de muestra.
• Por ejemplo la desviación estándar de la varianza
calculada en el ejemplo anterior es: 2.77
14. UNIDAD I: CONCEPTOS BASICOS
• COEFICIENTE DE VARIACION (CV): Es una medida relativa
del universo o muestra que se está analizando, mide la
dispersión de datos con respecto a la media.
CV= (σ / x) 100
• PUNTUACION “Z” (COLAS): En el histograma (grafica de
distribuciones de frecuencias) los valores “Z” son los que
se encuentran al inicio y al final de la grafica (colas), son
los valores que se encuentran más alejados de la media,
entre mas grande es “Z”, mas grande es la distancia a la
media. Z = (x – x ) / σ
15. UNIDAD I: CONCEPTOS BASICOS
Desarrollemos un ejercicio en donde apliquemos lo
aprendido. Cuando se realiza un estudio de este tipo, se
pueden analizar dos tipos de datos, los datos
cuantitativos, que se pueden medir como cantidades o
medidas y los datos cualitativos, que no se pueden medir
como color, forma, etc.
• Una fabrica de canicas de vidrio, produce un lote de 30
canicas, a las cuales se le mide el diámetro en milímetros
y el resultado es el siguiente:
16.2 15.7 16.4 15.4 16.4 15.8 16.0 15.3 15.7 16.6
15.8 16.2 15.9 15.9 15.6 15.8 16.1 15.9 16.0 15.6
15.3 16.8 15.9 16.3 16.9 15.6 16.0 16.8 16.0 16.3
16. UNIDAD I: CONCEPTOS BASICOS
Lo primero que debemos hacer, es organizar los datos de
menor a mayor:
15.2 15.6 15.7 15.8 15.9 16.0 16.0 16.2 16.4 16.8
15.3 15.6 15.7 15.8 15.9 16.0 16.1 16.3 16.4 16.8
15.4 15.6 15.8 15.9 15.9 16.0 16.2 16.3 16.6 16.9
Por lo que ya podemos calcular nuestro rango, el cual es:
Rango= Mayor – menor = 16.9 – 15.2 = 1.7
La media es = 16.0 La moda es= 15.9 con 4
La mediana es = 16.0
La varianza es = 0.1783 La desviación estándar es = 0.4295
¿De donde salieron estos valores? Muy fácil de EXCEL
17. UNIDAD I: CONCEPTOS BASICOS
• CV = (σ / x ) 100 = (0.4295 /16) 100 = 0.0268 (100)
CV = 2.68% o sea que las canicas que se están fabricando,
presentan una desviación relativa con relación a la
medida central (media) de un 2.68%, que es un valor
bajo.
• Z = (x – x) / σ Para esto tomamos los valores extremos
15.2 y 16.9, entonces:
Z1 = (15.2 – 16.0) / 0.4295 = (- 0.8) / 0.4295 = 1.86 mm
Z2 = (16.0 – 19.9) / 0.4295 = (0.9 ) / 0.4295 = 2.09 mm
Por lo que se ve una tendencia a desviarse (variacion)hacia
las medidas mas grandes.
18. UNIDAD I: CONCEPTOS BASICOS
• Preparémonos ahora para graficar nuestro Histograma,
primero calculemos el numero de clase:
V 30 = 5.47 el cual podemos cerrarlo en 5 o en 6, utilicemos
6 Con este valor, calculemos la amplitud (w)
w= Rango / Nº de clase = 1.7 / 6 = 0.2833 semejante o
aproximado a 0.3
Entonces procedemos a generar el ancho de columna de la
siguiente forma:
El valor menor es 15.2 + 0.3 = 15.5 pero este valor de 15.5,
representa el inicio del rango de la segunda columna, por
lo que nuestra tabla queda de la siguiente manera:
19. UNIDAD I: CONCEPTOS BASICOS
CLASE FRECUENCIA
15.2 a 15.4 2
15.5 a 15.7 5
15.8 a 16.0 11
16.1 a 16.3 6
16.4 a 16.6 3
16.7 a 16.9 3
TOTAL 30
Por lo que nuestro
Histograma quedará
de la siguiente
manera: 15.2 a 15.4 15.5 a 15.7 15.8 a 16.0 16.1 a 16.3 16.4 a 16.6 16.7 a 16.9
3
11
5
3
6
2
Media = 16.0