3. TEMARIO
UNIDAD I DISTRIBUCIONES DE FRECUENCIA
1.1 Conceptos de estadística y su clasificación.
1.2 Recopilación de datos.
1.3 Distribución de frecuencias.
1.3.1 Polígonos de frecuencia, histogramas y ojivas.
1.4 Medidas de tendencia central para datos agrupados.
1.4.1 Media, media ponderada, mediana y moda.
1.4.1.1 Relación entre media, mediana y moda.
1.5 Medidas de dispersión para datos agrupados.
1.5.1 Rango, Desviación media, Varianza , Desviación estandar
4. 1.1 CONCEPTOS
DE ESTADÍSTICA Y
SU CLASIFICACIÓN
• ¿QUÉ ES LA ESTADÍSTICA?
• Cuando hablamos de estadística nos referimos principalmente a
una de las tantas ramas de la matemática, pues, se encarga de
analizar y estudiar datos, y también buscar las explicaciones de
algunos fenómenos que alteran los resultados.
• Por otro lado, también se considera una ciencia, ya que estudia a
las poblaciones de forma específica, recopilando los diferentes
datos para determinar algún problema o para darle solución.
• Su ejecución se manifiesta en diferentes aspectos, tanto en la
física como en la ciencia, también se ejecuta en los negocios y en
el campo gubernamental.
5. OBJETIVO DE LA ESTADISTICA
• Aunque habitualmente se usa la estadística para dar
resultados matemáticos o científicos basados en datos, el
objetivo de esta se puede definir en diferentes formas en las
que ella desarrolla una situación, por ejemplo:
• Gracias a los datos específicos mejora la comprensión de los
hechos.
• Hacer una inferencia de una población en específico, tomando
como base los datos proporcionados.
• Según la estadística descriptiva, resumir la información
obtenida de los datos.
• Según la estadística inferencial, dar datos y soluciones de los
diferentes ámbitos.
6. CARACTERÍSTICAS DE LA ESTADÍSTICA
Su estudio, uso y aplicación es
fundamental para la toma de
decisiones de diferentes
ámbitos.
Da pie a un proceso donde se
estudian los problemas sociales,
científicos o industrial.
Este proceso puede llevar
tiempo para dar resultados
verídicos y con soluciones
pautadas.
Da un estimado ya sea numérico
o social y al mismo da tiempo
proporciona conclusiones que
llevan a una solución.
7. TIPOS DE
ESTADISTICA
Descriptiva o deductiva: Solo se encarga de mostrar el
resultado de los datos que se estudiaron de forma
específica, sin generalizaciones.
Inferencial o inductiva: Al contrario de la estadística
descriptiva, la inferencial si incluye datos y resultados
generales y de investigación amplia.
Aplicada: Con este tipo, se utilizan los dos métodos
anteriores, luego de investigar, estudiar y analizar se dan
resultados específicos y también resultados generalizados.
Matemática: Esta se relaciona mucho con la estadística
descriptiva y la inferencial, sin embargo, la estadística
matemática va más allá, pues utiliza análisis y álgebra,
dando así un punto de vista enfocado y formal.
8. 1.2 RECOPILACION DE DATOS
Concepto:
Uso de técnicas y herramientas que pueden
ser utilizadas para desarrollar sistemas de
información, los cuales pueden ser la
entrevistas, la encuesta, el cuestionario, la
observación, el diagrama de flujo y el
diccionario de datos.
Finalidad:
Buscar información que será útil a una
investigación en común.
9. TÉCNICAS PARA
HALLAR DATOS
Los analistas utilizan una variedad de métodos a fin de recopilar los
datos sobre una situación existente, como :
• Entrevistas
• Encuestas
• Diagrama de flujo
• Observación.
10. LA ENTREVISTA
• Las entrevistas se utilizan para
recabar información en forma verbal.
La estructura de la entrevista varia
dependiendo de el tipo de
información que se requiera.
11. LA ENCUESTA
• Un método de obtener información
de una muestra de individuos. Esta
"muestra" es usualmente sólo una
fracción de la población bajo estudio.
12. LA OBSERVACION
• Otra técnica útil para el analista en su
progreso de investigación, consiste en
observar a las personas cuando
efectúan su trabajo.
• Como técnica de investigación, la
observación tiene amplia aceptación
científica
13. DIAGRAMA DE
FLUJO
• Es una representación pictórica de los
pasos en proceso. Útil para
determinar cómo funciona realmente
el proceso para producir un
resultado.
• Se utiliza en:
• -Definición de proyectos
• -Identificación de las causas
principales
• -Diseño de soluciones
• -Aplicación de soluciones
• -Control
14. 1.3 DISTRIBUCION
DE FRECUENCIAS
• Las distribuciones de frecuencias son tablas en que se dispone
las modalidades de la variable por filas. En las columnas se
dispone el número de ocurrencias por cada valor, porcentajes,
etc.
• La finalidad de las agrupaciones en frecuencias es facilitar la
obtención de la información que contienen los datos.
15. 1.3.1 POLÍGONOS DE
FRECUENCIA,
HISTOGRAMAS Y OJIVAS
Polígono de frecuencia:
• Es el nombre que tiene el tipo de
gráfico que se realiza a partir de un
histograma de frecuencia, en los
cuales se utilizan columnas verticales
para expresar las frecuencias, el
polígono se crea al unir los puntos de
máxima altura dentro de estas
columnas.
16. HISTOGRAMA
• Un histograma es una representación
gráfica de una variable en forma de
barras, donde la superficie de cada
barra es proporcional a la frecuencia
de los valores representados.
17. OJIVA
• La ojiva es una gráfica asociada a la
distribución de frecuencias, es decir,
que en ella se permite ver cuántas
observaciones se encuentran por
encima o debajo de ciertos valores,
en lugar de solo exhibir los números
asignados a cada intervalo.
18. 1.4 MEDIDAS DE
TENDENCIA
CENTRAL PARA
DATOS
AGRUPADOS
Las medidas de tendencia central de
datos agrupados se utilizan en estadística
para describir ciertos comportamientos
de un grupo de datos suministrados,
como por ejemplo a qué valor están
cercanos, cuál es el promedio de los
datos recogidos, entre otros.
Cuando se toma una cantidad grande de
datos, es útil agruparlos para tener un
mejor orden de los mismos y así poder
calcular ciertas medidas de tendencia
central.
Entre las medidas de tendencia central
más utilizadas están la media aritmética,
la mediana y la moda. Estos números
dicen ciertas cualidades sobre los datos
recogidos en determinado experimento.
19. 1.4.1 MEDIA
• La media de un conjunto de números, algunas ocasiones
simplemente llamada el promedio , es la suma de los datos
dividida entre el número total de datos.
20. MEDIA
PONDERADA
• La media ponderada (MP) es una medida de centralización.
Consiste en otorgar a cada observación del conjunto de datos
(X1,X2,…,XN) unos pesos (p1,p2,…,pN) según la importancia de
cada elemento. Cuanto más grande sea el peso de un elemento,
más importante se considera que es éste.
21. MEDIANA
• La mediana de un conjunto de números es el número medio en
el conjunto (después que los números han sido arreglados del
menor al mayor) -- o, si hay un número par de datos, la mediana
es el promedio de los dos números medios.
22. MODA • La moda de un conjunto de números es el número que aparece
más a menudo.
23. 1.4.1.1
RELACIÓN
ENTRE MEDIA,
MEDIANA Y
MODA
Cuando una distribución de frecuencia es
simétrica, la media, mediana y moda coinciden
en su valor (X = Me = Mo). En el caso de una
distribución binomial simétrica, es necesario
calcular el promedio de las modas.
En una distribución sesgada a la izquierda, la
moda es menor a la mediana, y esta a su vez
menor que la media (X < Mo < Me)
En una distribución sesgada a la derecha la
relación se invierte, la moda es mayor a la
mediana, y esta a su vez mayor que la media
(Mo > Me >).
24. 1.5 MEDIDAS DE
DISPERSIÓN PARA
DATOS
AGRUPADOS
• Las medidas de dispersión nos permiten conocer si los valores en
general están cerca o alejados de los valores centrales, muestran
la variabilidad de una distribución de datos, indicando por medio
de un número si las diferentes puntuaciones de una variable
están muy alejadas de la medida de tendencia central.
25. 1.5.1 RANGO, DESVIACIÓN MEDIA,
VARIANZA, DESVIACIÓN ESTÁNDAR
Rango:
• Es la diferencia entre el valor máximo y el mínimo en nuestros
datos, esta medida de dispersión aunque es la más fácil de
obtener, en lo general es muy poco usada.
• Datos agrupados Hay dos formas para determinar el rango
para datos agrupados:
• 1) Rango = punto medio de la clase más alta – punto medio de
la más baja
• 2) Rango = límite superior de la clase más alta – límite inferior
de la más baja
26. DESVIACIÓN MEDIA
• La desviación media o desviación
promedio es abreviada por MD. Mide
la desviación promedio de valores
con respecto a la media del grupo, sin
tomar en cuenta el signo de la
desviación.
27. DESVIACIÓN ESTÁNDAR
La desviación estándar o desviación típica (σ) es una
medida de centralización o dispersión para variables de
razón (ratio o cociente) y de intervalo, de gran utilidad en
la estadística descriptiva.
Se define como la raíz cuadrada de la varianza. Junto con este valor, la
desviación típica es una medida (cuadrática) que informa de la media de
distancias que tienen los datos respecto de su media aritmética,
expresada en las mismas unidades que la variable.
28. INDICA QUÉ TAN DISPERSOS ESTÁN LOS DATOS CON
RESPECTO A LA MEDIA.
NOTA: Mientras mayor sea la desviación estándar, mayor será la
dispersión de los datos(variabilidad de datos). O sea nos indica si
estos valores están próximos entre si o si al contrario están muy
dispersos.
29. VARIANZA
• Es una medida estadística que mide la
dispersión de los valores respecto a
un valor central (media), es decir, es
el cuadrado de las desviaciones:
30. EJEMPLO
• A un grupo de 12 estudiantes se les aplico un examen y las calificaciones obtenidas son las siguientes:
El total de los datos es igual a
12.
N=12
31. Para datos no agrupados
La media se determina sumando los 12
datos y dividiendo ese resultado de la
suma entre el total de los datos
La mediana es el dato que esta en
medio de todos los datos ordenados.
Y la moda es el dato que mas se repite
en nuestro caso ningún dato se repite.
32. El rango se determina
restando el valor
máximo-el valor
mínimo. 93-50 = 43
La varianza se sustituye
en su formula descrita y
determina un resultado
de 209.6.
Y la desviación estándar
simplemente es la raíz
del resultado de la
varianza. Y da 14.5
Medidas de dispersión
33. Medidas de posición
Para determinar las
medidas de posición de
se utilizan los cuartiles
con la formula mostrada
en el recuadro.
34. Para datos agrupados
Para determinar la amplitud de
divide el rango sobre el numero
de clases.
El numero de clases es la raíz de
la cantidad de los datos.
35. Se elabora una tabla de frecuencias . El numero
de clases viene reflejado en la cantidad de filas a
utilizar en la tabla.
Para las medidas de tendencia central
en especial la media cambia su formula
para datos agrupados y se determina
con la mostrada en el recuadro.
36. Con las medidas de posición utilizando los cuartiles se
determina que la mediana es igual al cuartil 2.
Luego se obtiene su histograma y su ojiva
respectivamente usando los datos de las frecuencias y
intervalos