2. Temas
1.1 Introducción, notación sumatoria
1.1.1 Datos no agrupados.
1.1.2 Medidas de tendencia central
1.1.3 Medidas de posición.
1.1.4 Medidas de dispersión.
1.1.5 Medidas de forma
3. Notación sumatoria
La sumatoria o sumatorio (llamada también notación sigma)
• Operación matemática
• Calcular la suma de muchos o infinitos sumandos
La operación sumatoria se expresa con la letra griega sigma
mayúscula Σ, y se representa así:
4. Datos no agrupados
Los DATOS NO AGRUPADOS es información
• Sin ningún orden que no nos establece relación clara con lo que se
pretende desarrollar a lo largo de un problema.
Entonces estos datos son analizados sin necesidad de formar clases con
ellos y a esto es a lo que se le llama tratamiento de datos no agrupados.
Ejemplo:
Edades de un grupo de personas: 20, 50, 15, 13, 16, 13, 13, 20, 8, 16 , 40,
13, 20, 35, 28, 32.
Calificaciones de la materia de español de un grupo de estudiantes: 10,
5, 6, 8, 6, 9, 7, 5, 8, 7.
5. Medidas de tendencia central o de
posición
Son medidas estadísticas que buscan
Resumir en un sólo valor el centro de la distribución de un
conjunto de datos.
Valor que se encuentra en el centro o a la mitad de un conjunto
de datos
7. Media, media aritmética o promedio
• El promedio o media muestral (cuando los datos provienen de
una muestra) es la suma de los valores del conjunto dividida por
el número total de observaciones (tamaño de la muestra, n).
• Suma de los valores de una serie de medidas respecto del
número valores existentes.
• Se obtiene sumando los puntajes y dividiendo el total entre el
número de puntajes.
• Muestrales o Población.
8. • La mediana es la observación que ocupa el lugar central cuando
todas las observaciones están ordenadas en sentido ascendente
(o descendente).
• Valor que queda en el centro tras la división de una serie de
valores ordenados en dos partes iguales, una superior y una
inferior.
• Ordenar de < a > o viceversa
• # de elementos impar, el central.
• # de elementos par, valor medio de los 2 centrales.
9. La media es muy sensible a la presencia de valores extremos,
mientras la mediana es una medida más robusta.
En estos casos, la mediana puede ser preferible a la media como
medida de tendencia central.
10. Moda
Valor que se presenta con más frecuencia en una serie de
mediciones.
La moda (o el modo) es el valor más frecuente dentro del conjunto
de observaciones.
Valor que ocurre con mayor frecuencia.
Puede que:
• no exista (no haya observaciones
que se repitan)
• no está ubicada en el centro de la
distribución, o
• haya más de una.
Puede que:
• 2 valores ocurran con >f ambos son
moda -> bimodal.
• + de 2 valores =f multimodal.
• No hay repetición, no hay moda.
11. Mitad del rango
• Valor que esta a medio camino, entre el puntaje más alto y el
más bajo, en el conjunto original de datos.
𝑚𝑖𝑡𝑎𝑑 𝑑𝑒𝑙 𝑟𝑎𝑛𝑔𝑜 =
(𝑣𝑎𝑙𝑜𝑟 𝑚á𝑥𝑖𝑚𝑜 + 𝑣𝑎𝑙𝑜𝑟 𝑚í𝑛𝑖𝑚𝑜)
2
12. Medidas de posición
Cuartiles, deciles, percentiles: son indicadores usados para señalar que
porcentaje de datos dentro de una distribución de frecuencias superan
estas expresiones.
• Los Cuartiles: son los tres valores de la variable de una
distribución que la dividen en cuatro partes iguales, es decir, al
25%, 50% y 75%.
• Los Deciles: Corresponden a los 9 valores que dividen a estos en 10
partes iguales es decir, al 10%, al 20%... y al 90%.
• Los percentiles: son los noventa y nueve valores de la variable de una
distribución que la dividen en cien partes iguales es decir, al 1%, al
2%... y al 99% de los datos.
14. Ejemplo
Supongamos el caso de una señorita de 19 años que quiere hacerse socia
de un club para conocer a señores de edad similar a la suya.
Pregunta por el promedio de edad de los socios masculinos y le informan
que es de 21 años.
Cuando ingresa se encuentra con muchos señores de 55 a 60 años con
sus nietitos de 2 ó 3 años.
Va a la secretaría a reclamar porque se siente engañada, pero le
muestran que calculando el promedio de edades de una muestra de 6
individuos seleccionados en la piscina (55-3-1-60-4 y 3) es exactamente
21 años.
No le mintieron, pero la información que le dieron fué incompleta, ya
que hubiera sido necesario acompañar el promedio con alguna medida
de variación, que muestre cómo se distribuyen los valores alrededor del
promedio.
15.
16. Desviación estándar
• Medida de variación de todos los valores con respecto a la media
𝑠 =
(𝑥 − 𝑥) 2
𝑛 − 1
σ =
𝑛 (𝑥2) − ( 𝑥) 2
𝑛(𝑛 − 1)
Puedes observar la siguiente pagina
http://www.disfrutalasmatematicas.com/datos/desviacion-estandar.html
17. Varianza
Cuadrado de la desviación estándar
• Varianza muestral = s2
• Varianza poblacional = σ2
20. La asimetría es la medida que indica la simetría de la distribución de una variable respecto a la media
aritmética, sin necesidad de hacer la representación gráfica. Los coeficientes de asimetría indican si hay
el mismo número de elementos a izquierda y derecha de la media.
Existen tres tipos de curva de distribución según su asimetría:
Asimetría negativa: la cola de la distribución se alarga para valores inferiores a la media.
Simétrica: hay el mismo número de elementos a izquierda y derecha de la media. En este caso, coinciden
la media, la mediana y la moda. La distribución se adapta a la forma de la campana de Gauss, o
distribución normal.
Asimetría positiva: la cola de la distribución se alarga para valores superiores a la media.
21. La curtosis (o apuntamiento) es una medida de forma que mide
cuán escarpada o achatada está una curva o distribución.
Este coeficiente indica la cantidad de datos que hay cercanos a la
media, de manera que a mayor grado de curtosis, más escarpada
(o apuntada) será la forma de la curva.
22. 1.2. Datos agrupados
1.2.1 Tabla de frecuencia
1.2.2 Medidas de tendencia central y de
posición
1.2.3 Medidas de dispersión
1.2.4 Medidas de asimetría y curtosis
23. La distribución de frecuencias agrupadas o tabla con datos
agrupados se emplea si las variables toman un número grande de
valores o la variable es continua. Se agrupan los valores en
intervalos que tengan la misma amplitud denominados clases.
A cada clase se le asigna su frecuencia correspondiente.
24. Ejercicio
Organiza los datos y construye una tabla de distribuciones de
frecuencia agrupando en 5 intervalos de clase.
26. Dispersión
Los diagramas de dispersión son una forma de expresar datos de
dos variables, y hacer predicciones basadas en los datos. Al
contrario de los histogramas y los diagramas de caja, los de
dispersión muestran valores de datos individuales.
27. El diagrama "tallo y hojas" (Stem-and-Leaf Diagram)
permite obtener simultáneamente una distribución de
frecuencias de la variable y su representación gráfica.
Para construirlo basta separar en cada dato el último
dígito de la derecha (que constituye la hoja) del bloque
de cifras restantes (que formará el tallo).
28. Histograma
Se agrupan los datos en clases, y se cuenta cuántas observaciones
(frecuencia absoluta) hay en cada una de ellas.
En algunas variables (variables cualitativas) las clases están definidas
de modo natural, p.e sexo con dos clases: mujer, varón o grupo
sanguíneo con cuatro: A, B, AB, O. En las variables cuantitativas, las
clases hay que definirlas explícitamente (intervalos de clase).
29. Ojivas
Una distribución de frecuencia acumulativa nos permite ver
cuantas observaciones se hallan por arriba o por debajo de ciertos
valores, en lugar de limitarnos a anotar los números de elementos
dentro de los intervalos.
30. Polígono de frecuencias
Uniendo el punto medio de la parte superior de cada barra del
diagrama de barras se obtiene el polígono de frecuencias (en
naranja).
31. Diagrama de Caja y Ejes
Son una presentación visual que describe varias características
importantes, al mismo tiempo, tales como la dispersión y simetría.
Para su realización se representan los tres cuartiles y los valores
mínimo y máximo de los datos, sobre un rectángulo, alineado
horizontal o verticalmente.
32. Sectores
El diagrama de sectores se suele utilizar para variables cualitativas,
pero también se puede utilizar para representar datos discretos.
Consiste en dividir un círculo de forma que los valores más
frecuentes tienen sectores más grandes.
33. Referencias
Marangunich, L. (2004). Estadística Descriptiva. [documento electrónico]. Red de
Helmintología de FAO para América Latina y el Caribe. Disponible en
http://cnia.inta.gov.ar/helminto/Estadistica/Modulo%20I.pdf
Kazmier, Leonard J. (2006).“Diferentes tipos de obtención de datos” en Estadística
aplicada a Administración y Economía. (4ta. ed.). México: McGraw-Hill, pp. 2-4.
Kazmier, L. J. (2006). Presentaciones estadísticas y representaciones gráficas. En
Estadística aplicada a Administración y Economía (4ta. ed.) (pp. 11-20). México:
McGraw-Hill.
Triola, M. F. (2004). “Medidas de tendencia central” en Estadística (9a Edición).
México:
Pearson Education, pp. 59-68.
Triola, M. F. (2004). “Medidas de Variación” en Estadística (9a Edición). México:
Pearson Education, pp. 73-87.