2. MEDIDAS DE CONCENTRACIÓN
Media.- también llamada promedio o simplemente media, de
un conjunto finito de números es igual a la suma de todos sus
valores dividida entre el número de sumandos.
Expresada de forma más intuitiva, podemos decir que la media
(aritmética) es la cantidad total de la variable distribuida a partes
iguales entre cada observación.
3. MEDIDAS DE CONCENTRACIÓN
Mediana.- representa el valor de la variable de posición central
en un conjunto de datos ordenados. De acuerdo con esta
definición el conjunto de datos menores o iguales que la
mediana representarán el 50% de los datos, y los que sean
mayores que la mediana representarán el otro 50% del total de
datos de la muestra. La mediana coincide con el percentil 50, con
el segundo cuartil y con el quinto decil.
4. MEDIDAS DE CONCENTRACIÓN
Moda.- es el valor con una mayor frecuencia en una distribución
de datos
Ejemplo: La moda de 2, 4, 5, 5, 5, 7, 8, 8, 9, 12 es 5.
5. MEDIDAS DE POSICION
Las medidas de posición dividen un conjunto de
datos en grupos con el mismo número de individuos.
Para calcular las medidas de posición es necesario
que los datos estén ordenados de menor a mayor.
La medidas de posición son:
Cuartiles
Deciles
Percentiles
6. MEDIDAS DE POSICION
Cuartiles.- son los tres valores de la variable que dividen a un
conjunto de datos ordenados en cuatro partes iguales.
Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al
50% y al 75% de los datos. Q2 coincide con la mediana.
8. MEDIDAS DE POSICION
Deciles.- Son los nueve valores que dividen la serie de datos en
diez partes iguales.
Los deciles dan los valores correspondientes al 10%, al 20%... y al
90% de los datos.
D5 coincide con la mediana.
En la tabla de Frecuencia Acumulada
10. MEDIDAS DE POSICION
Percentiles.- Los percentiles son los 99 valores que dividen la
serie de datos en 100 partes iguales.
Los percentiles dan los valores correspondientes al 1%, al 2%... y
al 99% de los datos. P50 coincide con la mediana.
En la tabla de Frecuencia Acumulada
12. MEDIDAS DE DISPERSIÓN
Varianza.- (que suele representarse como σ2) de una variable
aleatoria es una medida de su dispersión definida como la
esperanza del cuadrado de la desviación de dicha variable
respecto a su media.
Está medida en unidades distintas de las de la variable. Por
ejemplo, si la variable mide una distancia en metros, la varianza
se expresa en metros al cuadrado. La varianza tiene como valor
mínimo 0.
13. MEDIDAS DE DISPERSIÓN
Desviación Típica Estándar.- La desviación estándar o
desviación típica (denotada con el símbolo σ) es una medida de
centralización o dispersión para variables de razón (ratio o
cociente) y de intervalo, de gran utilidad en la estadística
descriptiva.
Se define como la raíz cuadrada de la varianza. Junto con este
valor, la desviación típica es una medida (cuadrática) que
informa de la media de distancias que tienen los datos respecto
de su media aritmética, expresada en las mismas unidades que la
variable.
14. MEDIDAS DE DISPERSIÓN
Covarianza.- La covarianza entre dos variables es un estadístico
resumen indicador de si las puntuaciones están relacionadas
entre sí. La formulación clásica, se simboliza por la letra griega
sigma (σ) cuando ha sido calculada en la población. Si se obtiene
sobre una muestra, se designa por la letra “Sxy".
La formula suele aparecer expresada como:
15. MEDIDAS DE DISPERSIÓN
Coeficiente de correlación de Pearson (r).- Permite saber si el
ajuste de la nube de puntos a la recta de regresión obtenida es
satisfactorio. Se define como el cociente entre la covarianza y el
producto de las desviaciones típicas (raíz cuadrada de las
varianzas).
20. Tablas Dinámicas
Las tablas dinámicas, también llamadas pivot tables, son
herramientas para el análisis de bases de datos (BD). Se encargan
de resumir y ordenar la información contenida en la BD.
Permiten analizar sólo una porción de la BD, es decir, con una BD
con gran cantidad de campos o columnas, ayudan a visualizar
únicamente la información relevante, con lo que el análisis se
torna más sencillo. Las pivot tables están basadas en dos
conceptos: sumarización y rotación.
Sumarización.- Se refiere a la capacidad de resumir datos del
mismo tipo y con los mismos atributos.
Rotación.- Es la posibilidad de colocar, quitar y/o mover la
cantidad de campos seleccionados a cualquier posición que se
requiera, siempre y cuando estos campos estén contenidos en la
base de datos.