3. Definición: es la parte de las Matemáticas que estudia los métodos que tienen por objeto la
obtención, tratamiento e interpretación de los datos observados en un grupo de individuos.
CLASIFICACIÓN: se divide en dos partes fundamentales:
a) Estadística DESCRIPTIVA: trata del recuento, ordenación y análisis de los datos de las
observaciones; su finalidad es el diseño y obtención de tablas y gráficos que permitan
clarificar la complejidad de los datos obtenidos. También tiene el objetivo de definir medidas
que informen sobre la totalidad de los datos.
b) Estadística INFERENCIAL: tiene la finalidad de obtener conclusiones generales de
una población a partir de los datos observados sólo en una parte de la misma. Esta rama se
apoya en la anterior y en el cálculo de probabilidades.
Nos ocuparemos de la ESTADÍSTICA DESCRIPTIVA
POBLACIÓN: conjunto de elementos sobre los que se quiere hacer el estudio de alguna
característica. Ejemplo: supongamos que se desea conocer la intención de voto en cierto país
en un momento determinado; la población sería el conjunto de personas que tienen derecho a
voto en dicho país.
INDIVIDUO: cada uno de los elementos de la población. Ejemplo: cada una de las
personas con derecho a voto.
MUESTRA: parte de la población sobre la que se va a realizar el estudio. Ejemplo:
realizar una encuesta a toda la población con derecho a voto es imposible así que se selecciona
una parte de la población con el fin de preguntar sólo a estos individuos, y esa parte es la
muestra. La muestra ha de ser representativa.
VARIABLE ESTADÍSTICA: es el carácter o aspecto que se desea estudiar en la
población. Ejemplo: la intención de voto: partido A, partido B, etc o abstención. Cada una de
estas posibilidades se llama modalidad y son excluyentes, es decir, si un individuo vota a un
partido entonces no puede votar al otro.
TIPOS DE VARIABLE ESTADÍSTICA:
a) CUALITATIVAS: las modalidades no son numéricas. Ejemplo: los diferentes partidos
4. a los que se puede votar
b) CUANTITATIVAS: las modalidades son numéricas. Ejemplo: cuando queremos
estudiar el número de hijos por unidad familiar en un determinado país. Estas variables a su
vez se clasifican en:
b1) DISCRETAS: las modalidades o valores de la variable toman valores concretos y
entre dos de estos valores no puede haber valores intermedios. Ejemplo: el número de
hijos por unidad familiar sólo puede ser 0, 1, 2, 3, etc.
b2) CONTINUAS: las modalidades o valores de la variable pueden tomar cualquier
valor decimal entre dos valores cualesquiera de la variable. Ejemplo: si estudiamos el
carácter “tiempo de espera de una línea de autobuses en una parada determinada” los
valores de la variable pueden ser: 3 min, 3,25 min, 3,5 min, 4 min, etc
TABLAS DE FRECUENCIAS: son tablas que se utilizan para ordenar los datos de un
estudio estadístico.
xi fi hi % Fi Hi % acumulado
∑fi ∑hi ∑%
1. xi: distintas modalidades o valores que toma la variable estadística objeto de nuestro
estudio
2. fi: valores de las frecuencias absolutas
3. ∑fi: suma de todos los valores de la columna fi; se trata del nº total de individuos de la
población o de la muestra (tamaño de la población o de la muestra)
4. hi: valores de las frecuencias relativas; se calcula mediante los cocientes fi/∑fi
5. ∑hi: suma de todos los valores de la columna hi y es siempre 1
6. %: valores de los tantos por ciento de cada modalidad o valor de la variable; se calcula
multiplicando cada valor de hi por 100, es decir, hi ∙ 100
7. ∑%: suma de todos los valores de la columna % y es siempre 100
8. Fi: valores de las frecuencias absolutas acumuladas; el primer valor es el de la primera
frecuencia absoluta fi, el segundo valor es la suma de las dos primeras frecuencias
5. absolutas, el tercer valor es la suma de las tres primeras frecuencias absolutas, y así
sucesivamente hasta el último valor que coincide con ∑fi
9. Hi: valores de las frecuencias relativas acumuladas; el primer valor coincide con la primera
frecuencia relativa hi, el segundo valor se calcula sumando las dos primeras frecuencias
relativas, el tercer valor se calcula sumando las tres primeras frecuencias relativas, y así
sucesivamente hasta el último valor que coincide con ∑Hi
10.% acumulado: valores de los % acumulados; el primer valor coincide con el primer %, el
segundo valor se calcula sumando los dos primeros %, el tercer valor se calcula sumando
los tres primeros %, y así sucesivamente hasta el último valor que coincide con ∑% que es
siempre 100. También se puede calcular multiplicando por 100 a cada valor de la columna
Hi
Ejemplo:
Se ha realizado un estudio sobre la intención de voto en una población en la que se han
censado 25000 personas con derecho a voto; los partidos políticos candidatos son: PSOE, PP,
IU y PL (Partido Local) y se ha conseguido entrevistar a las 25000 personas con derecho a
voto. Los resultados de las entrevistas se han ordenado en la siguiente tabla de frecuencias (es
decir, se han tabulado):
PSOE 10500 0.42 42 10500 0.42 42
PP 8300 0.33 33.2 18800 0.75 75.2
IU 2200 0.09 8.8 21000 0.84 84
PL 3500 0.14 14 24500 0.98 98
ABSTENCIÓN 500 0.02 2 25000 1 100
25000 1 100
Esta manera de organizar los datos nos ofrece una información clara y cómoda de lo que
ocurre en esa población con respecto a la característica que estamos estudiando (la intención
de voto); así, podemos contestar con facilidad a preguntas como:
1. ¿Cuántos votos obtuvo el PP? 8300
6. 2. ¿Qué porcentaje suponen esos 8300 individuos? 33,2%
3. ¿Cuántos individuos votaron a los partidos mayoritarios PSOE y PP? 18800
4. ¿Qué % supone esa cantidad? 75,2%
5. ¿Cuántos individuos no practicaron la abstención? 24500
6. ¿Qué porcentaje no se abstuvo de votar? 98%
Debéis observar en qué filas y columnas están los valores de las respuestas y así daros
cuenta del significado de cada columna.
Puedes practicar con la tabla de datos cambiando los valores de fi y así observarás qué
datos cambian y qué datos no cambian en la tabla. Para ello, haz click “aquí”
Para ver un ejemplo correspondiente a variable estadística cuantitativa discreta te
remitimos a la Hoja3 de la hoja de cálculo adjunta haciendo click en la palabra
“cuantitativas”
Nota importante: en la tabla de datos, en la columna correspondiente a los valores de la
variable estadística, es decir, la que hemos designado como xi , cuando ésta es cuantitativa
(discreta o continua) los correspondientes valores han de disponerse de menor a mayor valor.
GRÁFICOS ESTADÍSTICOS: son representaciones gráficas de la distribución
estadística cuya finalidad es tener una idea clara al 1er golpe de vista de lo que está ocurriendo
con la/s variable/s estadística/s en la población objeto de nuestro estudio.
TIPOS DE GRÁFICOS ESTADÍSTICOS: hay varios aunque nosotros utilizaremos
principalmente 3:
7. · Diagrama de barras: se utiliza con variables cualitativas o cuantitativas discretas.
· Histograma de frecuencias: se utiliza con variables cuantitativas continuas o con variables
cuantitativas discretas cuyos valores se agrupan en intervalos.
· Diagrama de sectores: se utiliza fundamentalmente con variables cualitativas (aunque
también se puede utilizar con variables cuantitativas).
Veamos el diagrama de sectores y el diagrama de barras correspondiente a nuestro
estudio sobre la intención de voto en las elecciones de una determinada localidad.
INTENCIÓN DE VOTO INTENCIÓN DE VOTO
12000
10000
Frecuencia absoluta 8000
PSOE
PP 6000
IU
PL
ABSTENCIÓN 4000
2000
0
PSOE PP IU PL AB-
STE
NCIÓ
N
Modalidades de la variable
Para practicar con los graficos correspondientes a este ejercicio haz click en la palabra
“Gráficos” y en la hoja de cálculo correspondiente podrás hacer las modificaciones que se te
ocurran y que el programa te permita.
PARÁMETROS ESTADÍSTICOS
Son cálculos matemáticos que se hacen sobre los datos de una distribución estadística.
Clasificación de los parámetros estadísticos:
a) Medidas de posición: alrededor de ellas se distribuyen los valores de la distribución
estadística. Son, por ejemplo: la media, los cuartiles (entre ellos, la mediana Me), la moda
Mo
8. b)Medidas de dispersión: nos dan idea de cómo de separados de la media están los datos.
Son: la desviación típica σ y el coeficiente de variación CV
a) Medidas de posición
Media: como ya sabéis, es la suma de todos los distintos valores de la variable estadística
dividida entre el número total de valores. Obviamente, sólo se puede calcular cuando la
variable estadística es cuantitativa o numérica. Cuando tenemos los datos tabulados, para
calcular este parámetro podemos añadir una columna más, fi ∙ xi, hallar su suma y aplicar la
fórmula: (∑fi · xi) / ∑fi
Mediana:es el cuartil 2, es decir, el valor de la variable por debajo del cual hay tantos
valores como por encima. De modo similar se difiniría al cuartil 1 y al cuartil 3.
Moda: Es el valor de la variable que tiene mayor frecuencia, es decir, lo que más se da.
b) Medidas de dispersión
Desviación típica: este es un parámetro que nos da idea del grado de dispersión o
alejamiento de los datos sobre el valor promedio (o media). Podemos calcularla utilizando los
operadores de OpenOffice o bien aplicando la fórmula tradicional para lo cual añadimos a la
tabla de valores una nueva columna, fi · xi2
Coeficiente de variación: este parámetro mide la dispersión relativa a la media; se utiliza
para comparar la dispersión de poblaciones muy heterogéneas. Su cálculo se obtiene aplicando
la fórmula: CV=(σ / x)·100
A continuación vamos a ver un ejercicio en el que se calculan los parámetros mencionados
y alguno más:
Al contar el número de asignaturas suspendidas por cada alumno/a en la primera
evaluación de un grupo de 3º de la E.S.O., hemos obtenido estos datos:
1-1-2-3-2-6-0-0-1-0-4-5-0-0-0-3-2-1-3-1-1-1-0-1-2-0-0-5-4-2
El ejercicio está resuelto en la Hoja que hemos denominado “parámetros estadísticos”