2. Definición de Estadística
La Estadística es la ciencia cuyo objetivo es reunir una información cuantitativa concerniente
a individuos, grupos, series de hechos, etc. y deducir de ello gracias al análisis de estos datos
unos significados precisos o unas previsiones para el futuro.
Importancia de la Estadística.
Los métodos estadísticos tradicionalmente se utilizan para propósitos descriptivos, para
organizar y resumir datos numéricos. La estadística descriptiva, por ejemplo trata de la
tabulación de datos, su presentación en forma gráfica o ilustrativa y el cálculo de medidas
descriptivas.
Ahora bien, las técnicas estadísticas se aplican de manera amplia
en mercadotecnia, contabilidad, control de calidad y en otras actividades; estudios de
consumidores; análisis de resultados en deportes; administradores de instituciones; en la
educación; organismos políticos; médicos; y por otras personas que intervienen en la toma de
decisiones.
Métodos estadísticos
El proceso que sigue la estadística descriptiva para el estudio de una cierta población consta
de los siguientes pasos:
Selección de caracteres dignos de ser estudiados.
Mediante encuesta o medición, obtención del valor de cada individuo en los caracteres
seleccionados.
3. Elaboración de tablas de frecuencias, mediante la adecuada clasificación de los individuos
dentro de cada carácter.
Representación gráfica de los resultados (elaboración de gráficas estadísticas).
Obtención de parámetros estadísticos, números que sintetizan los aspectos más relevantes de
una distribución estadística.
Aplicaciones de la Estadística
La estadística es un potente auxiliar de muchas ciencias y actividades humanas: sociología,
sicología, geografía humana, economía, etc..
La estadística está relacionada con el estudio de proceso cuyo resultado es más o menos
imprescindible y con la finalidad de obtener conclusiones para tomar decisiones razonables de
acuerdo con tales observaciones.
El resultado de estudio de dichos procesos, denominados procesos aleatorios, puede ser
de naturaleza cualitativa o cuantitativa y, en este último caso, discreta o continúa.
Son muchas las predicciones de tipo sociólogo, o económico, que pueden hacerse a partir de
la aplicación exclusiva de razonamientos probabilísticos a conjuntos de datos objetivos como
son, por ejemplo, los de naturaleza demográfica.
Las predicciones estadísticas, difícilmente hacen referencia a sucesos concretos, pero
describen con considerable precisión en el comportamiento global de grandes conjuntos de
sucesos particulares. Son predicciones que, en general, no acostumbran resultar útiles.
4. Para saber quién, de entre los miembros de una población importante, va a encontrar trabajo o
a quedarse sin él; o en cuales miembros va a verse aumentada o disminuida
una familia concreto en los próximos meses. Pero que, en cambio puede proporcionar
estimaciones fiables del próximo aumento o disminución de la tasa de desempleo referido al
conjunto de la población; o de la posible variación de os índices de natalidad o mortalidad.
Población:
Puesto que la estadística se ocupa de una gran cantidad de datos, debe primeramente definir
de cuáles datos se va a ocupar. El conjunto de datos de los cuales se ocupa un determinado
estudio estadístico se llama población.
No debe confundirse la población en sentido demográfico y la población en sentido
estadístico.
La población en sentido demográfico es un conjunto de individuos (todos los habitantes de un
país, todas las ratas de una ciudad), mientras que una población en sentido estadístico es un
conjunto de datos referidos a determinada característica o atributo de los individuos (las edades
de todos los individuos de un país, el color de todas las ratas de una ciudad). Incluso una
población en sentido estadístico no tiene porqué referirse a muchos individuos. Una población
estadística puede ser también el conjunto de calificaciones obtenidas por un individuo a lo largo
de sus estudios universitarios.
Muestra: Es un subconjunto de la población, preferiblemente representativo de la misma. Por
ejemplo, si la población es el conjunto de todas las edades de los estudiantes de la provincia
5. de Buenos Aires, una muestra será conjunto de edades de 2000 estudiantes de la provincia de
Buenos Aires tomados al azar.
TIPOS DE MUESTREO:
Muestreo probabilístico:
Consiste en elegir una muestra de una población al azar. Podemos distinguir varios tipos de
muestreo:
a. Muestreo aleatorio simple:
Para obtener una muestra, se numeran los elementos de la población y se seleccionan al azar
los n elementos que contiene la muestra.
b. Muestreo aleatorio sistemático:
- Se elige un individuo al azar y a partir de él, a intervalos constantes, se eligen los demás
hasta completar la muestra.
- Por ejemplo si tenemos una población formada por 100 elementos y queremos extraer una
muestra de 25 elementos, en primer lugar debemos establecer el intervalo de selección que será
igual a 100/25 = 4. A continuación elegimos el elemento de arranque, tomando aleatoriamente un
número entre el 1 y el 4, y a partir de él obtenemos los restantes elementos de la muestra. 2, 6,
10, 14, 9
c. Muestreo aleatorio estratificado:
Se divide la población en clases o estratos y se escoge, aleatoriamente, un número de
individuos de cada estrato proporcional al número de componentes de cada estrato.
6. En una fábrica que consta de 600 trabajadores queremos tomar una muestra de 20. Sabemos
que hay 200 trabajadores en la sección A, 150 en la B, 150 en la C y 100 en la D.
Un muestreo puede hacerse con o sin reposición, y la población de partida puede ser infinita o
finita.
En todo nuestro estudio vamos a limitarnos a una población de partida infinita o a muestreo
con reposición.
Si consideremos todas las posibles muestras de tamaño n en una población, para cada muestra
podemos calcular un estadístico (media, desviación típica, proporción,) que variará de una a otra.
Así obtenemos una distribución del estadístico que se llama distribución muestral.
Variable:
Una variable es una característica que al ser medida en diferentes individuos es susceptible de
adoptar diferentes valores.
a. Variables cualitativas:
Son las variables que expresan distintas cualidades, características o modalidad. Cada
modalidad que se presenta se denomina atributo o categoría y la medición consiste en una
clasificación de dichos atributos. Las variables cualitativas pueden ser dicotómicas cuando sólo
pueden tomar dos valores posibles como sí y no, hombre y mujer o son politómicas cuando
pueden adquirir tres o más valores. Dentro de ellas podemos distinguir:
b. Variable cualitativa ordinal o variable cuasi cuantitativa:
7. La variable puede tomar distintos valores ordenados siguiendo una escala establecida, aunque
no es necesario que el intervalo entre mediciones sea uniforme, por ejemplo: leve, moderado,
grave.
c. Variable cualitativa nominal:
En esta variable los valores no pueden ser sometidos a un criterio de orden como por ejemplo
los colores o el lugar de residencia.
d. Variables cuantitativas:
Son las variables que se expresan mediante cantidades numéricas. Las variables cuantitativas
además pueden ser:
e. Variable discreta:
Es la variable que presenta separaciones o interrupciones en la escala de valores que puede
tomar. Estas separaciones o interrupciones indican la ausencia de valores entre los distintos
valores específicos que la variable pueda asumir. Ejemplo: El número de hijos (1, 2, 3, 4, 5).
f. Variable continua:
Es la variable que puede adquirir cualquier valor dentro de un intervalo especificado de
valores. Por ejemplo la masa (2,3 kg, 2,4 kg, 2,5 kg,...) o la altura (1,64 m, 1,65 m, 1,66 m,...),
que solamente está limitado por la precisión del aparato medidor, en teoría permiten que siempre
exista un valor entre dos variables, también puede ser el dinero o un salario dado.
8. ESTADÍSTICA DESCRIPTIVA:
La estadística descriptiva analiza, estudia y describe a la totalidad de individuos de una
población. Su finalidad es obtener información, analizarla, elaborarla y simplificarla lo necesario
para que pueda ser interpretada cómoda y rápidamente y, por tanto, pueda utilizarse eficazmente
para el fin que se desee. El proceso que sigue la estadística descriptiva para el estudio de una
cierta población consta de los siguientes pasos:
- Selección de caracteres dignos de ser estudiados.
- Mediante encuesta o medición, obtención del valor de cada individuo en los caracteres
seleccionados.
- Elaboración de tablas de frecuencias, mediante la adecuada clasificación de los individuos
dentro de cada carácter.
- Representación gráfica de los resultados (elaboración de gráficas estadísticas).
- Obtención de parámetros estadísticos, números que sintetizan los aspectos más relevantes de
una distribución estadística.
ESTADÍSTICA INFERENCIAL:
La estadística descriptiva trabaja con todos los individuos de la población. La estadística
inferencial, sin embargo, trabaja con muestras, subconjuntos formados por algunos individuos de
la población. A partir del estudio de la muestra se pretende inferir aspectos relevantes de toda la
población. Cómo se selecciona la muestra, cómo se realiza la inferencia, y qué grado de
confianza se puede tener en ella son aspectos fundamentales de la estadística inferencial, para
9. cuyo estudio se requiere un alto nivel de conocimientos de:
estadística, probabilidad y matemáticas.
Distribución de frecuencias
Las distribuciones de frecuencias son tablas en que se dispone las modalidades de la variable
por filas. En las columnas se dispone el número de ocurrencias por cada valor, porcentajes, etc.
La finalidad de las agrupaciones en frecuencias es facilitar la obtención de la información que
contienen los datos.
Ejemplo: Quieren conocer si un grupo de individuos está a favor o en contra de la exhibición
de imágenes violentas por televisión, para lo cual han recogido los siguientes datos:
La inspección de los datos originales no permite responder fácilmente a cuestiones como cuál
es la actitud mayoritaria del grupo, y resulta bastante más difícil determinar la magnitud de la
diferencia de actitud entre hombres y mujeres.
Podemos hacernos mejor idea si disponemos en una tabla los valores de la variable
acompañados del número de veces (la frecuencia) que aparece cada valor:
X: Símbolo genérico de la variable.
f: Frecuencia (también se simboliza como ni).
La distribución de frecuencias de los datos del ejemplo muestra que la actitud mayoritaria de
los individuos del grupo estudiado es indiferente.
10. La interpretación de los datos ha sido facilitada porque se ha reducido el número de números
a examinar (en vez de los 20 datos originales, la tabla contiene 5 valores de la variable y 5
frecuencias).
Generalmente las tablas incluyen varías columnas con las frecuencias relativas (son el número
de ocurrencias dividido por el total de datos, y se simbolizan "fr" o "pi"), frecuencias acumuladas
(la frecuencia acumulada es el total de frecuencias de los valores iguales o inferiores al de
referencia, y se simbolizan "fa" o "na". No obstante, la frecuencia acumulada también es definida
incluyendo al valor de referencia), frecuencias acumuladas relativas (la frecuencia acumulada
relativa es el total de frecuencias relativas de los valores iguales o inferiores al de referencia, y se
simbolizan "fr" o "pa")
La distribución de frecuencias es:
La reducción de datos mediante el agrupamiento en frecuencias no facilita su interpretación:
La tabla es demasiado grande. Para reducir el tamaño de la tabla agrupamos los valores en
intervalos, y las frecuencias son las de los conjuntos de valores incluidos en los intervalos:
Ahora es más sencillo interpretar los datos. Por ejemplo, podemos apreciar inmediatamente
que el intervalo con mayor número de datos es el 34-39, o que el 75% de los datos tiene valor
inferior a 46.
Este tipo de tabla es denominado "tabla de datos agrupados en intervalos".
Elementos básicos de las tablas de intervalos:
Intervalo: Cada uno de los grupos de valores de la variable que ocupan una fila en una
distribución de frecuencias
11. Límites aparentes: Valores mayor y menor del intervalo que son observados en la tabla.
Dependen de la precisión del instrumento de medida. En el ejemplo, los límites aparentes del
intervalo con mayor número de frecuencias son 34 y 39.
Límites exactos: Valores máximo y mínimo del intervalo que podrían medirse si se contara
con un instrumento de precisión perfecta. En el intervalo 34-39, estos límites son 33.5 y 39.5
Punto medio del intervalo (Mco Marca de clase): Suma de los límites dividido por dos. Mc
del intervalo del ejemplo= 36.5
Amplitud del intervalo: Diferencia entre el límite exacto superior y el límite exacto inferior.
En el ejemplo es igual a 6.
Frecuencia absoluta
De un valor de la variable estadística X, es el número de veces que aparece ese valor en el
estudio. Se suele denotar por ni a la frecuencia absoluta del valor X = xi de la variable X. Dada
una muestra de N elementos, la suma de todas las frecuencias absolutas debe dar el total de la
muestra estudiada N.
Frecuencia relativa
(fi), es el cociente entre la frecuencia absoluta y el tamaño de la muestra (N). Es decir, siendo
el fi para todo el conjunto i. Se presenta en una tabla o nube de puntos en una distribución de
frecuencias. Si multiplicamos la frecuencia relativa por 100 obtendremos el porcentaje o tanto
por ciento (pi)
12. Frecuencia absoluta acumulada
(Ni), se refiere al total de las frecuencias absolutas para todos los eventos iguales o anteriores
que un cierto valor, en una lista ordenada de eventos.
Frecuencia relativa acumulada:
(Fi), es el cociente entre la frecuencia absoluta acumulada y el total de la muestra.
Ejemplos de frecuencias:
Supongamos que las calificaciones de un estudiante de secundaria fueran las siguientes:
18, 13, 12, 14, 11, 08, 12, 15, 05, 20, 18, 14, 15, 11, 10, 10, 11, 1 3. Entonces:
La frecuencia absoluta de 11 es 3, pues 11 aparece 3 veces.
La frecuencia relativa de 11 es 0.16, porque corresponde a la división 3/18 (3 de las veces que
aparece de las 18 notas que aparecen en total).
La frecuencia absoluta acumulada para el valor 11 es 7, porque hay 7 valores menores o
iguales a 11.
La frecuencia relativa acumulada para el valor 11 es 0.38, porque corresponde a la división
7/18 (frecuencia absoluta acumulada dividida entre el número total de muestras).