Conceptos Básicos Estadísticos, con ejemplo. Variable, población y muestra, escala de medición, parámetros estadísticos,sumatoria, razón, proporción, tasa y frecuencia.
1. Instituto Universitario de Tecnología.
“Antonio José de Sucre.”
Extensión – Puerto La Cruz
Cátedra. Estadística I
(77)
Estadística
Profesora:
Ranielina
Rondón
Bachiller:
Stephany Briceño
C.I: 20343901
Puerto La Cruz, 31 de Mayo del 2016
2. Variable
Variable es una característica que al ser medida en
diferentes individuos es susceptible de adoptar diferentes valores.
Existen diferentes tipos de variables:
Variables cualitativas
Son las variables que expresan distintas cualidades,
características o modalidad. Cada modalidad que se presenta se
denomina atributo o categoría y la medición consiste en una
clasificación de dichos atributos. Las variables cualitativas
pueden ser dicotómicas cuando sólo pueden tomar dos valores
posibles como sí y no, hombre y mujer o son politómicas cuando
pueden adquirir tres o más valores. Dentro de ellas podemos
distinguir:
3. Variable cualitativa ordinal: También llamada variable
cuasicuantitativa. La variable puede tomar distintos valores
ordenados siguiendo una escala establecida, aunque no es necesario
que el intervalo entre mediciones sea uniforme.
Ejemplo: leve, moderado, grave.
Medallas de una prueba deportiva: oro, plata, bronce.
El grado de satisfacción de algo: Mucho, poco, nada. Bueno, regular,
malo.
Variable cualitativa nominal: En esta variable los valores no pueden
ser sometidos a un criterio de orden.
Ejemplo: Los colores o el lugar de residencia.
El estado civil, con las siguientes modalidades: soltero, casado,
separado, divorciado y viudo.
Profesión, Maestro, Doctor, Ingeniero, entre otras.
4. Variables cuantitativas
Son las variables que se expresan mediante cantidades numéricas. Las
variables cuantitativas además pueden ser:
Variable discreta: Es la variable que presenta separaciones o
interrupciones en la escala de valores que puede tomar. Estas
separaciones o interrupciones indican la ausencia de valores entre los
distintos valores específicos que la variable pueda asumir.
Ejemplo: El número de hijos (1, 2, 3, 4, 5).
Variable continua: Es la variable que puede adquirir cualquier valor
dentro de un intervalo especificado de valores.
Ejemplo: La masa (2.3 kg, 2.4 kg, 2.5 kg, ...) o la altura (1.64 m, 1.65
m, 1.66 m, ...), que solamente está limitado por la precisión del aparato
medidor, en teoría permiten que siempre exista un valor entre dos
variables.
5. Población y Muestra
Población:
Es la colección de datos que corresponde a las características
de la totalidad de individuos, objetos, cosas o valores en un proceso
de investigación.
Para su estudio, en general se clasifican en Poblaciones Finitas y
Poblaciones Infinitas.
- Poblaciones Finitas: Constan de un número determinado de
elementos, susceptible a ser contado. Ejemplo: Los empleados de una
fábrica, elementos de un lote de producción, etc.
- Poblaciones Infinitas: Tienen un número indeterminado de
elementos, los cuales no pueden ser contados. Ejemplo: Los números
naturales.
Así también las poblaciones pueden ser clasificadas en Reales e
Hipotéticas.
6. Las reales son aquellas concretas, que ya existen.
Ejemplo: Los aspirantes a un puesto de trabajo, los vendedores de
una empresa.
Mientras que las hipotéticas, son las formas imaginables en que se
podría presentar un suceso.
Ejemplo: Estimaciones de la población económicamente activa dentro
de diez años.
Muestra: “Es una parte representativa de la población que es
seleccionada para ser estudiada, ya que la población es demasiado
grande para ser estudiada en su totalidad” Allen Webster.
Ejemplo: Se quiere estudiar lo que van a votar los jovenes de 18 años
de toda Venezuela en las próximas elecciones. Se procede llamar a
100.000 números de jovenes de 18 años al azar.
Población: Todos los jovenes de 18 años de Venezuela.
Muestra: Los 100.000 jovenes a los que vas a preguntar.
7. Parámetros Estadísticos
Un parámetro estadístico es un número que se obtiene a partir de
los datos de una distribución estadística.
Los parámetros estadísticos sirven para sintetizar la información
dada por una tabla o por una gráfica.
Tipos de parámetros estadísticos
Hay tres tipos de parámetros estadísticos:
• De centralización.
• De posición
• De dispersión.
Medidas de centralización
Nos indican en torno a qué valor (centro) se distribuyen los datos.
La medidas de centralización son:
Media aritmética
La media es el valor promedio de la distribución.
8. Mediana
La mediana es la puntación de la escala que separa la mitad
superior de la distribución y la inferior, es decir divide la serie de
datos en dos partes iguales.
Moda
La moda es el valor que más se repite en una distribución.
Medidas de posición
Las medidas de posición dividen un conjunto de datos en grupos con el
mismo número de individuos.
Para calcular las medidas de posición es necesario que los datos estén
ordenados de menor a mayor.
La medidas de posición son:
Cuartiles
Los cuartiles dividen la serie de datos en cuatro partes iguales.
Deciles
Los deciles dividen la serie de datos en diez partes iguales.
Percentiles
Los percentiles dividen la serie de datos en cien partes iguales.
9. Medidas de dispersión
Las medidas de dispersión nos informan sobre cuanto se alejan del
centro los valores de la distribución.
Las medidas de dispersión son:
Rango o recorrido
El rango es la diferencia entre el mayor y el menor de los datos de
una distribución estadística.
Desviación media
La desviación media es la media aritmética de los valores
absolutos de las desviación es respecto a la media.
Varianza
La varianza es la media aritmética del cuadrado de las
desviaciones respecto a la media.
Desviación típica
La desviación típica es la raíz cuadrada de la varianza.
10. Escalas de Medición
El proceso de asignar un valor numérico a una variable se llama
medición. Las escalas de medición sirven para ofrecernos
información sobre las clasificaciones que podemos hacer con
respecto a las variables (discretas o continuas).
Cuando se mide una variable el resultado puede aparecer en uno de
cuatro diversos tipos de escalas de medición; nominal, ordinal,
intervalo y razón.
Conocer la escala a la que pertenece una medición es importante
para determinar el método adecuado para describir y analizar esos
datos.
Clasificación de las escalas de medición:
Escala nominal: Utiliza los números para identificar que un dato
pertenece a un grupo o a una categoría. Es aquella escala que no
presenta un orden o dimensión particular, son observaciones que
pueden clasificarse o contarse.
11. En el análisis de datos resulta más sencillo asignar a ciertos
atributos “etiquetas” numéricas en lugar de utilizar datos complejos.
Por ello podemos utilizar un “1” para designar a las mujeres y un “2”
para designar a los hombres, sin que ninguno de los números
represente más o menos, solamente con el objetivo de distinguir y
organizar datos.En esta escala cada persona u objeto debe pertenecer
a una y solamente una de las categorías que tienen y el conjunto de
estas categorías debe ser exhaustivo; es decir, tiene que contener a
todos los casos posibles.
Escala ordinal: En esta escala los números representan una
clasificación (mayor que o menor que), sin que represente una unidad
de medida, quedando implícito que un número de mayor cantidad tiene
más alto grado de atributo medido en comparación de un número
menor. Se establece una gradación u orden natural para las categorías,
cada uno de los datos puede localizarse dentro de alguna de las
categorías disponibles.
Escala de intervalo: En esta escala además del “mayor que” y el
“menor que” también se establece una unidad de medida que nos
permite precisar cuanto se es mayor o menor.
12. La unidad de medición es arbitraria, el cero es convencional y
pueden existir cantidades negativas; la medición de la temperatura y
del coeficiente intelectual son ejemplos de este tipo de escala.
En esta escala se pueden hacer comparaciones por medio de
diferencias o de sumas, sin embargo no se admiten comparaciones
por medio de multiplicaciones, divisiones o porcentajes pues carecen
de sentido.
Escala de razón: Similar a la escala de intervalo, pero tiene un cero
absoluto y por ello los múltiplos de los valores de la escala serán
significativos; el nivel de votos en una elección sería un buen ejemplo
de una escala de medición de razón.
13. Sumatoria
En estadística se requiere la suma de grandes masas de datos y es
pertinente tener una notación simplificada para indicar la suma de
estos datos. Así, si una variable se puede denotar por X, entonces las
observaciones sucesivas de esta variable se escriben.
X1+X2+X3+…+Xn
En general, la i-ésima observación se escribe X ; i=1, ..., n.
La letra griega sigma mayúscula (S ) se emplea para indicar la suma
de estas n observaciones.
= X1+X2+X3+…+Xn
14. La notación = X1+X2+X3+…+Xn se lee
Suma de X sub-i (ó sigma sub-i) donde i asume todos los valores de 1
hasta n, ó simplemente suma de X sub-i donde i va de 1 a n.
La letra debajo del operador S se llama índice de la suma; en la
expresión.
Note que el índice de la suma es i.
Ejemplo : Si X1 = 3; X2 = 9 ; X3 =11
Encontrar:
Solución:
15. Razón
Es la relación entre dos fenómenos independientes, el rango es de
cero a infinito positivo.
Por ejemplo: en un Hospital existen mil pacientes y un total de
cincuenta médicos, por lo cual se tiene una razón de 1000/50=20, en
otras palabras en el Hospital por cada médico existen 20 pacientes.
La fórmula de razones (ri) es:
ri=xi
n
16. Proporción
Es el cociente del número de veces que se presenta un valor o
característica con respecto al total de la muestra de la variable
en estudio.
Por ejemplo: en un estudio médico sobre el Alzheimer se
examinaron 280 mujeres y 220 hombres, entonces se puede notar
que:
Proporción (mujeres) = 280/500 = 0,56
Proporción (hombres) = 220/500 = 0,44
Es importante aclarar que las proporciones, se relacionan con
las frecuencias relativas simples; su rango, va desde cero
hasta uno (ambos inclusive), en otras palabras, el campo de
existencia de las proporciones se encuentra en el intervalo [0,1] y
la sumatoria de las proporciones es igual a uno.
17. La fórmula general de proporciones (Pi) es:
Pi= xi
n
Tasa
El concepto de tasa es similar al de una proporción, con la diferencia
de que las tasas llevan incorporado el concepto de tiempo. Las tasas
expresan la dinámica de un suceso en una población a lo largo del
tiempo. Se puede definir como la magnitud del cambio de una variable
(enfermedad o muerte) por unidad de cambio de otra (usualmente el
tiempo) en relación con el tamaño de la población que se encuentra en
riesgo de experimentar el suceso. En las tasas, el numerador expresa
el número de eventos sucedidos durante un periodo en un número
determinado de sujetos observados.
18. A diferencia de una proporción, el denominador de una tasa no expresa el
número de sujetos en observación, sino el tiempo durante el cual tales sujetos
estuvieron en riesgo de sufrir el evento. La unidad de medida empleada se
conoce como tiempo – persona de seguimiento u observación.
Dado que el periodo entre el inicio de la observación y el momento
en que aparece un evento puede variar de un individuo a otro, el
denominador de la tasa se estima a partir de la suma de los periodos
de todos los individuos. Las unidades de tiempo pueden ser horas,
días, meses o años, dependiendo de la naturaleza del evento que se
estudia.
El cálculo de tasas se realiza dividiendo el total de eventos
ocurridos en un periodo dado en una población entre el tiempo –
persona total (es decir, la suma de los periodos individuales libres
de la enfermedad) en el que los sujetos estuvieron en riesgo de
presentar el evento.
19. Las tasas se expresan multiplicando el resultado obtenido por una potencia
de 10, con el fin de permitir rápidamente su comparación con otras cosas.
Ejemplos:
La observación de 100 individuos en riesgo de padecer el evento
durante un año corresponde a 100 años – persona de seguimiento. De
manera similar, 10 sujetos observados durante 10 años corresponden
a 100 años – persona de seguimiento.
Si en una población la tasa de infarto al miocardio es 0,008 años-1, la
interpretación será que se producen ocho infartos por mil habitantes
al año.
Frecuencia
La frecuencia (o frecuencia absoluta) de un evento x, es el número
de veces ni que dicho evento se repite durante un experimento o
muestra estadística. Comúnmente, la distribución de la frecuencia
suele visualizarse con el uso de histogramas.
20. Tipos de frecuencia
En estadística se pueden distinguir hasta cuatro tipos de
frecuencias:
• Frecuencia absoluta: de un valor de la variable estadística X, es el
número de veces que aparece ese valor en el estudio. Se suele
denotar por Fi a la frecuencia absoluta del valor X = xi de la variable
X. Dada una muestra de N elementos, la suma de todas las
frecuencias absolutas debe dar el total de la muestra estudiada N.
• Frecuencia relativa: (fi), es el cociente entre la frecuencia
absoluta y el tamaño de la muestra (N). Es decir,
fi= ni/N = ni/∑i ni
siendo el fi para todo el conjunto i. Se presenta en una tabla o nube
de puntos en una distribución de frecuencias. Si multiplicamos la
frecuencia relativa por 100 obtendremos el porcentaje o tanto por
ciento (pi).
21. •Frecuencia absoluta acumulada: (Ni), se refiere al total de las
frecuencias absolutas para todos los eventos iguales o anteriores que
un cierto valor, en una lista ordenada de eventos.
•Frecuencia relativa acumulada: (Fi), es el cociente entre la
frecuencia absoluta acumulada y el total de la muestra.
Fi= Ni/N
Ejemplos de frecuencias:
Supongamos que las calificaciones de un estudiante de secundaria
fueran las siguientes:
18, 13, 12, 14, 11, 08, 12, 15, 05, 20, 18, 14, 15, 11, 10, 10, 11, 13.
Entonces:
• La frecuencia absoluta de 11 es 3, pues 11 aparece 3 veces.
• La frecuencia relativa de 11 es 0.17, porque corresponde a la
división 3/18 ( 3 de las veces que aparece de las 18 notas que
aparecen en total).
22. • La frecuencia absoluta acumulada para el valor 11 es 7, porque hay 7
valores menores o iguales a 11.
• La frecuencia relativa acumulada para el valor 11 es 0.38, porque
corresponde a la división 7/18 (frecuencia absoluta acumulada
dividida entre el número total de muestras).