Este documento presenta conceptos básicos de estadística como variables, tipos de variables cualitativas y cuantitativas, población y muestra, parámetros y estadísticos. Explica las escalas de medición nominal, ordinal, de intervalo y razón. También define términos como razón, proporción, tasa y frecuencia estadística. El documento proporciona ejemplos para ilustrar cada concepto.
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
Variables estadísticas y tipos de variables
1. Republica Bolivariana de Venezuela
Ministerio de Poder Popular para la Educación
Instituto Universitario Politécnico Santiago Mariño
Extensión Barcelona
Escuela: Ingeniería en Mantenimiento Mecánico
Cátedra: Estadística 1
Términos Básicos en Estadística
Profesor: Bachiller:
Ramón Aray Enrique Beltran
C.I: 25.687.801
Barcelona, Junio de 2016
2. Una variable estadística es una propiedad que puede fluctuar y
cuya variación es susceptible de adoptar diferentes valores, los
cuales pueden medirse u observarse. Las variables adquieren valor
cuando se relacionan con otras variables, es decir, si forman parte
de una hipótesis o de una teoría. En este caso se las
denomina constructos o construcciones hipotéticas.
Variable:
4. Variables cualitativas:
Son el tipo de variables que como su nombre lo indica expresan distintas
cualidades, características o modalidad. Cada modalidad que se presenta se
denomina atributo o categoría, y la medición consiste en una clasificación de
dichos atributos. Las variables cualitativas pueden ser dicotómicas cuando
sólo pueden tomar dos valores posibles, como sí y no, hombre y mujer o
ser politómicas cuando pueden adquirir tres o más valores. Dentro de ellas
podemos distinguir:
Variable cualitativa ordinal o variable casi cuantitativa: La
variable puede tomar distintos valores ordenados siguiendo una
escala establecida, aunque no es necesario que el intervalo entre
mediciones sea uniforme, por ejemplo: leve, moderado, fuerte.
Variable cualitativa nominal: En esta variable los valores no
pueden ser sometidos a un criterio de orden, como por ejemplo los
colores.
5. Variables cuantitativas:
Variable discreta: Es la variable que presenta separaciones o
interrupciones en la escala de valores que puede tomar. Estas
separaciones o interrupciones indican la ausencia de valores
entre los distintos valores específicos que la variable pueda
asumir. Ejemplo: El número de hijos (1, 2, 3, 4, 5).
Variable continua: Es la variable que puede adquirir cualquier
valor dentro de un intervalo especificado de valores. Por ejemplo
la masa (2,3 kg, 2,4 kg, 2,5 kg,...) o la altura (1,64 m, 1,65 m,
1,66 m,...), o el salario. Solamente se está limitado por la
precisión del aparato medidor, en teoría permiten que exista un
valor entre dos variables.
Son las variables que toman como argumento cantidades
numéricas, son variables matemáticas. Las variables
cuantitativas además pueden ser:
6. Población:
Es la colección de datos que corresponde a las características
de la totalidad de individuos, objetos, cosas o valores en un
proceso de investigación.
Para su estudio, en general se clasifican en Poblaciones Finitas y
Poblaciones Infinitas.
Poblaciones Finitas: Constan de un número determinado de
elementos, susceptible a ser contado. Ejemplo: Los empleados de
una fábrica, elementos de un lote de producción, etc.
Poblaciones Infinitas: Tienen un número indeterminado de
elementos, los cuales no pueden ser contados. Ejemplo: Los
números naturales.
7. Muestra:
“Es una parte representativa de la población
que es seleccionada para ser estudiada, ya
que la población es demasiado grande para
ser estudiada en su totalidad” Allen Webster.
Ya que se ha definido que es población y muestra, se procede a
definir dos conceptos que se encuentran íntimamente relacionados
a ellos:
Parámetro: Son las medidas o características descriptivas
inherentes a las poblaciones. Los salarios promedio de todos los
empleados de una empresa, puede ser un ejemplo de parámetro.
Estadístico o Estadígrafo: Son las medidas descriptivas inherentes
a una muestra, las cuales pueden usarse como estimación del
parámetro. Como ejemplo podría tomarse los salarios promedio de
una muestra de los empleados de la empresa.
8. Los 10 ejemplos de población y muestra de población son:
1.- Población mexicana en general; muestra, población de
mujeres mexicanas, menores de 35 años.
2.- Población de libros de una biblioteca; muestra, población de
libros en la sección de historia.
3.- Población de niños en edad escolar; muestra, población de
niños en primer grado de primaria.
4.- Población Densidad de estrellas en el universo; muestra,
densidad de estrellas en la vía láctea.
5.- Personas hospitalizadas en el año 2014; muestra, personas
hospitalizadas por accidente en 2014.
6.- Población de árboles de un bosque; muestra, la población de
abedules de una zona delimitada, dentro de ese bosque.
7.- Población de ganado vacuno en una granja; muestra, fracción
de vacas que pesan más de 700 kilos.
8.- Población de gatos de una ciudad; muestra, gatos vacunados
dentro de la misma ciudad.
9.- Población (productos), construidos en una fábrica; muestra,
cierta cantidad de productos tomados aleatoriamente, para revisar
su calidad.
10.- Población de conejos en una granja, muestra, cierta cantidad
de animales, representativa de los animales aptos para la cría.
9. Parámetro estadístico:
En estadística, un parámetro es un número que resume la gran
cantidad de datos que pueden derivarse del estudio de una variable
estadística. El cálculo de este número está bien definido,
usualmente mediante una fórmula aritmética obtenida a partir
de datos de la población.
Los parámetros estadísticos son una consecuencia inevitable del
propósito esencial de la estadística: crear un modelo de la realidad.
El estudio de una gran cantidad de datos individuales de una
población puede ser farragoso e inoperativo, por lo que se hace
necesario realizar un resumen que permita tener una idea global de
la población, compararla con otras, comprobar su ajuste a un
modelo ideal, realizar estimaciones sobre datos desconocidos de la
misma y, en definitiva, tomar decisiones. A estas tareas contribuyen
de modo esencial los parámetros estadísticos.
Por ejemplo, suele ofrecerse como resumen de la juventud de una
población la media aritmética de las edades de sus miembros, esto
es, la suma de todas ellas, dividida por el total de individuos que
componen tal población.
10. Escalas de medición:
El proceso de asignar un valor numérico a una variable se llama
medición. Las escalas de medición sirven para ofrecernos
información sobre las clasificaciones que podemos hacer con
respecto a las variables (discretas o continuas).
Cuando se mide una variable el resultado puede aparecer en
uno de cuatro diversos tipos de escalas de medición; nominal,
ordinal, intervalo y razón.
Conocer la escala a la que pertenece una medición es
importante para determinar el método adecuado para describir y
analizar esos datos.
11. Escala ordinal:
En esta escala los números representan una clasificación (mayor
que o menor que), sin que represente una unidad de medida,
quedando implícito que un número de mayor cantidad tiene más
alto grado de atributo medido en comparación de un número
menor. Se establece una gradación u orden natural para las
categorías, cada uno de los datos puede localizarse dentro de
alguna de las categorías disponibles.
Ejemplo:Las medidas pequeño, mediano y grande para dar el tamaño de
un objeto son datos ordinales no numéricos.
Escala nominal:
Utiliza los números para identificar que un dato pertenece a un
grupo o a una categoría. Es aquella escala que no presenta un
orden o dimensión particular, son observaciones que pueden
clasificarse o contarse.
Ejemplo:El sexo de una persona es un dato nominal no numérico. El
numero de seguro social de una persona es un dato nominal numérico.
12. Escala de razón:
Similar a la escala de intervalo, pero tiene un cero absoluto y por
ello los múltiplos de los valores de la escala serán significativos; el
nivel de votos en una elección sería un buen ejemplo de una
escala de medición de razón.
Ejemplo:Variables como la distancia, la altura, el peso y el tiempo se
miden con una escala de razón.
Escala de intervalo:
En esta escala además del “mayor que” y el “menor que” también
se establece una unidad de medida que nos permite precisar
cuanto se es mayor o menor. La unidad de medición es arbitraria,
el cero es convencional y pueden existir cantidades negativas; la
medición de la temperatura y del coeficiente intelectual son
ejemplos de este tipo de escala.
Ejemplo:Las mediciones de temperatura son datos de intervalo. Suponga
que la temperatura en un lugar es de 21°C y en otro es de 4°C. Estos
lugares se pueden jerarquizar de acuerdo con lo calurosos que son: el
primero es más caliente que el segundo. La unidad fija de medición, 1°C ,
permite decir cuán más caliente es el primer lugar: 17°C .
13. La Razón:
es el cociente entre dos números, en el que ninguno o sólo algunos
elementos del numerador están incluidos en el denominador. El
rango es de 0 a infinito.
Ejemplos:
En el año 2002, según el Centro Nacional de Epidemiología se
declararon los siguientes casos de legionelosis:
Comunitario Nosocomial Total
Casos Defunciones Casos Defunciones Casos Defunciones
372 9 29 5 401 14
1. Legionelosis adquirida en la comunidad/legionelosis
nosocomiales= 372/29= 12,8. Por cada caso de legionelosis
nosocomial hay 12,8 casos comunitarios.
2. Defunciones por legionelosis adquirida en la
comunidad/defunciones por legionelosis nosocomiales= 9/5=
1,8. Por cada defunción por legionelosis nosocomial hay 1,8
defunciones por legionelosis adquirida en la comunidad.
14. La proporción:
es una razón en la cual los elementos del numerador están incluidos
en el denominador.
Se utiliza como estimación de la probabilidad de un evento. El rango
es de 0 a 1, o de 0 a 100%.
Ejemplos (tomando los datos de la tabla de arriba):
1. Casos de legionelosis comunitarias en relación al total del año
2002= 372/401= 0,93* 100= 93%.
El 93% de las legionelosis declaradas en España en 2002 fueron
adquiridas en la comunidad.
2. Defunciones por legionelosis comunitarias en relación al total de
las defunciones por
legionelosis del año 2002= 9/14= 0,64* 100= 64%. El 64% de las
defunciones por legionelosis
declaradas en España en 2002 fueron por legionella adquirida en la
comunidad.
15. La tasa:
Es un tipo especial de razón o de proporción que incluye una medida de tiempo en el
denominador. Está asociado con la rapidez de cambio de un fenómeno por unidad de
una variable (tiempo,temperatura, presión). Los componentes de una tasa son el
numerador, el denominador, el tiempo específico en el que el hecho ocurre, y
usualmente un multiplicador, potencia de 10, que convierte una fracción o decimal en un
número entero.
Según el Instituto Nacional de Estadística, en el año 2002 se encontraba censada en
España una población de 41.837.894 personas.
Ejemplos (ver datos de la tabla):
1. Tasa de legionelosis en el año 2002 en España= 401/41.837.894 =0,96*10-5
(*100.000)= 0,96
personas padecieron legionelosis en el año 2002 en España por cada 100.000
habitantes.
2. Tasa de mortalidad por legionelosis en España en 2002= 14/41.837.894= 3,3*10-
7 (*100.000)= 0,033
personas fallecieron por legionelosis en España en 2002 por cada 100.000 habitantes.
16. Frecuencia estadística:
En estadística, la frecuencia (o frecuencia absoluta) de un
evento x, es el número de veces ni que dicho evento se repite
durante un experimento o muestra estadística.Comúnmente, la
distribución de la frecuencia suele visualizarse con el uso
de histogramas.
Ejemplos de frecuencias:
Supongamos que las calificaciones de un estudiante de secundaria
fueran las siguientes:
18, 13, 12, 14, 11, 08, 12, 15, 05, 20, 18, 14, 15, 11, 10, 10, 11, 13.
Entonces:
La frecuencia absoluta de 11 es 3, pues 11 aparece 3 veces.
La frecuencia relativa de 11 es 0.17, porque corresponde a la división
3/18 ( 3 de las veces que aparece de las 18 notas que aparecen en
total).
La frecuencia absoluta acumulada para el valor 11 es 7, porque hay 7
valores menores o iguales a 11.
La frecuencia relativa acumulada para el valor 11 es 0.38, porque
corresponde a la división 7/18 (frecuencia absoluta acumulada
dividida entre el número total de muestras).