1. INSTITUTO UNIVERSITARIO POLITÉCNICO SANTIAGO
MARIÑO ESCUELA INGENIERÍA ELECTRÓNICA
SEDE BARCELONA, ANZOÁTEGUI
TERMINOS BASICOS EN ESTADISTICAS
PROFESOR BACHILLER
Carlos Hernández Julio Morales
BARCELONA, Octubre de 2015
2. Variable
Una variable es una propiedad que puede fluctuar y cuya variación es
susceptible de adoptar diferentes valores, los cuales pueden medirse u
observarse. Las variables adquieren valor cuando se relacionan con otras
variables, es decir, si forman parte de una hipótesis o de una teoría. En este
caso se las denomina constructos o construcciones hipotéticas.
Existen diferentes tipos de variables: -cuantitativa -cualitativa -cualitativa
discreta -cuantitativa discreta.
Tipos de Variables
Variables cuantitativas:
Son las variables que toman como argumento cantidades numéricas,
son variables matemáticas. Las variables cuantitativas además pueden ser:
Variable discreta: Es la variable que presenta separaciones o
interrupciones en la escala de valores que puede tomar. Estas
separaciones o interrupciones indican la ausencia de valores entre los
distintos valores específicos que la variable pueda asumir. Ejemplo: El
número de hijos (1, 2, 3, 4, 5).
Variable continua: Es la variable que puede adquirir cualquier valor dentro
de un intervalo especificado de valores. Por ejemplo la masa (2,3 kg,
2,4 kg, 2,5 kg,...) o la altura (1,64 m, 1,65 m, 1,66 m,...), o el salario.
Solamente se está limitado por la precisión del aparato medidor, en teoría
permiten que exista un valor entre dos variables.
Variables cualitativas:
Son el tipo de variables que como su nombre lo indica expresan distintas
cualidades, características o modalidad. Cada modalidad que se presenta se
denomina atributo o categoría, y la medición consiste en una clasificación de
dichos atributos. Las variables cualitativas puede ser dicotómicas cuando sólo
pueden tomar dos valores posibles, como sí y no, hombre y mujer o
ser politómicas cuando pueden adquirir tres o más valores. Dentro de ellas
podemos distinguir:
Variable cualitativa ordinal o variable cuasicuantitativa: La variable
puede tomar distintos valores ordenados siguiendo una escala establecida,
aunque no es necesario que el intervalo entre mediciones sea uniforme, por
ejemplo: leve, moderado, fuerte.
3. Variable cualitativa nominal: En esta variable los valores no pueden ser
sometidos a un criterio de orden, como por ejemplo los colores.
Población y Muestra
Población: Representa todas las unidades de la investigación que se estudia
de acuerdo a la naturaleza del problema, es decir, la suma total de las
unidades que se van a estudiar, las cuales deben poseer características
comunes dando origen a la investigación. Arias (1999), señala que “es el
conjunto de elementos con características comunes que son objetos de
análisis y para los cuales serán válidas las conclusiones de la
investigación”. Por ejemplo población de niños en edad escolar.
Muestra: Es una parte de la población, o sea, un número de individuos u
objetos seleccionados científicamente, cada uno de los cuales es un elemento
del universo. Para Balestrini (1997), La muestra “es obtenida con el fin de
investigar, a partir del conocimiento de sus características particulares, las
propiedades de una población”. Por ejemplo muestra de población de niños en
primer grado de primaria.
Parámetros Estadísticos
Los parámetros estadísticos son una consecuencia inevitable del propósito
esencial de la estadística: crear un modelo de la realidad.
El estudio de una gran cantidad de datos individuales de una población puede
ser farragoso e inoperativo, por lo que se hace necesario realizar un resumen
que permita tener una idea global de la población, compararla con otras,
comprobar su ajuste a un modelo ideal, realizar estimaciones sobre datos
desconocidos de la misma y, en definitiva, tomar decisiones. A estas tareas
contribuyen de modo esencial los parámetros estadísticos.
Por ejemplo, suele ofrecerse como resumen de la juventud de una población la
media aritmética de las edades de sus miembros, esto es, la suma de todas
ellas, dividida por el total de individuos que componen tal población.
4. Escalas de Medición
La medición es un proceso inherente y consustancial a toda investigación sea
esta cualitativa o cuantitativa. Medimos principalmente variables y ello
demanda considerar tres elementos básicos: el instrumento de medición, la
escala de medición y el sistema de unidades de medición. La validez,
consistencia y confiabilidad de los datos medidos dependen, en buena parte,
de la escala de medición que se adopte. He ahí la importancia de profundizar
en el tema de las escalas de medición.
Escalas o Niveles de medición:
Muchas personas tienen noción errónea acerca de la naturaleza de la
medición. La medición incluye la evaluación, un proceso mediante el cual las
cosas se diferencian. No está limitada al uso de instrumentos altamente
desarrollados y refinados. Desde luego, termómetros, metros y cronómetros
pueden utilizarse para medir de precisa temperatura, distancia y tiempo. Sin
embargo, esas variables pueden también medirse de manera informal
mediante la observación por el ojo entrenado u ojo clínico. Se dice que
impresores expertos usando solo la vista y el tacto son capaces de evaluar
(medir) el grosor de una película de tinta con un grado de precisión increíble:
millonésimas de pulgadas. Los sentidos son nuestros metros para evaluar el
medio que nos rodea. Cuando esas observaciones se expresan utilizando el
lenguaje de los números, el proceso de medición se ha completado. En efecto,
hay una correspondencia estrecha entre la madurez científica de una disciplina
y el grado con el cual las variables relevantes de esa disciplina pueden medirse
de manera objetiva y precisa.
Por ejemplo, la medición en las ciencias sociales y en la educación
generalmente produce números, pero estos están sin algunas de las
propiedades matemáticas para la medición de variables como el tiempo,
distancia, área, peso o costo. Así, la escala de medición para evaluar el
coeficiente intelectual (CI), difiere en forma significativa de la usada para medir
la estatura de una persona. Esto es importante debido a que en la
interpretación de un valor influye la escala de medición correspondiente.
Una escala de medición es el conjunto de los posibles valores que una cierta
variable pueda tomar. Es un continuo de valores ordenados correlativamente,
que admite un punto inicial y otro final. El nivel en que una variable puede ser
medida determina las propiedades de medición de una variable, el tipo de
5. operaciones matemáticas que puede usarse apropiadamente con dicho nivel,
las formulas y procedimientos estadísticos que se utilizan para el análisis de
datos y la prueba de hipótesis teóricas.
Las escalas o niveles de medición se utilizan para medir variables o atributos.
Por lo general, se distinguen cuatro escalas o niveles de medición: nominal,
ordinal, intervalos y escalas de proporción, cociente o razón. Las dos primera
(nominal y ordinal) se conocen como escalas categóricas y las dos ultimas
(intervalo y razón) como escalas numéricas. Las escalas categóricas se usan
comúnmente para variables cualitativas, mientras que las numéricas son
adecuadas para la medición de variables cuantitativas.
Tipos de Escalas de Medición
Escala Nominal: Utiliza los números para identificar que un dato pertenece a
un grupo o a una categoría. Es aquella escala que no presenta un orden o
dimensión particular, son observaciones que pueden clasificarse o contarse.
En el análisis de datos resulta más sencillo asignar a ciertos atributos
“etiquetas” numéricas en lugar de utilizar datos complejos. Por ello podemos
utilizar un “1” para designar a las mujeres y un “2” para designar a los hombres,
sin que ninguno de los números represente más o menos, solamente con el
objetivo de distinguir y organizar datos.
En esta escala cada persona u objeto debe pertenecer a una y solamente una
de las categorías que tienen y el conjunto de estas categorías debe ser
exhaustivo; es decir, tiene que contener a todos los casos posibles.
Escala Ordinal: En esta escala los números representan una clasificación
(mayor que o menor que), sin que represente una unidad de medida, quedando
implícito que un número de mayor cantidad tiene más alto grado de atributo
medido en comparación de un número menor. Se establece una gradación u
orden natural para las categorías, cada uno de los datos puede localizarse
dentro de alguna de las categorías disponibles.
Escala de Intervalo: En esta escala además del “mayor que” y el “menor que”
también se establece una unidad de medida que nos permite precisar cuánto
se es mayor o menor. La unidad de medición es arbitraria, el cero es
convencional y pueden existir cantidades negativas; la medición de la
temperatura y del coeficiente intelectual son ejemplos de este tipo de escala.
6. En esta escala se pueden hacer comparaciones por medio de diferencias o de
sumas, sin embargo no se admiten comparaciones por medio de
multiplicaciones, divisiones o porcentajes pues carecen de sentido.
Escala de Razón: Similar a la escala de intervalo, pero tiene un cero absoluto
y por ello los múltiplos de los valores de la escala serán significativos; el nivel
de votos en una elección sería un buen ejemplo de una escala de medición de
razón.
Razón
Es la comparación, a través de una división, de dos grupos de individuos con
atributos de diferente naturaleza. Es la forma más simple de mostrar
desigualdades entre grupos. Continuando con otro ejemplo hipotético, se han
atendido a 1,200 pacientes con diabetes en el Servicio de Urgencias, 900 de
ellos fueron mujeres y 300 hombres. En la división puede considerarse como
numerador cualquiera de los valores. De ahí que 900/300 = 3, por lo que la
relación entre mujeres y hombres con respecto a diabetes mellitus que
acudieron al Servicio de Urgencias fue de 3 mujeres por cada hombre.
Por ejemplo, si en un salón de clases tenemos 24 niñas y 18 niños, entonces lo
representaremos de alguna de las siguientes formas:
24/18
24:18
Y como la fracción podemos simplificarla al dividirla entre 6, entonces
tendremos:
4/3
4:3
Y se lee que existe una razón de 4 a 3, o de 4 por cada 3.
Cada uno de los valores de una razón tiene un nombre. El valor que está del
lado izquierdo de la relación, se le llama antecedente, y al valor del lado
derecho se le llama consecuente.
En este caso, la relación de niñas respecto a los niños es una relación de 4 a 3,
o de 4 niñas por cada 3 niños.
7. Proporciones
La proporción es la medida de estadística descriptiva que más se usa. Es el
número de observaciones con una característica en particular entre la
población de referencia. El numerador siempre está incluido en el
denominador. Se expresa en porcentaje. Las medidas de proporción utilizadas
en la práctica clínica para describir la enfermedad son la prevalencia y la
incidencia. La prevalencia es el número de casos existentes de una
enfermedad en particular entre la población de referencia. Por ejemplo: la
prevalencia de pacientes con cáncer de próstata diagnosticados en el Servicio
de Urología en el 2004 sería: Prevalencia = No. de pacientes con cáncer de
próstata: 75 Total de pacientes del Servicio de Urología: 1,500 75/1500= 0.05.
Generalmente la fracción resultante se multiplica por 100, debido a que la
probabilidad es de 0 a 100 y se expresa en porcentaje. Esto es, la prevalencia
de pacientes con cáncer de próstata diagnosticados en el Servicio de Urología
durante el 2004 fue de 5%; dicho de otra manera, aproximadamente 5 de cada
100 pacientes que acuden al Servicio de Urología son diagnosticados con
cáncer de próstata. La incidencia, a diferencia de la prevalencia, es el número
de casos nuevos que se presentan de una enfermedad en particular dividida
entre la población libre de la enfermedad al inicio del seguimiento. Incidencia:
Número de casos nuevos Población libre de la enfermedad al inicio del periodo
de seguimiento Ejemplo: Se pretende estimar la incidencia de infección de sitio
quirúrgico en cirugías electivas en un hospital de segundo nivel. A lo largo del
trimestre se presentaron 25 casos nuevos de infección de sitio quirúrgico y en
ese mismo periodo se realizaron 789 cirugías. Incidencia: No. de casos nuevos
de infección de sitio quirúrgico Población expuesta a cirugía electiva = (25)
(789) x 100 = 3.17% es decir, durante el trimestre, de cada 100 pacientes que
se operaron, aproximadamente 3 desarrollaron infección de sitio quirúrgico.
8. Tasa
La tasa es la medida de frecuencia que da cuenta de la velocidad de cambio en
la población, de estar sana a pasar al estado enfermo, o del estado de enfermo
a sano. La tasa es la comparación, a través de una división, entre el número de
veces que se presenta una enfermedad, o el evento estudiado, en un periodo
determinado, entre el tiempo-persona o tiempo poblacional, que es la expresión
con la que cada individuo contribuye libre de la enfermedad, o del evento, en el
tiempo de seguimiento. Por ejemplo, se pretende estimar la tasa de
recuperación de los pacientes operados de colecistectomía por invasión
mínima. Se siguió a 10 pacientes durante 7 días. Se construye un cuadro con
la evolución de los pacientes en días, se realiza la suma de los días que
tardaron en recuperarse, se divide e 2l número de pacientes recuperados (9
pacientes) entre la sumatoria de los días-persona. La fracción se multiplica por
1,000 días persona, ya que la tasa se expresa en múltiplos de mil. Tasa de
recuperación = 9/33.5 días persona = 0.269 x 1,000 días persona = 269. La
interpretación es que si se siguiera a 1,000 pacientes post-operados de
colecistectomía con cirugía de invasión mínima en un día, se recuperarían 269.
La tasa debe describirse de acuerdo a la unidad de tiempo que puede ser día,
mes o año. El paciente número 8 no se recuperó, pero se contaron los 7 días
de contribución sin recuperación.
9. Frecuencia
Cada variable estadística X puede tomar distintos valores. En una muestra (x1,
x2,...,xN) se denomina frecuencia del valor X = x a la cantidad de veces que se
repite el valor x de la variable en la muestra.
Se suelen representar con histogramas y diagramas de Pareto.
Tipos de Frecuencia
Frecuencia absoluta: de un valor de la variable estadística X es el número de veces
que aparece ese valor en el estudio. Se suele denotar por Fi la frecuencia absoluta del
valor X = xi de la variable X. Dada una muestra de N elementos, la suma de todas las
frecuencias absolutas debe dar el total de la muestra estudiada N.
Frecuencia relativa: (fi), es el cociente entre la frecuencia absoluta y el tamaño de la
muestra (N). Es decir,
Siendo el fi para todo el conjunto i. Se presenta en una tabla o nube de puntos en
una distribución de frecuencias.
Si multiplicamos la frecuencia relativa por 100 obtendremos el porcentaje o tanto por
ciento (pi)
Frecuencia absoluta acumulada: (Ni), es el número de veces ni en la muestra N.
Frecuencia relativa acumulada: (Fi), es el cociente entre la frecuencia absoluta
acumulada y el total de la muestra.
Supongamos que las calificaciones de un estudiante de secundaria fueran las
siguientes:
18, 13, 12, 14, 11, 08, 12, 15, 05, 20, 18, 14, 15, 11, 10, 10, 11, 13. Entonces:
La frecuencia absoluta de 11 es 3, pues 11 aparece 3 veces.
La frecuencia relativa de 11 es 0.17, porque corresponde a la división 3/18 (3
de las veces que aparece de las 18 notas que aparecen en total).