Variables estadísticas y parámetros en análisis de datos
1. Instituto Universitario de Tecnología
“Antonio José de Sucre”
Extensión Barcelona – Puerto la Cruz
Bachiller:
Richard Figuera C.I: 14.580.373
Puerto La Cruz, 23 de mayo de 2016
Profesora
Ranielina Rondón Mejias
2. DEFINICION DE VERIABLE
Es la expresión simbólica representativa de un elemento no
especificado comprendido en un conjunto. Este conjunto
constituido por todos los elementos o variables, que pueden
sustituirse unas a otras es el universo de variables. Se llaman así
porque varían, y esa variación es observable y medible.
3. TIPOS DE VARIABLES
1.Variable cualitativa
Las variables cualitativas se refieren a características o cualidades que no pueden ser
medidas con números. Podemos distinguir dos tipos:
Variable cualitativa nominal
Una variable cualitativa nominal presenta modalidades no numéricas que no admiten
un criterio de orden. Por ejemplo:
El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado
y viudo.
Variable cualitativa ordinal o variable cuasi cuantitativa
Una variable cualitativa ordinal presenta modalidades no numéricas, en las que existe
un orden. Por ejemplo:
La nota en un examen: suspenso, aprobado, notable, sobresaliente.
2. Variable cuantitativa
Una variable cuantitativa es la que se expresa mediante un número, por tanto se
pueden realizar operaciones aritméticas con ella. Podemos distinguir dos tipos:
Variable discreta
Una variable discreta es aquella que solo puede tomar un número finito de valores
entre dos valores cualesquiera de una característica.
El número de hermanos de 5 amigos: 2, 1, 0, 1, 3.
Variable continúa
Una variable continua es aquella que puede tomar un número infinito de valores entre
dos valores cualesquiera de una característica.
La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75.
En la práctica medimos la altura con dos decimales, pero también se podría dar con
tres decimales.
4. POBLACION
Es la colección de datos que corresponde a las características
de la totalidad de individuos, objetos, cosas o valores en un
proceso de investigación.
Ejemplo: Los aspirantes a un puesto de trabajo, los vendedores de
una empresa. Mientras que las hipotéticas, son las formas
imaginables en que se podría presentar un suceso. Ejemplo:
Estimaciones de la población económicamente activa dentro de diez
años.
5. MUESTRA
Es un subconjunto de casos o individuos de una población estadística. En
diversas aplicaciones interesa que una muestra sea una muestra
representativa y para ello debe escogerse una técnica de muestreo adecuada
que produzca una muestra aleatoria adecuada (contrariamente se obtiene
una muestra sesgada cuyo interés y utilidad es más limitado dependiendo del
grado de sesgo que presente). La muestra es por lo tanto el grupo al que se le
aplican las pruebas.
Se tiene una población de 222.222 habitantes y se quiere conocer cuántos de
ellos son hombres y cuántos de ellos son mujeres. Se conjetura que cerca del
50% son mujeres y el resto hombres, pero se quiere seleccionar una muestra
para determinar cuántos hombres y mujeres hay en la muestra y a partir de ahí
inferior el porcentaje exacto de hombres y mujeres en la población total. La
descripción de una muestra, y los resultados obtenidos sobre ella, puede ser del
tipo mostrado en el siguiente ejemplo:
6. Dimension de la población : 222.222 habitantes
Probabilidad del evento: Hombre o Mujer 50%
Nivel de confianza : 90%
Desviación tolerada: 5%
Resultado 196
Tamaño de la muestra: 270
La interpretación de esos datos sería la siguiente:
•La población a investigar tiene 222.222 habitantes y queremos
saber cuántos son hombres o mujeres.
•Estimamos en un 50% para cada sexo y para el propósito del
estudio es suficiente un 90% de seguridad con un nivel entre 90 - 5
y 90 + 5.
•Generamos una tabla de 280 números al azar entre 1 y 222.222 y
en un censo numerado comprobamos el género para los
seleccionados.
7. PARAMETROS ESTADISTICOS
Es un número que resume la gran cantidad de datos que pueden derivarse del estudio
de una variable estadística. El cálculo de este número está bien definido, usualmente
mediante una fórmula aritmética obtenida a partir de datos de la población.
Por ejemplo, suele ofrecerse como resumen de la juventud de una población la media
aritmética de las edades de sus miembros, esto es, la suma de todas ellas, dividida por
el total de individuos que componen tal población.
ESCALA DE MEDICION
Es una clasificación acordada con el fin de describir la naturaleza de la información
contenida dentro de los números asignados a los objetos y, por lo tanto, dentro de una
variable. Según la teoría de las escalas de medida, varias operaciones matemáticas
diferentes son posibles dependiendo del nivel en el cual la variable se mide.
8. SUMATORIA RAZON
Es el cociente entre dos números, en el que ninguno o sólo algunos
elementos del numerador están incluidos en el denominador. El rango es de
0 a infinito.
Ejemplos:
En el año 2002, según el Centro Nacional de Epidemiología se declararon
los siguientes casos de legionelosis:
1. Legionelosis adquirida en la comunidad/legionelosis nosocomiales= 372/29= 12,8. Por cada caso de
legionelosis nosocomial hay 12,8 casos comunitarios.
2. Defunciones por legionelosis adquirida en la comunidad/defunciones por legionelosis
nosocomiales= 9/5= 1,8. Por cada defunción por legionelosis nosocomial hay 1,8 defunciones por
legionelosis adquirida en la comunidad.
Veamos la relación (hombres / mujeres) de 25 a 44 años, con un IMC >=30 -> Obesidad
Podemos interpretar que por cada mujer de 25 a 44 años que padece obesidad en el año 2006, hay 1,319
hombres del mismo rango de edad con el mismo problema de salud en dicho periodo.
Si miramos los adultos de más de 18 años que padecen obesidad y sacamos la proporción entre hombres y
mujeres, obtendremos que la razón disminuye:
9. TASA
La tasa es una forma especial de proporción o de razón que tiene en cuenta el tiempo. Es una medida
que relaciona el cambio de una magnitud por unidad de cambio en otra magnitud (por regla general,
tiempo). La utilización de las tasas es esencial para comparar experiencias entre poblaciones en
diferentes tiempos, diferentes lugares o entre diferentes tipos de personas. Su rango oscila entre 0 e
infinito y su medida es tiempo-¹.
Ejemplos
Cociente entre el número de casos de TBC en varones durante el años 2005 y la población estimada
de varones en el año 2005:
135/516.329=0,000261 La tasa es de 26,1 casos de TBC por cada 100.000 habitantes varones en 1
año (2005).
Cociente entre los casos de defunción por TBC y la población estimada en el año 2005:
8/1076635=0,000007 La tasa de mortalidad es de 0,7 por 100.000 habitantes en 1 año.
FRECUENCIA
Es un cociente en el que el numerador está incluido en el denominador. Una proporción no es más que
la expresión de la probabilidad de que un suceso ocurra.
El rango está comprendido entre 0 y 1 o bien en términos porcentuales de 0% a 100%, y no tiene
dimensión.
Ejemplos
Cociente entre el número de casos ocurridos en varones y el total de casos en el año 2005.
135/188=0,72 El 72% de los casos han ocurrido en varones.
Cociente entre el número de casos ocurrido en individuos con más de 65 años y el total de casos en el
año 2005.
77/188=0,41 El 41% de los casos se han detectado en personas mayores de 65 años.