c3.hu3.p1.p2.El ser humano y el sentido de su existencia.pptx
Términos básicos de estadística (variables, población, muestra, parámetro
1. REPÚBLICA BOLIVARIANA DE VENEZUELA
INSTITUTO UNIVERSITARIO POLITÉCNICO
“SANTIAGO MARIÑO”
EXTENSIÓN CARACAS
ASIGNATURA: ESTADISTICA
Julio Font C.I: 17.427.102
Términos Básicos (Estadística)
Caracas, 4 de Julio de 2016
2. Términos Básicos (Estadística)
Variables cuantitativas:
Son las variables que toman como argumento cantidades numéricas,
son variables matemáticas. Las variables cuantitativas además pueden ser:
Variable discreta: Es la variable que presenta separaciones o interrupciones
en la escala de valores que puede tomar. Estas separaciones o interrupciones
indican la ausencia de valores entre los distintos valores específicos que la
variable pueda asumir. Ejemplo: El número de hijos (1, 2, 3, 4, 5).
Variable continua: Es la variable que puede adquirir cualquier valor dentro de
un intervalo especificado de valores. Por ejemplo: la masa (2,3 kg, 2,4 kg,
2,5 kg,...) o la altura (1,64 m, 1,65 m, 1,66 m,...), o el salario. Solamente se
está limitado por la precisión del aparato medidor, en teoría permiten que
exista un valor entre dos variables.
Variables cualitativas
Son el tipo de variables que como su nombre lo indica expresan distintas
cualidades, características o modalidad. Cada modalidad que se presenta se
denomina atributo o categoría, y la medición consiste en una clasificación de
dichos atributos. Las variables cualitativas pueden ser dicotómicas cuando sólo
pueden tomar dos valores posibles, como sí y no, hombre y mujer o
ser politómicas cuando pueden adquirir tres o más valores. Dentro de ellas
podemos distinguir:
Variable cualitativa ordinal o variable casi cuantitativa: La variable puede
tomar distintos valores ordenados siguiendo una escala establecida, aunque
no es necesario que el intervalo entre mediciones sea uniforme, por
ejemplo: leve, moderado, fuerte.
Variable cualitativa nominal: En esta variable los valores no pueden ser
sometidos a un criterio de orden, como por ejemplo los colores.
3. Población
Es la colección de datos que corresponde a las características de la totalidad
de individuos, objetos, cosas o valores en un proceso de investigación.
Ejemplo:
Los miembros del Colegio de Ingenieros del Estado Cojedes.
El tamaño que tiene una población es un factor de suma importancia en
el proceso de investigación estadística, y este tamaño vienen dado por el número
de elementos que constituyen la población, según el número de elementos la
población puede ser finita o infinita. Cuando el número de elementos que integra la
población es muy grande, se puede considerar a esta como una población infinita,
por ejemplo; el conjunto de todos los números positivos. Una población finita es
aquella que está formada por un limitado número de elementos, por ejemplo; el
número de estudiante del Núcleo San Carlos de la Universidad Nacional
Experimental Simón Rodríguez.
Cuando la población es muy grande, es obvio que la observación de todos los
elementos se dificulte en cuanto al trabajo, tiempo y costos necesario para
hacerlo. Para solucionar este inconveniente se utiliza una muestra estadística.
Muestra:
Es una parte representativa de la población que es seleccionada para ser
estudiada, ya que la población es demasiado grande para ser estudiada en su
totalidad
Ejemplo:
Se tiene una población de 444.444 habitantes y se quiere conocer cuántos de
ellos son hombres y cuántos de ellos son mujeres. Se conjetura que cerca del
50% son mujeres y el resto hombres, pero se quiere seleccionar una muestra para
determinar cuántos hombres y mujeres hay en la muestra y a partir de ahí inferior
el porcentaje exacto de hombres y mujeres en la población total. La descripción de
4. una muestra, y los resultados obtenidos sobre ella, puede ser del tipo mostrado en
el siguiente ejemplo:
Dimensión de la población: 222.222 habitantes
Probabilidad del evento: Hombre o Mujer 50%
Nivel de confianza: 90%
Desviación tolerada: 5%
Resultado 196
Tamaño de la muestra: 270
La interpretación de esos datos sería la siguiente:
La población a investigar tiene 222.222 habitantes y queremos saber cuántos
son hombres o mujeres.
Estimamos en un 50% para cada sexo y para el propósito del estudio es
suficiente un 90% de seguridad con un nivel entre 90 - 5 y 90 + 5.
Generamos una tabla de 280 números al azar entre 1 y 222.222 y en un censo
numerado comprobamos el género para los seleccionados.
Parámetro:
Es un número que resume la gran cantidad de datos que pueden derivarse del
estudio de una variable estadística. Por ejemplo, suele ofrecerse como resumen
de la juventud de una población la media aritmética de las edades de sus
5. miembros, esto es, la suma de todas ellas, dividida por el total de individuos que
componen tal población.
Estadísticos:
Censo o recuento de la población, de los recursos naturales e industriales o de
cualquier otra manifestación o actividad de un Estado, provincia, pueblo, clase,
etc.
Escalas de medición
Escalas de medición son una sucesión de medidas que permiten organizar
datos en orden jerárquico. Las escalas de medición, pueden ser clasificadas de
acuerdo a una degradación de las características de las variables. Estas escalas
son: nominales, ordinales, intervalares o racionales. Según pasa de una escala a
otra el atributo o la cualidad aumenta. Las escalas de medición ofrecen
información sobre la clasificación de variables discretas o continuas. Toda vez que
dicha clasificación determina la selección de la gráfica adecuada.
Tipos de escalas de medición
La escala de medida de una característica tiene consecuencias en la manera
de presentación de la información y el resumen. La escala de medición -grado de
precisión de la medida de la característica- también determina los métodos
estadísticos que se usan para analizar los datos. Por lo tanto, es importante definir
las características por medir. Las escalas de medición más frecuentes son las
siguientes:
Escala nominal
Son variables numéricas cuyos valores representan una categoría o
identifican un grupo de pertenencia. Este tipo de variables sólo nos permite
6. establecer relaciones de igualdad/desigualdad entre los elementos de la variable.
La asignación de los valores se realiza en forma aleatoria por lo que NO cuenta
con un orden lógico. Un ejemplo de este tipo de variables es el Género ya que
nosotros podemos asignarles un valor a los hombres y otro diferente a las mujeres
y por más machistas o feministas que seamos no podríamos establecer que uno
es mayor que el otro.
Escala ordinal
Variables numéricas cuyos valores representan una categoría o identifican un
grupo de pertenencia contando con un orden lógico. Este tipo de variables nos
permite establecer relaciones de igualdad/desigualdad y a su vez, podemos
identificar si una categoría es mayor o menor que otra. Un ejemplo de variable
ordinal es el nivel de educación, ya que se puede establecer que una persona con
título de Postgrado tiene un nivel de educación superior al de una persona con
título de bachiller. En las variables ordinales no se puede determinar la distancia
entre sus categorías, ya que no es cuantificable o medible.
Escala de intervalo
Variables numéricas cuyos valores representan magnitudes y la
distancia entre los números de su escala es igual. Con este tipo de variables
podemos realizar comparaciones de igualdad/desigualdad, establecer un
orden dentro de sus valores y medir la distancia existente entre cada valor
de la escala. Las variables de intervalo carecen de un cero absoluto, por lo
que operaciones como la multiplicación y la división no son realizables. Un
ejemplo de este tipo de variables es la temperatura, ya que podemos decir
que la distancia entre 10 y 12 grados es la misma que la existente entre 15
y 17 grados. Lo que no podemos establecer es que una temperatura de 10
grados equivale a la mitad de una temperatura de 20 grados.
7. Escala razón
Variables de razón poseen las mismas características de las variables de
intervalo, con la diferencia que cuentan con un cero absoluto; es decir, el valor
cero (0) representa la ausencia total de medida, por lo que se
puede realizar cualquier operación Aritmética (Suma, Resta, Multiplicación y
División) y Lógica (Comparación y ordenamiento). Este tipo de variables permiten
el nivel más alto de medición. Las variables altura, peso, distancia o el salario, son
algunos ejemplos de este tipo de escala de medida.
Debido a la similitud existente entre las escalas de intervalo y de razón, SPSS
las ha reunido en un nuevo tipo de medida exclusivo del programa, al cual
denomina Escala. Las variables de escala son para SPSS todas aquellas variables
cuyos valores representan magnitudes, ya sea que cuenten con un cero (0)
absoluto o no. Teniendo esto en cuenta discutiremos a continuación los diferentes
procedimientos estadísticos que se pueden utilizar de acuerdo al tipo de medida
de cada variable.
Razón
Es un cociente en el que el numerador no está incluido en el denominador. A
menudo las cantidades se miden en las mismas unidades, pero no es esencial. El
rango oscila entre 0 e infinito.
Ejemplos:
Cociente entre el número de casos de TBC en varones y mujeres en 2005:
Razón= 135/53= 2,55
Cociente entre los casos de TBC ocurridos en individuos con edades superiores a
55 y el grupo de individuos con edades inferiores a 55:
Razón=95/93=1,02
8. Proporción
Es un cociente en el que el numerador está incluido en el denominador. Una
proporción no es más que la expresión de la probabilidad de que un suceso
ocurra.
El rango está comprendido entre 0 y 1 o bien en términos porcentuales de 0% a
100%, y no tiene dimensión.
Ejemplos
Cociente entre el número de casos ocurridos en varones y el total de casos en el
año 2005.
135/188=0,72 El 72% de los casos han ocurrido en varones.
Cociente entre el número de casos ocurrido en individuos con más de 65 años y el
total de casos en el año 2005.
77/188=0,41 El 41% de los casos se han detectado en personas mayores de
65 años.
Tasa
La tasa es una forma especial de proporción o de razón que tiene en cuenta el
tiempo. Es una medida que relaciona el cambio de una magnitud por unidad de
cambio en otra magnitud (por regla general, tiempo). la utilización de las tasas es
esencial para comparar experiencias entre poblaciones en diferentes tiempos,
diferentes lugares o entre diferentes tipos de personas. su rango oscila entre 0 e
infinito y su medida es tiempo-¹.
Ejemplos
Cociente entre el número de casos de tbc en varones durante el años 2005 y la
población estimada de varones en el año 2005:
9. 135/516.329=0,000261 la tasa es de 26,1 casos de tbc por cada 100.000
habitantes varones en 1 año (2005).
Cociente entre los casos de defunción por tbc y la población estimada en el año
2005:
8/1076635=0,000007 la tasa de mortalidad es de 0,7 por 100.000 habitantes en
1 año.
Diferencias entre la Estadística Descriptiva y la Inferencial.
La estadística descriptiva:
+ Es la rama de la estadística que se ocupa de la recolección, presentación,
descripción, análisis e interpretación de un conjunto de datos.
+ Analiza, estudia y describe las características particulares de la totalidad de los
individuos de un grupo.
+ Tiene como finalidad obtener información, analizarla, elaborarla y simplificarla lo
necesario para poder interpretarla rápidamente.
+ Tiene una función inductiva.
+ Cuenta con dos formas de ordenar los datos: a) por medio de tablas de
frecuencias, de valores numéricos, o de clases; ascendentes, descendentes y; b)
por medio de representaciones gráficas, utilizando los histográmas, polígonos de
frecuencias, gráficas de series de tiempos. Los sistemas computacionales de
Excel, Lotus Smart Suite, Minitab, SAS-Pe, Start Graph, permiten realizar
representaciones gráficas de diversos grupos de datos.
+ La ED utiliza como herramientas las Medidas de Tendencia Central que son de
10. gran utilidad para encontrar los indicadores mas representativos de un conjunto de
datos. Las de uso mas común son la Media Aritmética, La Media Ponderada, la
Mediana Moda; la Mediana y la Moda.
+ Las Medidas de Dispersión son las otras herramientas de la ED que se utilizan
para poder describir una distribución de frecuencias a partir de la variación de los
valores obtenidos. Las medidas de dispersión mas utilizadas son el Rango, la
Varianza, la Covarianza y la Desviación Estándar.
La estadística inferencial:
+ La EI es la rama de la Estadística que nos permite deducir las propiedades del
total de los elementos de un conjunto a partir del estudio de una muestra
significativa de este conjunto.
+ La inferencia siempre es en términos aproximados y debe declararse el nivel de
confianza de3 la inferencia.
+ La EI trabaja con muestras, subconjuntos, y a partir de su estudio se busca
deducir aspectos relevantes de toda una población.
+ La muestra debe ser representativa de la población, lo que significa que
cualquier individuo de la población estudiada debe tener la misma probabilidad de
ser elegido.
Herramientas de la EI
+ Análisis de varianza (ANOVA). Es una técnica estadística diseñada para
comparar la varianza de dos poblaciones a partir del análisis de sus respectivas
varianzas. Se deben de cumplir dos criterios:
1.- Las poblaciones de estudio deberán ser normales y tener varianzas iguales.
2.- La selección de muestras es independiente.
11. + Análisis multifactorial de varianza (ANCOVA). También es llamado Análisis de
Covarianza y permite la comparación de más de dos variables entre sí con la idea
de comprobar el efecto de las variables y el efecto de la interacción entre ellas. Se
usa para analizar los resultados de investigaciones de tipo experimental que usan
un diseño factorial.
+ Distribución Xi2 (Chi cuadrada). De bondad ajustada y de independencia. Es
una prueba usada para la contrastación de hipótesis.
+ Los elementos que integran la EI son:
1.- Teoría de las muestras. Las propiedades de una muestra deben ser
extrapolables a toda la población.
2.- Contraste de hipótesis. Permite juzgar si la propiedad que suponemos debe
cumplir la población estadística es compatible con lo observado en la muestra.
3.- Diseño experimental. Consiste en la serie de pasos que hay que dar para crear
un experimento científico para corroborar o descartar una hipótesis.
4.- Información baynesiana. Las observaciones y las evidencias son utilizadas
para actualizar o para inferir la probabilidad y grado de certeza de una hipótesis.
5.- Métodos no paramétricos. Son usados para estudiar modelos estadísticos que
tienen una distribución que no se ajusta a los criterios paramétricos conocidos.
Algunos de los métodos no paramétricos más utilizados son la Prueba Y
(cuadrada) de Pearson, la prueba de Cochran, la prueba de Fisher, la prueba de
Kendall, la prueba de la mediana.
En definitiva, la diferencia entre Estadística Descriptiva y Estadística
Inferencial es que la primera sólo se encarga de hacer descripciones a partir de
ciertos datos; mientras que la segunda se va más allá y hace estimaciones acerca
de los datos que se recogen de las muestras que se toman de una población.