1. Estadística Inferencial
DEFINICIONES Y CONCEPTOS BASICOS
1. CONCEPTOS Y ELEMENTOS
La estadística es una ciencia que sustenta sus bases en la presencia y acción de las
matemáticas y que se ocupa de la recolección, análisis e interpretación de datos que
buscan explicar las condiciones en aquellos fenómenos de tipo aleatorio o condicional y
que normalmente son presentados numérica o gráficamente.
De los aspectos más salientes de la estadística es que se trata de una ciencia
transversal y funcional a una gran variedad de disciplinas que se sirven de ella para
entender e interpretar algunas cuestiones referentes a sus objetos de estudio. La
mayoría de las ciencias sociales, la física, la química, las ingenierías, las ciencias
vinculadas a la salud, la administración de empresas y áreas como el control de calidad
y los negocios suelen muy recurrentemente ayudarse con la estadística para
comprender algunos fenómenos que se presentan en sus saberes.
Sin embargo, el hecho que permite a la estadística ser el vínculo directo para llevar a
cabo el proceso de investigación científica es quizá el aspecto más meritorio de la
misma.
Estadística descriptiva Comprende las técnicas que se emplean para recolectar,
presentar y caracterizar un conjunto de datos con el fin de describir apropiadamente las
diversas características del mismo y así facilitar su interpretación.
Estadística Inferencial Comprende los métodos que hacen posible la estimación de una
característica de una población y la toma de una decisión referente a una población
basándose sólo en los resultados de una muestra, Dado que las decisiones son tomadas
en condiciones de incertidumbre, se hace indispensable asociar el concepto de
probabilidad. Es decir, toda inferencia se acompaña de su probabilidad de acierto.
Se dedica a la generación de los modelos, inferencias y predicciones asociadas a los
fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones.
Estas inferencias pueden tomar la forma de respuestas a preguntas si/no (prueba de
hipótesis), estimaciones de características numéricas (estimación), pronósticos de
futuras observaciones, descripciones de asociación (correlación) o modelamiento de
relaciones entre variables (análisis de regresión).
Población: es la totalidad de elementos o cosas bajo consideración (bajo observación).
Pueden ser personas, cosas, objetos abstractos. La población puede ser finita (número
limitado de elementos) o infinita.
Muestra: Es un subconjunto de elementos de la población. Se suelen tomar muestras
cuando es difícil o costosa la observación de todos los elementos de la población
estadística.
Unidad estadística: Se llama unidad estadística o individuo a cada uno de los elementos
que componen la población estadística. El individuo es un ente observable que no tiene
por qué ser una persona, puede ser un objeto, un ser vivo, o incluso algo abstracto.
Variable estadística: Es la característica que se observa sobre las unidades estadísticas.
Asigna a cada unidad estadística un valor o un atributo (observación).
• Variables Cualitativas: son todas aquellas que no aparecen en forma numérica, sino
como categorías o atributos
Binarias: las observaciones pueden clasificarse en dos categorías.
2. Ordinales: corresponden a todas aquellas características que recogen la idea
de orden. Puede establecerse orden, pero no medirse distancia dentro de ese orden. La
medida estadística de tendencia central más apropiada para estas escalas es la
"mediana".
Nominales: son todas aquellas cualidades que no pueden clasificarse en dos
categorías y que no siguen un orden preestablecido. lo único que puede hacerse es
establecer frecuencias en cada atributo y la igualdad o desigualdad entre los diferentes
casos, ver cuál es el grupo que tiene mayor frecuencia alcanzando el concepto de
“moda”
• Variables Cuantitativas: son todos aquellos atributos a los que les puede corresponder
una medición numérica (pueden ser asociadas a un número).
Discretas: son aquellas que toman valores aislados, es decir no admite valores
intermedios entre dos valores específicos. Por lo tanto no pueden corresponder a
valores decimales ni fraccionarios.
Continuas: son aquellas a las que si se les puede asociar un valor decimal.
Observación: es el conjunto de modalidades o valores de cada variable estadística
medidos de una misma unidad estadística.
2. TEORIA DE MUESTRAS
En estadística se conoce como muestreo a la técnica para la selección de una muestra a
partir de una población. Al elegir una muestra se espera conseguir que sus propiedades
sean extendibles a la población; este proceso permite ahorrar recursos y obtener
resultados parecidos a los que se alcanzarían si se realizase un estudio en toda la
población. Cabe mencionar que para que el muestreo sea válido y se pueda realizar un
estudio adecuado debe cumplir ciertos requisitos y nunca se podrá estar seguro de que
el resultado sea una muestra representativa, pero sí de que esta condición se alcance
con una probabilidad alta.
Técnicas de muestreo: Existen los métodos para seleccionar muestras de poblaciones.
El muestreo aleatorio (que incorpora el azar como recurso en el proceso de selección) y
el muestreo no aleatorio o de juicio. El muestreo aleatorio está compuesto por cuatro
métodos principales que son:
1. La muestra aleatorio simple: es aquella en la que se escogen al azar elementos
individuales de una población, esta selección generalmente se hace empleando una
tabla de números aleatorios o un programa de computación generador de números
aleatorios para determinar los elementos numerados de la población que se elegirán
para la muestra.
2. La muestra sistemática: es una muestra aleatoria en la cual los elementos de una
población se eligen de una lista a intervalos uniformes. Un aspecto importante es la
posible existencia de algún factor periódico o cíclico en la lista de la población, esto
puede conducir a un error sistemático en los resultados de la muestra.
3. Muestreo estratificado: el investigador clasifica los elementos de la población en
subgrupos (estratos) con base en una o más características importantes, después de
cada estrato se toma por separado una muestra aleatoria simple o sistemática. Este plan
de muestreo se usa para asegurar que los diferentes subgrupos de la población estén
representados de manera proporcional en la muestra.
4. Muestreo por conglomerados: este tipo de muestreo aleatorio permite la clasificación
de los elementos de la población en subgrupos que se generan de forma natural.
Muestreo no aleatorio: Se eligen los elementos, en función de que sean representativos,
según la opinión del investigador y de esta manera el mismo obtiene los elementos que
necesita estudiar directamente, además de permitirle actuar sin los tediosos procesos de
selección aleatoria y verificación estadística. No obstante se corre el riesgo de obtener
3. demasiado sesgo en la muestra (no se puede precisar la presencia ni la cantidad de
sesgo). Y la presencia de sesgo puede hacer imposible generalizar nuestros resultados.
Un modo de reducir el sesgo hasta cierto punto es dejar a otra persona o grupo la
selección de los elementos. Entre los tipos más comunes de muestras no aleatorias se
encuentran:
1. Muestreo a juicio: es aquel en el que el investigador elige los elementos que abran de
incluirse en la muestra. Sin embargo no puede evaluarse estadísticamente si la muestra
es representativa de la población o no.
2. Muestreo de “casos típicos”: consiste en la utilización de “las mejores” unidades
estadísticas. Se busca que estas unidades representen lo mas relevante y sobresaliente
de una población determinada. La selección de esta muestra posee riesgos serios que
se tratan en el momento de delimitar el objeto de estudio.
3. Muestreo por conveniencia. Consiste utilizar un grupo ya existente como muestra.
Este es un método de fácil aplicación y bajos costos, pero el sesgo suele ser imposible
de estimar. Suele ser muy popular en las demostraciones y encuestas de poco valor
investigativo profesional.
4. Muestreo bola de nieve: Cuando se entrevista a miembros de un grupo, se puede
pedir a las personas que indiquen otros individuos en ese grupo que estén en la mejor
posición para dar información sobre ese tema; se podría también solicitarles que
indiquen personas que compartan sus puntos de vista y también otras que sean de
opinión opuesta. De tal modo que se entrevistaran a nuevos individuos y el proceso se
continúa del mismo modo hasta que no se obtengan nuevos puntos de vista de los
nuevos entrevistados. Este es un buen método por ejemplo para recoger los distintos
puntos de vista existentes en un grupo, pero su inconveniente es que no obtenemos una
idea exacta de la distribución de las opiniones
5. Muestreo por cuotas: También denominado en ocasiones "accidental". Se asienta
generalmente sobre la base de un buen conocimiento de los estratos de la población y/o
de los individuos más "representativos" o "adecuados" para los fines de la
investigación. Mantiene, por tanto, semejanzas con el muestreo aleatorio estratificado,
pero no tiene el carácter de aleatoriedad de aquél.
Por que utilizar el muestreo?
• La población es infinita
• Población finita pero muy grande, sería imposible o muy costoso estudiarla.
• La unidad estadística se transforma o destruye al ser analizada
• Los resultados que se obtendrían al realizar una encuesta por muestreo serían
suficientes y precisos.
Error de muestreo
• Se presenta sólo en muestras aleatorias.
• Es la diferencia entre el resultado dado por la muestra y el resultado que se hubiera
obtenido si se hubiera hecho un censo.
• Ventaja: se puede medir haciendo uso de la teoría de la probabilidad