2. Al hablar sobre estadística por lo general suele usarse entre dos significados
diferentes.
Uno es como colección de datos numérico donde éstos van a estar
representados de una manera ordenada y sistemática. Esta información para
pertenecer a la palabra estadística, los datos han de constituir un conjunto
coherente, establecido de forma sistemática y siguiendo un criterio de
ordenación.
El otro significado es como ciencia estudia el comportamiento de los
fenómenos de masas, buscando características generales de un colectivo y
prescinde de las particulares de cada elemento.
Entonces ¿Qué es Estadística?
3. "La estadística es una técnica especial apta para el
estudio cuantitativo de los fenómenos de masa o
colectivo, cuya mediación requiere una masa de
observaciones de otros fenómenos más simples llamados
individuales o particulares".
(Gini, 1953)
“La estadística estudia los métodos científicos para
recoger, organizar, resumir y analizar datos, así como
para sacar conclusiones válidas y tomar decisiones
razonables basadas en tal análisis”.
(Murray R. Spiegel, 1991)
“La Estadística es aquella ciencia que ostenta en sus bases una fuerte presencia y
acción de las matemáticas y que principalmente se ocupa de la recolección,
análisis e interpretación de datos que buscan explicar las condiciones en aquellos
fenómenos de tipo aleatorio”.
4. Descriptiva: Es la que se encarga de describir y analizar las características de un conjunto de
datos, obteniéndose de esa manera conclusiones sobre las características de dicho conjunto y
sobre las relaciones existentes con otras poblaciones, con el fin de compararlas y registrar esos
datos en tablas representados en gráficos. Esta calcula los parámetros estadísticos (medidas de
centralización y de dispersión); que describen el conjunto estudiado.
Inductiva: Por otra parte, es aquella que investiga y analiza una población partiendo de una
muestra tomada. Procede de las observaciones hechas solo a una parte de un conjunto
numeroso de elementos; implicando así que su análisis requiera de generalizaciones que van
más allá de los datos, dando como consecuencia la característica más importante del
crecimiento de la estadística, un cambio en el énfasis de los métodos que sirven para
generalizarlas.
La
estadística se
clasifican en
5. Cuando se habla de estadística debemos
tener claro que significa
Es un conjunto de datos que corresponde a las
características de la totalidad de individuos, objetos,
cosas o valores en un proceso de investigación. El
propósito del investigador o quien realiza un análisis de
los datos, es estudiar el comportamiento de la
población.
La población se clasifican
Poblaciones Finitas: Es aquella que constan de un número determinado de
elementos, susceptible a ser contado. Como por ejemplo, los empleados de una
fábrica, los elementos de un lote de producción, entre otros.
Población:
6. Poblaciones Infinitas: Son aquellas que tienen un número indeterminado de
elementos, los cuales no pueden ser contados. Ejemplo: Los números naturales.
Población Base: Es ese grupo de personas designadas por las siguientes
características: personales, geográficas o temporales, que son elegibles para
participar en el estudio.
Población Muestreada: Es la población base con criterios de viabilidad o
posibilidad de realizarse el muestreo.
Población Diana: Es el grupo de personas a la que va proyectado dicho estudio, la
clasificación característica de los mismos, lo cual lo hace modelo de estudio para el
proyecto establecido.
La población a su vez se clasifican
Reales Cuando son concretas es decir, que ya
existen. Ejemplo: Los aspirantes a un puesto de
trabajo, los vendedores de una empresa.
Hipotéticas Son las formas imaginables en que
se podría presentar un suceso. Ejemplo:
Estimaciones de la población económicamente
activa dentro de diez años.
7. Muestra:
“Es una parte representativa de la población que es
seleccionada para ser estudiada, ya que la población
es demasiado grande para ser estudiada en su
totalidad” Allen Webster.
Este estudio se realiza aislando alguna de sus
características, objeto del muestreo, la que se puede
representar mediante una variable. De esta manera
podemos crear modelos matemáticos para dicha
variable.
Probabilístico: Cuando cada elemento de la población tiene las mismas
probabilidades de ser seleccionado; es decir, si la población tiene N elementos, la
probabilidad de que un elemento cualquiera sea elegido será 1/N.
El muestreo puede ser:
8. Con reposición de los Elementos: Aquí las observaciones se realizan con
reemplazamiento de los individuos, de forma que la población es idéntica en
todas las extracciones. En poblaciones muy grandes, la probabilidad de repetir
una extracción es tan pequeña que el muestreo puede considerarse sin reposición
aunque, realmente, no lo sea.
Para realizar este tipo de muestreo, y en determinadas situaciones, es muy útil la
extracción de números aleatorios mediante ordenadores, calculadoras o tablas
construidas al efecto.
El muestreo aleatorio simple
puede ser de dos tipos :
Sin reposición de los Elementos: Es decir, que
cada elemento extraído se descarta para la
subsiguiente extracción
Muestreo Aleatorio
9. Muestreo por conglomerados: Es
cuando la población se encuentra
dividida, de manera natural, en grupos
que se suponen que contienen toda la
variabilidad de la población, es decir,
la representan fielmente respecto a la
característica a elegir, pueden
seleccionarse sólo algunos de estos
grupos o conglomerados para la
realización del estudio.
Muestreo estratificado: Se lleva a cabo
una la división de la población de
estudio en grupos o estratos
homogéneos (o que se suponen
homogéneos) respecto a la variable de
interés. A cada estrato se le asignaría
una cantidad o cuota que representa el
número de miembros o elementos del
mismo que deben componer la
muestra. Dentro de cada estrato el
muestreo se realizaría mediante un
muestreo aleatorio simple.
Muestreo sistemático: Esta se usa
cuando el universo es muy grande o
éste se extiende en el tiempo. Primero
hay que identificar las unidades y
relacionarlas con el calendario
(cuando proceda). Luego hay que
calcular una constante, que se
denomina coeficiente de elevación K=
N/n; donde N es el tamaño del universo
y n el tamaño de la muestra.
Determinar en qué fecha se producirá
la primera extracción, para ello hay
que elegir al azar un número entre 1 y
K; de ahí en adelante tomar uno de
cada K a intervalos regulares. Si es
posible, es conveniente tener en cuenta
la periodicidad del fenómeno.
10. Dentro de los grupos seleccionados se ubicará las unidades elementales, como
las personas a encuestar, y podría aplicársele el instrumento de medición a
todas las unidades, es decir, los miembros del grupo, o sólo se les podría aplicar
a algunos de ellos, seleccionados al azar. Este método tiene la ventaja de
simplificar el levantamiento de datos sobre la información muestral.
Muestreo No Probabilístico: cuando la selección se realiza tomando en cuenta
ciertos criterios que pueden ser incluso subjetivos. Los métodos de muestreo no
probabilísticos no garantizan la representatividad de la muestra y por lo tanto
no permiten realizar estimaciones inferenciales sobre la población.
(En algunas circunstancias los
métodos estadísticos y
epidemiológicos permiten resolver
los problemas de
representatividad aun en
situaciones de muestreo no
probabilístico, por ejemplo los
estudios de caso-control, donde los
casos no son seleccionados
aleatoriamente de la población.)
11. Muestreo opinático o intencional: Este
tipo de muestreo se caracteriza por un
esfuerzo deliberado de obtener muestras
"representativas" mediante la inclusión en
la muestra de grupos supuestamente
típicos. Es muy frecuente su utilización en
sondeos preelectorales de zonas que en
anteriores votaciones han marcado
tendencias de voto.
Podemos decir que una muestra es un
subconjunto de elementos de la población.
Hay, sin embargo, distintas formas o
métodos de seleccionar una muestra, que
dependen, en general, de las
características de la población que se va a
estudiar, pueden ser realizados de forma
probabilística o aleatoria (al azar), o no
probabilística.
Muestreo por cuotas: También
denominado en ocasiones
"accidental". Se asienta
generalmente sobre la base de un
buen conocimiento de los estratos de
la población y/o de los individuos
más "representativos" o
"adecuados" para los fines de la
investigación. Mantiene, por tanto,
semejanzas con el muestreo
aleatorio estratificado, pero no tiene
el carácter de aleatoriedad de aquél.
En este tipo de muestreo se fijan
unas "cuotas" que consisten en un
número de individuos que reúnen
unas determinadas condiciones.
12. Ya que se ha definido que es población y muestra, se
procede a definir dos conceptos que se encuentran
íntimamente relacionados a ellos
Parámetro: Son las medidas o características descriptivas inherentes a las
poblaciones. Los salarios promedio de todos los empleados de una empresa,
puede ser un ejemplo de parámetro.
Estadístico o Estadígrafo: Son las medidas descriptivas inherentes a una muestra,
las cuales pueden usarse como estimación del parámetro. Como ejemplo podría
tomarse los salarios promedio de una muestra de los empleados de la empresa.
Determinar el tamaño de una muestra: Es un paso importante en cualquier
estudio de investigación de mercados, se debe justificar convenientemente de
acuerdo al planteamiento del problema, la población, los objetivos y el propósito
de la investigación. Dependerá de decisiones estadísticas y no estadísticas, pueden
incluir por ejemplo la disponibilidad de los recursos, el presupuesto o el equipo
que estará en campo.
Antes de calcular el tamaño de la muestra se necesitara determinar varias cosas
como:
13. Tamaño de la población: Una población es una colección bien definida de objetos o
individuos que tienen características similares. Hablamos de dos tipos: población
objetivo, que suele tiene diversas características y también es conocida como la
población teórica. La población accesible es la población sobre la que los
investigadores aplicaran sus conclusiones.
Margen de error (intervalo de confianza): El margen de error es una estadística que
expresa la cantidad de error de muestreo aleatorio en los resultados de una
encuesta, es decir, es la medida estadística del número de veces de cada 100 que se
espera que los resultados se encuentren dentro de un rango específico.
Nivel de confianza: Son intervalos aleatorios que se usan para acotar un valor con
una determinada probabilidad alta. Por ejemplo, un intervalo de confianza de 95%
significa que los resultados de una acción probablemente cubrirán las expectativas
el 95% de las veces.
La desviación estándar: Es un índice numérico de la dispersión de un conjunto de
datos (o población). Mientras mayor es la desviación estándar, mayor es la
dispersión de la población.
14. La fórmula para calcular el tamaño de muestra cuando se desconoce el tamaño de la
población es la siguiente:
Cálculo del Tamaño de la Muestra desconociendo el tamaño de la
Población:
En donde
Z = nivel de confianza,
P = probabilidad de éxito, o
proporción esperada
Q = probabilidad de fracaso
D = precisión (error máximo admisible
en términos de proporción)
Cálculo del Tamaño de la Muestra conociendo el tamaño de la Población:
En donde
N = tamaño de la población
Z = nivel de confianza,
P = probabilidad de éxito, o
proporción esperada
Q = probabilidad de fracaso
D = precisión (Error máximo
admisible en términos de proporción).
15. Medidas Cualitativas y Cuantitativas:
Es la forma de representar a un conjunto de datos, que son los valores obtenidos
al estudiar una determinada característica de la población, sujeta a estudio y es
mediante el uso de las variables. Cuando hablamos de datos debemos tomar en
cuenta si estos califican o cuantifican una determinada característica de la
población sujeta a estudio.
Variable Cualitativa: califica, agrupa o identifica a una variable. Esta puede ser
a su vez:
Cualitativa nominal: Cuando nomina, identifica con un valor, al elemento de la
población o muestra. Por ejemplo, el número de transacción, en una operación
bancaria identifica a la operación. El género, estado civil, color o marca de un
vehículo constituyen variables cualitativas nominales.
Cualitativa ordinal: Cuando agrupa o clasifica varios valores de la variable en
grupos con cierta afinidad o característica. Ejemplo, un conjunto de electores, su
nivel socioeconómico, su grado de instrucción, el número de mesa donde votan
son variables cualitativas ordinales.
16. Variable Cuantitativa: cuantifica a los elementos de la población o muestra. Por
ejemplo el ingreso mensual de un trabajador; el peso de un melón; el número de
clientes de un banco que esperan ser atendidos en una ventanilla; el número de
vehículos esperando en una caseta de control de peaje; el tiempo que tarda un
operador de la caseta en atender a un cliente; etc.
De los ejemplos dados de variable cuantitativa, podemos deducir que hay dos
tipos de variables cuantitativas: Aquellas que se producen por lo general de un
conteo: Número de clientes que esperan ser atendidos y aquéllas otras como el
tiempo que el operador se tarda en atender a un cliente. Los primeros constituyen
variables discretas y los segundos, variables continuas.
Las variables discretas se pueden enumerar: x1, x2, xk, xn.
Las variables continuas no se pueden enumerar, se representa por intervalos: a ,
x , b.
Finalmente diremos que cualquiera que sea el elemento de la población, puede
ser representada por una variable.
17. Escala de Medición:
Es el proceso de asignar un valor numérico a una variable. Las escalas de
medición sirven para ofrecernos información sobre las clasificaciones que
podemos hacer con respecto a las variables (discretas o continuas).
Cuando se mide una variable el resultado puede aparecer en uno de cuatro
diversos tipos de escalas de medición; nominal, ordinal, intervalo y razón.
Conocer la escala a la que pertenece una medición es importante para
determinar el método adecuado para describir y analizar esos datos.
Escala nominal: utiliza los números para identificar que un dato pertenece a un
grupo o a una categoría. Es aquella escala que no presenta un orden o dimensión
particular, son observaciones que pueden clasificarse o contarse. En el análisis de
datos resulta más sencillo asignar a ciertos atributos “etiquetas” numéricas en
lugar de utilizar datos complejos. Por ello podemos utilizar un “1” para designar
a las mujeres y un “2” para designar a los hombres, sin que ninguno de los
números represente más o menos, solamente con el objetivo de distinguir y
organizar datos.
En esta escala cada persona u objeto debe pertenecer a una y solamente una de
las categorías que tienen y el conjunto de estas categorías debe ser exhaustivo; es
decir, tiene que contener a todos los casos posibles.
18. Escala ordinal: En esta escala los números representan una clasificación (mayor
que o menor que), sin que represente una unidad de medida, quedando implícito
que un número de mayor cantidad tiene más alto grado de atributo medido en
comparación de un número menor. Se establece una gradación u orden natural
para las categorías, cada uno de los datos puede localizarse dentro de alguna de
las categorías disponibles.
Escala de intervalo: En esta escala además del “mayor que” y el “menor que” (> ó
<) también se establece una unidad de medida que nos permite precisar cuánto se
es mayor o menor. La unidad de medición es arbitraria, el cero es convencional y
pueden existir cantidades negativas; la medición de la temperatura y del
coeficiente intelectual son ejemplos de este tipo de escala.
En esta escala se pueden hacer comparaciones por medio de diferencias o de
sumas, sin embargo no se admiten comparaciones por medio de multiplicaciones,
divisiones o porcentajes pues carecen de sentido.
Escala de razón: Similar a la escala de intervalo, pero tiene un cero absoluto y por
ello los múltiplos de los valores de la escala serán significativos; el nivel de votos
en una elección sería un buen ejemplo de una escala de medición de razón.
19. Se hace a través de tablas que pueden ser una distribución de frecuencia simple o
distribución con frecuencia de intervalos. La frecuencia es el número de veces que
aparece una variable o dato nominal.
La obtención de datos para el análisis estadístico es un proceso integral que incluye
las siguientes etapas típicas:
Definición de los objetivos del estudio observacional o experimento.
Definición de la variable y la población de interés. Este aspecto tiene que ver con
los alcances del estudio.
Definición de los métodos para la obtención y medición de los datos. También
incluye, en su caso, la decisión de la obtención de un censo o la determinación del
tamaño de la muestra.
Determinación de las técnicas descriptivas o de inferencia que sean las
apropiadas para el análisis de los datos.
Organización de
Datos:
20. Una vez que se obtienen los datos para un estudio estadístico, el primer paso es
realizar una crítica y organización de los datos para su posterior tratamiento. En
general, este proceso implica una elaboración de listas o su recuento y agrupación
en frecuencias simples, que se conoce con el nombre de conteo. De manera similar
a como se realiza el conteo de los votos para una elección. En los tiempos actuales,
con la herramienta de la computadora, estos procesos pueden ser ciertamente
tediosos en algunos casos, pero siempre resultará un procedimiento muy simple.
Distribución de Frecuencia:
Las distribuciones de frecuencias son tablas en que se dispone las modalidades de
la variable por filas. En las columnas se dispone el número de ocurrencias por
cada valor, porcentajes, etc. La finalidad de las agrupaciones en frecuencias es
facilitar la obtención de la información que contienen los datos.
Frecuencia absoluta: La frecuencia absoluta es el número de veces que aparece
un determinado valor en un estudio estadístico.
Se representa por fi.
La suma de las frecuencias absolutas es igual
al número total de datos, que se representa
por N.
21. Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma
mayúscula) que se lee suma o sumatoria.
Frecuencia relativa: La frecuencia relativa es el cociente entre la frecuencia
absoluta de un determinado valor y el número total de datos.
Se puede expresar en tantos por ciento y se representa por (ni).
La suma de las frecuencias relativas es
igual a 1
22. Frecuencia acumulada: La frecuencia acumulada es la suma de las frecuencias
absolutas de todos los valores inferiores o iguales al valor considerado.
Se representa por Fi.
Frecuencia relativa acumulada: La frecuencia relativa acumulada es el cociente
entre la frecuencia acumulada de un determinado valor y el número total de
datos. Se puede expresar en tantos por ciento.
Distribución de Frecuencia Agrupadas:
La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea
si las variables toman un número grande de valores o la variable es continua. Se
agrupan los valores en intervalos que tengan la misma amplitud denominados
clases. A cada clase se le asigna su frecuencia correspondiente.
Límites de la clase: Cada clase está delimitada por el límite inferior de la clase y
el límite superior de la clase.
Amplitud de la clase: La amplitud de la clase es la diferencia entre el límite
superior e inferior de la clase
23. Marca de clase: La marca de clase es el punto medio de cada intervalo y es el valor
que representa a todo el intervalo para el cálculo de algunos parámetros.
Construcción de una tabla de datos agrupados
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11,
13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.
1º Se localizan los valores menor y mayor de la distribución. En este caso son 3 y
48.
2º Se restan y se busca un número entero un poco mayor que la diferencia y que
sea divisible por el número de intervalos de queramos poner. Es conveniente que
el número de intervalos oscile entre 6 y 15.
En este caso, 48 - 3 = 45, incrementamos el número hasta 50 : 5 = 10 intervalos. Se
forman los intervalos teniendo presente que el límite inferior de una clase
pertenece al intervalo, pero el límite superior no pertenece intervalo, se cuenta en
el siguiente intervalo.
Intervalo de clases: Los intervalos de clase se emplean si las variables toman un
número grande de valores o la variable es continua. Se agrupan los valores en
intervalos que tengan la misma amplitud denominados clases. A cada clase se le
asigna su frecuencia correspondiente.
24. Representación Gráfica De Datos Estadísticos:
En los análisis estadísticos, es frecuente utilizar representaciones visuales
complementarias de las tablas que resumen los datos de estudio. Con estas
representaciones, adaptadas en cada caso a la finalidad informativa que se
persigue, se transmiten los resultados de los análisis de forma rápida, directa y
comprensible para un conjunto amplio de personas.
Tipos de representaciones gráficas: Cuando se muestran los datos estadísticos a
través de representaciones gráficas, se ha de adaptar el contenido a la
información visual que se pretende transmitir. Para ello, se barajan múltiples
formas de representación:
Diagramas de barras: muestran los valores de las frecuencias absolutas sobre un
sistema de ejes cartesianos, cuando la variable es discreta o cualitativa.
25. Histogramas: formas especiales de diagramas
de barras para distribuciones cuantitativas
continuas.
Polígonos de frecuencias: formados por
líneas poligonales abiertas sobre un sistema
de ejes cartesianos.
Para construir polígonos de frecuencias, se trazan las frecuencias absolutas o
relativas de los valores de la variable en un sistema de ejes cartesianos y se unen los
puntos resultantes mediante trazos rectos. Con ello se obtiene una forma de línea
poligonal abierta. Los polígonos de frecuencias se utilizan preferentemente en la
presentación de caracteres cuantitativos, y tienen especial interés cuando se indican
frecuencias acumulativas. Se usan en la expresión de fenómenos que varían con el
tiempo, como la densidad de población, el precio o la temperatura.
26. Pictogramas: O representaciones
visuales figurativas. En realidad son
diagramas de barras en los que las
barras se sustituyen con dibujos
alusivos a la variable.
Cartogramas: expresiones gráficas a modo
de mapa.
Pirámides de población: para clasificaciones de
grupos de población por sexo y edad.
27. Diagramas de barras e histogramas: Los
diagramas de barras se usan para
representar gráficamente series
estadísticas de valores en un sistema de
ejes cartesianos, de manera que en las
abscisas se indica el valor de la variable
estadística y en las ordenadas se señala su
frecuencia absoluta. Estos gráficos se usan
en representación de caracteres
cualitativos y cuantitativos discretos. En
variables cuantitativas continuas, se
emplea una variante de los mismos
llamada histograma.
Gráficos de sectores: En los diagramas de
sectores, también llamados circulares o de tarta,
se muestra el valor de la frecuencia de la variable
señalada como un sector circular dentro de un
círculo completo. Por ello, resultan útiles
particularmente para mostrar comparaciones
entre datos, sobre todo en forma de frecuencias
relativas de las variables expresadas en forma de
porcentaje.
28. Pictogramas y Cartogramas: Para aligerar la presentación de datos estadísticos,
con frecuencia se recurre a imágenes pictóricas representativas del valor de las
variables. Dos formas comunes de expresión gráfica de los datos son: Los
pictogramas, que muestran diagramas figurativos con figuras o motivos que aluden
a la distribución estadística analizada (por ejemplo, una imagen antropomórfica
para indicar tamaños, alturas u otros). Los cartogramas, basados en mapas
geográficos que utilizan distintas tramas, colores o intensidades para remarcar las
diferencias entre los datos.
29. Bibliografía:
Páginas web
[Documento en Línea] Disponible
http://www.monografias.com/trabajos94/trabajo-estadistica-tejera/trabajo-estadistica-
tejera.shtml#ixzz4ilUoGQ4I
[Consultado, 01 Junio 2017]
Páginas web
[Documento en Línea] Disponible
http://estadisticaparaadministracion.blogspot.com/2011/10/poblacion-y-muestra-parametro-y.html
[Consultado, 01 Junio 2017]
Páginas web
[Documento en Línea] Disponible
https://www.definicionabc.com/general/estadistica.php
[Consultado, 01 Junio 2017]
Páginas web
[Documento en Línea] Disponible
http://www.psyma.com/company/news/message/como-determinar-el-tamano-de-una-muestra
[Consultado, 02 Junio 2017]
Páginas web
[Documento en Línea] Disponible
https://es.wikiversity.org/wiki/Estad%C3%ADstica_Aplicada_a_la_Sociolog%C3%ADa/Medici%C3%
B3n_en_estad%C3%ADstica
[Consultado, 02 Junio 2017]
30. Bibliografía:
Páginas web
[Documento en Línea] Disponible
http://www.ditutor.com/estadistica/distribuci%C3%B3n_frecuencias.html
[Consultado, 03 Junio 2017]
Páginas web
[Documento en Línea] Disponible
http://www.hiru.eus/matematicas/representacion-grafica-de-datos-estadisticos
[Consultado, 03 Junio 2017]