Este documento describe diferentes tipos de datos estadísticos y conceptos básicos. Explica que los datos pueden ser cuantitativos o cualitativos, y que los cuantitativos se dividen en discretos y continuos. También define conceptos como población, muestra, frecuencia, tabla de frecuencias, medidas de tendencia central y diferentes tipos de gráficos estadísticos. El objetivo es mejorar la comprensión de los datos mediante su organización y representación visual.
2. Cuantitativos o estadística de variables
• Todo lo que se puede medir y contar, decimos que se puede cuantificar. Se denomina
investigación cuantitativa aquella que genera datos numéricos o estadísticos para
cuantificarlos que pueden ser:
Discretas
Sólo pueden tomar un número finito de valores enteros, los valores posibles de estas
variables son aislados.
• Ejemplos de variables estadísticas cuantitativas discretas
- Número de hermanos: pueden ser 1, 2, 3 …, pero nunca podrá ser 3,45.
- Número de empleados de una fábrica.
- Número de goles marcados por un equipo de futbol en la liga.
3. Continuas
Pueden tomar cualquier valor real (infinitos) dentro de un intervalo.
Ejemplos de variables estadísticas cuantitativas continuas
- Velocidad de un vehículo: puede ser 20; 54,2; 100 ; … km/h
- Temperaturas registradas en un observatorio cada hora.
- Peso en kg de los recién nacidos en un día en España.
4. Cualitativos o estadística de atributos
Es el nombre dado a los datos que se expresan en forma de palabras o textos que
ayudan a comprender ciertas acciones y actitudes de los encuestados que no son
cuantificables, por lo que su uso es muy importante para fundamentar cualquier
investigación seria.
Ejemplos de variables estadísticas cualitativas
- Color de los ojos.
- Bondad de una persona.
- Profesión de una persona.
Determinan modalidades. Las modalidades del carácter profesión pueden ser: arquitecto,
albañil, médico, … etc.
5. Estadística
• La estadística podría definirse como la ciencia que se encarga de recopilar,
organizar, procesar, analizar e interpretar datos con el fin de deducir las
características de una población objetivo, pero esta sería solo una visión estrecha de
lo que comprende esta rama del saber.
Objetivo de la estadística
• El objetivo de la estadística es mejorar la comprensión de hechos a partir de
datos. (Moore, p.267)
• El principal objetivo de la estadística es hacer inferencias acerca de una población,
con base en la información contenida en una muestra. (Pérez, p.172)
6. Población
• Una población es un conjunto finito de sujetos o individuos, los cuales
pueden estar formados por: personas, animales, plantas, objetos inanimados
como; computadores, cuadernos, lápices, o cualquier tipo de individuo
cuantificable.
• Por ejemplo, en una comuna del sur de América, que tiene del orden de
20.000 habitantes, posee una población de perros de unos 10.000 individuos.
Aquí se puede observar que hay dos poblaciones, una la de las personas
habitantes, y la otra la de los perros.
7. Muestra
• Una muestra estadística, es justamente solo una muestra, es una parte del todo, con
lo que se constituye en un conjunto representativo de todos.
• Las muestras estadísticas son utilizadas para la realización de encuestas
Ejemplo
En periodos de elecciones es muy usual que se hagan estudios para predecir quien
ganará las elecciones. En ese caso, se toma una muestra aleatoria (selección al alzar de
una porción de la población), se realiza una encuesta a cada uno de los individuos
seleccionados, y luego se realiza el análisis de los datos para estimar ganadores y
perdedores.
9. DATOS CUANTITATIVOS
• “Datos cuantitativos” hace referencia precisamente a eso, a la
información tangible, la que es obtenida mediante algún
método de investigación
•
Se denomina investigación cuantitativa aquella que genera
datos numéricos o estadísticos para cuantificar opiniones,
comportamientos o cualquier variable
10. EJEMPLOS DE DATOS CUANTITATIVOS
• Datos cuantitativos continuos:
Este tipo de datos cuantitativos se refiere al flujo constante de valores posibles de la variable
EJEMPLO
Medir la altura de una persona
Edad
• Datos cuantitativos discretos:
Prácticamente hablamos de números enteros, por valores completos. Se cuentan, no se miden.
EJEMPLO
Número de hijos, adultos o mascotas en su familia.
11. • Para caracterizar una variable cuantitativa, cuyos
datos no están agrupados, se utilizan un grupo de
medidas que se muestran a continuación:
-MEDIDAS DE TENDENCIA CENTRAL
-MEDIDAS DE POSICION
-DIAGRAMA DE CAJAS Y BIGOTES
12. Tablas DE frecuencia
• La tabla de frecuencias (o distribución de frecuencias) es una
tabla que muestra la distribución de los datos mediante
sus frecuencias. Se utiliza para variables cuantitativas o
cualitativas ordinales.
• La tabla de frecuencias es una herramienta que permite
ordenar los datos de manera que se
presentan numéricamente las características de la distribución
de un conjunto de datos o muestra.
13. Construcción de la tabla de frecuencias
1. En la primera columna se ordenan de menor a mayor los diferentes valores que
tiene la variable en el conjunto de datos.
2. En las siguientes columnas (segunda y tercera) se ponen las frecuencias
absolutas y las frecuencias absolutas acumuladas.
3. Las columnas cuarta y quinta contienen la las frecuencias relativas y las frecuencias
relativas acumuladas.
4. Adicionalmente (opcional) se pueden incluir dos columnas (sexta y séptima),
representando la frecuencia relativa y la frecuencia relativa acumulada como tanto
por cien. Estos porcentajes se obtienen multiplicando las dos frecuencias por cien.
14. • Frecuencia absoluta
• La frecuencia absoluta (ni) de un valor Xi es el número de veces que el valor está
en el conjunto (X1, X2,…, XN).
• La suma de las frecuencias absolutas de todos los elementos diferentes del
conjunto debe ser el número total de sujetos N. Si el conjunto tiene k números (o
categorías) diferentes, entonces:
• Frecuencia absoluta acumulada
• La frecuencia absoluta acumulada(Ni) de un valor Xi del conjunto (X1, X2,…,
XN) es la suma de las frecuencias absolutas de los valores menores o iguales a
Xi, es decir:
15. • Frecuencia relativa
• La frecuencia relativa (fi) de un valor Xi es la proporción de valores iguales a Xi en el
conjunto de datos (X1, X2,…, XN). Es decir, la frecuencia relativa es la frecuencia
absoluta dividida por el número total de elementos N:
• Las frecuencias relativas son valores entre 0 y 1, 0 ≤ fi ≤ 1. La suma de las frecuencias
relativas de todos los sujetos da 1. Supongamos que en el conjunto tenemos k números
(o categorías) diferentes, entonces:
16. • Frecuencia relativa acumulada
• Definimos la frecuencia relativa acumulada (Fi) de un valor Xi como
la proporción de valores iguales o menores a Xi en el conjunto de datos (X1,
X2,…, XN). Es decir, la frecuencia relativa acumulada es la frecuencia absoluta
acumulada dividida por el número total de sujetos N:
• La frecuencia relativa acumulada de cada valor siempre es mayor que
la frecuencia relativa. De hecho, la frecuencia relativa acumulada de un elemento
es la suma de las frecuencias relativas de los elementos menores o iguales a él, es
decir:
25. GRÁFICOS ESTADÍSTICOS
Es una representación visual de una serie de datos estadísticos.
Es una herramienta muy eficaz, ya que un buen gráfico:
- capta la atención del lector;
- presenta la información de forma sencilla, clara y precisa;
- no induce a error; facilita la comparación de datos y destaca las
tendencias y las diferencias; ilustra el mensaje, tema o trama del
texto al que acompaña.
26. TIPOS DE DATOS
Cualitativos: se refieren a cualidades o modalidades que
no pueden expresarse numéricamente. Pueden ser:
- Ordinales: si siguen un orden o secuencia (ej. el
abecedario, los meses del año).
- Categóricos: si no siguen ningún orden (ej. el estado
civil de las personas: solteros, casados, viudos,
divorciados y separados).
27. TIPOS DE DATOS
Cuantitativos: se refieren a cantidades o valores
numéricos. Pueden ser:
- Discretos: si toman valores enteros (0, 1, 2, 3...). Ej. el
número de hijos, el número de alumnos de una clase…
- Continuos: si pueden tomar cualquier valor dentro de
un intervalo (ej. la estatura o el peso de las personas).
28. GRÁFICO DE BARRAS
• Es una representación gráfica en un eje cartesiano de las
frecuencias de una variable cualitativa o discreta.
29. PIRÁMIDE DE POBLACIÓN
• Es un histograma bi-direccional que muestra la
estructura demográfica de una población, por sexo y
edad, en un momento determinado.
30. GRÁFICO DE LÍNEAS
• Es una representación gráfica en un eje cartesiano de la
relación que existe entre dos variables reflejando con claridad
los cambios producidos.
31. Gráfico de líneas 13 / 28
IPC
jul-09 106,3
ago-09 106,7
sep-09 106,4
oct-09 107,2
nov-09 107,8
dic-09 107,8
ene-10 106,7
feb-10 106,5
mar-10 107,3
abr-10 108,4
may-10 108,7
jun-10 108,9
jul-10 108,4
Un gráfico de líneas es una representación gráfica en un eje cartesiano de la relación
que existe entre dos variables reflejando con claridad los cambios producidos.
IPC 2009 - 2010
Base 2006
110
109
108
107
106
105
Índice de precios al consumo
Base 2006
jul-
09
ago-
09
sep-
09
oct-
09
nov-
09
dic-
09
ene-
10
feb-
10
mar-
10
abr-
10
may-
10
jun-
10
jul-
10
Fuente: IPC. INE
En cada eje se representa cada una de las variables cuya relación se quiere observar (en el ejemplo,
en el eje horizontal los meses y en el eje vertical la media mensual del IPC correspondiente a esos
32. Gráfico de sectores 18 / 28
Un gráfico de sectores es una representación circular de las frecuencias relativas de una
variable cualitativa o discreta que permite, de una manera sencilla y rápida, su comparación.
Alojamientos Turísticos. 2009
Categoría Número de viajeros
Viajeros hospedados en hoteles españoles
por categoría del establecimiento. 2009
Total 69.152.754
Cinco estrellas 4.216.253
Cuatro estrellas 31.960.442
Tres estrellas 24.079.125
Dos estrellas 6.331.715
Una estrella 2.565.219
Una estrella
4%
Dos estrellas
9%
Cinco estrellas
6%
Fuente: Encuesta de Ocupación en Alojamientos Turísticos
Tres estrellas
35%
Cuatro estrellas
46%
33. Pictograma 21 / 28
Un pictograma es un gráfico que representa mediante figuras o símbolos las frecuencias de una
variable cualitativa o discreta.
Al igual que los gráficos de barras suelen usarse para comparar magnitudes o ver la evolución
en el tiempo de una categoría concreta.
Tipos de pictogramas:
• Gráficas de barras cuyas barras están constituidas por símbolos o figuras
distorsionadas que se adaptan a la longitud de la barra.
Porcentaje de viviendas cuyos residentes depositan residuos
en su punto especificado de recogida. 2008
80
70
60
50
40
30
20
10
0
Vidrio Papel y
Cartón
Pilas y
pequeñas
baterías
Envases
plásticos,
metálicos
Medicamentos Aceites de
cocina
34.
35. Un cartograma es un mapa en el que se presentan datos
estadísticos por regiones bien poniendo el número o
coloreando las distintas zonas en función del dato que
representan.
Fuente:
España en cifras. INE
Fuente: Panorámica de la industria. INE
37. • Sirven como puntos de referencia para interpretar las calificaciones que
se obtienen en una prueba.
• La media aritmética : comúnmente conocida como media o promedio . Se
representa por medio de una letra M o por una X con una línea en la parte superior.
• La mediana : la cual es el puntaje que se ubica en el centro de una distribución. Se
representa como Md .
• La moda : que es el puntaje que se presenta con mayor frecuencia en una
distribución. Se representa Mo .
38. Media aritmética o promedio
• Es aquella medida que se obtiene al dividir la suma de todos los valores de una variable por la frecuencia total . En palabras más simples,
corresponde a la suma de un conjunto de datos dividida por el número total de dichos datos.
•
Ejemplo 1:
En matemáticas, un alumno tiene las siguientes notas: 4, 7, 7, 2, 5, 3
n = 6 (número total de datos)
La media aritmética de las notas de esa asignatura es 4,8. Este número representa el promedio
39. Largo (en m) Frecuencia absoluta Largo por Frecuencia
absoluta
5 10 5 . 10 = 50
6 15 6 . 15 = 90
7 20 7 . 20 = 140
8 12 8 . 12 = 96
9 6 9 . 6 = 54
Frecuencia total = 63 430
40. Moda (Mo)
• Es la medida que indica cual dato tiene la mayor frecuencia en un conjunto de datos; o sea, cual se repite más.
• Ejemplo 1:
• Determinar la moda en el siguiente conjunto de datos que corresponden a las edades de niñas de un Jardín Infantil.
• 5, 7, 3, 3 , 7, 8, 3 , 5, 9, 5, 3 , 4, 3
• La edad que más se repite es 3, por lo tanto, la Moda es 3 (Mo = 3)
• Ejemplo 2:
• 20, 12, 14, 23, 78, 56, 96
• En este conjunto de datos no existe ningún valor que se repita, por lo tanto, este conjunto de valores no tiene moda.
41. Mediana (Med)
• Para reconocer la mediana, es necesario tener ordenados los valores sea de mayor a
menor o lo contrario. Usted divide el total de casos (N) entre dos, y el valor resultante
corresponde al número del caso que representa la mediana de la distribución.
• Es el valor central de un conjunto de valores ordenados en forma creciente o
decreciente. Dicho en otras palabras, la Mediana corresponde al valor que deja igual
número de valores antes y después de él en un conjunto de datos agrupados.
• Según el número de valores que se tengan se pueden presentar dos casos:
• Si el número de valores es impar, la Mediana corresponderá al valor central de dicho
conjunto de datos.
• Si el número de valores es par, la Mediana corresponderá al promedio de los dos valores
centrales (los valores centrales se suman y se dividen por 2)
42. • Ejemplo 1:
• Se tienen los siguientes datos: 5, 4, 8, 10, 9, 1, 2
• Al ordenarlos en forma creciente, es decir de menor a mayor, se tiene: 1, 2, 4, 5 ,
8, 9, 10
• El 5 corresponde a la Med, porque es el valor central en este conjunto de datos
impares.