texto argumentativo, ejemplos y ejercicios prácticos
Guia estadistica
1. 1
GUÍA DE APOYO AL APRENDIZAJE N°1
1.- Definiciones de conceptos básicos.
Estadística: la estadística es un conjunto de métodos y procedimientos que sirven para
recolectar, organizar y presentar los datos obtenidos, con el fin de predecir fenómenos que
permitan tomar decisiones.
Estadística Descriptiva: es la parte de la estadística que describe el comportamiento de lo
datos mediante las medidas de posición y dispersión (que veremos más adelante).
Estadística Inferencial: es la parte de la estadística que se basa en los resultados obtenidos
en la Estadística Descriptiva para establecer conclusiones de un experimento, tomar
decisiones sobre él y poder predecir fenómenos.
Población: es un conjunto de objetos o personas que tienen características comunes y que
son objeto de estudio. Existen poblaciones finitas e infinitas. Cuando la población se
considera finita el estudio se hace caso a caso; si la población se considera infinita el estudio
se hace mediante un plan de muestreo, esto es elegir una muestra de la población. Ejemplos
de población finita: los alumnos de un curso; los pacientes de un hospital; los neumáticos
producidos por una fábrica; los votantes de una comuna; las calculadoras; etc. Ejemplo de
población infinita: la población que consta de todos los resultados posibles (cara o sello) en
lanzamientos sucesivos de una moneda.
Muestra: es un conjunto formado por una parte de la población, y por ende posee las
mismas características de esta, como por ejemplo, los profesores del área de Matemática.
Ejemplos de muestra: uno de cada 10 sacos de trigo de un cargamento; 1.820 televidentes
escogidos al azar; los automovilistas que acceden a contestar una encuesta de opinión; las
cajas de leche que se analizan cada hora en una fábrica; etc.
Variable: es una característica que se desea estudiar en una población (característica de
interés de una población o muestra). Las variables se anotan con letras mayúsculas X, Y, Z,
W, etc.
Ejemplos:
X = Edad de los estudiantes de un Instituto Profesional.
Y = Sueldos de los empleados de la cadena DYS.
Z = Nivel educacional del personal de la empresa DYS.
W = Raza de la población de Sudamérica.
Dato: valor de la variable asociado a un elemento de una población o muestra.
Muestreo: actividad realizada, según un plan definido, cuyos resultados producen un
conjunto de datos (método utilizado para seleccionar los elementos que componen la
muestra).
Parámetro: características numéricas de una población.
2. 2
1.1.- Recorrido de una Variable.
Es el conjunto formado por los posibles valores que toma una variable.
Ejemplos:
X = Estado Civil.
Re c X soltero, casado, viudo, separado
Y = N°de Hijos.
Re c Y 0, 1, 2, 3, 4, 5
1.2.- Clasificación de las Variables.
Las variables se clasifican según su recorrido en 2 grupos:
1) Cuantitativas: son aquellas cuyo recorrido es un conjunto de números. Este grupo se
divide en dos tipos, discretas y continuas.
a) Discretas: son aquellas variables que pueden tomar únicamente valores enteros
dentro de una categoría o intervalo. Ejemplos; número de hijos de una familia,
número de tiradas de un dado hasta obtener el primer uno, etc.
b) Continuas: son aquellas variables que pueden tomar cualquier valor real dentro de
un intervalo. Ejemplos; el agua caída en Santiago durante un año cualquiera, la
edad de una persona, el sueldo de los empleados de un departamento, la estatura
de las personas, el tiempo necesario para realizar una transacción bancaria de
parte del cliente, etc.
2) Cualitativas o Atributos: son aquellas cuyo recorrido es un conjunto de conceptos
(sexo, profesión, color de ojos, etc.). Este grupo se divide en dos tipos, ordinales y
nominales.
a) Ordinales: el recorrido puede ser ordenado. Ejemplos; nivel socioeconómico que
puede ser alto, medio o bajo; los grados religiosos, etc.
b) Nominales: el recorrido no se puede ordenar. Ejemplos; nacionalidad, religión,
colores de vehículos, etc.
Ejemplos para Clasificación de Variables:
En las siguientes variables clasificar e identificar la población:
a) X = Número de hijos de un grupo de 40 familias.
Variable = número de hijos.
Población = 40 familias.
Clasificación = cuantitativa – discreta.
3. 3
b) Y= Sueldos de los empleados del Supermercado Líder.
Variable = sueldos.
Población = empleados del Supermercado Líder.
Clasificación = cuantitativa – continua.
c) Z = Cargos de los empleados de la empresa ALFA.
Variable = cargos.
Población = empleados de la empresa ALFA.
Clasificación = cualitativa – ordinal.
d) W = Sexo de los empleados del Supermercado Santa Isabel.
Variable = sexo.
Población = empleados del Supermercado Santa Isabel.
Clasificación = cualitativa – nominal.
e) T = Número de cheques protestados durante un mes en el Banco del Estado en c/u
de sus sucursales.
Variable = número de cheques protestados.
Población = sucursales del Banco del Estado.
Clasificación = cuantitativa – discreta.
2.- Organización de los Datos.
Existen dos maneras de organizar un conjunto de datos:
1º A través de Gráficos: se usan para tener una idea inmediata y simple de la población.
Aun cuando las tablas estadísticas contienen toda la información, muchas veces es
necesario hacer la representación gráfica de ellas; en otros casos, a partir de un gráfico
se construye la tabla estadística Existen gráficos de barras, gráficos circulares (el gráfico
circular se usa para mostrar porcentajes, es decir, la proporción que cada parte es del
total), gráfico lineal (el gráfico lineal se utiliza normalmente para mostrar la evolución de
un dato a lo largo del tiempo), histograma, polígono de frecuencias, etc.
Ejemplo:
Dada la siguiente tabla, expresar los datos en gráficos de barra y circular.
Colores de
Vehículos
Numero de
Personas ( fi )
Porcentajes (%) Grados (i )
Rojo 25 12,5 45
Azul 15 7,5 27
Verde 17 8,5 30,6
Blanco 63 31,5 113,4
Acero 80 40 144
N = 200
4. 4
NOTA: Para calcular los grados del círculo se utiliza la siguiente fórmula, i
360
f
N
Gráfico Circular
12,5%
7,5%
40,0%
8,5%
31,5%
Rojo
Azul
Verde
Blanco
Acero
Rojo Azul Verde Blanco Acero
Colores de Vehículos
1715
2540
20
0
63
80
60
80
100
Gráfico de Barras
NúmerodePersonas
i
5. 5
2º A través de Tablas de Frecuencias, que se dividen en las siguientes columnas:
a) Frecuencia Absoluta fi
: Representa el número de elementos de la población que
toma el valor fi
de la variable, es decir, el número de veces que se repite la variable. En una
tabla N = tamaño de la población o muestra.
Ejemplo: la siguiente tabla muestra el número de hijos de 25 familias. Interprete la tabla.
Número de Hijos fi
0 10
1 6
2 7
3 2
Interpretación: interpretaremos las siguientes frecuencias absolutas de la tabla.
f1
10 familias tienen 0 hijo.
f 3
7 familias tienen 2 hijos.
b) Frecuencia Relativa Porcentual hi
: Representa el tanto por ciento (%) por uno de los
valores o datos que toman el valor hi
de la variable. Observaciones la frecuencia relativa
toma valores entre 0% y 100% y la suma de todos los porcentajes de los valores de la
variable es 100%. Ejemplo: del ejemplo anterior calcule la Frecuencia Relativa Porcentual e
interprete esa columna.
Número de Hijos fi
hi
hi
(%)
0 10 0,4 40
1 6 0,24 24
2 7 0,28 28
3 2 0,08 8
Fórmula: hi
fi 100%
N
Interpretación: interpretaremos las siguientes frecuencias relativas de la tabla.
h2
El 24% de las familias tienen 1 hijo.
h4
El 8% de las familias tienen 3 hijos.
6. 6
c) Frecuencia Absoluta Acumulada Fi
: Representa el número de elementos de la
población que toma el valor Fi
acumulado de la variable. Ejemplo: del ejemplo anterior
calcule la Frecuencia Absoluta Acumulada e interprete esa columna.
Numero de Hijos fi
Fi
0 10 10
1 6 16
2 7 23
3 2 25
Fórmula: Fi
Fi 1
fi
Interpretación: interpretaremos las siguientes frecuencias absolutas acumuladas de la
tabla.
F2
F4
16 familias tienen a lo más 1 hijo.
25 familias tienen a lo más 3 hijos.
d) Frecuencia Relativa Porcentual Acumulada Hi
: Representa el tanto por ciento (%)
acumulado de los valores o datos que toman el valor Hi
de la variable. Ejemplo: del ejemplo
anterior calcule la Frecuencia Relativa Porcentual Acumulada e interprete esa columna.
Numero de
Hijos
fi
hi
Hi
Hi
(%)
0 10 0,4 0,4 40
1 6 0,24 0,64 64
2 7 0,28 0,92 92
3 2 0,08 1 100
Fórmula: Hi
H i 1
hi
; o bien se puede calcular: H
Fi 100%
i N
Interpretación: interpretaremos las siguientes frecuencias relativas acumuladas de la
tabla.
H 2
El 64% de las familias tienen a lo más 1 hijo.
H 3
El 92% de las familias tienen a lo más 2 hijos.
7. 7
PROBLEMA PROPUESTO
En un negocio de ventas de frutas del país, se examinó un lote de 25 cajas de manzanas,
cada una teniendo un contenido de 48 manzanas. El número de manzanas en mal estado en
cada caja fue:
3 –4 –1 –2 –1 – 2 – 5 – 2 – 1 – 2 – 3 – 0 – 1
0 – 3 – 3 – 2 – 0 – 2 – 1 – 3 – 4 – 1 – 2 – 2.
Determine variable, población, clasificación. Confecciona una Tabla de Frecuencias y en
base a ella responder:
a) ¿Cuántas cajas contienen menos de 3 manzanas en mal estado? (17 cajas)
b) ¿Qué porcentaje de cajas contienen al menos 3 manzanas en mal estado? (32%)
c) ¿Cuántas cajas contienen de 2 a 4 manzanas en mal estado? (15 cajas)
d) ¿Qué porcentaje de cajas contienen a lo más 2 manzanas en mal estado? (68%)
8. 8
2.1.- Tabulación de una variable continua.
Para organizar los datos de una variable cuantitativa continua se recurre a intervalos. Se
debe seguir el siguiente método:
i) Identificar entre los datos él X
máx
y X
mín
.
ii) Calcular el número de intervalos con la fórmula de Sturges: m 1 3,3logN
(o bien utilizar el número de intervalos dado).
iii) Calcular la amplitud de cada intervalo el cual se representará con la fórmula:
C
X
máx
X
mín
i m
; m
número de int ervalos C
i
amplitud del intervalo.
iv) Construir la Tabla de Frecuencias.
Ejemplo: se tiene la siguiente información respecto al peso (en toneladas) de los containers
llegados durante febrero al puerto de Valparaíso.
10,5 – 12 – 15 – 12,3 – 12,1 – 14,3 – 10,7 – 13
13,8 – 13,5 – 11,2 – 11,8 – 11,4 – 12,5 – 14,3 – 14,7
12,1 – 14,7 – 10,8 – 12,3 – 14,8 – 14,5 – 14 – 13,9
11,5 – 12 – 14 – 14,1 – 13,8 – 13,2 – 12,5 – 10,8
12,9 – 14 – 10,2 – 12,5 – 10,6 – 11,2 – 14,6 – 13
Determine variable, población, clasificación y organizar los datos en una Tabla de
Frecuencias con 4 intervalos e interpretar: f1
, h4
, F2
, H3
.
SOLUCIÓN: Variable = peso en toneladas de los containers.
Población = 40 containers.
Clasificación = cuantitativa – continua.
X 15 ; X 10,2 ; C
X
máx
X
mín
15 10,2
4,8
1,2
máx mín i m 4 4
Peso de los
Containers
(en toneladas)
fi
hi
Fi
Hi
10,2 – 11,4 8 0,2 8 0,2
11,4 – 12,6 12 0,3 20 0,5
12,6 – 13,8 5 0,125 25 0,625
13,8 – 15,0 15 0,375 40 1
N = 40
f1
8 containers que pesan entre 10,2 y 11,4 toneladas.
h4
F2
El 37,5% de los containers pesan entre 13,8 y 15 toneladas.
20 containers pesan entre 10,2 y 12,6 toneladas.
H 3
El 62,5% de los containers pesan entre 10,2 y 13,8 toneladas.