2. CONCEPTOS INICIALES
• Es la parte de las Matemáticas que utiliza conjuntos de datos para obtener, a
partir de ellos, información basada en el cálculo de probabilidades.
• Estadística Descriptiva
Procedimientos que sirven para recolectar, resumir y presentar conjuntos de
datos.
• Estadística Inferencial
Procedimientos que sirven para deducir o inferir características y tendencias de
un conjunto de datos (Población) a partir de un subgrupo de ellos (Muestra).
• Población: Conjunto de todos los posibles individuos (personas u objetos) o
mediciones de interés estadístico. Al tamaño de la población se lo denota con N
• Muestra: Una porción o parte de una población de interés. Al tamaño de una
muestra se lo denota con n
3. CONCEPTOS IMPORTANTES
Variable: Característica de la población que se está analizando en un
estudio estadístico.
a)Variable cualitativa: Cuando la característica o variable en estudio es no
numérica; se le denomina también variable de atributo.
b) Variable cuantitativa: Cuando la variable estudiada es expresable
numéricamente. Pueden ser discretas o continuas.
4. • Variables discretas: Asumen solo ciertos valores, usualmente
existen “brechas” entre ellos.
• Variables continuas: Pueden asumir cualquier valor dentro de un
intervalo específico.
CONCEPTOS IMPORTANTES
4
Por lo tanto, el número de
valores es contable.
Por lo tanto, el número de
valores es incontable.
0 1
1/2
1/4
1/16
0 1 2 3 ...
7. RECOLECCIÓN DE DATOS
Es la actividad que consiste en la recopilación de estos dentro de un cierto contexto.
Luego viene el procesamiento de datos, que consiste en trabajar con lo recolectado
para convertirlo en conocimiento útil (información).
La recolección depende principalmente del uso que se le pretende dar:
- Generación de indicadores
- Presentación de información
- Base para sistemas de información
- Proyecciones o análisis de tendencias
- Inferencia estadística
- Tratamiento para posteriores estudios
Se puede apelar a diversas técnicas: encuestas, observación, toma de
muestras y entrevistas.
8. FUENTES DE DATOS
Datos primarios: Datos que origina el investigador para una aplicación específica.
- Censos.
- Estudios de observación.
- Experimentación.
- Manejo de información histórica
Datos secundarios: Datos ya publicados que han sido recolectados para propósitos
diferentes a las específicas de la investigación en desarrollo.
- Bases de datos computacionales (internet).
- Fuentes gubernamentales (censos, estudios): INEC, CORPEI, BCE.
- Fuentes de empresas o Instituciones: MARKOV, MARKET.
- Revistas o periódicos.
9. REGLAS PARA CUESTIONARIOS
• Las preguntas han de ser pocas (no más de 30).
• De preferencia deben ser cerradas y numéricas.
• Redactar las preguntas con lenguaje sencillo.
• Formular las preguntas de manera neutral (nunca en negativo).8y
• Las preguntas no deben obligar a hacer esfuerzos de memoria o cálculos complejos.
• No hacer preguntas indiscretas.
• Redactar las preguntas para que se contesten de forma inequívoca.
• Redactar las preguntas limitadas a una sola idea o referencia.
10. PRESENTACION Y ORGANIZACIÓN DE LOS DATOS
TABLA DE DISTRIBUCIÓN DE FRECUENCIAS
Representación ordenada de los datos, en clases o intervalos
excluyentes y exhaustivos.
Excluyente: Si un valor esta en una clase/grupo no puede estar en otro a la vez.
Exhaustivo: No podemos olvidar ningún posible valor de la variable
Nota:
Cuando se realizan tablas distribución de frecuencias de variables cualitativas, se debe
referir a las clases como categorías
11. Pasos para Distribuciones de Frecuencia
• Recolección de los datos (Datos sin procesar). nrepresenta el número de datos
• Ordenamiento de los datos (Datos ordenados)
Se puede apreciar el máximo y mínimo
Se puede ver la frecuencia de aparición de ciertos datos
• Elección del número de intervalos o clases (siempre se redondea hacia arriba)
k = 1 + 3.32 * Log (n) (fórmula de STURGES)
n < 𝟐𝒌, donde k es el menor valor que cumple la desigualdad.
• Cálculo de la Amplitud de Clase: Distancia entre dos límites consecutivos.
A = (Máximo – Mínimo) / k
• Generación de la tabla de frecuencias
Clases (identificador)
Intervalos o clases (Límite inferior y superior)
Marca de clase: (punto medio de la clase) = (Ls + Li)/2
Frecuencia absoluta: Conteo de observaciones que hay en cada clase.
Frecuencia relativa: Proporción de observaciones en cada clase. FR = FA / n
12. Auto Reparación
El Gerente de Auto Reparación quiere tener una mejor comprensión del costo de las
refacciones utilizadas al hacer una reparación en su taller. Examina 50 facturas de sus
clientes. Los costos de las refacciones de cada reparación (redondeados), son:
91 78 93 57 75 52 99 80 97 62
71 69 72 89 66 75 79 75 72 76
104 74 62 68 97 105 77 65 80 109
85 97 88 68 83 68 71 69 67 74
62 82 98 101 79 105 79 69 62 73