Este documento presenta conceptos básicos de estadística descriptiva como medidas de tendencia central (media, mediana, moda), medidas de dispersión (rango de variación, varianza, desviación estándar, coeficiente de variación) y tipos de variables (cualitativa, cuantitativa). También describe métodos de recolección y presentación de datos como distribución de frecuencias, tablas y gráficos.
3. Estudios exploratorios: tienen por objeto esencial
familiarizarnos con un tópico desconocido o poco
estudiado o novedoso. Esta clase de investigaciones
sirven para desarrollar métodos a utilizar en estudios
más profundos.
Estudios descriptivos: sirven para analizar cómo es y se
manifiesta un fenómeno y sus componentes.
Estudios correlacionales: pretenden ver cómo se
relacionan o vinculan diversos fenómenos entre si (o si
no se relacionan).
Estudios explicativos : buscan encontrar las razones o
causas que provocan ciertos fenómenos.
La investigación implica…
Una misma investigación puede abarcar fines exploratorios, en su inicio, y terminar siendo descriptiva,
correlacional yhasta explicativa: todo segúnlos objetivos del investigador. Loimportante espartir por la
descripcióndelcontexto.
4. ESTADISTICA Disciplina encargaday dedicada aestudiar las poblaciones, de dos maneras:
2. INFERENCIAL
1. DESCRIPTIV
A
POBLACIONES
MUES
TRA
V
ARIABLE
CUALIT
A
TIV
A
CUANTITATIVA
CONTINUAS DISCRET
AS
dicotómica
politónica
Valores fijos (número de hijos). Entre
1 y 2 hijos no pueden haber 1,5 hijos.
Puede haber medidas intermedias
entre los valores. Por ejemplo el
peso(entre 89 y 90 podemos tener
89,5.
DEDUCCIONES
5. EJEMPLO 1:
Población:
Personas del mundo entero
Muestra:
Personas del mundo entero en ciudades
representativas, New York, Washington,
Londres, Paris, Tokio
Variable:
Nº de sucursales o casas matriz que hacen
presencia en dichas ciudades
representativas
TipodeVariable:
Cuantitativa Continua
7. EJEMPLO 3:
Población:
Jóvenes en el País
Muestra:
Jóvenes en el país entre 17 y 22 años
Variable:
Genero Musical preferido (Rock, Pop, música clásica,
instrumental, electrónica, nativa)
TipodeVariable:
Cualitativa
8. Otro tipo de variables
• Variable independiente: Cualquier suceso que sospechamos es la causa de otro
• Variable dependiente: Medida utilizada para estudiar la variable independiente
• Variable extraña: Aquellas que pueden influir sobre la variable dependiente pero
no nos interesa estudiar sus efectos.)
• Ejemplo de la hipertensión:
• Variable independiente: Tipo de tratamiento
• Valor 1 de la variable independiente: Tratamiento estándar
• Valor 2 de la variable independiente: Tratamiento estándar más terapia
• Variable dependiente: Hipertensión arterial
• Variable extraña: Obesidad (sabemos que la obesidad puede influir en la hipertensión
arterial pero no nos interesa estudiarla en este caso)
9. Distribución de Frecuencias
• Una distribución de frecuencias es una representación de la relación entre un
conjunto de medidas exhaustivas y mutuamente influyentes y la frecuencia de
cada una de ellas.
• Ante un gran número de datos, resulta de mucha utilidad distribuirlos en clases o
categorías y precisar el número de individuos pertenecientes a cada clase, que es
la frecuencia de clase. La ordenación tabular de los datos en clases, reunidas las
clases y con las frecuencias correspondientes a cada una, es una distribución de
frecuencias o tabla de frecuencias. La tabla 1, es una distribución de frecuencias
de alturas (en centímetros) de 1,000 estudiantes universitarios.
• Funciones:
• Ofrecer la información necesaria para realizar representaciones graficas
• Facilitar los datos para obtener los estadísticos muéstrales
10. Conceptos
• Frecuencia absoluta (ni): Número de veces que se repite cada uno de los valores de una variable. La
suma de todas las frecuencias absolutas representa el total de la muestra (n)
• Proporción o frecuencia relativa (pi): Cociente entre la frecuencia absoluta de cada valor de la
variable (ni) y el número total de observaciones (n). pi = ni /n
• Porcentaje (Pi): Valor de la frecuencia relativa (pi) multiplicado por cien: Pi = pi x 100
• Frecuencia absoluta acumulada (na): Número de veces que se repita cada modalidad o cualquiera
de las modalidades inferiores.
• Proporción acumulada o frecuencia relativa acumulada (pa): Cociente entre la frecuencia absoluta
acumulada de cada clase y el total de observaciones. pa = na / n
• Porcentaje acumulado (Pa): Valor de la frecuencia relativa acumulada multiplicado por cien. Pa=
pax 100
• La amplitud de los intervalos representa al número de unidades que tenemos dentro de cada
intervalo. No es lo mismo tener una amplitud de intervalos de 10 en 10 (11-20) (21- 30) (31-40) que
de 5 en 5 (15-19) (20-24) (25-29).
11. Representaciones Gráficas
• Un gráfico es una forma rápida de visualizar un conjunto de
datos o distribución de frecuencias. El sistema de
coordenadas más habitual está formado por:
• Eje vertical (ordenada o eje Y)
• Eje horizontal (abscisa o eje X)
• Origen: Punto donde se juntan ambos ejes
12. Representación grafica de una variable
a) Diagrama de barras
• Se utiliza para variables cualitativas y
cuantitativas discretas.
• – En el eje X se colocan los valores y en el Y
las frecuencias.
Sobre cada valor de la variable se dibuja un
rectángulo o barra perpendicular cuya altura
debe ser igual a la frecuencia.
• Diagrama de barras acumulativo
Variedad del diagrama de barras que se utiliza
en variables ordinales y cuantitativas discretas.
En el eje X se sitúan los valores de la variable y
en el eje Y las frecuencias acumuladas.
13. b) Diagrama de sectores
• Se utiliza para variables cualitativas y
cuasicuantitativas
• – Representación en forma de círculo. El
círculo se divide en secciones cuya superficie
es proporcional a la frecuencia de la
modalidad correspondiente. Para determinar
el ángulo de los sectores de cada modalidad
se multiplica la frecuencia relativa por 360,
que es el número de grados de una
circunferencia.
14. c) Pictograma
• Se utiliza para variables cualitativas
• – Son dibujos alusivos al objeto de estudio.
Son escalas que deben ser proporcionales al
valor que representan.
15. d) Histograma
• Parecido al diagrama de barras pero no hay
espacio entre los rectángulo. Se utiliza para
variables cuantitativas continuas con datos
agrupados en intervalos
• En el eje X se colocan los límites exactos de
los intervalos y en el eje Y la frecuencia.
16. Representación grafica de dos variables
a) Diagrama de barras conjunto
• Se utiliza cuando al menos una de las dos
variables es cualitativa
• Los datos se organizan en una tabla de
doble entrada. Se sitúan los valores de
una variable en las filas y los valores de
la otra variable en las columnas.
• Una vez construida la tabla, se procede
a dibujar los gráficos por columnas
17. b) Diagrama de dispersión o nube de puntos
• Se utiliza en el caso de dos variables
cuantitativas
• – Una variable se sitúa en el eje X y la otra
en el eje Y. Para cada par de datos se
localiza la intersección entre ambas
variables y se marca con un punto.
• – Es una manera rápida de hallar relaciones
lineales entre las dos variables.
18. Las matemáticas en la investigación de
mercados y muestreo
• La investigación de mercados es la obtención, interpretación y comunicación de
información orientada a las decisiones, la cual será utilizada en todas las fases del
proceso estratégico de mercadotecnia. Esta definición tiene dos importantes
contenidos:
• Interviene en las tres fases del proceso administrativo del marketing: planeación,
instrumentación y evaluación.
• Reconoce la responsabilidad del investigador de recabar información útil para los
administradores.
19. Alcances de la investigación de mercado
• Dependiendo de sus necesidades y nivel de complejidad, los directivos de
mercadotecnia utilizan cuatro principales fuentes de información:
• Una es la obtención de reportes proporcionados regularmente, los cuales son elaborados
y vendidos por empresas de investigación. Éstos son llamados servicios sindicados
porque son desarrollados sin tener en cuenta a un cliente en particular, pero son
vendidos a cualquier interesado. Suscribirse a este servicio permite al empresario
observar regularmente las ventas al detalle de los productos de sus competidores por
tipo de establecimiento y zona geográfica.
• La segunda fuente es el sistema de información de mercadotecnia, una actividad interna
de una empresa la cual le proporciona un reporte estandarizado continuo, programado o
de flujo de demanda. Los sistemas de información de mercadotecnia son utilizados por
directivos y vendedores.
20. Alcances de la investigación de mercado
• La tercera fuente es el sistema de apoyo a las decisiones. También es interno, pero
permite a los directivos interactuar directamente con los datos a través de
computadoras personales para contestar preguntas concretas. Un administrador, por
ejemplo, podría tener un sistema de apoyo a las decisiones que proporcionará
suposiciones específicas que estimularán el impacto de varios niveles de publicidad en
las ventas de un producto.
• La cuarta fuente es un no recurrente y exclusivo proyecto de investigación de
mercadotecnia, conducido por el personal de asesoría de la compañía o por una
empresa de investigación independiente, para contestar una pregunta específica.
22. MEDIDAS DE TENDENCIA CENTRAL
Las medidas de tendencia central son medidas
estadísticas que pretenden resumir en un solo valor a un
conjunto de valores. Representan un centro en torno al
cual se encuentra ubicado el conjunto de los datos. Las
medidas de tendencia central más utilizadas son: media,
mediana y moda.
Promedio o media
La medida de tendencia central más
conocida y utilizada es la media
aritmética o promedio aritmético. Se
representa por la letra griega µ cuando
se trata del promedio del universo o
población
¿Cuál será la media aritmética de los números 10, 5, 8,
14, 13?
23. MEDIDAS DE TENDENCIA CENTRAL
Mediana
Otra medida de tendencia central es la mediana. La
mediana es el valor de la variable que ocupa la posición
central, cuando los datos se disponen en orden de
magnitud. Es decir, el 50% de las observaciones tiene
valores iguales o inferiores a la mediana y el otro 50%
tiene valores iguales o superiores a la mediana.
Si el número de observaciones es par, la mediana
corresponde al promedio de los dos valores centrales.
24. MEDIDAS DE TENDENCIA CENTRAL
Moda
La moda de una distribución se define como
el valor de la variable que más se repite. En
un polígono de frecuencia la moda
corresponde al valor de la variable que está
bajo el punto más alto del gráfico. Una
muestra puede tener más de una moda.
Ejemplo 1
La serie: 2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 12, 18
La moda es 9
Ejemplo 2
La serie: 3, 5, 8, 10, 12, 15, 16
No tiene moda
Ejemplo 3
La serie: 2, 3, 4, 4, 4, 5, 5, 7, 7, 7, 9
Tiene dos modas, por ello es bimodal
25. MEDIDAS DE DISPERSIÓN
Las medidas de dispersión entregan
información sobre la variación de la
variable. Pretenden resumir en un solo valor
la dispersión que tiene un conjunto de datos.
Las medidas de dispersión más utilizadas
son: Rango de variación, Varianza,
Desviación estándar, Coeficiente de
variación.
Rango de variación
Rango. Es la diferencia entre el
máximo y el mínimo valor de la
variable o de un conjunto de
números
R= X máx. - Xmín
R= X máx. - Xmín
R= 6325 - 1274 R= 5051
26. MEDIDAS DE DISPERSIÓN
Desviación Estándar
La desviación típica o desviación
estándar (denotada con el símbolo σ o s,
dependiendo de la procedencia del
conjunto de datos) es una medida de
dispersión para variables de razón
(variables cuantitativas o cantidades
racionales) y de intervalo. Se define como
la raíz cuadrada de la varianza de la
variable.
28. MEDIDAS DE DISPERSIÓN
Coeficiente de Variación
La variación real o dispersión determinada
a partir de la desviación estándar u otra
medida de dispersión, es llamada la
dispersión absoluta.
Si la dispersión absoluta es la desviación
estándar S y el promedio, la dispersión
relativa se llama coeficiente de variación
o coeficiente de dispersión.
30. EJERCICIOS
Cinco amigos han escrito en una tabla las edades de sus padres:
Se pide:
1.Calcular la media, moda, mediana, desviación media y desviación típica de las edades de los padres
(varones).
2.Hacer lo mismo con las edades de las madres.
3.En general, ¿son más mayores los padres o las madres?
4.¿Las edades que se alejan más de la media son las de los padres o las de las madres?
31. PROBLEMA 2
El número de bolígrafos que llevan en el estuche un grupo de alumnos son
3, 4, 2, 5, 3,
3, 4, 2, 2, 4
Se pide:
1.Calcular la media y la mediana de los datos (grupo de 10).
Recientemente, se une un alumno al grupo. Este nuevo individuo tiene un estuche que consta con una
colección de 45 bolígrafos de colores.
2.Calcular la media y la mediana de los datos incluyendo al nuevo individuo (grupo de 11).
3.Sacar conclusiones del comportamiento de la media y de la mediana.
32. PROBLEMA 3
La siguiente tabla recoge las notas de 7 alumnos en la asignatura Matemáticas:
Se pide:
1.Calcular la varianza y la desviación estándar.
El profesor había olvidado un examen en la carpeta. Lo corrige y añade la nota a la tabla (es un 1):
2.Calcular la varianza y la desviación estándar añadiendo el nuevo dato.
3.Según los resultados, ¿es más sensible la varianza o la desviación estándar?