INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING
FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING - INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL
Grado Superior Gestión Comercial y Marketing - Trabajo Informe Promoción de V...
Similar a INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING
Similar a INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING (20)
INVESTIGACIÓN COMERCIAL - TEMA 7 ESTADISTICA APLICABLE A LA INVESTIGACION COMERCIAL - FP A DISTANCIA ANDALUCIA - GRADO SUPERIOR GESTION COMERCIAL Y MARKETING
1. Este documento ha sido generado para facilitar la impresión de los contenidos.
Los enlaces a otras páginas no serán funcionales.
¿Por qué utilizamos la estadística en investigación comercial?
¿Hemos pensado alguna vez cuantas veces al año se suena la nariz una persona?,
¿Sabemos cuánto tiempo dedicamos a la semana a pasar el aspirador?, ¿Conoces
que Holanda importa el 52 % de la flor cortada de fuera de la Unión Europea?
Realmente podemos pensar que eso no le importa a nadie, pero la cosa cambia si
nos ponemos por un momento en la piel del director de marketing de una empresa
de pañuelos de papel, de una empresa de filtros para aspirador o de un importador
de flores.
Pensemos que vamos a crear un hotel en Isla Paraíso.
Aquí tenemos 10 millones de euros para gastar como queramos. Adelante, ya
podemos edificar el hotel, vamos a darle el dinero a una constructora y a pedirle que
nos hagan el hotel.
A los cinco minutos ha venido el director de la constructora y me ha hecho un par de preguntas que me han hecho
reflexionar. ¿Cuántas habitaciones quiere para el hotel?,¿De cuántas estrellas?.
La verdad es que no tengo ni idea, ¿Cómo podemos averiguarlo?,
probemos a contar con información.
Me interesa conocer el mercado: Qué tipo de cliente viaja a una isla
como la nuestra, qué tipo de hotel prefiere, cuánto gasta durante su
estancia, cómo contrata su viaje, etc..
A las empresas les interesa estudiar su mercado, para
poder adaptar su oferta a las necesidades del mismo
Supongamos que hemos sido capaces de conseguir la información
que necesitamos. ¿hemos terminado?
Me temo que esto únicamente es el principio, ahora llega el momento cumbre, hay que tomar la decisión.
Consideremos que hemos decidido construir un hotel de tres estrellas con
cien habitaciones. La empresa constructora ha realizado su trabajo en un
tiempo record y nos acaba de entregar nuestro hotel perfectamente
equipado. El personal ya ha sido contratado con antelación y estamos en
condiciones de recibir a nuestros primeros clientes.
Todavía no hemos terminado con la búsqueda de información, ahora es
necesario saber si los clientes han quedado satisfechos de su estancia.
A las empresas les interesa conocer el nivel de satisfacción
de sus clientes
Los primeros datos son bastante positivos:
El primer mes hemos tenido una ocupación media del 60 %, sabemos que uno de cada tres clientes ha quedado
muy satisfecho, que el 40 % piensan repetir sus próximas vacaciones y que el gasto medio por cliente ha sido de
200 € a la semana.
La estadística nos ha ayudado a obtener y presentar estos datos.
Página 1 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
2. El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no
funcionarán.
El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no
funcionarán.
La estadística busca características generales de un colectivo y prescinde de las particulares
de cada elemento.
Cuando la estadística encuentra regularidades en el comportamiento del colectivo, nos servirán para describir el
fenómeno y para realizar predicciones.
Para saber más:
http://www.aiteco.com/satisfac.htm
http://www.servicevalley.net/rootes/showprod.asp?
codProd=147&categID=102&subcatID=102
http://www.asifal.org/Satisfaccion_al_Cliente.htm
Autoevaluación
Responder con verdadero o falso: La estadística busca características particulares de cada elemento y prescinde de las generales de un
colectivo.
a) Verdadero
b) Falso
Estadística aplicable a la Investigación Comercial
Conceptos básicos de estadística descriptiva
Para comprender mejor los conceptos vamos a utilizar un ejemplo casi
real.
La Isla Paraíso está situada en el archipiélago de Nirvana en el Océano
Atlántico. Goza de una temperatura estable durante todo el año, lo que la
convierte en un enclave maravilloso, tanto para vivir como para pasar una
temporada de vacaciones.
En la isla viven 100.000 habitantes dedicados, en su mayoría, a
actividades vinculadas al turismo y a la fabricación de objetos de bambú.
Población
Muestra
Tamaño muestral
Estadística aplicable a la Investigación Comercial
Universo y Población
Cuando queremos obtener información la primera pregunta que debemos responder es ¿de qué elementos quiero
extraer la información?, esta pregunta no resulta tan fácil de responder como puede parecer.
En estadística se denomina Universo al conjunto de elementos u objetos de los cuales se
quiere obtener información.
Aquí el término elementos tiene un significado mucho más amplio que el usual, ya que puede referirse a personas,
cosas, actos, áreas geográficas e incluso al tiempo.
Página 2 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
3. El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no
funcionarán.
Si nos fijamos en alguna o algunas de las características de los elementos del Universo nos aparecerá un nuevo
concepto "la Población", que es el que recogerá todas esas informaciones que queremos obtener.
En estadística se denomina Población al conjunto de datos referidos a todos y cada uno de los
elementos del Universo.
Por ejemplo:
Si estudiamos al Universo "habitantes de isla Paraíso" podremos estudiar:
La Población: edades de los habitantes de isla Paraíso.
La Población: alturas de los habitantes de isla Paraíso.
Etc....
Si estudiamos al Universo "flautas fabricadas" podremos investigar:
La Población: la calidad de las flautas de bambú fabricadas.
La Población: los tipos de flautas de bambú fabricadas.
Etc...
Si queremos saber sobre el Universo "turistas" podremos investigar:
La Población: nivel de satisfacción de los turistas que visitan la isla.
La Población: edades de los turistas que visitan la isla.
Etc...
Vayamos a la práctica.
¿Es fácil de definir la población?
La respuesta es que no siempre es fácil definir correctamente la población ya que debe estar perfectamente definida
en el tiempo o/y en el espacio.
Por ejemplo, para estudiar la edad de los habitantes habrá que especificar a que año nos referimos: Habitantes de la
isla en el año 2003.
Si vamos a medir la calidad de las flautas de bambú
será necesario detallar qué tipo de flauta y el período
en el que se hayan fabricado.
Una población puede ser finita e infinita.
Cuando la Población es infinita, y es complicado
realizar un estudio en ella por no poder acceder a
todos los datos, nos aparece un nuevo concepto
estadístico "La Muestra" que explicaremos en la
pregunta siguiente.
Autoevaluación
Se estudian las horas semanales que dedica a investigación un Departamento especializado. Indicar cual es el universo y cual la
población de las siguientes afirmaciones:
a) Se recogen todos los datos de todas las características del Departamento especializado.
Elige una opción...
b) Se recogen los datos correspondientes a las horas semanales que dicho Departamento le dedica a
investigación
Elige una opción...
Estadística aplicable a la Investigación Comercial
Página 3 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
4. Muestra
Podemos estar pensando que obtener información es un proceso demasiado complicado. ¿Cuánto tiempo podemos
tardar en preguntar algo a todos los españoles?; si queremos saber el recorrido de los clientes en un hipermercado
¿Tenemos que seguirlos a todos?; para comprobar si los pastelillos de una fábrica tienen la calidad deseada ¿hay
que probarlos todos?
Evidentemente hay ocasiones en las hay que obtener la información de un número de elementos inferior al de la
población, en estos caso hablamos de muestra.
Muestra: es un subconjunto de la población o parte representativa de la misma.
La información que obtengamos de la muestra debe servir para conocer a la población, por ello es
importante utilizar una muestra que represente a la población.
Diremos que una muestra es representativa cuando los datos estudiados de la Población se
cogen al azar.
Para que la muestra represente a la población y sea de utilidad estadística, deben reunirse ciertos requisitos para la
selección de los datos como vemos.
¿Cuándo interesa recurrir a una muestra? Casi siempre.
Compensa utilizar una muestra en los siguientes casos:
Si la población tiene un tamaño muy grande o infinito y, en consecuencia, es imposible observar a todos sus elementos.
Por ejemplo, si queremos analizar la calidad del agua que fluye por el
cauce del río Casto (único en nuestra isla), es imposible estudiar cada
gota de agua.
Si el coste de realizar una observación exhaustiva es muy alto.
Por ejemplo, si hay que visitar a los habitantes que viven en los
pequeños poblados de muy difícil acceso. (aunque debe de entrar
alguno en la muestra) .
Si el tiempo de recolección de datos es muy extenso. Por ejemplo, si queremos preguntar a
los turistas que visitaron la isla en los últimos cuatro años.
Si la observación de los elementos es destructiva.
Por ejemplo, si queremos estudiar si están sabrosos los helados de una partida destinada a la venta
en hoteles, no podríamos probarlos todos porque los destruiríamos.
En otros casos es interesante estudiar todos los elementos que componen la población, en estos
casos hablamos de un censo.
Autoevaluación
¿Cuál de las siguientes afirmaciones no es correcta?: Compensa recurrir a una muestra si:
a) La población tiene un tamaño muy grande o infinito.
b) El coste de realizar una observación exhaustiva es muy alto.
c) El tiempo de recolección de datos es muy pequeño.
Página 4 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
5. El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no
funcionarán.
d) La observación de los elementos es destructiva.
Es importante cuando utilizamos una muestra que sea representativa
a) Verdadero
b) Falso
Estadística aplicable a la Investigación Comercial
Tamaño de la muestra
Pensemos en lo curioso que puede llegar a ser la estadística.
Antonio y Arturo son dos amigos que han pasado juntos toda su vida, pero a Antonio le
han ido francamente bien las cosas y a Arturo le han ido bastante mal.
Antonio tiene un valioso patrimonio: dos casas, cuatro coches, ocho locales
comerciales, y cuarenta tiendas, su único problema es que ha dedicado todo su tiempo
a su trabajo y sigue soltero a sus cuarenta años. Arturo se casó a los veinte años, tuvo
cuatro hijos, se separó y ha vuelto a casarse y lo han despedido de todos sus empleos.
Si usamos la estadística podemos afirmar que
cada amigo tiene una casa, dos coches, cuatro
locales comerciales y veinte tiendas. También
veremos que cada uno tiene dos hijos y se ha
casado una única vez.
¿Qué ha pasado?
Los elementos de la población (Antonio y Arturo) son bastante diferentes y al
calcular la media de sus posesiones lo único que conseguimos es que
ninguno de los dos quede representado.
Podemos pensar, si esto ha ocurrido con dos personas, ¿Qué ocurrirá con poblaciones de mayor tamaño?, o peor
aún, ¿Qué ocurrirá si en vez de preguntar a toda la población recurrimos a una muestra?.
La respuesta a todo esto también la tiene la estadística. Hay que usar la técnica adecuada a cada situación.
Vamos a centrarnos en el tamaño de la muestra.
Ya hemos dicho que para que podamos utilizar de manera útil la información extraída de una muestra esta debe ser
representativa, y por lo tanto útil.
Para que una muestra sea representativa debe de reflejar las similitudes y diferencias encontradas en la población, y
ejemplificar las características de la misma. Cuando decimos que una muestra es representativa indicamos que
reúne aproximadamente las características de la población que son importantes para la investigación.
Cuando una muestra tiene el tamaño adecuado y sus elementos han sido seleccionado
correctamente los resultados obtenidos representan a la población.
¿Existe un tamaño de muestra ideal para cualquier investigación?
Página 5 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
6. El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no
funcionarán.
La respuesta es no, en cada caso tendremos que calcular cuál es el tamaño muestral
adecuado. Sí existe, y se calcula a través de una formula matemática dependiendo de lo que estemos estudiando.
¿Qué debemos tener en cuenta para calcular el tamaño óptimo de la muestra?
Para calcular el tamaño de la muestra hay que considerar:
El tipo de parámetro que queramos extraer o estimar y del tipo de estadístico que vamos a emplear. Es distinto el tamaño muestral necesario para calcular una
media que para calcular una proporción.
Hay que considerar la tasa de respuesta. Si suponemos que algunos elementos no van a contestar es interesante sobredimensionar la muestra para que al final
tengamos el número de datos que necesitamos.
El tipo de muestreo que vamos a utilizar.
Desde luego hay que tener en cuenta una cosa, si el tamaño de la muestra es superior al necesario, las
conclusiones también son válidas, por ello siempre es preferible pecar por exceso que por defecto, es decir, en caso
de duda hay que elegir el tamaño de la muestra mayor.
Para saber más:
http://www.uniovi.es/~Psi/REMA/v3n1/a2/p3.html
http://www.seh-lelha.org/tamuestra.htm
Autoevaluación
Una muestra representa a la población cuando tiene el tamaño adecuado y sus elementos han sido seleccionados correctamente
a) Verdadero
b) Falso
En caso de dudas, con respecto al tamaño de la muestra es preferible es preferible elegir el tamaño de la muestra menor.
a) Verdadero
b) Falso
Estadística aplicable a la Investigación Comercial
Elementos de la población
Hemos comentado que en estadística el término población sirve para referirse a
multitud de cosas: personas, objetos, actos, áreas geográficas e incluso al tiempo.
Estos elementos pueden ser de dos tipos: los cuantitativos y los cualitativos.
Los elementos cuantitativos se denominan variables y pueden ser descritos
mediante números, como, por ejemplo, la edad, el número de hijos, el salario, etc.
Todas las personas tienen edad, pero cada una
tendrá una diferente, por lo tanto cada
observación proporcionará un número. Estos
números son los valores de la variable.
Los elementos cualitativos se llaman atributos y se describen mediante
palabras, como la profesión, la nacionalidad o el estado civil. No se pueden medir
mediante números.
Página 6 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
7. El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no
funcionarán.
Tampoco los atributos aparecen de manera constante en todos los elementos,
por ejemplo si miramos la profesión habrán economistas, profesores, abogados, fontaneros, etc.
Las distintas formas de presentación del atributo se denominan modalidades.
Los elementos cuantitativos se denominan variables y pueden ser descritos mediante números
y los elementos cualitativos se llaman atributos y se describen mediante palabras
Para saber más:
http://cursos.itam.mx/mendoza/t02.pdf
Autoevaluación
En estadística el elemento población solo sirve para referirse a personas.
a) Verdadero
b) Falso
Los elementos cualitativos se denominan atributos y se describen mediante palabras.
a) Verdadero
b) Falso
Indicar si son variable/atributo los siguientes elementos de una población:
a) La edad.
Elige una opción...
b) La profesión.
Elige una opción...
c) La nacionalidad.
Elige una opción...
d) El número de hijos
Elige una opción...
e) El sueldo
Elige una opción...
Estadística aplicable a la Investigación Comercial
Variable estadística
Una variable es cualquier elemento de la población que puede ser descrito
mediante números.
Existe una importante clasificación de las variables distinguiendo los diferentes
valores que puede tomar, así se puede diferenciar entre variables discretas y
continuas:
Variables discretas: sólo pueden tomar valores enteros (1, 4, -5, etc) y no
puede tomar ningún valor comprendido entre ellos. Por ejemplo, el número de
empleados de una empresa es una variable discreta, que podrá tomar los
valores 0, 1, 2, 3, 4, 5, etc. , nunca encontraremos una organización en la que
trabajen 8,4 empleados. También serán variables discretas el número de
miembros de la familia, el número de automóviles de la familia, el número de
Página 7 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
8. El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no
funcionarán.
productos que puede transportar un vehículo etc.
Variables discretas: son las que pueden tomar cualquier valor comprendido entre un intervalo. Por ejemplo, la
altura de una persona puede ser 1,83 metros, 2,05 metros, etc.
Las variables discretas sólo pueden tomar valores enteros y las variables continuas pueden
tomar cualquier valor comprendido entre un intervalo
Si somos un poco exigente todas las variables son discretas, por ejemplo, la velocidad de
un coche pasa de 100 a 101 kilómetros a la hora, por lo que podemos hablar de variable
discreta, pero si intentamos medir la velocidad de un fórmula 1 exigiremos mucha más
precisión en la medida y hablaremos de 100,456 kilómetros a la hora.
La diferencia entre variable discreta y continua depende de la precisión
del instrumento de medida que se utilice.
También podemos clasificar las variables en función del número de características que se
estudien, así podemos distinguir entre: Variables unidimensionales, bidimensionales y
multidimensionales.
Variables unidimensionales: sólo recogen información sobre una característica (por ejemplo: edad de los habitantes de isla
Paraíso).
Variables bidimensionales: recogen información sobre dos características de la población (por ejemplo: edad y altura de los habitantes de la isla).
Variables multidimensionales: recogen información sobre tres o más características (por ejemplo: edad, altura y peso de los habitantes de la isla).
Autoevaluación
Indicar si son continua/discreta las siguientes variables:
a) El número de alumnos de un Instituto
Elige una opción...
b) El peso de los alumnos de un Instituto
Elige una opción...
c) La distancia en kilómetros, que los alumnos recorren cada día para llegar al Instituto
Elige una opción...
d) El número de hermanos de los alumnos de un Instituto
Elige una opción...
Las variables discretas pueden tomar cualquier valor comprendido entre un intervalo, mientras que las continuas solo pueden tomar valores
enteros.
a) Verdadero
b) Falso
Estadística aplicable a la Investigación Comercial
Atributos
Los atributos miden una cualidad y únicamente se pueden representar por palabras
ya que no pueden medirse numéricamente.
Cada respuesta de una variable cualitativa que se pueda obtener en los diferentes
individuos representa una cualidad de dicho individuo.
Página 8 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
9. Los ejemplos típicos de atributos son:
El sexo, cuyas posibles repuestas son masculino y femenino.
La nacionalidad, que puede tomar muchísimas respuestas: español, italiano, francés, ...
El nivel de instrucción, que también puede tomar múltiples valores:
Cada repuesta posible de un atributo se denomina modalidad, nivel o categoría
Cosas importante cuando trabajemos con atributos:
Se deben definir los niveles de cada variable cualitativa de tal manera que cada individuo de la población pertenezca a una
única categoría. Esto se expresa diciendo que las categorías son mutuamente excluyentes.
Se deben definir los niveles de cada variable cualitativa de tal manera que cada individuo de la población pertenezca siempre
a alguna de las categorías definidas. Esto se expresa diciendo que la lista de categorías es exhaustiva.
No todas las variables cualitativas son iguales, podemos hacer dos grupos según si existe o
no un orden preestablecido de los niveles o respuestas de la variable, distinguiremos:
Variables nominales, si no existe un orden jerárquico en las categorías de la variable cualitativa.
Lo importante es comprobar que no existe ninguna categoría de mayor nivel que otra.
Por ejemplo el sexo, la causa de una reclamación, la localización de un establecimiento, etc.. son todas variables nominales.
Variables ordinales, si existe un orden entre los niveles asociados a la variable.
Por ejemplo, la "calidad de atención al cliente",puede tener las categorías de: baja, media,
alta y excelente, "el nivel socioeconómico" que puede tomar las modalidades de: alto, medio o bajo. En ambos
casos vemos que se puede apreciar el orden entre ellas.
Las variables cualitativas pueden ser nominales, si no existe un orden jerárquico en las
categorías de la variable, u ordinales cuando existe un orden entre los niveles de la variable
Otro caso especial de atributo son las denominadas variables dicotómicas, que son
las que presentan únicamente dos categorías, una de las cuales representa éxito o
presencia de una característica y la otra representa fracaso o ausencia de la
característica
Por ejemplo, si el objetivo del estudio es analizar si los turistas que llegan a la isla se
han vacunado o no contra la fiebre amarilla. Esta variable es dicotómica pues
únicamente admite las respuestas de "si" o "no".
Autoevaluación
¿Cuál de las siguientes afirmaciones es la correcta?: Cuando trabajamos con atributos, se deben definir los niveles de cada variable
cualitativa de tal manera que:
a) Cada individuo de la población pertenezca siempre a todas las categorías definidas.
b) Cada individuo de la población pertenezca a una sola categoría.
c) Las dos son correctas.
d) Ninguna es correcta.
Las variables cualitativas son nominales si no existe un orden jerárquico en las categorías, mientras que son ordinales si existe un orden
entre los niveles asociados a la variable.
a) Verdadero
b) Falso
Página 9 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
10. El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no
funcionarán.
Estadística aplicable a la Investigación Comercial
Distribución de frecuencias
Los tipos de distribución de frecuencia que existen en función del número de características que estudiemos son:
Distribuciones unidimensionales: cuando estudiemos sólo una característica. Por ejemplo: número de miembros de la familia.
Distribuciones bidimensionales: cuando estudiemos dos características en la muestra. Por ejemplo: Los miembros de la familia y el nivel de ingresos familiares
mensuales.
Distribuciones enedimensionales: cuando estudiemos "n" características en la muestra. Por ejemplo: el número de miembros de la familia, el nivel de ingreso de
la familia mensual, gastos mensuales de la familia...
Comenzaremos por las unidimensionales que son las más simples y a través de ellas conoceremos los conceptos
más básicos.
Vamos a conocer un poco mejor a los habitantes de la isla Paraíso (Universo):
Estamos especialmente interesados en saber cual es el número de miembros que
componen cada una de las familias que viven en la isla (Población).
Hemos contratado a Ufano y a Fausto, dos jóvenes isleños muy trabajadores y con un
gran interés por aprender. Ellos van a ayudarnos a realizar la investigación.
Hemos calculado que con una muestra de 1000 familias obtendremos la información que
deseamos, y les hemos dado instrucciones para que elijan al azar aquellas a las que se
va a preguntar.
El trabajo ha sido duro, pero con una gran ilusión lo han culminado y han recogido los
datos que me presentan de la siguiente manera:
3, 5, 6, 2, 4, 6, 7, 7, 1, 6, 7, 5, 4, 3, 4, 5, 3, 2, 4, 6, 7, 5, 3, 3, 4, 2, 3, 5, 6, 2, 4, 6, 7, 7, 1, 6, 7, 5, 4, 3, 4, 5, 3, 2, 4, 6,
7, 5, 3, 3, 4, 2, 3, 5, 6, 2, 4, 6, 7, 7, 1, 6, 7, 5, 4, 3, 4, 5, 3, 2, 4, 6, 7, 5, 3, 3, 4, 2, 3, 5, 6, 2, 4, 6, 7, 7, 1, 6, 7, 5, 4, 3,
4, 5, 3, 2, 4, 6, 7, 5, 3, 3, 4, 2 ....................................
¿Qué nos dicen estos datos?
La verdad es que los valores presentados de esta manera poco o nada nos dicen sobre qué valores puede tomar la
variable (Campo de variabilidad). Pero si observamos y agrupamos los valores vemos que la variable X puede tomar
los siguientes valores.
X = {1, 2, 3, 4, 5, 6, 7}
Debemos clasificar los datos y presentar la información de manera que sea clara, concisa y ordenada, viendo
cuantas veces sale o se repite cada valor de la variable.
Llamaremos distribución de frecuencias al conjunto ordenado de valores de la variable con sus
correspondientes frecuencias.
Pero os preguntaréis ¿Qué es una frecuencia?
La frecuencia es el número de veces que se presenta cada valor de la variable.
En este caso se nos ocurre presentar la información en una tabla que tenga dos columnas:
La primera columna contiene los distintos valores de la variable
La segunda columna presenta las veces que se aparece cada valor en la muestra utilizada (Frecuencia).
Tamaño de la familia (Variable) Número de veces que ha aparecido el valor (Frecuencia)
1 100
Página 10 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
11. El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no
funcionarán.
Ahora nos resulta muy fácil analizar la información y con un simple vistazo a la tabla podemos hacernos una idea
clara de cómo son las familias de isla Paraíso.
Entre otras cuestiones vemos rápidamente que:
Lo más frecuente es encontrar familias con 4 o cinco miembros
Es muy raro hallar familias con un hijo único
100/ 1.000 = 0,1.
El máximo número de miembros de una familia es 7
Existen dos tipos de frecuencias las absolutas y las relativas, hablaremos a continuación de ellas.
2 150
3 40
4 230
5 300
6 150
7 30
Total 1000
Estadística aplicable a la Investigación Comercial
La frecuencia absoluta
En la tabla anterior hemos incluido el número de veces que se ha repetido cada valor en la muestra, a ello le
llamaremos Frecuencia absoluta.
La frecuencia absoluta es el número de veces que aparece un valor de la variable en la muestra
estudiada
La frecuencia absoluta puede ser de dos tipos: ordinaria y acumulada.
La frecuencia absoluta ordinaria es la que hemos visto hasta ahora, número de veces que se presenta cada valor de la variable. La llamaremos ni
La frecuencia absoluta acumulada sería número de veces que se presenta cada valor de la variable y la de los valores anteriores a él. La llamaremos Ni
Vamos a utilizar la terminología estadística para ir acostumbrándonos a ella:
Llamaremos x1, x2, x3, ............., xn a los distintos valores de la variable.
Llamaremos n1, n2, n3, ............., nn a las veces que aparece cada valor de la variable.
Llamaremos N1, N2, N3, .......... Nn a las veces que aparece cada valor de la variable más la de los valores anteriores a él. ( lo entenderéis muy bien el ejemplo)
La principal atracción de Isla Paraíso es un espectáculo de danza que atrae tanto a los turistas como a los nativos.
Usemos como muestra un ejemplo en el que estudiaremos el número de veces mensuales que asiste una persona a
presenciar la danza.
xi(Variable) ni(Frecuencia absoluta ordinaria) Ni(Frecuencia absoluta acumulada)
x1
n1 N1= n1
x2 n2 N2= n1 + n2
x3 n3 N3= n1 + n2 + n3
... ... ...
... ... ...
... ... ...
xn nn
Nn = n1 + n2 + n3 +...+ Nn
Página 11 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
12. Los resultados obtenidos los encontramos en la siguiente tabla:
Si sumamos las frecuencias absolutas: 6 + 10 +12 + 8 + 6 + 2 el resultado es 44 que coincide con el tamaño de la
muestra.
Recuerda "La suma de todas las frecuencias absolutas ordinarias nos da el tamaño muestral". En estadística se
denomina por la letra "n"
n = Se han estudiado a 44 personas.
De las cuales ¿Qué diríamos?
Hay 6 personas que no han asistido Ninguna vez a las danzas populares, 10 personas que han asistido 1 sola vez,
12 personas han asistido 2 veces, y así sucesivamente.
¿Cuántas personas han asistido como máximo a la danza 3 veces? Para responder a esta pregunta tenemos a la
frecuencia acumulada, que nos dirá que han sido 36 personas las que como máximo han asistido al espectáculo.
Como veis, lo más importante son las interpretaciones que podemos dar sobre esta tabla (todavía incompleta).
Autoevaluación
La tabla nos muestra el resultado de una encuesta hecha a 50 familias, sobre el número de personas activas dentro
de cada una.
Se pide:
Asistencia a la danza ni Ni
0 6 6
1 10 16
2 12 28
3 8 36
4 6 42
5 2 44
Total 44 = n No se suman todas
Xi (Variable) ni (Frecuencia absoluta
ordinaria)
Ni (Frecuencia absoluta
acumulada)
fi (Frecuencia relativa
ordinaria)
Fi (Frecuencia relativa
acumulada)
1 16 16 0,32 0,32
2 20 36 0,4 0,72
3 9 45 0,18 0,9
4 5 50 0,1 1
Total 50 1
Indicar cuál es el universo, la población y la muestra de las siguientes alternativas:
a) Número de personas activas en todas las familias
Elige una opción...
b) Número de personas activas en 50 familias
Elige una opción...
c) Todas las personas con todas sus características (número de hijos, número de miembros, ingresos
mensuales,....)
Elige una opción...
¿Cuál es el tamaño muestral?
a) 40
b) 50
c) 60
Página 12 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
13. El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no
funcionarán.
¿Cuántas familias tienen dos personas activas?
a) 30
b) 36
c) 20
¿Cuántas tienen como máximo tres personas activas?
a) 45
b) 6
c) 36
Estadística aplicable a la Investigación Comercial
Frecuencia relativa
Vamos a volver a nuestro ejemplo de la asistencia al espectáculo de danza. Ahora nos interesa saber que
proporción de la población no asiste nunca a esa distracción. Para calcularlo basta con dividir el número de
personas de la muestra que nunca asisten (6) entre el total de personas que formó la muestra (44) siendo el
resultado de 0.14, es decir 14 de cada 100 habitantes de la isla no asisten nunca a la danza.
La frecuencia relativa es el porcentaje de veces que se presenta cada valor de la variable.
La frecuencia relativa al igual que la absoluta tiene dos tipos de frecuencia: la ordinaria y la acumulada.
La frecuencia relativa ordinaria es el porcentaje de veces que se presenta cada valor de la
variable. Y la representaremos por la letra "f".
Se calcula fi = ni / n
La frecuencia relativa acumulada es el porcentaje de veces que aparece cada valor de la
variable y el de los valores anteriores a él. Y la representaremos por la letra "F".
Se calcula Fi = Ni / n
Si calculamos la proporción del resto de valores tendremos los resultados que aparecen en la tabla.
Ya por fin tenemos el cuadro completo, esto es lo que se denomina Distribución de frecuencias
Asistencia a la danza Frecuencia absoluta ordinaria Frecuencia absoluta acumulada
Frecuencia relativa
ordinaria
Frecuencia relativa
acumulada
0,00 6,00 6,00 0,1363 0,1363
1,00 10,00 16,00 0,2272 0,3636
2,00 12,00 28,00 0,2727 0,6363
3,00 8,00 36,00 0,1818 0,8181
4,00 6,00 42,00 0,1363 0,9545
5,00 2,00 44,00 0,0454 1
Total 44,00 ≈≈≈≈ 1
Xi (Variable) ni (Frecuencia absoluta
ordinaria)
Ni (Frecuencia absoluta
acumulada)
fi (Frecuencia relativa
ordinaria)
Fi (Frecuencia relativa
acumulada)
x1 n1 N1 f1 F1
x2 n2 N2 f2 F2
Página 13 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
14. La fórmula que permite el cálculo de la frecuencia relativa es:
f1 = n1/n; f2 = n2/n; ...; fn = nn/n
F1 = N1/n; F2 = N2/n; ...; Fn = Nn/n
Lógicamente la suma de todas las frecuencias relativas ordinarias será 1, y la última frecuencia relativa acumulada
también será 1 (Porque es la suma de todas ellas).
La frecuencia relativa también se puede calcular en porcentajes, para ello basta con multiplicar la frecuencia relativa
fi o Fi por 100 %. Esto nos será útil a la hora de interpretar, ya que estaremos siempre hablando de porcentajes.
Por ejemplo, el porcentaje de personas que no asisten a la danza es:
0,1363 x 100% = 13,63%
Diremos que de 100 personas sólo 14 aproximadamente no asisten a la danza.
Si preguntamos, ¿Qué porcentaje de personas asiste como máximo a la danza dos veces?
La respuesta será: 0,6363 x 100% = 63,63%
Diremos que de 100 personas como máximo 64 asisten a la danza dos veces.
Autoevaluación
La tabla nos muestra el resultado de una encuesta hecha a 50 familias, sobre el número de personas activas dentro
de cada una.
x3 n3 N3 f3 F3
... ... ... ... ...
... ... ... ... ...
... ... ... ... ...
xn nn Nn = n fn Fn = 1
Total n 1
Xi (Variable) ni (Frecuencia absoluta
ordinaria)
Ni (Frecuencia absoluta
acumulada)
fi (Frecuencia relativa
ordinaria)
Fi (Frecuencia relativa
acumulada)
1 16 16 0,32 0,32
2 20 36 0,4 0,72
3 9 45 0,18 0,9
4 5 50 0,1 1
Total 50 1
¿Qué porcentaje de familias tienen una sola persona activa?
a) 36%
b) 42%
c) 32%
¿Qué porcentaje de familias tienen como máximo dos personas activas?
a) 36%
b) 72%
c) 40%
Estadística aplicable a la Investigación Comercial
Página 14 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
15. El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no
funcionarán.
Distribuciones de frecuencias agrupada y sin agrupar
Vamos a ver tres situaciones diferentes:
a.- Deseamos conocer cuantas horas trabajan al día los cinco curanderos de la isla.
Los resultados los podemos incluir en la siguiente tabla:
Como el número de observaciones es pequeño se aprecia con claridad las horas que trabaja cada curandero.
Si el número de observaciones es pequeño lo podemos representar en una tabla con una única
columna
b.- Queremos saber ahora cuantas personas trabajan de
cada una de las familias de la isla.
Si queremos presentar los resultados en una tabla de una
columna nos encontraríamos con una tabla larguísima y
resultaría imposible analizar e interpretar los resultados.
Ahora tenemos que encontrar algún método para
representar la información.
El método no es otro que el de incluir los distintos valores
y representarlos junto a sus frecuencias.
Si la muestra es de 200 familias
Ahora también podemos analizar con comodidad los datos.
Si el número de observaciones es grande y el número de valores es pequeño lo podemos
representar en una tabla con dos columnas: una con los valores y otra con sus frecuencias
c.- Queremos conocer los ingresos de cada familia.
Si intentamos usar una tabla con una columna también sería demasiado larga y si queremos
usar una tabla con dos columnas, una con los valores y otra con las frecuencias nos ocurrirá lo
mismo. ¿Qué nos ocurre?, exactamente lo mismo, la tabla es demasiado larga porque es muy
difícil que coincidan los ingresos de dos familias.
Horas de trabajo diario de los curanderos de isla Paraíso
8
7
6
9
8
Personas que trabajan Número de familias
0,00 10,00
1,00 50,00
2,00 60,00
3,00 30,00
4,00 10,00
5,00 40,00
total 200,00
Página 15 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
16. Solución:
Habrá que agrupar aquellas familias que tengan ingresos similares.
Los grupos de valores se llaman clases . Una vez definidas las clases procedemos a obtener la frecuencia de cada
clase.
Presentada la información de esta manera podemos analizarla con comodidad.
Si el número de observaciones es grande y el número de valores también es elevado
tendremos que agrupar los valores en clases.
¿Existe alguna diferencia entre agrupar los valores y no agruparlos?
La respuesta es sí, si agrupamos los valores perdemos parte de la información y es imposible volver a construir los
datos originales.
Pero cuando empleamos en una encuesta una pregunta como ésta, lo normal es plantearla en forma de intervalo
para que a las personas les sea fácil de contestar, aunque por ello se pierda información
Por ejemplo:
¿Cambiaría algo la tabla si hay 100 familias con ingresos de 901 € y pasan a ingresar 1099 €?
La respuesta es no, la tabla sigue siendo la misma.
¿Podemos saber cuantas familias ingresan 535 €?
La respuesta vuelve a ser negativa, solo conocemos que 300 familias cobran entre 500 y 700 €.
Si agrupamos los valores incurrimos en errores de agrupamiento
Autoevaluación
Ingresos familiares mensuales Número de familias
De 0 a 300 € 100
De 301 a 500 € 500
De 501 a 700 € 300
De 701 a 900 € 200
De 901 a 1100 € 100
De 1101 a 1500 € 800
Total 2000
¿Cuál de las siguientes afirmaciones es la correcta?: Es conveniente agrupar los valores de la variable en intervalos, llamados clases,
cuando:
a) El número de observaciones es pequeño.
b) El número de observaciones es grande y el número de valores pequeño.
c) El número de observaciones es grande y el número de valores también es elevado.
Si agrupamos los valores en clases perdemos parte de la información y por tanto incurrimos en errores de agrupamiento.
a) Verdadero
b) Falso
Página 16 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
17. El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no
funcionarán.
Estadística aplicable a la Investigación Comercial
Representaciones gráficas
A veces nos resulta muy cómodo representar gráficamente la información,
para poder hacernos rápidamente una idea de la información. Otras veces
es interesante realizar los gráficos para comprobar si hemos calculado bien
la medida.
Vamos a ver los tipos de gráficos que más se usan para presentar un
informe de una investigación: el diagrama de barras y el diagrama de
sectores.
Existen otros tipos de gráficos, que se usan menos al realizar el informe,
pero que en estadística, o en algún tipo de presentaciones es útil, como
son:
Histograma: se utiliza para representar las distribuciones de frecuencia de valores agrupados y su naturaleza es
la misma que el diagrama de barras.
El diagrama acumulado y el polígono acumulado: se utilizan para representar en los dos tipos de distribuciones a la frecuencia acumulada, y normalmente sirve
para comprobar si hemos calculado bien las medidas de posición.
El pictograma: es otro medio de representación de las distribuciones de frecuencia. Consiste en tomar como unidad un símbolo arbitrario (un dibujito) para el que
debemos fijar previamente el valor que le asignamos como tal unidad. Este tipo de gráfico queda muy bonito en una presentación de un informe, pero no es muy
utilizado.
Diagramas de Barras
Diagramas de Sectores
Representación Gráfica de la Frecuencia Acumulada
Autoevaluación
Una representación gráfica es la forma de representar gráficamente la información recogida.
a) Verdadero
b) Falso
La diferencia entre un histograma y un diagrama de barras es que este se utiliza para representar las distribuciones de frecuencias de
valores agrupados y el histograma para valores sin agrupar.
a) Verdadero
b) Falso
Página 17 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
18. El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no
funcionarán.
El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no
funcionarán.
¿Cuál de las siguientes afirmaciones es la correcta?: El diagrama de barras consiste en levantar para cada valor de la variable, una barra
cuya altura sea:
a) Su frecuencia absoluta.
b) Su frecuencia relativa.
c) Su frecuencia acumulada.
d) Cualquiera de las tres.
Estadística aplicable a la Investigación Comercial
Diagrama de barras
Los valores expresados en la tabla de frecuencias pueden ser representados en dos ejes para obtener una visión
gráfica de la forma de la distribución de los valores.
El diagrama de barras consiste en levantar, para cada valor de la variable, una barra cuya altura
sea su frecuencia absoluta
Indicamos los distintos valores en el eje horizontal, y las frecuencias absolutas en el eje vertical.
Como veis nos da una visión sobre los valores que más veces se presentan, en este caso diríamos que lo más
habitual en las personas estudiadas es que asistan dos veces a la danza. Este tipo de gráfico sólo se puede utilizar
cuando estamos estudiando una distribución de frecuencias unidimensional sin agrupar.
Estadística aplicable a la Investigación Comercial
Diagrama de sectores
Esta modalidad consiste en dividir un círculo en tantos sectores circulares como valores podamos observar. Cada
sector deber ser proporcional a la frecuencia absoluta de su valor.
Página 18 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
19. El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no
funcionarán.
Este gráfico es de la misma naturaleza que el diagrama de barras; A cada frecuencia absoluta u relativa ordinaria le
correspondería una porción del sector, es decir, una superficie del circulo; la suma de todas esas frecuencias
corresponderá con el área o superficie total del circulo, es decir, 360º.
En otras ocasiones es interesante presentar la información acumulando los datos, en esos casos hablamos de
frecuencia absoluta acumulada.
Con la frecuencia acumulada obtenemos el número de observaciones correspondientes a cada valor y a todos los
anteriores.
Esta frecuencia absoluta acumulada únicamente puede usarse con variables medibles y con valores que pueden ser
ordenados.
En cada casilla de la frecuencia acumulada tenemos los valores menores o iguales que cada xi.
Asistencia a la danza Frecuencia absoluta Frecuencia acumulada
0 6 6
1 10 16
2 12 28
3 8 36
4 6 42
5 2 44
Total 44 44
Estadística aplicable a la Investigación Comercial
Representación gráfica de la frecuencia acumulada
Para representar gráficamente la frecuencia acumulada también se puede utilizar el diagrama de barras, pero ahora
la altura de la barra equivale a la frecuencia acumulada.
Página 19 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
20. El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no
funcionarán.
Estadística aplicable a la Investigación Comercial
Las medidas
¿Qué es lo que estamos buscando?
Puedes pulsar en algunos de los términos de este esquema para acceder al apartado
correspondiente.
Algunas veces interesa llevar esa reducción al grado máximo y sustituir todos los valores observados por un solo.
Podemos encontrar esta afirmación:
Los habitantes de isla Paraíso son bastante altas ya que el hombre medio mide 1,81 metros y la mujer media 1,71
metros.
Lógicamente habrá algún nativo que mida 1,55 y será bajito, pero habrá otro que mida 2 metros y sea
exageradamente alto.
La idea de promedio implica variación, no tiene sentido calcular el promedio de
algo invariante, por ejemplo, es absurdo comentar que los habitantes de isla
Paraíso tienen dos piernas, dos brazos y una única nariz.
Qué le vamos a exigir a un promedio. Si va a sustituir al conjunto de observaciones
de la población debe cumplir la condición de que sea representativo, es decir, que
represente la tendencia del resto de las observaciones.
Página 20 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
21. El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no
funcionarán.
El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no
funcionarán.
Si el promedio va a ser representativo debe cumplir, por lo menos, que esté comprendido entre los valores extremos
de la variable.
Sería curioso que en la isla no hubiese nadie con una estatura superior a 1,81 metros y ese fuera el promedio que lo
representa.
Para saber más:
http://thales.cica.es/rd/Recursos/rd99/ed99-0278-01/est_des3.html
Estadística aplicable a la Investigación Comercial
Medidas básicas de posición
Estas medidas básicas nos van a suministrar información de la serie de datos que estamos analizando. Pueden
existir infinitos promedios pero vamos a ver aquí a los más habituales
Las medidas pueden ser de tres tipos:
Medidas de tendencia central, que intentan resumir la información calculando valores medios.
Medidas de posición, que informan sobre cómo se distribuyen los valores.
Medidas de dispersión, que indican si los valores se encuentran más o menos concentrados ,o más o menos dispersos
Autoevaluación
Las medidas de tendencia central miden si los valores se encuentran más o menos concentrados, mientras que las medidas de dispersión
intentan resumir la información calculando valores medios.
a) Verdadero
b) Falso
Con las medidas de dispersión comprobamos la representatividad de las medidas de tendencia central.
a) Verdadero
b) Falso
Las medidas de tendencia central no tienen que ser representativas del resto de las observaciones.
a) Verdadero
b) Falso
Estadística aplicable a la Investigación Comercial
Medidas de tendencia central
Las medidas de tendencia central buscan un número que represente la distribución. Las principales medidas de
tendencia central son la media, la mediana y la moda
Media aritmética simple.
Media aritmética ponderada.
Página 21 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
22. El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no
funcionarán.
Mediana.
Moda.
Estadística aplicable a la Investigación Comercial
Media aritmética simple
Es una de las medidas más importantes cuando es representativa. Se representa por la letra " ". Es la más
utilizada, por lo que cuando se habla de media se habla de ella, así que nosotros vamos a mantener esa
denominación.
La media es número que se obtiene al dividir el número de observaciones por el número de ellas.
Nos va a indicar el valor medio de la serie de datos.
La media aritmética simple es el valor de la variable que será el centro de gravedad de la
distribución.
Por ejemplo, si queremos calcular la media de horas trabajadas por los curanderos de la isla
horas de trabajo diario que realizan los curanderos de la isla.
Como vemos, la media aritmética es un valor de la variable que viene dado en la misma
unidad de medida de la variable, pero que posiblemente sea un valor no observable.
Recordemos que cuando trabajamos con distribuciones agrupadas perdemos información y
es imposible conocer cual es el valor correspondiente a cada elemento.
¿Podemos calcular la media en este caso?
Si, podemos calcular la media aritmética pero esta no será exacta, llevará cierto error.
Veamos como se calcula utilizando nuestra tabla relativa a
los ingresos familiares.
Pensemos un momento: ¿Qué valor representa mejor a los que ingresan entre
300 y 500 €?
Lógicamente podemos pensar que 400, el valor medio, es el que corre menor riesgo
de equivocarse.
Este valor que representa a cada clase lo denominamos marca de clase, es decir, es el valor medio de cada
intervalo.
Horas de trabajo diario de los curanderos de isla Paraíso
8
7
6
9
8
Página 22 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
23. La fórmula que sirve para calcularla es:
Con nuestros datos tenemos:
847,5€
Cada familia de la isla ingresa por término medio 847,5 € mensuales.
Autoevaluación
Ingresos familiares mensuales Número de familias ni xi (Marcas de clase) xini
De 0 a 300 € 100 150 15000
De 300 a 500 € 500 400 20000
De 500 a 700 € 300 600 180000
De 700 a 900 € 200 800 160000
De 900 a 1100 € 100 1000 100000
De 1100 a 1500 € 800 1300 1040000
Total 2000
Supongamos que un alumno de formación profesional a distancia ha sacado las siguientes calificaciones en las tareas de la unidad 1 del
módulo de Investigación comercial:
¿Cuál será la media aritmética simple?
Tarea número 1......... 5
Tarea número 2......... 6
Tarea número 3......... 5
Tarea número 4......... 8
Tarea número 5......... 9
a) 5.8
b) 7.3
c) 6.6
d) 6.3
Estadística aplicable a la Investigación Comercial
Media aritmética ponderada
Recordemos que una de las fuentes principales ocupaciones de los habitantes de isla
Paraíso es la fabricación y comercialización de Flautas de bambú.
Existen tres variedades de flautas y el precio de las mismas se fija en función del peso
del bambú utilizado.
Flauta ganga: que lleva 100 gramos de bambú y se vende a 6€.
Flauta tradicional: que necesita 200 gramos de bambú y se vende a 15€.
Flauta portentosa: que requiere 350 gramos de bambú y se comercializa a 30 €.
Si deseamos calcular el precio medio al que se vende el bambú que se usa para elaborar las flautas podemos
calcular el precio medio de las flautas y ver que:
Página 23 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
24. El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no
funcionarán.
, el precio medio de las flautas se fija en 17 €
También podemos considerar que es importante contemplar el bambú que incorpora cada flauta y podemos calcular
la media aritmética ponderada.
En este caso vemos con más claridad que el precio medio al que se vende las flautas teniendo en cuenta el bambú
que poseen es de 21,7 €.
Esta media aritmética ponderada la hemos calculado multiplicando cada valor de la variable por un número que
expresa su mayor o menor importancia en el conjunto de valores. Estos números se llaman pesos o
ponderaciones.
Autoevaluación
Si el alumno anterior sacara un 10 en el examen de la unidad y suponiendo que a las tareas le damos una importancia o ponderación del
80% y a la nota del examen de un 20%, ¿cuál será la media aritmética ponderada de la unidad 1?:
6.36
7.28
7.53
8.34
Estadística aplicable a la Investigación Comercial
Mediana
La media aritmética es el promedio o estadístico que más se utiliza, pero tiene un
grave inconveniente, pues se puede ver influida por los valores extremos que se
aparten del resto de los datos.
Recordemos que si hay dos personas, una de ellas se bebe dos vasos de agua y
la otra ninguno la media dice que cada uno se ha tomado un vaso.
Si los valores extremos condicionan el valor de la media, esta puede perder
representatividad.
La mediana es un parámetro que intenta solventar el inconveniente que puede
derivarse de los valores extremos.
La mediana es el valor de la serie de datos que se sitúa justamente en el centro de la muestra (un 50% de valores
son inferiores y otro 50% son superiores).
La mediana es el valor de la variable que acumula el 50% de la masa de frecuencia
Para calcular la mediana tendremos que ver primero si estamos en
una distribución agrupada o sin agrupar, y aun así tendremos dos casos a tener
en cuenta:
Primer caso: Cuando existe una frecuencia relativa acumulada igual 0,50
Página 24 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
25. Segundo caso: Cuando no existe una frecuencia relativa acumulada igual a 0,50,
esto quiere decir, que hay una menor y otra mayor a 0,50.
En función de estos casos aplicaremos una formula u otra.
Si retomamos la tabla relativa a las horas de trabajo de los curanderos y calculamos la mediana. (estamos en una
distribución sin agrupar).
Estamos en una distribución de frecuencia unidimensional sin agrupar y en donde no hay un valor de Fi = 0,5
La formula aplicar es la siguiente si no existe un Fi = 0,5 existirá una que sea menor F2 = 0,4 y uno que sea mayor
F3 = 0,6, el valor de la variable que corresponde al mayor es la mediana.
Me = 8
Interpretemos: En el 50% de los curanderos trabajan como máximo 8 horas diarias.
Utilicemos la tabla que recoge los datos de asistencia a los espectáculos de danza, un poco cambiados.
Seguimos en una distribución de frecuencia unidimensional no agrupada, pero estamos en el caso de que existe un
Fi = 0,5
En este caso cogemos el valor de la variable que corresponde con 0,5 y el valor siguiente a esa variable, los
sumamos y los dividimos entre 2.
Interpretación: El 50% de las personas estudiadas han asistido como máximo 2 veces y media a la danza.
Aquí podemos aproximar a dos.
Cuando estamos calculándola en las distribuciones de frecuencia de valores de la variable agrupados, varía.
Autoevaluación
Horas de trabajo diario de los curanderos
de isla Paraíso
ni Ni fi Fi
6 1 1 0,2 0,2
7 1 2 0,2 0,4
8 1 3 0,2 0,6
8 1 4 0,2 0,8
9 1 5 0,2 1
Asistencia a la danza ni Ni fi Fi
0 4 4 0,0909 0,0909
1 8 12 0,1818 0,2727
2 10 22 0,2272 0,5
3 12 34 0,2727 0,7727
4 8 42 0,1818 0,9545
5 2 44 0,0454 1
Total 44 ≈ 1
¿Cuál de las siguientes afirmaciones no es correcta?:
a) La media tiene el inconveniente de verse influida por los valores extremos.
b) La mediana puede solventar el inconveniente derivado de los valores extremos.
c) La mediana es el valor de la serie tal que el 40% de los valores son inferiores a ella y el 60% restante son superiores.
Página 25 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
26. El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no
funcionarán.
Estadística aplicable a la Investigación Comercial
Moda
La moda es un término que se usa coloquialmente para expresar lo que viste la
mayoría de las personas, o lo que más gusta a la mayoría de la gente y ese significado
es muy similar al del término estadístico.
La moda es el valor de la variable que más se repite en la muestra.
La moda es el valor de la variable más frecuente en la muestra
estudiada.
Su cálculo es extremadamente fácil ya que únicamente es necesario buscar el valor de
la variable que tiene la frecuencia absoluta ordinaria más frecuente.
En la tabla de asistencia a la danza vemos que 2 veces tiene la mayor frecuencia con 12 observaciones, o sea,
Mo = 2 veces de asistencia al espectáculo de danza.
Hay veces que hay dos valores que presentan la máxima frecuencia, en estos caso hablamos de distribuciones
bimodales. De la misma manera encontramos distribuciones trimodales y multimodales.
Autoevaluación
Estudiamos en unos estudiantes el número de hermanos que poseen y obtuvimos la siguiente tabla:
La Moda es el valor de la variable que más se repite.
a) Verdadero
b) Falso
Número de hermanos Número de alumnos
0 3
1 6
2 5
3 3
4 1
5 1
6 1
Responder a las siguientes cuestiones: ¿Cuál es el número medio de hermanos que tienen los estudiantes?
a) 2
b) 1
c) 3
¿Cuál es el número más normal (moda) de hermanos entre los estudiantes?
a) 1
b) 2
c) 3
Página 26 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
27. El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no
funcionarán.
¿Cuál es el número de hermanos que tienen como máximo el 50% de los alumnos? (Para contestar debes realizar la columna
correspondiente a la frecuencia relativa acumulada y calcular la mediana).
a) El 50% de los estudiantes tienen como máximo un hermano
b) El 50% de los estudiantes tienen como máximo dos hermanos
c) El 50% de los estudiantes tienen como máximo tres hermanos.
Estadística aplicable a la Investigación Comercial
Medidas de posición
Son los valores de la variable que acumulan una determinada masa de frecuencia. ¿Os suena esta definición? Pues
sí, se parece a la definición que hemos dado de mediana, ya que ésta es una medida también de posición.
Su forma de calcularse es la misma que la de la mediana lo único que cambiaríamos sería el porcentaje a buscar.
Existen otros promedios que pueden ser característicos de la distribución pero que no son los valores centrales.
Los más usuales son los que dividen la muestra en tramos iguales.
Cuartiles
|_25%__|__50%__|__75%__|_100%_|
q1q2q3
Son 3 valores que dividen a una serie de datos, ordenada de forma creciente o decreciente, en
cuatro tramos iguales, de manera que en cada uno de ellos se encuentra el 25 % de los
resultados.
q1 = es aquel valor de la variable que acumula el 25 % de la masa de frecuencia.
q2= es aquel valor de la variable que acumula el 50% de la masa de frecuencia. (la mediana)
q3= es aquel valor de la variable que acumula el 75 % de la masa de frecuencia.
Deciles
Dividen a la masa de frecuencia en diez partes
|_10%_|_20%_|_30%_|_40%_|_50%_|_60%_|_70%_|_80%_|_90%_|_100%|
d1d2d3d4d5.............d9
d1= valor de la variable que acumula el 10 % de la masa de frecuencia.
d2= valor de la variable que acumula el 20% de la masa de frecuencia.
d5= valor de la variable que acumula el 50% de la masa de frecuencia. (mediana y cuartil segundo)
d9= valor de la variable que acumula el 90% de la masa de frecuencia.
Son 9 valores que dividen a una serie de datos, ordenada de forma creciente o decreciente, en diez tramos iguales,
de manera que en cada uno de ellos se encuentra el 10 % de los resultados.
Percentiles
Divide la masa de frecuencia en cien partes.
Página 27 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
28. p1= valor de la variable que acumula el 1% de la masa de frecuencia.
Etc...
p10= d1= valor de la variable que acumula el 10% de la masa de frecuencias.
Etc...
p50= d5=q2= Me= valor de la variable que acumula el 50% de la masa de frecuencia.
Etc..
p99= valor de la variable que acumula el 99% de la masa de frecuencias.
Son 99 valores que dividen a una serie de datos, ordenada de forma creciente o decreciente, en cien tramos iguales,
de manera que en cada uno de ellos se encuentra el 1 % de los resultados
Por ejemplo:
Vamos a calcular los tres cuartiles de la asistencia a danza.
El primer cuartil:
Buscamos una frecuencia relativa acumulada que sea igual a 0,25. Como no existe
miramos en la tabla y vemos una que es un poco más pequeña 0,14 y otra que es un
poco más grande 0,36. Según la fórmula explicada en la mediana será aquel valor de
la variable que corresponda a la frecuencia mayor luego.
q1= 1
Interpretación: el 25 % de personas asisten como máximo 1 vez a la danza.
Al calcular el cuartil segundo y tercero pasa igual ya que no existen frecuencias relativas iguales a 0,5 y 0,75 así que
corresponderá a aquel valor de la variable que corresponda a la frecuencia un poco mayor que las expuestas, así
tendremos que:
El segundo cuartil es 2.
Interpretación: el 50% de las personas estudiadas asisten a la danza dos veces como máximo.
El tercer cuartil es 3.
Interpretación: el 75% de las personas estudiadas asisten a la danza tres veces como máximo.
Autoevaluación
Asistencia a la danza Frecuencia absoluta Frecuencia acumulada Frecuencia relativa
Frecuencia relativa
acumulada
0 6 6 0,14 0,14
1 10 16 0,23 0,36
2 12 28 0,27 0,64
3 8 36 0,18 0,82
4 6 42 0,14 0,95
5 2 44 0,05 1,00
Total 44 44 1,00 1,00
¿Cuál de las siguientes afirmaciones no es correcta?
a) Los cuartiles son tres valores que dividen a la distribución de tal forma que en cada uno de ellos se encuentra el 25% de los resultados.
Página 28 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
29. El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no
funcionarán.
El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no
funcionarán.
b) Los deciles son 10 valores que dividen a la distribución de manera que en cada uno de ellos se encuentra el 10% de los resultados
c) Existen otros promedios que dividen la muestra en tramos iguales, siendo los más usuales, los cuartiles, los deciles y los percentiles
Estadística aplicable a la Investigación Comercial
Medidas de dispersión
¿Podrá la estadística solucionar el problema de que si una
persona tiene dos coches y otra ninguno, la estadística dice
que cada persona tiene un coche?. La media es la misma que
si cada uno tiene su propio coche, y la situación es
radicalmente distinta.
Afortunadamente la respuesta es sí. Para solucionarlo existen
las medidas de dispersión que nos indican si los valores se
encuentran próximos o alejados a las medidas de tendencia
central, es decir, nos indicará la representatividad.
Las medidas de dispersión analizan si los valores se encuentran más o menos dispersos, o
más o menos concentrados con respecto a las medidas de tendencia central.
Las medidas de dispersión más utilizadas son:
Varianza
Desviación típica
Autoevaluación
Las medidas de dispersión (varianza y desviación típica) nos indican si los valores se encuentran próximos o alejados de la media,
mediana o moda.
a) Verdadero
b) Falso
Las medidas de tendencia central nos indican la representatividad de las medidas de dispersión.
a) Verdadero
b) Falso
Estadística aplicable a la Investigación Comercial
Rango o recorrido
Recordemos que los curanderos de la isla trabajaban por término medio 7,6
horas.
Página 29 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
30. El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no
funcionarán.
Podemos preguntarnos, ¿Todos ellos trabajan alrededor de ese tiempo o unos
trabajan mucho y otros pocos?. El rango nos ayuda a resolver esa cuestión.
El curandero que más trabaja lo hace 9 horas y el que menos 6 horas, la diferencia entre esos valores es el rango,
que en este caso es 3 horas.
El recorrido o rango mide la amplitud de los valores de la muestra y se calcula por diferencia
entre el valor más bajo y el valor más elevado.
Estadística aplicable a la Investigación Comercial
Varianza
Se nos puede ocurrir calcular las distancias de cada valor a la media, que llamaremos desviaciones y para ello
vamos a presentar una tabla que las incluya.
Podemos ver que las distancias con positivas en unos casos y negativas en otros, lo que
indica que algunos valores superan la media y otros se quedan por debajo.
Pasemos ahora a sumar todas las desviaciones.
¿Qué ocurre? La suma de las distancias es 0. Esto es lógico las distancias por exceso
se compensan con las distancias por defecto. ¿Qué podemos hacer?
Si las elevamos al cuadrado todos los valores serán positivos, y en eso consiste la
varianza.
La varianza mide la distancia existente entre los valores reales y la media
La varianza se calcula sumando todas las desviaciones elevadas al cuadrado y dividiéndolas entre el
tamaño de la muestra.
En nuestro ejemplo:
S2 = [(8 - 7,6)2 + (7 - 7,6)2 + (6 - 7,6)2 + (9 - 7,6)2 + (8 - 7,6)2] / 5 = 1,04
La varianza siempre va a ser positiva y mayor que cero.
Cuanto mayor sea la varianza mas alejados de la media están los valores, y cuanto más se aproxime a cero más
próximo a la media estarán los valores reales.
La varianza siempre será mayor que cero.
Mientras más se aproxima a cero, más concentrados están los valores de la serie alrededor de la media. Por el
contrario, mientras mayor sea la varianza, más dispersos están.
Horas de trabajo diario de los curanderos de isla Paraíso
Distancia a la media (Xi- ) ; = 7,6
8 0,4
7 - 0,6
6 -1,6
9 1,4
8 0,4
Página 30 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
31. El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no
funcionarán.
Estadística aplicable a la Investigación Comercial
Desviación típica
Es otra medida de dispersión, que se utiliza debido a que la varianza puede presentar problemas de interpretación,
ya que aunque viene expresada en las mismas unidades de medida que la media estas están elevadas al cuadrado
y se calcula como raíz cuadrada de la varianza.
La desviación típica es la raíz cuadrada de la varianza
Luego la varianza mide la bondad de la media aritmética a través de la desviación típica que será la que
se interprete.
En nuestro ejemplo:
= 1, 01
¿Cómo interpretamos el resultado de la desviación típica?
1. Sumamos y restamos la desviación típica a la media y obtenemos los siguientes valores: 7,6 + 1,01 = 8,61 y 7,6 - 1,01 = 6,59
2. Interpretamos:Las horas que por término medio trabajan los curanderos de la isla oscilan entre 6,59 y 8,61.
3. Si queréis saber que porcentaje de desviación existe hay que calcular el Coeficiente de Variación de Pearson (V).
Que es igual a dividir la desviación típica por la media aritmética, el resultado lo multiplicamos por cien.
V = 13,28 % es la dispersión de los valores de la variable con respecto a la media, luego esta media es bastante
representativa de esa muestra.
Para saber más:
http://www.noticiasdot.com/publicaciones/2002/0302/0403/
noticias0403/040302-10.htm
http://mail.udlap.mx/~tesis/udlap/lps/magana_m_a/capitulo3.pdf
http://www.ince.mec.es/hf/anx1.htm
Autoevaluación
En las pruebas de Selectividad los alumnos de un centro obtuvieron los siguientes resultados:
Se pide:
Puntuación Número de alumnos
0 3
1 7
2 10
3 15
4 23
5 18
6 15
7 9
8 5
¿Cuál es el recorrido?
Página 31 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
32. El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no
funcionarán.
a) 5
b) 8
c) 4
¿Cuál sido la nota media de Selectividad en el centro?
a) 4.25
b) 5.34
c) 6.23
¿Cuál es la desviación típica?
a) 0.98
b) 2.34
c) 1.94
¿Cuál ha sido la nota más frecuente entre los alumnos en Selectividad?
a) 4
b) 6
c) 3
Estadística aplicable a la Investigación Comercial
Distribuciones bidimensionales
Intentemos responder a una sencilla cuestión, ¿Está gordo un hombre que pesa 80 kg?.
La respuesta siempre es depende.
Depende de la altura de la persona, si mide 1,35 metros estará bastante gordo, sin
embargo, si mide 1,98 metros estará muy delgado.
Este es el concepto de variable bidimensional, que consiste en estudiar simultáneamente
dos características de los elementos de la población.
En cada elemento medimos los dos valores y la variable está formada por la pareja de
valores.
En cada persona medimos su altura, luego medimos su peso y los dos valores forman la variable bidimensional.
La variable bidimensional son dos letras (X, Y) que representan las dos características de una
observación.
Las distribuciones bidimensionales son aquellas en las que se estudian de cada elemento del
universo dos variables al mismo tiempo. Es el conjunto de valores de la variable bidimensional con sus
correspondientes frecuencias.
Página 32 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
33. Por ejemplo, estamos interesados en conocer si el tamaño de la vivienda en isla Paraíso está relacionado con el
número de miembros de la familia.
La tabla que hemos visto es cuando se presenta cada par de valores una sola vez y hay
pocos pares.
También puede ocurrir que haya pocos pares de valores pero que se repitan con cierta
frecuencia y entonces tendremos.
Supongamos que en el ejemplo anterior hemos estudiado una muestra de 100 familias y
el resultado que nos sale es el siguiente:
Si el número de elementos observados es muy alto se utiliza una tabla de correlación para representar la
información obtenida, que presenta la forma siguiente:
Las "x" representan los valores de una de las variables y las "y" los valores de la otra variable. En cada intersección
de una valor de "x" y un valor de "y" se recoge el número de veces que dicho par de valores se ha presentado
conjuntamente (frecuencia absoluta ordinaria) y a veces se recoge el porcentaje de veces que se ha presentado
cada par de valores en tantos por uno (frecuencia relativa ordinaria).
En nuestro ejemplo las "x" serán el tamaño de la familia y las "y" el número de habitaciones de la vivienda.
La interpretación de la información es muy simple.
En cada casilla se coloca el número de veces que se ha repetido cada pareja de valores. Podemos ver que 200 son
las familias de un único miembro y con una única habitación, o que hay 365 familias con tres miembros y que
disponen de dos habitaciones en su vivienda.
Autoevaluación
Tamaño de la familia Tamaño de la vivienda (en m2)
0 100
1 150
3 200
4 120
6 150
4 200
5 130
Tamaño de la familia
Tamaño de la vivienda
(en m2)
ni
0 100 22
1 150 25
3 200 23
4 120 12
6 150 10
4 200 5
5 130 3
X/Y y1 y2 ........ yn
x1 n1,1 n1,2 ...... n1,n
x2 n2,1 n2,2 n2,n
.........
Xn nn,1 nn,2 nn,n
Tamaño de la familia Número de habitaciones 1 2 3 4
1 200 134 251 12
2 120 254 362 125
3 45 365 124 255
4 136 85 268 85
5 245 96 111 43
¿Cuál de las siguientes afirmaciones es la correcta?
Página 33 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
34. El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no
funcionarán.
El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no
funcionarán.
Si queremos observar simultáneamente, la edad y la altura de cada uno de los elementos de una población o muestra, la variable es:
a) Unidimensional
b) Bidimensional
c) Las dos son correctas
d) Ninguna es correcta
A partir de la tabla de correlación que aparece en la pregunta, indicar:
¿Cuántas familias de cuatro miembros disponen de una habitación en su vivienda?
a) 255
b) 136
c) 85
¿Qué porcentaje representan dichas familias sobre el total?
a) 4.10
b) 18.23
c) 5.28
d) 4.93
Estadística aplicable a la Investigación Comercial
Tipos de distribuciones bidimensionales
Si el número de valores de las dos variables es reducido no es necesario agrupar las variables, pero si una de las
variables (o las dos) presenta muchos valores diferentes, y cada uno de ellos se presenta pocas veces, será
deseable agrupar los valores.
Podemos distinguir:
Distribuciones de frecuencia de valores de la variable sin agrupar
Distribuciones de frecuencia de valores agrupados
Distribuciones marginales
Distribuciones condicionadas
Estadística aplicable a la Investigación Comercial
Distribuciones de frecuencia de valores de la variable sin agrupar
Son las distribuciones donde las dos variables presentan un número reducido
de valores.
Por ejemplo, el caso que hemos expuesto relativo al tamaño de la familia y al
número de habitaciones de la vivienda.
Página 34 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
35. El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no
funcionarán.
El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no
funcionarán.
Estadística aplicable a la Investigación Comercial
Distribuciones de frecuencia de valores agrupado
Son aquellas distribuciones donde algún valor (o los dos) presenta muchos valores diferentes, y cada uno de ellos
se presenta pocas veces.
En este caso habrá que proceder a agrupar los valores. Con la consiguiente pérdida de información, ya que para
calcular los estadísticos tendremos que hacerlo con las marcas de clase, que como ya sabéis son los valores
medios de los intervalos.
Por ejemplo:
Deseamos medir la relación existente entre la edad de los habitantes de la isla y sus
ingresos.
En este caso ambas variables tienen muchos valores posibles lo que obligará a agruparlas
a las dos.
Los resultados obtenidos los presentamos en una tabla de correlación.
*(miles de € al mes)
El inconveniente de la agrupación es que se produce una pérdida de información, pero a cambio podemos
interpretar los datos con facilidad.
Autoevaluación
Edad (años)/Ingresos* 0- 0,5 0,5-1 1-2 2-5
0-20 230 233 126 15
21-35 20 134 257 333
36-50 145 222 85 81
51-65 222 134 168 25
66-100 145 258 91 8
Con los datos ofrecidos en la tabla de correlación de la distribución de frecuencias de valores agrupados de la correspondiente pregunta,
contestar a las siguientes cuestiones:
¿Cuántos habitantes de la Isla, con una edad comprendida entre los 36 y 50 años (ambos inclusive) ganan entre 500 y 1.000 euros
mensuales?:
a) 225
b) 233
c) 222
d) 333
Estadística aplicable a la Investigación Comercial
Distribuciones marginales
Consideran la distribución de una de las variables, olvidándose de la otra. Con lo que nos aparece una distribución
unidimensional, como las que hemos estudiado anteriormente y a las cuales les podemos calcular las medidas
aprendidas.
Nos aparecen dos distribuciones marginales la de X y la de Y.
Página 35 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
36. Vayamos a los ejemplos:
En el primero no hay duda cuales son las distribuciones marginales.
Distribución marginal de X
Distribución marginal de Y
Podríamos calcular la media, varianza y desviación típica, que serían las medidas más importantes.
= 3,28 3,91 = 1,97
Interpretémoslas:
El tamaño medio de familia en la muestra estudiada en isla paraíso es de 3 personas aproximadamente con una
variación de 2 arriba o abajo
= 150 = 1.257,14 = 35,45
Interpretémoslas:
El tamaño medio de la vivienda de las familias estudiadas en isla paraíso es de 150 m2 con una variación con
respecto a la media de más o menos 35 m2
En la tabla de correlación también es muy fácil
Comprobémoslo
Yj = Tamaño de la familia
Xi = Número de habitaciones en la vivienda
En la tabla de correlación hemos creado una nueva fila en donde se recogerá las veces que se presenta cada valor
de la variable X, al cual llamaremos Hi.
También crearemos una columna nueva que recogerá las veces que se presenta cada valor de la variable Y, al cual
llamaremos Gj.
Tamaño de la familia ni
0 1
1 1
3 1
4 2
5 1
6 1
Totales 7
Tamaño de la vivienda (en m2) ni
100 1
120 1
130 1
150 2
200 2
Totales 7
Xi/Yj 1 2 3 4 Gj
1 200 134 251 12 597
2 120 254 362 125 861
3 45 365 124 255 789
4 136 85 268 85 574
5 245 96 111 43 495
Hi 746 934 1116 520 3316
Página 36 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
37. Ellos nos servirán para hacer las distribuciones marginales, en los cuales calcularemos los estadísticos más
importantes.
Distribución marginal de X
= 2,42 ≈1 ≈.1
Interpretemos: el número medio de habitaciones por vivienda varía de una a tres, en la muestra estudiada.
Distribución marginal de Y
= 2,85 = 1,72 = 1,31
Interpretemos: el tamaño medio de las familias estudiadas varía de dos a cuatro personas aproximadamente.
Autoevaluación
En nuestro ejemplo las "x" serán el tamaño de la familia y las "y" el número de habitaciones de la vivienda.
Xi Hi Xi *Hi X2* Hi
1 746 746 746
2 934 1868 3736
3 1116 3348 10044
4 520 2080 8320
3316 8042 22846
Yj Gj Yj *Gj Y2* Gj
1 597 597 597
2 861 1722 3444
3 789 2367 7101
4 574 2296 9184
5 495 2475 12375
3316 9454 32701
Tamaño de la familia
Número de habitaciones
1 2 3 4
1 200 134 251 12
2 120 254 362 125
3 45 365 124 255
4 136 85 268 85
Construir la distribución marginal de las variables "x" y contestar a las siguientes preguntas:
¿Cuál es la media de la variable "x"
a) 2.51
b) 1.89
c) 3.01
¿Cuál es la desviación típica?
a) 0.94
b) 0.88
c) 0.97
Página 37 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
38. El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no
funcionarán.
Estadística aplicable a la Investigación Comercial
Distribuciones condicionadas
Es una distribución que se obtiene manteniendo fija una variable y considerando los valores que toma la otra con
sus correspondientes frecuencias. Y nos explican como se distribuye una variable según los valores de la otra.
Son de dos tipos la de X/Y y la de Y/X.
Habrá tantas distribuciones X/Y como valores distintos de Y.
Habrá tantas distribuciones de Y/X como valores distintos de X.
Estas distribuciones son unidimensionales y podremos calcular todos los estadísticos estudiados.
Por ejemplo:
Si tenemos la siguiente tabla de correlación
Distribución condicionada de X/ Y= 4
Distribución condicionada de Y / X=3
Autoevaluación
A partir de la tabla de correlación correspondiente a la autoevaluación de la pregunta: Distribuciones marginales,
construir la tabla de la distribución condicionada de X/Y = 2 y contestar a las siguientes cuestiones:
Yj Xi 3 5 7 Gj
2 2 5 2 9
4 5 10 5 20
6 2 3 2 7
Hi 9 18 9 36
X / Y = 4 ni
3 5
5 10
7 5
Y / X = 3 ni
2 2
4 5
6 2
¿Cuál es la media?
a) 2.57
b) 3.09
c) 2.44
¿cuál es la desviación típica?
a) 0.95
b) 0.93
c) 0.90
Página 38 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
39. El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no
funcionarán.
Estadística aplicable a la Investigación Comercial
Covarianza
Si queremos medir la relación que existe entre dos variables tenemos que usar la covarianza.
La covarianza es una medida del grado de asociación entre dos variables.
Para calcular la covarianza utilizaremos esta formula práctica:
En nuestro ejemplo:
Es diferente la manera de calcularlo en función de que tengamos una tabla de correlación o no, calculémoslo en una
tabla de correlación que es donde puede ser un poco más complicado.
La columna que vamos a representar en verde la vamos a ir calculando poco a poco aquí para que vayáis viendo
como se hace.
A parte ya habíamos calculado:
= 2,42 ≈1 ≈1
= 2,85 = 1,72 = 1,31
Luego sólo nos queda aplicar la formula práctica y tendremos:
Sxy = 22708 / 3316 - (2,42 * 2,85) = -0.0489
Este sería el resultado de la covarianza.
En el primer ejemplo: El tamaño familiar medio es de 3,28 miembros y el tamaño medio de la vivienda es de 150 m2
Xi/Yi 1 2 3 4 Gi X* Y* nij
1 200 134 251 12 597 1269
2 120 254 362 125 861 4428
3 45 365 124 255 789 6501
4 136 85 268 85 574 5800
5 245 96 111 43 495 4710
Hi 746 934 1116 520 3316 22708
1*200*1+ 1*134*2+1*251*3+1*12*4= 200+268+753+48= 1269
2*120*1+2*254*2+2*362*3+2*125*4= 240+1016+2172+1000= 4428
3*45*1+3*365*2+3*124*3+3*255*4= 135+2190+1116+3060= 6501
4*136*1+4*85*2+4*268*3+4*85*4= 544+680+3216+1360= 5800
5*245*1+5*96*2+5*111*3+5*43*4= 1225+960+1665+860= 4710
22708
Página 39 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
40. El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no
funcionarán.
Se realizamos los cálculos para la covarianza obtenemos que:
Sxy = 3580 / 7 - (3.28 * 150) = 19.42
Esta medida nos será útil para los cálculos que haremos a continuación.
X Y X * Y
0 100 0
1 150 150
3 200 600
4 120 480
6 150 900
4 200 800
5 130 650
Estadística aplicable a la Investigación Comercial
La relación entre variables: correlación y regresión.
El objetivo más importante del estudio de las distribuciones bidimensionales es el ver la relación que existe entre las
variables X e Y.
Puedes pulsar en algunos de los términos de este esquema para acceder al apartado
correspondiente.
Autoevaluación
Responder con regresión/correlación
Aquella medida que permite obtener el valor de una variable cuando se da el valor de la otra a través de una función matemática se llama
a) Regresión
b) Correlación
Aquella medida que permite saber la dependencia entre las dos variables que forman la variable bidimensional se llama:
a) Regresión
b) Correlación
Página 40 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
41. El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no
funcionarán.
Estadística aplicable a la Investigación Comercial
La correlación
La correlación nos sirve para medir la intensidad de la relación entre dos variables.
La relación o dependencia entre las variables se va ha denominar "covariación". Existen cinco tipos de
covariaciones:
Dependencia causal unilateral: Cuando una de las variables influye en la otra, pero no
viceversa.
Ejemplo: La lluvia caída influye en el rendimiento del trigo, pero el rendimiento del trigo no va a influir en lo que va ha
caer de lluvia.
Interdependencia: Cuando las variables se influyen mutuamente.
Ejemplo: El precio depende de la cantidad demandada, y la cantidad demandada depende del precio.
Dependencia indirecta: Cuando la influencia de una tercera variable "Z" hace variar a X e Y en
el mismo o contrario sentido, puede aparecer una dependencia entre ellas que realmente no
existe directamente.
Ejemplo: El nivel de vida influye en el consumo de gasolina y en la talla de los soldados, y debido a esto se observa
que la talla aumenta cuando aumenta el consumo de gasolina, y viceversa.
Concordancia: Aun sabiendo que X e Y son independientes, queremos conocer si existe una
concordancia en sus variaciones.
Ejemplo: Valoración de dos jueces en un concurso de belleza.
Dependencia casual: Cuando se observa una dependencia entre dos variables sin que exista
ningún vínculo ni directo, ni indirecto entre ellas, se llega a la conclusión de que es casual o
accidental.
Ejemplo: Si estudiamos por una casualidad la talla de los soldados y el consumo de gasolina y nos da por
casualidad una relación de interdependencia.
La correlación mide la dependencia entre las dos variables que forman la variable
bidimensional, a través del coeficiente de correlación que nos dará la clase y el grado de
covariación entre ellas.
Autoevaluación
Indicar en los siguientes casos que tipo de covariación (Dependencia causal unilateral/ Interdependencia/Dependencia
Indirecta/Concordancia/Dependencia causal), existe entre las dos variables:
a) El precio depende de la cantidad ofrecida y la cantidad ofrecida depende del precio.
Elige una opción...
b) El nivel de vida influye en el nivel de estudios y en la talla de la población y debido a
esto observamos que la talla aumenta cuando aumenta el nivel de estudio y viceversa
Elige una opción...
Página 41 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
42. El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no
funcionarán.
El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no
funcionarán.
Estadística aplicable a la Investigación Comercial
Cálculo de la correlación
Para medir la correlación podemos usar el coeficiente de correlación lineal, al que llamaremos "r"
Su fórmula es:
en el que:
Sxy= la covarianza de x e y
Sx = Desviación típica de x
Sy= desviación típica de y
En nuestro ejemplo que relaciona el tamaño de la familia y el tamaño de la vivienda el coeficiente de correlación es:
Interpretación:
Los valores que puede tomar el coeficiente de correlación "r" están siempre comprendidos entre - 1 y 1. Si nos sale
un valor diferente nos hemos equivocado en algún cálculo
-1 < r < 1
Autoevaluación
Los valores que puede tomar el coeficiente de correlación están siempre comprendidos entre cero y uno.
a) Verdadero
b) Falso
Estadística aplicable a la Investigación Comercial
Interpretación del coeficiente de correlación
Del coeficiente de correlación tenemos que interpretar dos cosas:
En primer lugar: El signo o clase (positivo o negativo)
Si el coeficiente de correlación es positivo ( r > 0) hablamos de correlación lineal positiva,
y significa, que cuando sube el valor de una variable también sube el de la otra, y
viceversa, cuando el valor de una variable baja el de la otra también.
Por ejemplo: A mayores ingresos familiares mayor
Página 42 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
43. El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no
funcionarán.
es el gasto en ropa, cuantos más kilómetros recorra
un vendedor mayor es el gasto de mantenimiento del vehículo, etc...
Si el coeficiente de correlación es negativo ( r > 0) hablamos de correlación
lineal negativa, y significa, que cuando sube el valor de una variable baja el
valor de la otra.
Por ejemplo: Cuanto más gasta una familia menor es su tasa de ahorro,
cuanto mayor es el gasto de mantenimiento en un automóvil menor es el
número de averías que sufre, etc.
En segundo lugar: El grado de relación, que como norma general la vamos a
interpretar de la siguiente forma:
Por supuesto esto es a modo indicativo, dependerá del tipo de fenómeno que se estudie y el criterio con el que se
trabaje. Pero os ayudará en un principio a interpretar.
Interpretemos el ejemplo anterior: el resultado de "r" era 0,27
Luego diremos que la relación o covariación es positiva y poco significativa.
Positiva: Que cuanto mayor es el tamaño de la familia, mayor será la superficie de la vivienda, y viceversa.
Poco significativa: en la muestra estudiada esta relación o covariación tiene poca fuerza, se relacionan débilmente.
r > 0 La correlación es positiva
0 < r < 0,5 Positiva y poco significativa.
0,5 < r < 0,7 Positiva y significativa.
r > 0,7 Positiva y muy significativa.
r < 0 La correlación es negativa
-0,5 < r < 0 Negativa y poco significativa.
-0,7 < r < -0,5 Negativa y significativa.
r < -0,7 Negativa y muy significativa.
Estadística aplicable a la Investigación Comercial
El valor de la correlación (en valor absoluto)
Si la correlación se aproxima a 1 hablamos de correlación fuerte, cuanto más cerca de
1 o -1 se encuentre el coeficiente, más fuerte será la correlación.
Si la correlación se aproxima a 0 hablamos de correlación
débil.
Ejemplos:
Relación entre altura y peso de los habitantes de la isla:
r = 0,95 significa que la correlación es directa y fuerte, es decir, hay una gran relación
entre las dos variables y cuando sube la altura también lo hace el peso.
En nuestro ejemplo que relaciona el tamaño de la familia y el tamaño de la vivienda el coeficiente de correlación:
r = 0,23 significa que la correlación es directa pero débil, es decir, el tamaño de la familia explica muy mal el tamaño
de la vivienda, aunque su relación es positiva.
Relación entre tamaño de la familia de turistas y tiempo de permanencia en la isla.
Página 43 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
44. El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no
funcionarán.
r = -0,85 significa que la correlación es inversa y fuerte, es decir, la relación entre ambas variables es muy alta pero
a medida que crece el tamaño de la familia se reduce el tiempo de estancia en la isla.
Una correlación fuerte no garantiza que exista una relación de causa-efecto entre las dos
variables pues el resultado puede deberse únicamente a la casualidad
Autoevaluación
Cuando sube el valor de una variable y baja el valor de la otra, hablamos de correlación lineal negativa.
a) Verdadero
b) Falso
Una correlación fuerte garantiza siempre que existe una relación de causa-efecto entre las dos variables
a) Verdadero
b) Falso
Estadística aplicable a la Investigación Comercial
La regresión
Intentemos representar las parejas de valores del tamaño de la familia y
el tamaño de la vivienda.
Para hacerlo tomamos un par de ejes rectangulares y colocamos en
cada uno de ellos una variable.
Cada pareja de valores se representa por un punto y, por eso, el
resultado de colocarlos todos se denomina nube de puntos. Diagrama
que aparece en las distribuciones bidimensionales.
Podemos también intentar trazar una recta que muestre la tendencia de la nube de puntos:
Página 44 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
45. Esa recta que hemos trazado se denomina recta de regresión.
¿Cuál es la ventaja de la recta de regresión?
Nos va a permitir estimar cual será el tamaño de la vivienda si conocemos el tamaño de la familia.
¿Cómo lo haremos?
Supongamos que queremos estimar cual será el tamaño de la vivienda de una familia compuesta por dos miembros.
Trazamos una línea recta hasta la recta de regresión que parta de un tamaño familiar igual a 2 y comprobaremos
cual es el valor que toma la variable tamaño de vivienda en ese punto.
Vemos que el valor que corresponde es 100, así podemos estimar que el tamaño de una vivienda para una familia
de dos miembros será de 100 m2.
Técnicamente la regresión nos sirve para estimar el valor de una variable cuando damos el valor de la otra variable.
La regresión permite obtener el valor de una variable cuando se da el valor de la otra a través
de una función matemática.
Luego la regresión considerada en un amplio sentido, lo que busca es una "línea" o "función matemática" que
exprese sin irregularidades la relación entre las dos variables.
Existen muchos tipos de funciones matemáticas a aplicar, y cogeremos una u otra en función a la forma que tenga
en la gráfica la nube de puntos.
Nosotros solo estudiaremos el caso de la Regresión lineal.
Para representar a la nube de puntos podemos usar una gran variedad de líneas: parábolas, curvas, rectas, etc.
Página 45 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
46. Cuando la línea de regresión es una recta se denomina regresión lineal
¿Cuál es la mejor recta de regresión?
Es aquella que haga mínimas las distancias entre los puntos reales y los de la recta. Podemos estudiar la regresión
lineal de Y/ X.- en donde obtendremos valores medios de Y en función de valores determinados de X.
La ecuación de una recta es:
y = A + Bx
A y B son las incógnitas de un sistema de dos ecuaciones:
En esas ecuaciones no se ha tenido en cuenta la frecuencia, ya que el ejemplo abajo considerado la frecuencia de
presentación de los pares de valores siempre es uno. Pero en el caso de que exista frecuencia las ecuaciones serían
las siguientes:
Si hacemos una ciertas operaciones con esas ecuaciones tendremos que:
Que como veis serán más fáciles de usar en cualquier tipo de distribución bidimensional.
Donde:
n = número de elementos estudiados, es decir, número de parejas de valores
xi= valores de la variable x
yi = valores de la variable y
Vamos a calcular la recta de regresión del tamaño de la familia y el tamaño de la vivienda.
Sustituyendo en la fórmula:
7 A + 23 B = 1050
23 A + 103 B = 3580
Tamaño de la familia (x) Tamaño de la vivienda en m2 (y) X2 Xy
0 100 0 0
1 150 1 150
3 200 9 600
4 120 16 480
6 150 36 900
4 200 16 800
5 130 25 650
Total=23 Total=1050 Total=103 Total=3580
Página 46 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...
47. El navegador utilizado no soporta JavaScript. Puede navegar por el material, pero las preguntas de autoevaluación no
funcionarán.
Resolviendo el sistema:
A = 134,42
B = 4,74
Con lo que la recta de regresión es:
y = 134,42 + 4,74 x
Vamos a calcular ahora cuantos metros suponemos que tendrá la vivienda de una familia con dos miembros.
Sustituimos la x por 2:
y = 134,42 + 4,74*2
y = 143,9 m2
Ya hemos podido estimar que una vivienda de una familia con dos miembros tendrá 143,9 m2.
Por último tendríamos que estudiar si esta recta representa correctamente la relación entre las variables, para ello
se tiene que calcular "el coeficiente de determinación", que en el caso de la regresión lineal es
R2=r20≤ R2≤ 1
Si R2 = 0 No se ha explicado nada con este modelo y si R2 = 1 el ajuste es perfecto.
Calculémoslo en el caso que nos ocupa:
R2 = (0.27)2 = 0.07. Como veis esta muy próximo a cero luego este modelo matemático no explica la relación entre
estas dos variables, no es válido.
Si quisiéramos ahora calcular la otra recta de regresión, la de X/ Y, sería casi igual cambiaríamos donde hay Y por
X, y por supuesto todo lo que esta relacionado con una y otra también. El coeficiente de determinación no varía.
Para saber más:
http://www.fisterra.com/material/investiga/regre_lineal_simple
/regre_lineal_simple.htm
Estadística aplicable a la investigación de mercados
Distribuciones multidimensionales
Vamos a intentar predecir cuantas veces cenará una familia en el restaurante de un hotel
de isla Paraíso.
Antes tendremos que calcular de qué factores depende: supongamos que hemos decidido
que las veces que cena un familia en el restaurante depende de:
Número de miembros de la familia
Renta de la familia
Número de excursiones que contrata la familia durante su estancia en la isla.
Queremos explicar una variable (número de cenas) y disponemos de otras tres variables explicativas.
¿Qué podemos hacer?
Podemos intentar elegir la variable que explica mejor el número de cenas que realiza una familia en el restaurante y
usar las técnicas que conocemos para una distribución bivariante.
Página 47 de 57¿Por qué utilizamos la estadística en investigación comercial?
14/04/2008http://moodle.ced.junta-andalucia.es/educacion/elearning/cursos/blocks/recopila/view...