Los Datos y la Estadística MATERIAL DIDÁCTICO REALIZADO POR: Dr. en C.D.H. Leopoldo Xavier Cárdenas González PARA LA MATERIA DE:  HERRAMIENTAS DE APLICACIÓN ESTADÍSTICA AÑO 2010
Objetivo El uso de modelos probabilísticos y métodos estadísticos para analizar datos, se ha vuelto práctica común en casi todas las disciplinas científicas. Se pretende en este curso proporcionar una introducción completa a los modelos y métodos que los estudiantes de este módulo encontrarán en sus actividades profesionales. Los ejercicios y ejemplos están diseñados esencialmente con un adecuado análisis estadístico, con diferentes métodos y sus diversas aplicaciones al conocimiento científico.
¿Qué es la estadística? 1.- ¿Qué entiendes por Estadística? ¿Cuál es su utilidad? 2.- Describa tres aplicaciones de la estadística en  su área de trabajo 3.- ¿Qué tipo de datos se manejan en la estadística? 4.- ¿Para qué se recopilan datos en una investigación? 5.- ¿Cuáles son las fuentes de datos para una  investigación? 6.- Mencione algún experimento en donde existan variaciones en las mediciones con diferentes periodos de tiempo
MAPA PARA SELECCIONAR UN MÉTODO ESTADÍSTICO TIPO DE ANÁLISIS NUMÉRICOS CATEGÓRICOS TIPO DE DATOS Descripción de un grupo o diversos grupos Arreglo ordenado, diagrama de tallo y hoja, distribución de frecuencias, distribuciones de: frecuencia, frecuencia relativa, porcentajes, porcentajes acumulados; Histograma, polígono, polígono de porcentaje acumulado Tabla de resumen, gráfica de barras, gráfica de pastel, diagrama de Paretto Media, mediana, moda, cuartiles, media geométrica, rango, rango intercuartil, desviación estándar, varianza, coeficiente de variación, gráfica de caja y bigote
MAPA PARA SELECCIONAR UN MÉTODO ESTADÍSTICO TIPO DE ANÁLISIS NUMÉRICOS CATEGÓRICOS Inferencia acerca de un grupo Estimación del intervalo de confianza para la media Prueba Z para la media Prueba t para la media Estimación de intervalo de confianza para una proporción Prueba Z de hipótesis para la proporción Comparación de dos grupos Pruebas para la diferencia en las medias de dos poblaciones independientes Prueba t apareada Prueba F para la diferencia entre dos varianzas Prueba Z para la diferencia entre 2 proporciones Prueba Chi cuadrada para la diferencia entre 2 proporciones
MAPA PARA SELECCIONAR UN MÉTODO ESTADÍSTICO TIPO DE ANÁLISIS NUMÉRICOS CATEGÓRICOS Comparación de más de dos grupos Análisis de varianza de una vía Prueba chi cuadrada para las diferencias entre más de dos proporciones Análisis de la relación entre dos variables Diagrama de dispersión, gráfica de series de tiempo Covarianza, coeficiente de correlación Regresión lineal simple Prueba t de correlación Tabla de contingencia, gráfica de barras agrupadas Prueba de chi cuadrada de independencia Análisis de la relación entre dos o más variables Regresión múltiple
Diferencias en las aplicaciones de la estadística en las diversas disciplinas académicas  La mayor diferencia radica en los ejemplos que se utiliza En la facultad de  Administración  nos interesan cosas como: ganancias, horas trabajadas y salarios. En el depto. de  Psicología  se interesan por las calificaciones obtenidas en las pruebas de algún test aplicado a determinada población de alumnos En la facultad de  Ingeniería  quizá se interesen por la cantidades de unidades que se fabrican en una máquina en particular. Sin embargo las 3 áreas se interesan en el valor típico y la variación que existe en la información. Quizá haya también una diferencia en el nivel de matemáticas que se requiere.
Razones para estudiar Estadística 1.- La información está en todas partes 2.- Las técnicas estadísticas se emplean para tomar muchas decisiones que afectan nuestra vida 3.- Sin importar cuál sea su profesión, tomará decisiones más profesionales que comprenden información
Razones para estudiar Estadística Como ciudadano, estará expuesto a, y tal vez incluso ayude a generar, descripciones estadísticas y análisis de datos que sean de vital importancia para su comunidad local, estatal, nacional y mundial. Como profesional de negocios, encarará mediciones estadísticas de desempeño y éxito, y conocerá empresarios que esperarán que ud. pueda utilizar las técnicas estadísticas y herramientas de software para computadora más recientes al trabajar con estas mediciones.
Casos de Negocios En todos los casos,   la empresa u organización necesita apoyo estadístico para analizar su base de datos con el fin de ganar más dinero, tomar mejores decisiones o sencillamente llegar al siguiente año fiscal. Se deben tomar muy en cuenta algunos lineamientos en forma de preguntas o cuestiones específicas que el estudiante podría abordar al emplear la estadística para negocios como recurso, con el fin de formular observaciones y recomendaciones informativas o útiles para su “cliente”.
¿Qué se necesita a fin de tomar una decisión adecuada? 1.- Determinar si la información existente es adecuada o si se necesita una información adicional 2.- Recopilar información adicional, en caso de ser necesaria, de manera que no proporcione resultados erróneos. 3.- Resumir la información en forma útil y organizada 4.- Analizar la información disponible 5.- Sacar conclusiones y hacer deducciones al tiempo que evalúa el riesgo de una conclusión incorrecta 6.- Debe existir ética en el análisis y preparación de los informes estadísticos
LOS DATOS Y LA ESTADÍSTICA ¿QUÉ ES LA ESTADÍSTICA ? Es el arte y ciencia de reunir, analizar, presentar e interpretar datos.  La disciplina de la estadística enseña cómo razonar de manera lógica y tomar decisiones informadas en presencia de incertidumbre y variación.  Sin estas dos últimas, habría poca necesidad de los métodos estadísticos o de los profesionales de la estadística  EJEMPLOS QUE ILUSTRAN ALGUNAS APLICACIONES DE LA ESTADÍSTICA: a) Contabilidad b) Finanzas c) Mercadotecnia d) Producción e) Economía  f) Educación  g) Psicología h) Ingeniería i) Control estadístico de procesos y la calidad j) Administración k) Recursos Humanos  l) Valuación
Los datos Los datos son los hechos y los números que se reúnen y resumen para su presentación. Al estar reunidos, los datos recopilados en determinado estudio se denominan conjunto de datos.
Datos Cuantitativos y Cualitativos Los  datos cualitativos : son identificadores o nombres asignados a un atributo de cada elemento. Pueden ser numéricos o no numéricos: Ejemplo: los números de seguro social, como 310-22-7924 están formados por valores numéricos, sin embargo, son cualitativos, porque en realidad identifican a determinado individuo. Los  datos cuantitativos : indican cuánto o cuántos.  Siempre son numéricos. Ejemplo: Ventas de refrescos en determinada empresa, número de alumnos/grupo en la universidad,  ganancias por acción, cantidad de agua que contiene el cuerpo humano, número de palabras/página promedio que contiene la obra Don Quijote de la Mancha.
DIFERENCIA ENTRE DATOS CUALITATIVOS Y CUANTITATIVOS La diferencia consiste en  que las operaciones aritméticas ordinarias sólo tienen sentido con los datos cuantitativos. Por ejemplo: cuando los datos son  cuantitativos , sus valores se pueden sumar y después dividir entre la cantidad de valores para calcular el valor promedio de ellos. Este promedio tiene sentido y, por lo general se interpreta con facilidad. Sin embargo, cuando se registran datos  cualitativos  en forma de valores numéricos, esas operaciones aritméticas producen resultados sin importancia.
Tipos de Estadística La Estadística Descriptiva : estudia las técnicas que se utilizan para describir o caracterizar los datos obtenidos La Estadística Inferencial  :incluye las técnicas que emplean los datos obtenidos en la muestra para, a partir de ellos, hacer inferencias sobre sus respectivas poblaciones.
Ejemplos de Estadística Descriptiva Durante el 2009, los miembros del Congreso recibieron un total de 90 millones de mensajes por correo electrónico, más del doble de la cantidad recibida durante 2007 Más de 8.5 millones de habitantes viven en la ciudad de Nueva York (año 2007) y viven 10,000 personas por km 2  . Loving County (Texas) tiene 67 residentes y una densidad de población de una persona por 10 millas   cuadradas. Más de 1800 plantas y animales están en la lista de especies en peligro de extinción del Departamento del Interior del gobierno de E.U. De enero de 2008 a la fecha, 80.6% de los vuelos de Continental Airlines arribó a tiempo.
Ejemplos de estadística inferencial Una investigación de Nielsen/NertRaitings estima que 162.8 millones de estadounidenses (58% de la población) tiene acceso a sitios web en su domicilio. A partir de un estudio de 340 mujeres divididas en 4 grupos según su ocupación, los investigadores de la Universidad de Pittsburg encontraron que las empleadas de oficina tienen el mayor riesgo de padecimientos cardiovasculares. De 1400 directores corporativos de finanzas encuestados, 38% dijo que “el reconocimiento frecuente de los logros” era el mejor modo de motivar a sus empleados. En una encuesta realizada a alumnos de último semestre de preparatoria que aspiraban a matricularse en una universidad, 33% dijo que “el nivel académico” era la característica más importante al elegir una universidad.
Estadística Descriptiva La mayor parte de la información estadística que aparece en los diarios, revistas, informes y demás publicaciones consiste en datos resumidos y presentados en forma comprensible para el lector. Esos resúmenes de datos, que puede ser tabulares, gráficos o numéricos, se llaman  estadísticas descriptivas
Inferencia Estadística Uno de los mayores aportes de la estadística es que los datos de una muestra pueden emplearse para elaborar estimaciones y probar hipótesis ( indican lo que estamos buscando o tratando de lograr )   acerca de las características de una población. A este proceso se le denomina  inferencia estadística.
LA ESTADÍSTICA Y EL MUNDO REAL En áreas de verdadera importancia para usted, debe preguntarse cosas como: ¿Están respaldadas estas afirmaciones por datos? ¿Qué tan confiables son esos datos? ¿Es el azar una explicación razonable para los datos?
LA ESTADÍSTICA Y EL MUNDO REAL Si no existen datos, o si éstos se presentan con expresiones como: “ mi experiencia es que……….” en lugar de haber sido obtenidos por medio de experimentos bien controlados, usted comenzará a cuestionarse si debe considerar en serio el consejo de esa autoridad.
OBTENCIÓN DE DATOS MEDIANTE ENCUESTAS DE INVESTIGACIÓN Es muy probable que un especialista en estadística que realiza una encuesta desee desarrollar un instrumento que le permita hacer varias preguntas y manejar diversos fenómenos o características. A estos fenómenos  o características se les denomina variables aleatorias
TIPOS DE VARIABLES Cualitativas  Cuantitativas Marca de PC  Discretas  Continuas Estado civil Color del cabello  *Hijos en la familia  *Cantidad de  *Letras del alfabeto  impuesto pagado *TV en una casa  *Peso de un alumno *Precipitación anual en Zapopan, Jal
VARIABLES ALEATORIAS TIPOS DE DATOS  TIPOS DE PREGUNTAS  RESPUESTAS CUALITATIVOS   ¿Posee actualmente bonos  Si  No de ahorro del gobierno? ¿Ud. es?  Hombre  Mujer Su cabello es:  castaño, negro, rojizo, rubio o canoso  CUANTITATIVO: DISCRETO :  ¿A cuántas revistas está  ______número suscrito actualmente? CONTÍNUO:   ¿Cuál es su estatura?  _______ cm  ¿Cuál es el volumen de un líquido en un recipiente?  _______ cm 3
TIPOS DE DATOS Los  datos cuantitativos discretos   son respuestas numéricas que surgen de un proceso de conteo (su respuesta puede ser sólo un número finito de números) Por ejem: 8 personas, 3 revistas, 12 automóviles. Los  datos cuantitativos continuos   son respuestas numéricas que surgen de un proceso de medición (la respuesta puede tomar cualquier valor dentro de un intervalo).  Por ejemplo: 1.75 mts, 16.97% de interés mensual,  19.4 lb/pulg 2  de presión
ESCALAS DE MEDICIÓN La asignación de un valor numérico a una variable es un proceso llamado medición. Por ejemplo:  a) La temperatura en la cd. de Guadalajara en este momento es de 25°C b) 8 focos rotos en una caja c) 4 llantas radiales en un automóvil  d) El volumen de una lata de refresco es de 100 ml Los números 25, 8, 4 y 100 constituyen mediciones
NIVELES o ESCALAS DE MEDICIÓN NOMINAL  ORDINAL  DE INTERVALO  DE RAZÓN Los datos sólo  Los datos se  Diferencia significativa  Punto “0” signi- se clasifican  ordenan  entre los valores  ficativo y razón entre valores Números en las  Su número de  Temperatura  Número de playeras de los  lista en clase  pacientes vistos jugadores de futbol  Posición de  Número de Marca de un auto  llegada en una  llamadas de carrera de  ventas el dia de maratón  hoy
NIVELES o ESCALAS DE MEDICIÓN Las Áreas Sociales utilizan normalmente el nivel cualitativo de medición:  nominal y ordinal. ¿ Qué operaciones matemáticas se pueden realizar con estas escalas?  proporciones, porcentajes y razones Cuando la variable puede medirse se utilizan  las escalas de intervalo o de razón ¿ Qué operaciones matemáticas se pueden realizar con estas escalas? proporciones, porcentajes y razones, media aritmética, moda,  mediana, rango y desviación estándar
ESCALAS DE MEDICIÓN “Nominales, Ordinales, de Intervalos y de Razón” ESCALA NOMINAL : Representa el nivel mínimo de medición y se utiliza con frecuencia para variables de naturaleza  cualitativa  y no cuantitativa. Ejemplos de  variables cualitativas : Marcas de zapatos deportivos, distintos tipos de frutas o música, los días de la semana, la nacionalidad, creencias religiosas y el color de los ojos. Al utilizar una escala nominal, la variable se divide en sus diversas categorías. La medición con una escala nominal EQUIVALE en realidad, a clasificar los objetos y a darles el nombre de la categoría a la cual pertenecen.
ESCALA DE MEDICIÓN:  Nominal EJEMPLO DE ESCALA NOMINAL “ Zapatos deportivos Nike,  Brooks y New Balance” VARIABLE: “marca de Zapatos Deportivos” TIPO: Cualitativo CATEGORÍA: (Diversas marcas de zapatos deportivos) Categoría zapatos deportivos 1 (Nike) Categoría zapatos deportivos 2 (Brooks) Categoría zapatos deportivos 3 (New Balance) De lo anterior podemos, contar el número de zapatos que pertenecen a cada categoría. Por ejemplo: Nike: 20 pares, Brooks: 26 pares y de New Balance: 17 pares, y con esta información tener las frecuencias que nos permitan comparar el número de zapatos en cada categoría.
Ejemplo de la medición en la  escala nominal en un cuestionario EJEMPLO DE LA ESCALA NOMINAL EN UN CUESTIONARIO: Estado civil : soltero, casado, viudo, divorciado  (son mutuamente excluyentes) Estos indicadores sólo pueden clasificarse, no medirse. Las operaciones matemáticas que se aplican en el análisis de estos datos son: razones, proporciones y porcentajes
ESCALA DE MEDICIÓN:  Ordinal Con esta escala ordenamos los objetos medidos, tomando como base si poseen más, menos o la misma cantidad de la variable medida. Así, una escala ordinal permite determinar si: A > B,  A = B  ó  A < B Ejemplo: ordenamiento de los 5 mejores participantes en un concurso de Oratoria, según facilidad de palabra. Nombre de la persona   Rango que ocuparon Karla Icela Méndez  1° Carolina Beltrán  2° Brian Muñoz  3° Felipe Solís  4°
ESCALA DE MEDICIÓN:  Ordinal Entre los oradores, la persona de rango 1 fue considerada mejor que la persona con rango 2,  quien a su vez fue mejor que la de rango 3, etc. Es importante observar que aunque esta escala permite hacer comparaciones del tipo: “mejor que, igual que o menor que”, no dice nada sobre la magnitud de la diferencia entre las unidades adyacentes que pertenecen a dicha escala. Otros ejemplos : Clasificación de los corredores que participaron en el Maratón de Guadalajara según su orden de llegada. El orden de los maestros según su capacidad de enseñanza El orden de los estudiantes según su nivel de motivación
Ejemplo de la medición en la  escala ordinal  en un cuestionario ¿La clase de matemáticas es interesante? a) de acuerdo b) duda c) en desacuerdo Resultados de la encuesta a 100 alumnos en una universidad: 60% de acuerdo 15% en duda 25% en desacuerdo
ESCALA DE MEDICIÓN:  de Intervalo Representa un nivel superior de medición respecto a la escala ordinal. Posee las propiedades de magnitud e igualdad de intervalos entre las unidades adyacentes, pero no tiene un cero absoluto. Ejemplo: Escala Celsius para medir la temperatura. Tiene la propiedad de poseer intervalos iguales entre las unidades adyacentes, pero no tiene un punto correspondiente al cero absoluto. Así la cantidad de adicional de calor que provoca un cambio de lectura de la temperatura de 2° a 3° Celsius producirá también un cambio en la lectura de 51° a 52° o de 105° a 106° Celsius. Podemos determinar si: A = B,  A > B  ó  A < B
Ejemplo de la medición en la escala de intervalo en un cuestionario ¿Cual es el intervalo en la edad de los alumnos de primer año? a) de 14 a 16 años b) de 17 a 19 años c) de 20 a 22 años ¿Qué operaciones matemáticas se pueden hacer en este tipo de escala? Media aritmética, mediana, moda, desviación estándar, etc.
ESCALA DE MEDICIÓN:  de Razón El siguiente y máximo nivel de medición es la Escala de Razón. Tiene todas las propiedades de una escala de intervalo y además, posee un cero absoluto. Ejemplos: Tiempo de reacción La longitud El peso La edad La frecuencia de cualquier evento La temperatura en °Kelvin (tiene un cero absoluto,  ausencia completa de calor) Se pueden realizar todas las operaciones matemáticas asociadas por lo general con los números (+, -, x , /)
ESCALA DE MEDICIÓN:  de Razón Ejemplo para ilustrar la diferencia entre la escala de Intervalo y la de Razón: Experimento: Comparar la escala °C y la escala °K El cero en la escala Celsius es la temperatura a la cual se congela el agua El cero de la escala Kelvin es el cero absoluto La diferencia de calor entre 8° y 9° es igual a la diferencia entre 99° y 100° sin importar que la escala sea °C o °K Una lectura de 20°C no es el doble de caliente que 10°C, ¿porqué? Convertimos a calor real (°K) estas temperaturas: °K = °C + 273 = 20° + 273° = 293°K = 10° + 273° = 283°K Es obvio que 293° no es el doble que 283°
ESCALAS DE MEDICIÓN EN LAS CIENCIAS DEL COMPORTAMIENTO Muchas de las escalas utilizadas se consideran con frecuencia como si fuesen de intervalo sin establecer con claridad que la escala, en realidad, posee intervalos iguales entre unidades adyacentes. Ejemplos: La medición del CI Las variables emocionales: ansiedad y depresión Las variables de personalidad: autosuficiencia, introversión,  extroversión y la dominancia. Variables de eficiencia o logros terminales Variables de actitud Nota: Para todas estas variables, sus escalas no son de razón (no tienen un cero absoluto como referencia)
Ejemplo del C.I. Si una persona ha obtenido un cero en la escala de inteligencia para adultos de Wechsler (WAIS), no podríamos decir que tiene inteligencia nula. Se supone que se encontrarían algunas preguntas que podría contestar el individuo en cuestión, de modo que tendría un CI > 0 Así la prueba WAIS no tiene un punto cero absoluto y la escala de razón no es adecuada Por lo tanto no es correcto decir que una persona con un CI de 160 es lo doble de inteligente que alguien con un CI de 80
Influencia del nivel de escalas en la selección del tipo de prueba que se usará en el Análisis de Datos Existen 2 criterios: 1° El primero afirma que el uso de ciertas pruebas:  “ t” de Student “ ANOVA” (análisis de varianza) deben limitarse a los datos que pertenecen a escalas de intervalo y de razón. 2° El segundo criterio no concuerda con lo anterior y afirma que esas pruebas también se pueden utilizar con datos nominales y ordinales
Práctica # 1  Indicar cuáles de las siguientes variables son continuas y cuáles son discretas a) La hora del día b) Número de mujeres en este grupo c) Número de veces que una rata oprime la palanca en una caja de Skinner d) Edad de los sujetos en un experimento e) Número de palabras recordadas f) Peso del alimento ingerido g) % de estudiantes de su grupo que son mujeres h) Velocidad de los corredores en una carrera
PRÁCTICA # 2 Identificar la escala de cada una de las siguientes variables (Nominales, Ordinales, de Intervalos y de Razón) A) Número de automóviles que utilizan los alumnos de primer cuatrimestre B) Tipos de autos utilizados por los estudiantes de 2° cuatrimestre C) El C.I. de los maestros de la Universidad (suponga que utiliza una escala con intervalos iguales) D) El dominio de las matemáticas, clasificado en las categorías de: malo, regular y bueno E) Sensación de ansiedad al hablar en público, calificada según una escala de 0 a 100 (suponga que la diferencia en el grado de ansiedad entre las unidades adyacentes de toda la escala no siempre es la misma) F) El peso de un grupo de personas sometidas a una dieta
PRÁCTICA # 2 Identificar la escala de cada una de las siguientes variables G) El tiempo de reacción al escuchar un sonido H) El dominio de las matemáticas, medido en una escala de 0 a 100. La escala está bien normalizada y se puede considerar que tiene intervalos iguales entre las unidades adyacentes. I) Las calificaciones de los maestros asignados por los estudiantes, en una escala de 50 puntos. No existe una base suficiente para suponer que los intervalos entre las unidades adyacentes son iguales.
PROCESO DE INFERENCIA ESTADÍSTICA EN UN EJEMPLO DE UNA EMPRESA QUE FABRICA BOMBILLAS ELÉCTRICAS LA POBLACIÓN ES IGUAL A TODAS LAS BOMBILLAS  FABRICADAS CON EL NUEVO FILAMENTO. SE ESCONOCE LA DURACIÓN PROMEDIO (1) SE FABRICA UNA MUESTRA DE 200 BOMBILLAS CON EL NUEVO  FILAMENTO (2) EL RESUMEN DE LOS DATOS DE LA MUESTRA DA COMO RESULTADO UNA DURACIÓN PROMEDIO DE 76 HORAS POR BOMBILLA (3) EL VALOR DEL PROMEDIO DE LA MUESTRA SE EMPLEA PARA ESTIMAR EL PROMEDIO DE LA POBLACIÓN (4)
POBLACIÓN Y MUESTRA Población:  “ Es el conjunto completo de individuos, objetos o datos que el investigador está interesado en estudiar”. Muestra : “ Es un subconjunto de la población”.
VARIABLES Variable:   “Es cualquier propiedad o característica de algún evento, objeto o persona que puede tener diversos valores en diferentes instantes, según las condiciones”. Ejemplos : La altura, el peso, el tiempo de reacción y la dosis de un medicamento. Constante : “No asume diferentes valores en diferentes instantes”. Ejemplo :  el símbolo matemático pi:  Π
Variable independiente La variable independiente   de un experimento es aquella que es controlada en forma sistemática por el investigador. El experimentador controla los niveles de la variable y mide el efecto que produce sobre las demás variables. EJEMPLO : Un científico podría estar interesado en el efecto del alcohol sobre el comportamiento social. Para investigar esto, es probable que el experimentador varíe la cantidad de alcohol y mida sus consecuencias sobre la conducta social de las personas. La cantidad de Alcohol es la  variable independiente .
Variable dependiente La variable dependiente  en un experimento es la que el investigador mide para determinar el efecto de la variable independiente. Ejemplo : En el experimento que estudia los efectos del alcohol sobre el comportamiento social, la  variable dependiente  es el  comportamiento social .  El comportamiento social de los sujetos se mide para ver si resulta afectado por la cantidad de alcohol consumida.
Estadístico y Parámetro Estadígrafo : es un número calculado a partir de los datos de la muestra.  ejemplo : promedio de un conjunto de datos de la muestra.(Muestra) Parámetro : es un número calculado sobre los datos de una población. ejemplo : valor promedio de un conjunto de datos poblacionales.(habla de la población)
Práctica # 3   identificar: Variable independiente, dependiente, muestra, población, datos, estadístico y parámetro   Un psicólogo clínico está interesado en evaluar tres métodos para tratar la depresión:  la medicación, la reestructuración cognitiva y el ejercicio. Se incluye una cuarta condición de tratamiento: un grupo que sólo estará en espera de tratamiento, para tener un grupo de control de línea base. Se recluta a 60 personas deprimidas entre los estudiantes de licenciatura de una universidad, 15 de ellos son asignados a cada método de tratamiento.
… .. continuación práctica # 3 Los tratamientos se administran durante 6 meses, después de lo cual cada estudiante recibe un cuestionario diseñado para medir el grado de depresión. El cuestionario tiene una escala de 0 a 100, donde los puntajes mayores indican un mayor grado de depresión. Luego se calculan las medias de los valores de depresión para los 4 tratamientos y se comparan entre sí para determinar la eficiencia relativa de cada tratamiento.
Práctica # 4 Indicar cuáles de las siguientes afirmaciones representan una variable y cuáles una constante A) El número de letras del alfabeto B) El número de horas que tiene un día C) La hora en que Ud. come D) El número de estudiantes que se especializan en Administración cada año, en esta Universidad E) El número de cm en un metro F) La cantidad de horas que duerme usted cada noche G) Su peso H) El volumen de 1 litro de agua
Práctica # 5 Indicar cuáles de las siguientes situaciones corresponden a la estadística descriptiva y cuáles a la estadística inferencial A) Un informe anual para accionistas que detalla los bienes de la corporación B) Un maestro de Contabilidad que anuncia a su grupo el número de estudiantes que obtuvieron la máxima calificación en un examen reciente C) El cálculo de la media de un conjunto de datos de una muestra para caracterizarla. D) El uso de los datos de una muestra en una encuesta para estimar la opinión de la población E) Realizar un estudio de correlación sobre una muestra para determinar si el nivel educativo y el ingreso de la población están relacionados F) Un artículo de un periódico sobre los salarios promedio de los empleados federales a partir de los datos reunidos de todos los interesados.
Practica # 6 (en equipos) 1.- Diseñen un experimento y mencionen la metodología que utilizarían para obtener los datos necesarios. 2.- Estructuren una encuesta (10 preguntas) para obtener información necesaria en una investigación de mercado referente a la promoción de un producto de su preferencia. 3.- Den un ejemplo en un área de interés grupal, en la que los datos sean útiles para la toma de decisiones. ¿Que datos son utiles? ¿Cómo podrían obtenerse? ¿Cómo podrán usarse los datos en el proceso de toma de decisiones? 4.- ¿Qué significado tiene?: a) El Error de Muestreo b) Error de Medicion 5.- ¿Cuales son las ventajas y desventajas de las entrevistas personales, las encuestas telefónicas y las encuestas por correo?
DISTRIBUCIONES DE FRECUENCIA Una distribución de frecuencias presenta los valores de los datos y la frecuencia con que se presentan. Al ser mostrados en una tabla, los valores de los datos se presentan en orden y, por lo general, el valor del dato más bajo aparece en la parte inferior de la tabla.
Elaboración de una distribución de frecuencias de datos agrupados Pasos: 1.- Encontrar el rango de los datos 2.- Determinación del número de intervalos de clase 5  <  i  <  18 3.- Determinar la amplitud (ancho) de cada intervalo de clase 4.- Formamos los intervalos de clase agregando i – 1  5.- Hacer una lista con los límites de cada intervalo de clase, colocando en la parte inferior de la misma al intervalo que contenga el dato más pequeño (mínimo) 6.- Contar los datos en bruto contenidos en los intervalos de clase correspondientes 7.- Sumar las cuentas de cada intervalo para obtener la frecuencia del intervalo
ELABORE UNA DISTRIBUCIÓN DE FRECUENCIAS CON LOS SIGUIENTES DATOS DEL COSTO ANUAL (en miles de $) DE ENERGÍA ELÉCTRICA EN 70 EMPRESAS METAL MECÁNICAS EN MÉXICO EN EL AÑO 2009  95  57  76  93  86  80  89 76  76  63  74  94  96  77 65  79  60  56  72  82  70 67  79  71  77  52  76  68 72  88  84  70  83  93  76 82  96  87  69  89  77  81 87  65  77  72  56  78  78 58  54  82  82  66  73  79 86  81  63  46  62  99  93 82  92  75  76  90  74  67
Pasos para la “Elaboración de la distribución de frecuencias” 1.- Determinación del rango: Rango = dato máximo menos dato mínimo = 99 – 46 = 53 2.- Determinamos el número de intervalos de clase: Nota: 5  <  i  <  18 para este caso tomamos 10 3.- Determinación de la amplitud (ancho) del intervalo de clase (i): i =  rango  = 53  = 5.3  5 Número de intervalos de clase  10 se redondea al mismo número de decimales que aparece en los datos en bruto
Pasos para la “Elaboración de la distribución de frecuencias” 4.- Formamos los intervalos de clase agregando i – 1  tenemos: 5 – 1 = 4 (es decir a cada valor empezando por el límite inferior agregamos 4 unidades) 5.- La lista de los intervalos: debemos determinar el límite inferior de dicho intervalo. Requisitos:  a) El límite inferior de este intervalo debe ser tal que el  intervalo contenga al dato mínimo b) Se “acostumbra” hacer que el límite inferior de este intervalo sea exactamente divisible entre “i” Para nuestro ejemplo, el número más pequeño es 46 (no es exactamente divisible entre 5), por tanto el límite inferior del intervalo más bajo debe ser 45
Diagrama de tallos y hojas Son una alternativa sencilla para acomodar los datos desagrupados y resultan sumamente útiles para resumir y describir datos cuando el número de éstos no es mayor de 100. En los diagramas de tallos y hojas no se pierde ninguno de los datos originales. Al hacer un diagrama de este tipo, cada dato es representado mediante un tallo y una hoja. El tallo se coloca a la izquierda de la línea vertical y la hoja a la derecha. Por ejemplo, los tallos y hojas de los dos primeros números de la primer columna serían: Tallo  hoja 9  5 7  6
Diagrama de tallos y hojas 4  6 5  2, 4, 6, 6, 7, 8 6  0, 2, 3, 3, 5, 5, 6, 7, 7, 8, 9 7  0, 0, 1, 2, 2, 2, 3, 4, 4, 5, 6, 6, 6, 6, 6, 6, 7, 7, 7, 7, 8, 8, 9, 9, 9 8  0, 1, 1, 2, 2, 2, 2, 2, 3, 4, 6, 6, 7, 7, 8, 9, 9 9  0, 2, 3, 3, 3, 4, 5, 6, 6, 9
Construcción de una distribución de frecuencias para el costo anual agrupado de las Empresas metal mecánica en México Intervalos de clase  límites reales   frecuencias 45-49  44.5-49.5  1 50-54  49.5-54.5  2 55-59  54.5-59.5  4 60-64  59.5-64.5  4 65-69  64.5-69.5  7 70-74  69.5-74.5  9 75-79  74.5-79.5  16 80-84  79.5-84.5  10 85-89  84.5-89.5  7 90-94  89.5-94.5  6 95-99  94.5-99.5  4
Frecuencia relativa, frecuencia acumulada y distribuciones de porcentajes acumulados Una  distribución de frecuencias relativas : indica la proporción del número total de datos que aparecen en cada intervalo. Una  distribución de frecuencias acumuladas : indica el número de datos que están por debajo del límite real superior de cada intervalo Una  distribución de porcentajes acumulados : indica el porcentaje de datos que están por debajo del límite real superior de cada intervalo
Distribuciones de frecuencias relativas, frecuencias acumuladas y porcentajes acumulados para los datos agrupados  Intervalos de clase  f   f.a.   f.r.(%)   f.r.a. 45-49  1  1  1.43  1.43 50-54  2  3  2.86  4.29 55-59  4  7  5.71  10.00 60-64  4  11  5.71  15.71 65-69  7  18  10.00  25.71 70-74  9  27  12.85  38.56 75-79  16  43  22.85  61.41 80-84  10  53  14.28  75.69 85-89  7  60  10.00  85.69 90-94  6  66  8.57  94.26 95-99  4   70  5.71   100 70  100
REPRESENTACIÓN GRÁFICA DE LOS DATOS MÉTODOS GRÁFICOS USUALES EL HISTOGRAMA:  Describe una distribución de frecuencias mediante una serie de rectángulos adyacentes, cada uno de los cuales tiene una amplitud proporcional a la frecuencia o la frecuencia relativa de la clase que representa. EL POLÍGONO DE FRECUENCIA: Está relacionado con el histograma y consiste en segmentos de líneas que conectan los puntos formados por las intersecciones de las marcas de clase y las frecuencias de clase. También se emplean las frecuencias relativas o los porcentajes para construir este tipo de gráfica. También se relaciona con el polígono de frecuencia la OJIVA, una representación gráfica de los valores acumulados de las frecuencias, las frecuencias relativas o los porcentajes.
REPRESENTACIÓN GRÁFICA DE LOS DATOS MÉTODOS GRÁFICOS USUALES LÁ GRÁFICA DE BARRAS: Igual que el histograma, la gráfica de barras representa las frecuencias de acuerdo con las alturas relativas de un conjunto de rectángulos, pero difiere del histograma en dos aspectos: a) El histograma se utiliza para representar datos cuantitativos b) La gráfica de barras representa datos cualitativos c) Los rectángulos adyacentes en el histograma comparten un lado común d) En la gráfica de barras tienen una separación entre ellos
REPRESENTACIÓN GRÁFICA DE LOS DATOS MÉTODOS GRÁFICOS USUALES LA GRÁFICA DE BARRAS MÚLTIPLES: En la gráfica de barras múltiples, cada periodo, empresa, subsidiaria u otra unidades se representa mediante dos o más barras, y así apreciar de un vistazo la relación de la información de dos tipos de datos. LA GRÁFICA DE LÍNEAS: La gráfica de líneas se construye para mostrar la dependencia entre dos variables cuantitativas (“y” en el eje vertical, y “x” en el eje horizintal). Ésta consiste en segmentos de rectas que conectan los puntos observados o medidos para ambas variables.
REPRESENTACIÓN GRÁFICA DE LOS DATOS MÉTODOS GRÁFICOS USUALES LA GRÁFICA DE PASTEL: Es un círculo dividido en secciones según la cantidad de observaciones que caen en cada una de ellas o los valores relativos de las mismas. Si la gráfica de pastel no se genera mediante computadora, puede construirse teniendo en cuenta que un círculo tiene 360°. El ángulo utilizado para cada sector del círculo se calcula del modo siguiente: Cantidad de grados  Valor relativo de para la categoría  =  la categoría  x  360 EL PICTOGRAMA: El pictograma describe las frecuencias u otros valores de interés empleando símbolos en lugar de barras.
Histograma del Costo Anual de Energía Eléctrica en México en el año 2009 en diferentes empresas metal mecánicas
Histograma de frecuencias acumuladas del Costo Anual de Energía Eléctrica en México en el año 2009 en diferentes empresas metal mecánicas
Histograma de Frecuencias Relativas del Costo Anual de Energía Eléctrica en México en el año 2009 en diferentes empresas metal mecánicas
Histograma de frecuencias relativas acumuladas del Costo Anual de Energía Eléctrica en México en el año 2009 en diferentes empresas metal mecánicas
EJERCICIOS PARA ALUMNOS A continuación se presentan algunos ejercicios para que los resuelvas y los entregues al facilitador del módulo
Ejercicio # 1 Aplicaciones pág. 55, Estadística para Administración y Economía Anderson, Sweeney y Williams (THOMSON) La conclusión de una encuesta en 40 estados, que llevó a cabo el Joint Council on Economic Education fue que los alumnos no aprenden suficiente economía. Las conclusiones se basaron en resultados de pruebas a los alumnos de 2do. y 3ero. de Preparatoria, cada una con 46 preguntas de opción múltiple de respuesta acerca de conceptos económicos básicos, como por ejemplo las utilidades y la ley de la oferta y la demanda. La tabla siguiente es una muestra de datos sobre la cantidad de preguntas contestadas en forma correcta
Continuación Ejercicio #1 Aplicaciones pág. 55, Estadística para Administración y Economía Anderson, Sweeney y Williams (THOMSON) 12  10  16  24  12  14  18  23 31  14  15  19  17  9  19  28 24  16  21  13  20  12  22  18 22  18  30  16  26  18  16  14 8  25  22  15  33  24  17  19
Continuación del Ejercicio #1: Resuma estos datos empleando: a) Un diagrama de tallo y hojas b) Una distribución de frecuencias c) Una distribución de frecuencias relativas d) Una distribución de frecuencias acumuladas e) Con base en estos datos, ¿concuerda usted con la afirmación de que los alumnos no aprenden suficiente economía? Explique su respuesta
Ejercicio # 2 Aplicaciones   pág. 37, Estadística para Administración y Economía Anderson, Sweeney y Williams (THOMSON) El personal de un consultorio ha estudiado los tiempos de espera de pacientes que llegan solicitando servicio de emergencia. Los siguientes datos fueron reunidos en un periodo de un mes, con los tiempos de espera en minutos  2  5  10  12  4  4  5  17  11  8 9  8  12  21  6  8  7  13  18  3 Emplee clases de 0 a 4, 5 a 9, etc. a) Forme la distribución de frecuencias b) Forme la distribución de frecuencias relativas c) Forme la distribución de frecuencias acumuladas d) Forme la distribución de frecuencias relativas acumuladas e) ¿Qué proporción de pacientes que necesitan servicio de emergencia tienen tiempo de espera de 9 minutos o menos?
Ejercicio num. 3 Aplicaciones   pág. 55, Estadística para Administración y Economía Anderson, Sweeney y Williams (THOMSON) A continuación se presentan las temperaturas máxima y mínima diarias (en grados Farhenheit) para 20 ciudades del mundo. Ciudad  Máxima  Mínima  Ciudad  Máxima  Mínima Atenas  75  54  Melbourne  66  50 Bangkok  92  74  Montreal  64  52 Cairo  84  57  París  77  55 Copenhagen  64  39  Río de Janeiro  80  61 Dublin  64  46  Roma  81  54 Habana  86  68  Seúl  64  50 Hong Kong  81  72  Singapur  90  75 Johanesburgo  61  50  Sydney  68  55 Londres  73  48  Tokyo  79  59 Manila  93  75  Vancouver  57  43
Continuación del ejercicio # 3 a) Elabore un diagrama de tallos y hojas para las temperaturas máximas b) Elabore un diagrama de tallos y hojas para las temperaturas mínimas c) Compare los diagramas de tallos y hojas de los incisos (a) y (b)  y haga comentarios acerca de las diferencias entre las temperaturas máxima y mínima diarias d) Use el diagrama de tallos y hojas del inciso (a) para determinar el número de ciudades con temperatura alta de 80°F o más e) Forme la distribución de frecuencias para los datos de temperatura máxima y mínima con sus respectivas gráficas
Datos para elaborar una  Gráfica de Barras Múltiple Tenencia de acciones en E.U. por tipo de inversionista 1995 1996 1997 1998 Households $3,995 $4,525 $5,319 $6,300 Institutions $4,337 $5,538 $7,457 $9,138
Gráfico de Barras Múltiple elaborado en Excel
Datos para elaborar una Gráfica de Barras Nonrecreational Airplane Pilot Certificates Certificate Type Number (thousands) Student 97.736 Private 247.226 Commercial 122.053 Transport 134.612
Gráfico de Barras
Datos para elaborar una Gráfica de Líneas Ejemplo de los ingresos de la compañía  Mc. Donald´s Año Ingresos Totales ($Billones de U.S.D.) 1993 1.08 1994 1.22 1995 1.43 1996 1.57 1997 1.64 1998 1.55 1999 1.95 2000 1.98 2001 1.64 2002 0.89
Gráfico de Líneas
La Gráfica de Pastel Ejemplo de las ventas ($millones de U.S.D.) de la compañía Black  & Decker Segment   Sales Power Tools  3,209 Hardware  & Home  882 Fasteners  498
Gráfica de Pastel
Diagrama de Pareto En un diagrama de Pareto las respuestas categorizadas se trazan en orden descendente de acuerdo con sus frecuencias y se combinan con la línea de porcentaje acumulado en la misma gráfica. El diagrama de Pareto permite separar a lo “poco vital” de lo “mucho trivial”, lo que nos permite enfocarnos en las categorías importantes.  En las situaciones en las que los datos en estudio consisten en información “defectuosa” o “incompleta”, el diagrama de Pareto se convierte en una herramienta valiosa para dar prioridad a los esfuerzos de mejoramiento
Diagrama de Pareto El análisis de Pareto es una técnica para llevar la cuenta del número de defectos que aparecen dentro de un producto o servicio. Su concepto, con frecuencia denominado regla 80-20, es que 80% de la actividad se debe a 20% de los factores. Al concentrarse en 20% de los factores, los gerentes pueden dedicarse a 80% del problema.
Ejemplo de Aplicación a través del Diagrama de Pareto La siguiente tabla presenta datos de una gran compañía de moldeado de inyección que produce componentes moldeados de plástico para teclados de computadora, lavadoras, automóviles y televisores. Los datos presentados consisten en todos los teclados de computadora defectuosos producidos durante un periodo de tres meses. Se presenta un resumen para los defectos de los teclados de computadora, en las que las categorías están ordenadas de acuerdo con el porcentaje (y no alfabéticamente). Los porcentajes acumulados para las categorías ordenadas también forman parte de la tabla.
Tabla ordenada de resumen de las causas de los defectos en los teclados de computadora en un periodo de 3 meses Causa  Frecuencia  Porcentaje  Porc. Acum. Deformación  1,987  31.42  31.42 Daño  1,039  16.43  47.85 Marca de clavijas  834  13.19  61.04 Rasguños  442  6.99  68.03 Mancha negra  413  6.53  74.56 Raya plateada  413  6.53  81.09 Marca de hundimiento  371  5.87  86.96 Marca de spray  292  4.62  91.58 Impacto en el molde  275  4.35  95.93 Embarque  258  4.08  100.00 Total  6,324  100.01
Defectos en el teclado de Computadoras para un periodo de tres meses
Interpretación del Diagrama de Pareto La figura anterior presenta las barras de forma vertical a lo largo de al línea de porcentaje acumulado. La línea acumulativa está trazada en el punto medio de cada barra a una altura semejante al porcentaje acumulado. Si sigue la línea, verá, por ejemplo, que las 3 primeras categorías abarcan más del 60% de las correcciones. Como las categorías del diagrama de Pareto están ordenadas por la frecuencia de ocurrencia, quienes toman decisiones podrán ver dónde concentrar sus esfuerzos para mejorar el proceso. Los intentos de reducir los defectos por deformación, daño y marcas de clavijas deberán generar el mayor gasto. Después podrán hacerse esfuerzos para reducir los rasguños y las manchas negras.
Cómo construir un Diagrama de Pareto utilizando el programa MINITAB Ejemplo: (pág. 715, Lind-Marchal, edit. Mc. Graw-Hill, 13ª. Edic) El administrador de una ciudad, está preocupado por consumo de agua, en particular en los hogares unifamiliares.  Le gustaría desarrollar un plan para reducir el consumo de agua en esa ciudad.  Para investigar esto, selecciona una muestra de 100 hogares y determina el consumo normal de agua diario para diversos fines. En la siguiente diapositiva se muestran los resultados de la muestra:
Cómo construir un Diagrama de Pareto utilizando el programa MINITAB Consumo de agua Galones por día Lavandería 24.9 Regar el jardín 143.7 Baño personal 106.7 Cocinar 5.1 Alberca 28.3 Lavar trastos 12.3 Lavar automóvil 10.4 Beber 7.9
Pasos para realizar el Diagrama de Pareto en  Minitab Un diagrama de Pareto es útil para identificar las áreas principales de consumo de agua y enfocarse en aquéllas donde se obtenga la mayor reducción.  Es conveniente convertir cada actividad en porcentaje y luego, ordenarlas de mayor a menor. El consumo total de agua es de 339.3 galones
Paso # 1  Escriba las razones del consumo de agua en la columna  C 1 , los galones consumidos en  C 2  y el porcentaje en  C 3 . Anote los nombres adecuados en cada columna
Paso 2 :  Haga clic en  Stat, Quality Tols, Pareto Chart  y luego oprima enter
Paso 3 : seleccione  Chart defects table , e indique la ubicación de las clasificaciones y frecuencias
Paso 4: Se anotan los datos de las columnas tal como se indicó en el paso anterior, en  Chart defects table
Paso 5: Haga clic en  Options  y escriba el título de la gráfica, después haga clic en  OK
Paso 6 Se observa como resultado de los pasos anteriores  la gráfica del diagrama de Pareto
Matriz de datos y la Tabla de distribución de Frecuencias Cuando los datos son cuantitativos, dos de las formas en que podemos organizar los datos son: a) La matriz de datos b) La tabla de distribución de frecuencias
Representación de datos A continuación se lista la tasa de natalidad (nacimientos por cada 1000 habitantes) para 105 países.  Al examinar estas cifras, observamos que algunos países tenían una tasa de natalidad más alta que otros. Si quisiéramos aprender más de esta información, sería útil que los datos se listaran de un modo más ordenado.
(A) Datos originales 42.7 29 45.1 19.5 14.1 11.2 22.1 34.6 13 11.5 47.3 31.6 21.2 11.8 48.1 28 43.4 44.4 40.4 13.7 42.1 20.3 17.8 21.9 46.2 14.5 13.5 12.4 24.1 25.1 28.7 32.4 46.7 12.2 13 15.8 11 43.6 10.6 34.7 43.4 38.6 34.1 12 12.7 27.8 24.1 34.9 43.6 20.4 10.9 10.7 19.3 41.7 23.3 15.6 44.9 44.8 49.8 28 51.9 26.6 27.9 44.6 37.3 12.4 54.8 43.3 41.8 31.5 24.9 30.4 13.3 11.7 13.7 12.6 48.5 38.8 42.9 14.2 14.5 45.5 33.4 11.2 18.1 41.3 13.2 12 43.2 15.3 34.1 45.3 18.9 22.5 25.3 48 12.3 13.2 29.5 25.1 26.3 44.9 48.3 45.5 36.4
b) Matríz de datos (de menor a mayor) 10.6 12.6 15.6 24.1 31.5 41.7 44.9 10.7 12.7 15.8 24.9 31.6 41.8 45.1 10.9 13 17.8 25.1 32.4 42.1 45.3 11 13 18.1 25.1 33.4 42.7 45.5 11.2 13.2 18.9 25.3 34.1 42.9 45.5 11.2 13.2 19.3 26.3 34.1 43.2 46.2 11.5 13.3 19.5 26.6 34.6 43.3 46.7 11.7 13.5 20.3 27.8 34.7 43.4 47.3 11.8 13.7 20.4 27.9 34.9 43.4 48 12 13.7 21.2 28 36.4 43.6 48.1 12 14.1 21.9 28 37.3 43.6 48.3 12.2 14.2 22.1 28.7 38.6 44.4 48.5 12.3 14.5 22.5 29 38.8 44.6 49.8 12.4 14.5 23.3 29.5 40.4 44.8 51.9 12.4 15.3 24.1 30.4 41.3 44.9 54.8
c) Tabla de Distribución de Frecuencias (número de países en cada categoría) Nacimientos (por cada 1000 habitantes)  Número de países 10 – menos de 15  29 15 – menos de 20  8 20 – menos de 25  10 25 – menos de 30  12 30 – menos de 35  10 35 – menos de 40  4 40 – menos de 45  18 45 – menos de 50  12 50 – menos de 55  2
La matriz de datos En comparación con la lista original de datos, la matriz de datos es útil porque presenta los datos en orden numérico creciente o decreciente. VENTAJAS: 1) Podemos determinar de un vistazo el menor y el mayor valor de los datos. Observamos con facilidad que las tasas de natalidad van desde un mínimo de 10.6 (Grecia) hasta un máximo de 54.8 (Nigeria) 2) Podemos identificar grupos de valores de datos similares. Por ejemplo, observamos que tres países tenían una tasa de natalidad menor que 11 y que dos tenían una tasa de natalidad mayor que 50 3) Apreciamos las diferencias entre los valores de los datos. Por ejemplo, el país con la más alta tasa de natalidad (54.8) está 2.9 unidades por encima del segundo lugar (51.9)
Tasa de natalidad de 105 países 10.6 12.6 15.6 24.1 31.5 41.7 44.9 10.7 12.7 15.8 24.9 31.6 41.8 45.1 10.9 13 17.8 25.1 32.4 42.1 45.3 11 13 18.1 25.1 33.4 42.7 45.5 11.2 13.2 18.9 25.3 34.1 42.9 45.5 11.2 13.2 19.3 26.3 34.1 43.2 46.2 11.5 13.3 19.5 26.6 34.6 43.3 46.7 11.7 13.5 20.3 27.8 34.7 43.4 47.3 11.8 13.7 20.4 27.9 34.9 43.4 48 12 13.7 21.2 28 36.4 43.6 48.1 12 14.1 21.9 28 37.3 43.6 48.3 12.2 14.2 22.1 28.7 38.6 44.4 48.5 12.3 14.5 22.5 29 38.8 44.6 49.8 12.4 14.5 23.3 29.5 40.4 44.8 51.9 12.4 15.3 24.1 30.4 41.3 44.9 54.8
Pasos para hacer en Excel la Matriz de Datos 1. Acomodar en una sola columna los datos 2.- Seleccionar: Herramientas, Análisis de Datos, “Rango y Percentiles” y Aceptar 3.- En el Rango de entrada: seleccionar los datos dependiendo de la columna donde se encuentren 4.- Agrupar por columnas 5.- Si tenemos en la columna algún nombre, seleccionar “etiquetas en la primera fila” 6.- En Rango de salida: darle clic a cualquier casillero donde queramos que aparezcan los resultados de la matriz
Resultados parciales del Excel de la matriz de datos Posición TASA DE NATALIDAD Jerarquía Porcentaje 105 54.8 1 100.00% 104 51.9 2 99.00% 103 49.8 3 98.00% 102 48.5 4 97.10% 101 48.3 5 96.10% 100 48.1 6 95.10% 99 48 7 94.20% 98 47.3 8 93.20% 97 46.7 9 92.30% 96 46.2 10 91.30% 94 45.5 11 89.40% 95 45.5 11 89.40% 93 45.3 13 88.40% 92 45.1 14 87.50% 90 44.9 15 85.50%
“ Tabla de Distribución de Frecuencia” Presenta los datos de una manera condensada que se comprende con rapidez y se interpreta con facilidad En el programa EXCEL anotamos lo siguiente: a) Escribimos “clase” en la celda C1 b) Introduzca las divisiones de las clases: de 10 a 55 en múltiplos de  5 en alguna de las celdas (D24-D33) por ejemplo c) Haga clic en: Herramientas, Análisis de Datos. seleccione: Histograma y OK d) Escriba el rango de datos: A1:A106 en el Rango de Entrada Escriba en el Rango de clases: D24-D33 Haga clic para marcar el cuadro de etiquetas (si cada variable tiene su nombre en la primera celda de su bloque) e) Seleccione Rango de salida: E23
Continuación de la tabla de distribución de frecuencias en Excel f) Haga clic para marcar el cuadro: Porcentaje Acumulado  Haga clic para marcar el cuadro: Crear Gráfica Haga clic en Aceptar (OK) h) Dentro de la gráfica, haga clic con botón derecho e irse a opciones de gráfico En Eje de categorías escribir: Tasa de Natalidad  Haga doble clic en cualquiera de las barras de la gráfica Seleccione Opciones y ponga Ancho de separación en 0 Haga clic en Aceptar
TABLA DE DISTRIBUCIÓN DE FRECUENCIAS (EXCEL)
INFORMACIÓN QUE APARECE JUNTO CON LA TABLA DE DISTRIBUCIÓN DE FRECUENCIAS (EXCEL) CLASE 10 Frecuencia % acumulado 10 Frecuencia % acumulado 10 15 29 27.62% 15 29 27.62% 15 20 8 35.24% 45 18 44.76% 20 25 10 44.76% 30 12 56.19% 25 30 12 56.19% 50 12 67.62% 30 35 10 65.71% 25 10 77.14% 35 40 4 69.52% 35 10 86.67% 40 45 18 86.67% 20 8 94.29% 45 50 12 98.10% 40 4 98.10% 50 55 2 100.00% 55 2 100.00% 55 y mayor... 0 100.00% y mayor... 0 100.00%
FORMAS DE LAS CURVAS DE FRECUENCIA CALIFICACIÓN FRECUENCIA CALIFICACIÓN FRECUENCIA CALIFICACIÓN FRECUENCIA CALIFICACIÓN FRECUENCIA EN FORMA DE CAMPANA RECTANGULAR O UNIFORME EN FORMA DE U EN FORMA DE J
FORMAS DE LAS CURVAS DE FRECUENCIA FRECUENCIA FRECUENCIA CALIFICACIÓN CALIFICACIÓN SESGO POSITIVO SESGO NEGATIVO SESGO POSITIVO : LA MAYOR PARTE DE LOS DATOS SE CONCENTRA EN LOS VALORES BAJOS DEL EJE HORIZONTAL Y LA CURVA DISMINUYE HACIA EL EXTREMO DE LOS VALORES ALTOS SESGO NEGATIVO : LA MAYOR PARTE DE LOS DATOS SE CONCENTRA EN LOS VALORES ALTOS DEL EJE HORIZONTAL Y LA CURVA SE REDUCE HACIA EL EXTREMO DE LOS VALORES BAJOS
TÉCNICAS DE OBSERVACIÓN DE FENÓMENOS O HECHOS
POBLACIÓN Y MUESTRA
POBLACIÓN Y MUESTRA
PASOS PARA LA SELECCIÓN DE UNA MUESTRA
MÉTODOS o TÉCNICAS DE MUESTREO
ESTRATEGIA DE MUESTREO PROBABILÍSTICA
ESTRATEGIA DE MUESTREO NO PROBABILÍSTICA
Técnicas de Muestreo Hay dos maneras de elegir los individuos de la muestra: Por muestreo Probabilístico Por muestreo No Probabilístico Solamente el  muestreo Probabilístico  permite generalizar (con determinado margen de error) en la población total los resultados obtenidos (hacer inferencias) El  muestreo No Probabilístico  no autoriza la generalización
Requisitos para que una muestra sea representativa en un estudio Para que una realmente la muestra sea representativa deberá cumplir con los requisitos que marca la teoría de la probabilidad, es decir: ¡ QUE SEAN ELEGIDOS AL AZAR  !
Cálculo del tamaño de la Muestra El cálculo del tamaño de una muestra depende de 3 factores: El porcentaje de confianza con que se desea generalizar los datos en la población total El porcentaje de error que se está dispuesto a aceptar en tal generalización El nivel de variabilidad que se calcula para la comprobación de la hipótesis
Porcentaje de Confianza El 100% de confianza para generalizar los resultados indicaría que todos los individuos de la población, sin excepción, comparten las conclusiones obtenidas del estudio de los individuos de la muestra. Pero para lograr 100% de confianza hay que estudiar todos los casos de la población. Como esto resulta costoso en tiempo y dinero, lo que se hace es tolerar que haya algunos sujetos de cada cien (de la población) que no compartan las conclusiones del estudio de la muestra
……  porcentaje de confianza Si se eligiera 80% de confianza en la selección de una muestra, el tamaño resultante indicaría: Que existe la seguridad de generalizar sólo 80% de sujetos de la población. Cuanto mayor sea el % de confianza que se escoja, mayor será la cantidad de sujetos necesarios para la muestra. En investigaciones de tipo social, por lo general, se busca un 95% de confianza
Porcentaje de error Elegir el porcentaje de error significa seleccionar la probabilidad de aceptar una hipótesis falsa, o a la inversa: rechazar una hipótesis verdadera Si se buscara un 0% de error, significaría que no se está dispuesto a correr este tipo de riesgos y entonces, la muestra podría ser igual a la población, por tanto, es preferible aceptar algún riesgo. Es frecuente que los investigadores acepten de 4 a 8% de error. Por ejemplo: 4 % de error significa que existen 4 de 100 posibilidades de equivocarse. NOTA : No debe entenderse que el porcentaje de error es complementario del porcentaje de confianza:  ejemplo: se puede tener 96% de confianza y 6% de error
Variabilidad Cuando se ha aplicado el instrumento de recolección de datos en otros estudios, se puede esperar que la nueva contrastación en otro lugar sea similar a las anteriores. Ejemplo: suponga que se aplicó un cuestionario y se obtuvo que el 70%  de los sujetos de la muestra confirmó la hipótesis, mientras que las respuestas del otro 30% sugerían que la hipótesis debía rechazarse.  Suele darse un valor simbólico a la variabilidad : Se usa “p” para indicar los cuestionarios a favor de la hipótesis = 70% Se usa “q” para indicar los cuestionarios en contra de la hipótesis  = 30% resumiendo: p = 0.7  y  q = 0.3
Variabilidad En caso de que no se haya aplicado nunca el instrumento de recolección, se pueden seleccionar algunas personas de la población a encuestar (digamos 20 por ejemplo) para que contesten el instrumento y analizar sus respuestas a fin de conocer el grado de variabilidad que se espera en la población. Cuando no se dispone de tiempo suficiente para realizar esta «preprueba» o «piloteo» lo que se recomienda es aceptar la máxima variabilidad que consiste en:  p = 0.5  y  q = 0.5
TAMAÑO DE LA MUESTRA Cuando se desconoce el tamaño de la población Fórmula: n=  (Z 2 pq) (e 2 )  Donde: n = tamaño de la muestra Z 2  = nivel de confianza  p = variabilidad positiva q = variabilidad negativa e 2  = precisión o error
Ejemplo del cálculo del tamaño de la muestra cuando se desconoce el tamaño de la población Datos: Nivel de confianza del 95%: Z = 1.96  (tablas de curva normal) Máxima variabilidad:  p= 0.5  y  q = 0.5 Nivel de error = 5% = 0.05 n =  (1.96) 2 (0.5)(0.5)  = 384.16 (.05) 2
TAMAÑO DE LA MUESTRA Cuando se conoce el tamaño de la población Fórmula: n =  (Z 2  pq N)__ (Ne 2  + Z 2  pq) Donde: n = Tamaño de la muestra Z = nivel de confianza p = variabilidad positiva q = variabilidad negativa N = tamaño de la población e = precisión o error
CÁLCULO DEL TAMAÑO DE LA MUESTRA Cuando se conoce el tamaño de la población Datos: n = Tamaño de la muestra = ? Z = nivel de confianza = 95% = 1.96 p = variabilidad positiva = 0.5 q = variabilidad negativa = 0.5 N = tamaño de la población = 11,730 e = precisión o error = 5% = 0.05 n =  [(1.96 2 ) (0.5)(0.5)(11,730)] [(11,730)(.05 2 ) + (1.96 2 )(0.5)(0.5)] n = 371.977
Ejercicios para el alumno 1.- Calcule el tamaño de una muestra en que se pide 4% de error, 94% de confiabilidad y la máxima variabilidad 2.- Con estos mismos datos del ejercicio anterior, calcule el tamaño de una muestra en la que además, se conoce que el tamaño de la población es de 3,267  3.- Calcule el nivel de error si tenemos 250 elementos en la muestra,  92 % de confiabilidad y variabilidad positiva del 60% 4.- Calcule el nivel de confianza si tenemos un nivel de error del 3%, la muestra se compone de 500 elementos y existe una máxima variabilidad
¿A quiénes de la población se debe escoger si ya tenemos la muestra calculada? Para esta situación, se tienen diversas técnicas de muestreo Tipos  (técnicas) de Muestreo : a)  Probabilístico : consiste en escoger al azar cada uno de los individuos en la muestra b)  No probabilístico : este tipo de muestreo no permite generalizar los resultados a la población, por tanto se usa en estudios de tipo exploratorios, de casos o cualquier otro que no requiera generalizar
Muestreo Probabilístico Técnicas: muestreo aleatorio simple, muestreo aleatorio estratificado y muestreo sistemático a)  Muestreo aleatorio simple : garantiza, en teoría, que cada uno de los individuos de la población tenga la misma oportunidad de aparecer en la muestra.  Por ejemplo : se selecciona totalmente al azar a los sujetos de una población, escribimos su nombre en un papelito, luego todos los nombres se ponen en una esfera abierta, se revuelven y después se van sacando de uno en uno hasta completar la cantidad deseada. Otra manera de hacerlo es a través de  generar números aleatorios  para conformar la muestra necesaria de una población Por ejemplo  para generar números aleatorios menores que 100 escribimos en el programa excel: =ALEATORIO()*100
Paso I: Imagen de una hoja en el programa  Excel  para empezar a generar números aleatorios menores que 100
Paso II Vamos a suprimir las decimales que aparecen en la generación de los números aleatorios, dando clic botón derecho a la celda generada
Paso III secuencia para quitar los decimales que aparecen en las celdas
Paso IV Ya generado el primer número aleatorio, podemos copiar desde la primer celda hacia abajo la cantidad que se requiera
Uso del  Análisis de Datos  en  Excel    Muestreo Aleatorio Simple Las sritas. Alexandra y Myriam administran “El Popeye Inn”, una pensión donde dan alojamiento y desayuno, localizada en cd. Guzmán, Jal. Se rentan ocho habitaciones en esta pensión.  A continuación aparece el número de estas ocho habitaciones rentadas diariamente durante el mes de Octubre del 2009.  Utilice el programa “Análisis de datos” en Excel para seleccionar una muestra de cinco noches de Octubre
Tabla con los datos de las habitaciones en renta en el mes de Octubre del 2009, en la pensión “El Popeye Inn”
Paso 1 : en el  Análisis de Datos  de  Excel  para seleccionar una muestra de 5 noches de Octubre: dar clic en:  Datos, Análisis de datos y Muestra
Paso 2:  llenar el cuadro de la  Muestra : Rango de entrada: B1: B31; dar clic en Rótulos Método de muestreo: Aleatorio Número de muestras: 5 Rango de Salida: D1
Paso 3: Revisar que la información capturada esté correcta posteriormente darle clic en  Aceptar
Paso 4: La respuesta por parte del programa Excel es la siguiente NOTA: Excel toma muestras con reemplazo, así que es posible que el valor de una población aparezca más de una vez en la muestra
b) Muestreo aleatorio estratificado (muestreo probabilístico) Implica el mismo procedimiento que el aleatorio simple; la diferencia radica en que la población se subdivide en grupos o estratos más pequeños. Por ejemplo : encuestar a los trabajadores de una empresa de polímeros. La subdividimos en obreros y empleados administrativos. El total de trabajadores es = 836  El estrato de obreros es = 489 El estrato de empleados = 347 Confiabilidad = 90% Precisión o error = 5% Máxima variabilidad: p = 0.5 y q = 0.5
b) Muestreo aleatorio estratificado (muestreo probabilístico) Fórmula: n = (Z 2  pq N)/(Ne 2  + Z 2  pq) Cálculo: n =  [(1.65 2 )(0.5)(0.5)(836)]  = 205.34   [(836)(.05 2 ) + (1.65 2 )(0.5)(0.5)] Cálculo de la cantidad de elementos en los estratos: % obreros = (489/836) = 0.5849 % administrativos = (347/836) = 0.415 Muestra estratificada: Obreros: 205.34 (0.5849) = 120 Empleados: 205.34 (0.415) = 85
Tabla de la muestra estratificada Población Tamaño de población por estratos Tamaño de muestra por estratos Obreros 489 120 Empleados 347 85 Total 836 205
Muestreo no probabilístico Las técnicas de muestreo no probabilísticos que vamos a estudiar son dos: 1.- MUESTREO POR CUOTAS 2.- MUESTREO POR ACCIDENTE Nota: hay que recordar que este tipo de muestreo  no permite  generaliza r  los resultados a la población. Este tipo de muestreo se usa en estudios de tipo: EXPLORATORIO DE CASOS CUALQUIER OTRO TIPO QUE NO REQUIERA GENERALIZAR
Muestreo por CUOTAS (no probabilístico) En el muestreo por cuotas se determina la cantidad (cuota) de individuos de una población, para que sean miembros de la muestra. No hay un procedimiento especial para establecer la cuota. El criterio es arbitrario, simplemente puede determinarse encuestar, por ejemplo, a 35 hombres y a 35 mujeres que compartan ciertas características específicas según la definición que el estudio señale.
Muestreo por accidente (no probabilístico) Consiste en seleccionar de manera arbitraria los individuos para la muestra.  Por ejemplo , los investigadores que se van a una plaza comercial y, sin ningún otro criterio, encuestan a cualquier persona que se encuentre de paso por ahí. Por eso se denomina  muestreo accidental . Las conclusiones que obtenga el investigador con este tipo de muestreo impiden suponer que «las personas que van a la plaza comercial piensan y opinan de tal forma», ya que la muestra no es aleatoria.
Técnicas de Recolección de Datos Objetivo Presentar un procedimiento para diseñar instrumentos de recolección: desde la hipótesis hasta el instrumento
Técnicas e instrumentos de recolección Método : es el camino que se que se sigue para lograr una meta u objetivo; es el procedimiento que se recorre en la investigación para obtener conocimientos. Cabe mencionar que existen muchos métodos y, por ello, una gran variedad de formas de lograr los objetivos. Es casi imposible hablar de «todos los pasos» de cada método, ya que dependen del objeto de estudio y de los objetivos que se pretendan alcanzar en una investigación
Técnicas e instrumentos de recolección Técnica   se define como: «un conjunto de reglas y operaciones para el manejo de los instrumentos que auxilian al individuo en la aplicación de los métodos» (Rojas Soriano, R. 1991, p.63) El instrumento  puede entenderse como el dispositivo o conector que permite captar los datos que se obtendrán para, después de analizarlos, decidir si se acepta o se rechaza la hipótesis de investigación.  Ejemplo de Instrumento : Un cuestionario
Técnicas e instrumentos de recolección La captación de datos es válida, si el o los instrumentos se aplican con las condiciones de la técnica respectiva. Por ejemplo: Que un conjunto de personas conteste un  cuestionario  ( instrumento ), a través de la indicación de las  normas técnicas  de la encuesta (indicaciones iguales a todos, un tiempo igual para contestar, condiciones iguales de aplicación, etc). El instrumento es sólo el listado de preguntas. Hacer que los datos sean válidos y confiables depende de que se sigan los preceptos de la técnica, en este caso de la encuesta.
Instrumentos de recolección de datos Operacionalización  es el nombre que recibe el proceso mediante el cual se determina el instrumento El término  &quot;Indicador&quot;  en el lenguaje común, se refiere a datos esencialmente cuantitativos, que nos permiten darnos cuenta de cómo se encuentran las cosas en relación con algún aspecto de la realidad que nos interesa conocer. Los Indicadores pueden ser medidas, números, hechos, opiniones o percepciones que señalen condiciones o situaciones específicas.
¿Cuál es la importancia de los indicadores? Permite medir cambios en esa condición o situación a través del tiempo. Facilitan mirar de cerca los resultados de iniciativas o acciones Son instrumentos muy importantes para evaluar y dar surgimiento al proceso de desarrollo. Son instrumentos valiosos para orientarnos de cómo se pueden alcanzar mejores resultados en proyectos de desarrollo.
Ejemplos de indicadores Administrativos:  Eficiencia, efectividad y eficacia Económicos:  PIB, inflación, Devaluación, tasa de interés, exportaciones, imprtaciones, IED, tasa de la deuda neta del Gobierno Federal (% PIB), tipo de cambio, etc. Calidad : satisfacción del cliente, evaluación, seguimiento y comparación de los servicios, tiempo de entrega, tiempo de demora. Salud:  la tasa de hemorragias cerebrales en pacientes con infarto agudo de miocardio sometidos a fibrinolisis; número de pacientes que reingresa en urgencias en las 48 siguientes al alta o proporción de salidas falsas en servicios de emergencia.
Técnicas e instrumentos de recolección Los analistas utilizan una variedad de  métodos  a fin de recopilar los datos sobre una situación existente, como Observación Entrevista Encuesta Tests Cuestionarios Generalmente, se utilizan dos o tres para complementar el trabajo de cada una y ayudar a asegurar una investigación completa
Técnicas de recolección de datos: « Observación » La observación es por excelencia la técnica de investigación de cualquier ciencia La  observación científica  se define como: «la percepción dirigida de los objetos o fenómenos de la realidad» Para la Observación , se pueden emplear los siguientes instrumentos para recolectar datos: El cuaderno de notas El diario Grabador y reproductor de sonidos Video-grabadora
Técnicas de recolección de datos: « Observación » En el acto de la observación se puede distinguir: El objeto de la observación El sujeto de la observación Los medios para la observación Las condiciones de la observación El sistema de conocimientos a partir del cual se formula la finalidad de la observación y se interpretan los resultados de ésta
Técnicas de recolección de datos: « Tipos de Observación » Observación No participante : En este paradigma de observación el investigador intenta actuar como una cámara fotográfica, como una mente con manos que registra la naturaleza tal como ocurre, sin perturbarla o modificándola lo menos posible. La objetividad consiste en que el observador se convierta casi en una máquina que únicamente registre lo que ve y oye.
Técnicas de recolección de datos: « Tipos de Observación » Observación participante : Se parte del supuesto, en las ciencias sociales, de que « lo observado » tiene las mismas características que el observador y, por ello, es mucho más difícil ser objetivos. Cuando se actúa con el mismo esquema de objetividad que en las ciencias naturales se pierde objetividad, debido a que se capta al sujeto de manera distorsionada, es decir, « participa » con los sujetos que observa.
Técnicas de recolección de datos: « Tipos de Observación » El observador participante  tiene que cumplir dos papeles o roles: Ubicarse como uno más entre los objetos que observa Por otra parte, excluirse para registrar, de la forma más objetiva, lo que allí ocurre
Técnicas e instrumentos de recolección « Entrevista Abierta » Entrevista abierta o no estructurada Se trata de una conversación que dirige el entrevistado, pero que controla el entrevistador. Este tipo de entrevistas se privilegian en la investigación clínica. Generalmente, el entrevistado informará respecto de sí mismo: su desempeño, capacidad, personalidad, síntomas o enfermedades, etc. según el tipo de especialista que lo entrevista. La información vertida se analiza y se evalúa después.
Técnicas e instrumentos de recolección « Entrevista Abierta » En la mayor parte de los estudios lo más común es la entrevista semiabierta. Esto significa que sí se tipifican algunas preguntas que sirven como guía de la entrevista (instrumento), pero que conforme se formulan pueden conducir a otras no previstas inicialmente. Esto es más común en profesionales como periodistas, trabajadores sociales, sociólogos, economistas, entre otros.
Técnicas e instrumentos de recolección « Entrevista Cerrada » Se conduce de manera rígida por medio de una lista de preguntas que funciona como una guía, de la cual el entrevistador no puede desviarse. El entrevistador memorizará un formulismo que repetirá exactamente igual con todos sus entrevistados. Este tipo de entrevistas, por ejemplo, puede tener el propósito de recabar opiniones de grupos con características similares para conocer su posición respecto de algo o bien recabar opiniones de grupos diferentes para comparar efectos de alguna decisión tomada antes
Técnicas e instrumentos de recolección « Entrevista Cerrada » En este tipo de entrevistas, el instrumento es exactamente igual que el de una encuesta. La diferencia consiste en que, en esta técnica de recolección, el entrevistador contesta el cuestionario, no el entrevistado. Suele usarse para censos en que se parte del supuesto de que no todas las personas saben leer
Técnicas e instrumentos de recolección « Encuesta » La técnica de la encuesta consiste en la interrogación sistemática de individuos a fin de generalizar.  Se usa para conocer la opinión de un determinado grupo de personas respecto de un tema que define el investigador. Se usa principalmente para conocer la opinión de las personas respecto a una variedad de temas: servicios públicos, desempeño de profesores en una universidad, productos comerciales, etc.
Técnicas e instrumentos de recolección « Encuesta » En la técnica de la encuesta, primero se selecciona una cantidad de sujetos que sea representativa de la población (o clase de sujetos) de interés. Esa muestra contestará un cuestionario (instrumento) y después la información recabada se usará para generalizar a todos los individuos de la población Al procedimiento de seleccionar sólo algunos sujetos de la población se le denomina «muestreo».
Diseño de Cuestionario El cuestionario es el listado de preguntas que deberán contestar los sujetos de la muestra.  Las preguntas o los reactivos que contiene el instrumento se deducen de las hipótesis y de los objetivos de la investigación. El instrumento de la encuesta o cuestionario debe diseñarse de modo que resulte de fácil comprensión y que no sea necesaria ninguna información adicional.
Diseño de Cuestionario Antes de escribir las preguntas debe decidirse si para lograr los objetivos y probar las hipótesis es más conveniente usar preguntas cerradas o abiertas, o bien una combinación de ambas.
Preguntas cerradas Se llama  pregunta cerrada  a la que proporciona opciones de respuesta para que el sujeto respondedor elija la que más se acerque a su situación.  El investigador puede diseñar diferentes formas de preguntas cerradas: Opción mutuamente excluyente Opción múltiple con más de una elección Elección de un número determinado de opciones Ordenación jerárquica de opciones
Preguntas cerradas Opción mutuamente excluyente En esta opción el encuestado deberá seleccionar una de las dos o más opciones de respuesta. Por ejemplo: verdadero o falso; si o no; solero, casado, divorciado, viudo etc. Lo importante es que al elegir una se excluyan las demás.
Preguntas cerradas 2)  Opción múltiple con más de una elección El encuestado elige más de una opción, por ejemplo, ante la indicación:  «de las siguientes materias, subraya las que te gusten más: Matemáticas Psicología Economía Administración Literatura» Nota: aquí el respondedor pude elegir más de una opción
Preguntas cerradas 3)  Elección de un número determinado de opciones En este caso, las preguntas podrían ser como en el caso # 2, con la única diferencia de que se indica la cantidad y el orden en la instrucción Una opción de pregunta sería la siguiente: «enumere en orden de importancia las tres materias que le gusten más»
Preguntas cerradas 4)  Ordenación jerárquica de opciones Aquí se ofrecen opciones de respuesta que el sujeto debe numerar en orden de importancia, según su opinión. La diferencia entre este tipo de ítem y el anterior consiste que en éste se deben ordenar todas las opciones
Preguntas Abiertas Las preguntas abiertas son las que se formulan sin escribir opciones de respuesta. En éstas el encuestado contestará lo que le parezca pertinente. Este tipo de preguntas se usan con mayor frecuencia en los  estudios exploratorios. Habrá tantas respuestas como personas encuestadas. Es usual clasificar las respuestas en grupos, de acuerdo con un criterio que impone el investigador, según lo requiera el estudio. Este procedimiento recibe el nombre de  cerrar preguntas
Redacción de las preguntas Debe cuidarse en el diseño del cuestionario la redacción de las preguntas (ítems o reactivos). Aunque los indicadores estén bien definidos, de acuerdo con el marco referencial de la investigación, es preciso que el lenguaje se adecue al tipo personas que se consultarán.  La redacción de las preguntas debe ser sencilla, clara y concisa. Evitar en lo posible cansar al que responde el cuestionario con preguntas que exigen de él muchos datos .
Redacción de las preguntas La pregunta debe redactarse con ideas afirmativas, evitando negaciones. Por ejemplo: ¿no está satisfecho con su empleo actual? Será mejor cambiarla por: ¿está satisfecho con su empleo actual? Es mejor la redacción desprovista de carga emocional, es decir, seleccionar palabras que no sean peyorativas (que indica una idea desfavorable o despectiva) Redactar la pregunta de manera que no sugiera la respuesta Deben evitarse las preguntas en las que sea muy probable que todos contesten igual. Por ejemplo: ¿te gustaría ganar más sueldo? Deben evitarse las preguntas sin relación directa con el estudio actual (de relleno)
Validez y Confiabilidad de un cuestionario Validez:  Es la capacidad de captar de manera significativa y con un grado de exactitud satisfactoria, las variables de la hipótesis que se ponen a prueba. Se trata que el instrumento mida aquello para lo que se diseñó. Cuando existe otro instrumento validado, se aplican ambos y luego se comparan los resultados, así se juzga el nivel de precisión con que el cuestionario capta aquello para lo que se diseñó. En la mayoría de las veces, no se cuenta con este recurso de comparación externa.
Validez y Confiabilidad de un cuestionario … .  Validez Una  segunda  manera de validar un cuestionario es aplicarlo a personas con actitud conocida, conocimiento u opinión respecto al tema que el instrumento mide y comprobar su validez de ese modo Una   tercera   forma, es la «administración de los reactivos o preguntas a jueces». Este método parte del supuesto de que todo instrumento de recolección es producto del proceso de operacionalización.
Derivación de un cuestionario a partir de la operacionalización de variables A B a1 a2 b1 b2 Variables dimensiones indicadores Las preguntas del cuestionario captan todos los indicadores
Confiablidad La confiabilidad es la capacidad de un instrumento de arrojar resultados equivalentes entre los que responden, independientemente de quién lo aplique Para lograr esto, el instrumento (cuestionario) debe aplicarse exactamente en las mismas condiciones a todos los sujetos. Esto significa que cada uno recibe una copia del mismo instrumento y, por tanto, la presentación y el orden de las preguntas será el mismo para todos. Se deben cuidar las condiciones de aplicación: espacio, horario, iluminación, actitud del encuestado, etc.
Confiablidad Cuando quienes están respondiendo un cuestionario preguntan mucho respecto de los ítems, se puede deducir que no está bien diseñado, ya que un buen instrumento no requiere información adicional. Para evitar este tipo de problemas debe realizarse una prueba piloto antes de la aplicación definitiva.
Confiablidad Los cuestionarios con preguntas cerradas pueden contener un promedio de 50 preguntas, sin que con ello se corran riesgos de sesgo debido al cansancio. Las preguntas abiertas suelen despertar incomodidad en quien responde, debido a que le exigen mayor cuidado y esfuerzo.  Cuando el instrumento de recolección tiene preguntas abiertas, el agotamiento llega primero que con las cerradas, de modo que no es conveniente que incluya más de 20
Confiablidad Si se quiere realizar otra prueba de confiabilidad se pueden seleccionar 2 muestras de la misma población y comparar los resultados. Si en ambas muestras las diferencias no son significativas, se deducirá que el instrumento es fiable.
Preparación del Análisis del cuestionario Se deben determinar el número y orden de las preguntas en el instrumento Se fotocopiará tantas veces necesario, según la cantidad de la muestra a analizar. Se deben de numerar cada uno de ellos Las preguntas abiertas es conveniente cerrarlas.
Proceso del cierre de las preguntas abiertas Una vez que se aplica a todos los sujetos, los investigadores estudian las respuestas Esta actividad debe hacerse por separado (dos o más investigadores) para no viciar su interpretación Ante la misma pregunta los investigadores tipificarán o clasificarán los modos en que pueden agruparse las diferentes respuestas
Proceso del cierre de las preguntas abiertas Por ejemplo ante las diferentes preguntas, un investigador puede clasificar las respuestas en digamos 10 modos distintos y otro investigador en 14 formas. Después de revisar encontrarán concordancias y divergencias respecto al modo de clasificar cada uno. Las concordancias se adoptan, mientras que las divergencias se pasan a un apartado con el título de “otras”
FÓ RMULA PROBABILÍSTICA PARA DETERMINAR EL TAMAÑO DE LA MUESTRA
OPERACIONALIZACIÓN DE LAS VARIABLES
PREPARACIÓN PARA LA RECOPILACIÓN DE DATOS
CONSTRUCCIÓN DE FORMAS DE RECOPILACIÓN DE DATOS
Ejemplo: los primeros cinco de 200 casos en el conjunto de puntajes de competencia
CODIFICACIÓN DE DATOS
EJEMPLO DE CODIFICACIÓN DE DATOS
Los 10 mandamientos de la recopilación de datos
Medidas de Tendencia Central
MEDIDAS DE TENDENCIA CENTRAL Las  medidas de tendencia central  (también llamadas medidas de localización) son: Media aritmética, Mediana, Moda, cuartiles y percentiles Las  medidas de variabilidad  son: Rango, Desviación estándar y Varianza La tendencia central y la variabilidad son las dos características de las distribuciones que son objeto de cuantificación más frecuentemente
Introducción Anteriormente analizamos la forma de organizar y presentar los datos de manera significativa. La distribución de frecuencias son útiles a este respecto, pero en sí mismas, no nos permiten hacer afirmaciones cuantitativas que caractericen a la distribución como un todo, ni tampoco permiten realizar comparaciones cuantitativas entre dos o más distribuciones. Por ejemplo : suponga que una psicóloga ha realizado un experimento para averiguar si los hombres y las mujeres tienen aptitudes matemáticas diferentes. Esta investigadora cuenta con 2 conjuntos de calificaciones (uno para hombres y otro para mujeres) del experimento. ¿Cómo puede comparar esas distribuciones? Para hacerlo ella necesita ¨cuantificarlas¨
Introducción La forma en que esto se realiza más a menudo consiste en calcular la calificación promedio de cada grupo y después comparar el resultado. La cantidad calculada es una medida de la  tendencia central  de cada distribución. Una 2da. característica de las distribuciones que resulta de gran utilidad para cuantificarlas es la  variabilidad  de la distribución. La  variabilidad  especifica la medida en la cual los datos son diferentes unos de otros debido a su dispersión.
Media aritmética Se define como la suma de los datos dividida entre el número de los mismos. En forma de ecuación X =  Σ  X i  = X 1  + X 2  + X 3  + ….. X n  media de una muestra n  n µ  =  Σ  X i  = X 1  + X 2  + X 3  + ….. X N  media de una población N  N
La media global Esta ecuación establece que la media global es igual a la suma de la media de cada grupo multiplicada por el número de datos del grupo, entre la suma del número de datos de cada grupo X global   = Suma de todos los datos N =  Σ  X 1 (primer grupo) +  Σ  X 2 (segundo grupo) + Σ  X 3  (primer grupo) + …  Σ X i  (primer grupo)  n 1  + n 2  + n 3  + ….. n k
Ejemplo de Media Un analista estadístico toma una muestra aleatoria de n=11 laboratorios de investigación tecnológica de una Empresa con la siguiente información: Laboratorio  Num. Investigadores  Laboratorio  Num. Invest. A  54  G  43  B  39  H  57 C  26  I  28 D  45  J  61 E  36  K  54 F  52  Calcule la media
Ejemplo de la media global Un investigador realizó un experimento con tres grupos de sujetos. La media del primer grupo fue de 75 y había en él 50 sujetos. La media del segundo grupo fue de 80 y estaba integrado por 40 sujetos. En el tercer grupo había 25 sujetos y la media fue de 70. Calcule la media global de los tres grupos combinados Solución: X global   = n 1  X 1  + n 2  X 2  + n 3  X 3   n 1  + n 2  + n 3 =  50(75) + 40(80) + 25(70)  =  75.65 50 + 40 + 25
LA MEDIANA
Efecto de los datos extremos sobre la media y la mediana Datos  Media   Mediana 3, 4, 6, 7, 10  6  6 3, 4, 6, 7, 100  24  6 3, 4, 6, 7, 1000  204  6
Ejemplo de Mediana Calcule la mediana de la siguiente serie de datos  a) Calificaciones de 11 alumnos en la materia de Epistemología: 8.5, 8.9, 9.4, 7.5, 9.1, 9.6, 7.7, 8.3, 9.5, 8.2, 9.3 b) Calificaciones de 14 alumnos en la materia de  Metodología de la Investigación: 9, 10, 8, 9, 10, 8, 7, 6, 6, 7, 8, 9, 9, 10 NOTA: Recuerde que debe acomodar los datos en orden ascendente
LA MODA
EJEMPLO: CALCULAR LA MEDIA, MEDIANA Y MODA
Medidas de tendencia central y simetría Asimetría negativa Media Mediana Moda Frecuencia
Medidas de tendencia central y simetría Curva en forma de campana Frecuencia Media Mediana Moda
Medidas de tendencia central y simetría Moda Mediana Media Frecuencia Asimetría positiva
MEDIDAS DE VARIABILIDAD
El intervalo
Propiedades de la Desviación Estándar 1º Nos proporciona una medida de la dispersión con respecto a la media. 2º  Es sensible  a cada uno de los datos de la distribución :   a) Si se cambiara un dato por un valor más cercano a la media, entonces la desviación estándar sería menor. b) Inversamente, si se le cambiara por otro más alejado de la media, entonces la desviación estándar aumentaría. 3º Es estable con respecto a las variaciones debidas al muestreo .
La varianza La varianza de un conjunto de datos es simplemente el cuadrado de la desviación estándar. La varianza no se usa muy a menudo en  Estadística Descriptiva  porque proporciona unidades de medición elevadas al cuadrado. Sin embargo, se utiliza muy frecuentemente en  Estadística Inferencial
Desviación estándar En general, la desviación estándar se emplea como una medida para comparar la dispersión en 2 o más conjuntos de observaciones. En una distribución de frecuencias simétrica, con forma de campana,  aproximadamente 68% de las observaciones estarán entre más una y menos una desviación estándar desde la media; aproximadamente 95% de las observaciones se encontrarán entre dos y menos dos desviaciones estándar desde la media; prácticamente todas las observaciones (99.7%) se hallarán entre más tres y menos tres desviaciones estándar, a partir del valor medio.
Gráfica simétrica de campana, que muestra las relaciones entre la desviación estándar y la media 34.13%  34.13%  13.59% 13.59% 2.15% 2.15% 0.13% 0.13% µ µ + µ + µ + µ µ µ
Cuartiles  Con frecuencia se dividen los datos en cuatro partes, cada una con aproximadamente la cuarta parte, o el 25% de las observaciones. A los puntos de división se les llama cuartiles y se definen como sigue: Q 1  = primer cuartil o percentil 25 Q 2  = segundo cuartil o percentil 50 (mediana) Q 3  = tercer cuartil o percentil 75
Cuartiles  (las fórmulas dan las posiciones o ubicación) Q 1  = N/4 Q 2  = N/2 Q 3  = 3N/4 NOTA: Si el resultado es un número entero, entonces el cuartil es el promedio entre ese valor y el siguiente. Si el resultado contiene decimales, entonces el cuartil es el siguiente valor de la serie acomodada en orden ascendente.
Localización de los Cuartiles Q 1 Q 2 Q 3 Percentil 25 Percentil 50 Percentil 75 25% 25% 25% 25%
Ejemplo para calcular los Cuartiles Millones de personas se levantan cada mañana en Norteamérica y trabajan en sus propias casas. Se sugiere que el uso creciente de computadoras es una de las razones por las que las personas pueden trabajar en empresas caseras. A continuación vemos una muestra de datos sobre las edades de esas personas: 22  58  24  50  29  52  57  31  30  41 44  40  46  29  31  37  32  44  49  29 a) Calcule los 3 cuartiles: Q 1  , Q 2  y Q 3
Solución al ejercicio anterior (cuartiles): primero acomodaremos en orden ascendente los datos 22, 24, 29, 29, 29, 30, 31, 31, 32, 37, 40, 41, 44, 44, 46, 49, 50,52, 57, 58 Q 1  = N/4 = 20/4 = 5, entonces el primer cuartil es el promedio entre la 5a y 6ta posición: (29 + 30)/2 = 29.5  Q 2  = N/2 = 20/2 = 10, entonces el 2do cuartil es el promedio entre la  10a y 11ava posición: (37 + 40)/2 = 38.5 Q = 3N/4 = 3(20)/4 =15, entonces el 3er cuartil es el promedio entre la 15ava y 16ava posición: (46+49)/2 = 47.5
Percentiles El p-ésimo percentil es un valor tal que por lo menos “p” por ciento de las observaciones son menores o iguales que este valor y por lo menos (100 – p) por ciento de las observaciones son mayores o iguales que este valor.
Percentiles Por ejemplo, suponga que un solicitante alcanza una calificación bruta de 54 en la parte verbal del examen de admisión en una Universidad mexicana. No se sabe con facilidad cómo se desempeñó ese alumno en relación con otros que presentaron la misma prueba; sin embargo, si la calificación bruta de 54 corresponde al percentil 70, sabemos que, aproximadamente, 70% de los alumnos tuvo calificaciones menores que este valor y más o menos el 30% tuvo calificaciones mayores que él.
¿Cómo calcular Percentiles? Paso 1: Ordene los datos de manera ascendente Paso 2: Calcule un índice i: i = (p/100)*n en donde “p” es el percentil de interés y “n” la cantidad de observaciones. Paso 3:  a) Si “i” no es entero, se redondea. El valor entero inmediato mayor que “i” indica la posición del p-ésimo percentil b) Si “i” es entero, el p-ésimo percentil es el promedio de los valores de los datos ubicados en los lugares i e i + 1
Ejemplo del cálculo del percentil Determinar el percentil 85 de los datos de salarios de una compañía acerera: Paso 1: acomodamos los datos en orden ascendente: $2,710  2,755  2,850  2,880  2,880  2,890  2,920  2,940  2,950  3,050  3,130  3,325 Paso 2:  i = (p/100)*n = (85/100)*12 = 10.2 Paso 3: como i no es entero, redondeamos. El lugar del percentil 85 es el siguiente entero mayor que 10.2, o sea, el lugar 11 (es = 3130)
Continuación del ejemplo del cálculo del percentil Ahora calculemos el percentil 50 del mismo ejemplo anterior: i = (50/100)*12 = 6 Como i es entero, el paso 3b) establece que el percentil 50 es el promedio de los valores de los datos sexto y séptimo; es por lo tanto:  (2890 + 2920)/2 = 2,905. Observe que el percentil 50, es también la mediana
LA DESVIACIÓN ESTÁNDAR
EJEMPLO DEL CÁLCULO DE LA DESVIACIÓN ESTÁNDAR
Ejemplo num 1 MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN DE UNA POBLACIÓN (Medidas descriptivas) Los siguientes datos representan las razones de PU (precio/utilidad) de las 20 compañías que participan en la rama industrial de procesamiento de alimentos, publicados por el ¨Bussines Week Corporate Scoreboard¨ (Año 2008)
Continuación ejemplo 1° Compañía:  Razón PU :  Compañía:  Razón PU : 1  11  11  19 2  13  12  20 3  14  13  20 4  17  14  21 5  17  15  21 6  17  16  21 7  17  17  21 8  18  18  22 9  18  19  24 10  19  20  25
Calcular del ejemplo núm. 1 a) Media aritmética  b) Mediana  c) Moda  d) El rango medio (dato mayor – dato menor)/2 e) El rango f) Varianza g) Desviación estándar h) Coeficiente de variación  CV = (desv. estándar/media) x 100 i) Cuartiles j) Rango intercuartílico (Q 3  – Q 1 ) k) Eje medio (Q 3  + Q 1 )/2
Solución a) Media = 375/20= 18.75 b) Mediana = (n+1)/2 * debemos ordenar de menor a mayor los datos para hacer este cálculo:  Mediana =  (20 + 1)/2 = 10.5 *esto significa que debemos obtener la media entre la posición 10 y la 11:  (19 + 19)/2 = 19 c) Moda: 17 y 21 d) Rango Medio: (25 – 11)/2 =14/2 = 7 e) Rango: 25 – 11 = 14
Solución e) Varianza = 12.09 g)  Desv. Estándar = 3.47 h) Coeficiente de variación = (3.47/18.75)x100 = 18.5% i)  Cuartiles: (posiciones) Q 1  =  20/4 = 5  prom. entre 5 y 6 posición  = 17  Q 2   = 20/2 = 10  prom. entre 10 y 11 posición = 19  Q 3  = 3(20)/4 = 15  prom. entre 15 y 16 posición = 21
Solución j)  Rango intercuartílico: Q 3   -  Q 1   = 21 – 17 = 4 k) Eje medio :  (Q 3  + Q 1  )/2 = (21+ 17)/2 = 19
RESULTADOS en EXCEL del ejercicio anterior Herramientas-Análisis de datos-estadística descriptiva   Media 18.75 Error típico 0.777563671 Mediana 19 Moda 17 Desviación estándar 3.477370452 Varianza de la muestra 12.09210526 Curtosis 0.290848679 Coeficiente de asimetría -0.434437474
RESULTADOS en EXCEL del ejercicio anterior Herramientas-Análisis de datos-estadística descriptiva Rango 14 Mínimo 11 Máximo 25 Suma 375 Cuenta 20 Mayor (1) 25 Menor(1) 11 Nivel de confianza(95.0%) 1.627459974
Prácticas para los alumnos Resolver los ejercicios siguientes y entregarlos al facilitador del módulo
Ejercicio # 1 de Aplicación de Estadística Descriptiva  en EXCEL (ALUMNOS) Evalúe las medidas de tendencia central La compensación anual total para un miembro del consejo en una de las 100 compañías públicas más grandes de E.U. se basa en parte en la cuota fija, un pago anual por servir al consejo. Además de la cuota fija de efectivo, un miembro del consejo podría recibir una cuota fija de acciones, un subsidio accionario, una opción de compra de acciones y una cuota por asistir a las reuniones del consejo.  La compensación fácilmente puede ser mayor de $100,000 dólares, incluso con una cuota fija anual tan baja como $15,000 dólares. Los datos siguientes muestran la cuota fija de efectivo para una muestra de 20 de las compañías públicas más grandes de E.U. ( USA Today, 14 de Mayo del 2008)
Continuación del Ejercicio # 1 de Aplicación Estadística en EXCEL (ALUMNOS) Compañía   Cuota fija de efectivo American Express  64 Bank of América  36 Boeing  26 Chevron  35 Dell Computer  40 DuPont  35 ExxonMobil  40 Ford Motor  30 General Motors  60 International Paper  36
Continuación del Ejercicio # 1 de Aplicación Estadística en EXCEL (ALUMNOS) Compañía   Cuota fija de efectivo Kroger  28 Lucent Technologies  50 Motorola  20 Procter  & Gamble  55 Raytheon  40 Sears Roebuck  30 Texaco  15 United Parcel Service  55 Wal-Mart Stores  25 Xerox  40
Ejercicio # 2 de Aplicación de Estadística Descriptiva  en EXCEL (ALUMNOS) Evalúe las medidas de tendencia central Se efectuó una encuesta acerca de la capacidad de los fabricantes de computadoras para resolver con rapidez sus problemas ( PC Computing,  noviembre de 1977). Se obtuvieron los siguientes resultados: Empresa  Días para resolver el problema Compaq  13 Packard Bell  27 Quantex  11 Dell  14 NEC  14 AST  17 Acer  16
Continuación ejercicio # 2 Empresa  Días para resolver el problema Gateway  21 Digital  27 IBM  12 Hewlett-Packard  14 AT  & T  20 Toshiba  37 Micron  17
Ejercicios # 3 y # 4 Calcule la Desviación estándar y la varianza  e interprete los resultados 3.- Una organización de protección al consumidor se preocupa por las deudas de las tarjetas de crédito. Una encuesta entre 10 adultos jóvenes que tienen deudas de más de $2,000 con tarjetas de crédito mostró que pagaban un promedio de poco más de $100 al mes. A continuación se presenta una lista de las cantidades que cada adulto joven abonó a su saldo el mes pasado: $110  $126  $103  $93  $99  $113  $87  $101  $109  $100 4.- Los siguientes son los números de cambios de aceite durante los últimos 7 días en un taller mecánico de la cd. de Guadalajara,  Jal. 41  15  39  54  31  15  33
DATOS AGRUPADOS Medidas de tendencia central Media, Mediana, Moda,  Desviación Estándar y Varianza
MEDIA, MEDIANA Y MODA, DE DATOS AGRUPADOS Con frecuencia los datos relacionados con ingresos, edades y demás, se agrupan y presentan en forma de distribución de frecuencias. Por lo general, resulta imposible obtener los datos originales. De modo que si interesa un valor típico que represente a los datos, es necesario “ estimarlo”  basándose en la distribución de frecuencias.
MEDIA ARITMÉTICA DE DATOS AGRUPADOS x  =  Σ fX n X = es la media aritmética X = es el valor central o punto medio, de cada clase f = es la frecuencia de cada clase n = es el número total de frecuencias
Cálculo de la Media del precio de venta de 80 vehículos que se vendieron el mes pasado en una agencia VW Precio de venta (miles de dólares) Frec. (f ) Punto medio  (X) fX 12 hasta 15 8 $13.50 $108 15 hasta 18 23 16.5 379.5 18 hasta 21 17 19.5 331.5 21 hasta 24 18 22.5 405 24 hasta 27 8 25.5 204 27 hasta 30 4 28.5 114 30 hasta 33 2 31.5 63 total 80 $1,605
Cálculo de la Media del precio de venta de 80 vehículos que se vendieron el mes pasado en una agencia VW X =  Σ fX  = $ 1,605  = $20.1 miles  n  80 Por tanto se concluye que la media del precio de venta de los vehículos es aproximadamente $20,100.
MEDIANA DE DATOS AGRUPADOS Mediana = L +  (n/2 – FA)  (i) f L = es el límite inferior de la clase que contiene a la mediana n = número total de frecuencias f = es la frecuencia de la clase que contiene a la mediana FA = es el número acumulado de frecuencias en todas las clases que preceden a la clase que contiene a la mediana i = es la amplitud (o anchura) de la clase en que se encuentra la mediana
Cálculo de la Mediana del precio de venta de 80 vehículos que se vendieron el mes pasado en una agencia VW Precio de venta Número vendido  Frecuencia acumulada  (miles de dólares) ( f ) (FA) 12 hasta 15 8 8 15 hasta 18 23 31 18 hasta 21   17   48 21 hasta 24 18 66 24 hasta 27 8 74 27 hasta 30 4 78 30 hasta 33 2 80 total 80
Cálculo de la Mediana del precio de venta de 80 vehículos que se vendieron el mes pasado en una agencia VW Mediana = L +  (n/2 – FA)  (i) f Mediana = $18,000 +  (80/2 – 31) ($3,000) 17 Mediana = $18,000 + $1,588 = $19,588
Moda de datos agrupados Recuérdese que la moda se define como el valor que ocurre con más frecuencia. Para datos agrupados en una distribución de frecuencias, es posible aproximar la moda usando  “el punto medio de la clase que contiene el mayor número de frecuencias de clase”
Ejemplo del cálculo de la Moda (datos agrupados) Ventas netas (millones de $)  Porcentaje del total 1 hasta 4  13 4 hasta 7  14 7 hasta 10  40 10 hasta 13  23 13 y superior  10
Resultado del ejemplo del cálculo de la Moda (datos agrupados) Moda = (7 + 10)/2 = 8.5 millones
Desviación estándar de datos agrupados en una distribución de frecuencias S =  Σ fx 2  –  ( Σ fX) 2 n n – 1 s = desv. estándar  X = punto medio de una clase f = es la frecuencia de clase  n = num. total de observaciones en la muestra
Calcule la desviación estándar de una muestra de las inversiones quincenales realizadas por empleados de acuerdo con el plan de participación de utilidades Cantidad Inv. Frecuencia f Punto Medio X fX fX 2 $30 hasta $35 3 $32.5 $97.50 3,168.75 35 hasta 40 7 37.5 262.5 9,843.75 40 hasta 45 11 42.5 467.5 19,868.75 45 hasta 50 22 47.5 1045 49,637.50 50 hasta 55 40 52.5 2100 110,250 55 hasta 60 24 57.5 1380 79,350 60 hasta 65 9 62.5 562.5 35,156.25 65 hasta 70 4 67.5 270 18,225 total 120 $6,185 325,500
Obtenemos ahora la desviación estándar muestral con los resultados de la tabulación anterior S =  325,500 – (6185) 2 /120 (120 – 1) S = $7.51
Ejercicio # 1 para el alumno (DATOS AGRUPADOS) Calcular: la media, la mediana, la moda, la desviación estándar y la varianza En una gasolinera se formó la siguiente distribución de frecuencias de galones de gasolina vendidos por automóvil, en una muestra de 680 vehículos: Gasolina (galones)   Frecuencia 0-4  74 5-9  192 10-14  280 15-19  105 20-24  23 25-29  6 Total  680
Ejercicio # 2 para el alumno (DATOS AGRUPADOS) Calcular: la media, la moda, la mediana, la desviación estándar y la varianza Las cuestiones de salud son de interés para directores, o gerentes de empresa, en especial porque evalúan el costo del seguro médico. En un estudio reciente con 150 ejecutivos de varias empresas de polímeros, una gran aseguradora y financiera localizada en una cd. de los E.U., aparecieron las cifras de sobrepeso en libras de los ejecutivos. Sobrepeso (libras)  frecuencia 0 hasta 6  14 6 hasta 12  42 12 hasta 18  58 18 hasta 24  28 24 hasta 30  8
Ejercicio # 3 para el alumno (DATOS AGRUPADOS) Calcular: la media, la desviación estándar y la varianza A continuación se presenta una distribución de frecuencias de la duración de 20 llamadas telefónicas de larga distancia, en minutos.  Duración de la llamada (min)  Frecuencia 4 – 7  4 8 – 11  5 12 – 15  7 16 – 19  2 20 – 23  1 24 – 27  1 Total  20
Ejercicio # 4 para el alumno (DATOS AGRUPADOS) Calcular: la media, la desviación estándar y la varianza Un radar policiaco vigila la velocidad de los automóviles que viajan por la carretera transversal del estado de Nueva York. En la tabla siguiente se presenta una distribución de frecuencia de las velocidades: Velocidad (millas/hr)  Frecuencia 45 – 49  10 50 – 54  40 55 – 59  150 60 – 64  175 65 – 69  75 70 – 74  15 75 – 79  10 Total  475
Diagramas de Control de Calidad Los diagramas de control identifican el momento en que entran al proceso las causas asignables de variación o los cambios. Estos diagramas indican a los trabajadores, líderes de grupos, ingenieros de control de calidad, supervisores de producción y gerentes, si la producción de la parte o el servicio está “bajo control” o “fuera de control”. Si algo está fuera de control, la persona responsable ajustará la máquina, fabricará la pieza o hará lo que sea necesario para poner la producción “bajo control”.
Ejemplo   La compañía “ G  ξ  L ” que produce artículos de papelería, ofrece un número telefónico de larga distancia sin costo al cual los clientes pueden llamar todos los días, de 7 a.m. a 11 p.m., para resolver problemas con sus productos. Es imposible que un representante técnico conteste de inmediato, pero es importante que los clientes no esperen demasiado en línea. Los clientes se molestan cuando escuchan demasiadas veces el mensaje “su llamada es importante para nosotros. En breve le contestará un representante”
Ejemplo Para comprender el proceso, la compañía decidió elaborar una tabla de control con el tiempo total desde el momento en que se recibe una llamada hasta que el representante la responde y soluciona el problema del cliente. El día de ayer se tomó una muestra de cinco llamadas cada hora durante las 16 horas de operación del servicio de atención al cliente.  Con base en esa información, elabore una tabla de control para la duración media de la llamada. ¿Parece existir una tendencia en las horas de las llamadas? ¿Hay algún periodo donde parece que los clientes esperan más que otros?
Tabla de la duración de 16 muestras de cinco sesiones de ayuda
Pasos en Minitab para realizar el Diagrama de Control de Rangos   Paso 1 : Haga clic en  Stat, Control Charts, Variables Charts for subgroups, Xbar-R  y oprima enter
Paso 2 : Seleccione  Observations for a subgroup are in one row of columns ; seleccione las columnas  C2, C3, C4, C5 y C6  con un clic a c/u
Paso 3:  dar clic a  Labels , para poner el nombre de la gráfica, después darle clic en  OK  dos veces
Xbar-R Chart of Minutes Paso 4, Resultado :  Diagrama de Control de Rangos de la duración de las llamadas de los clientes en la compañía “ G  ξ  L ”
Comentarios acerca de los resultados del Diagrama de control de rangos  La media  es de 9.413 minutos, el límite de control superior se ubica en 13.093 minutos y el límite de control inferior en 5.732 minutos.  Hay una variación en la duración de las llamadas, pero todas las medias de la muestra están dentro de los límites de control. Por tanto, con base en 16 muestras de 5 llamadas, la conclusión es que, 99.74% (seis sigmas) de las veces, la duración media de una muestra de 5 llamadas estará entre 5.732 min y 13.093 min
Conclusión Puesto que la teoría estadística se basa en la normalidad de muestras grandes, los diagramas de control deben tener como base un proceso estable, es decir, una muestra muy grande tomada durante un periodo. Una regla básica es diseñar el diagrama después de seleccionar al menos 25 muestras.
BIBLIOGRAFÍA 1.- Estadística Básica en Administración Conceptos y Aplicaciones 6ª Edición Berenson/Levine Ed. Prentice-Hall 2.- Estadística para Administración y Economía Anderson, Sweeney y Williams 8. Edición Ed. Thomson 3.- Estadística para Administradores Richard Levin Ed. Prentice-Hall 4.- Estadística para Administradores y Economía Mason y Lind Ed. Alfaomega
BIBLIOGRAFÍA 5.- Estadística Aplicada a los Negocios y a la Economía 12ª. Edición Lind, Marchal & Wathen Ed. Mc. Graw-Hill 6.- Probabilidad & Estadística 8ª Edición Walpole, Myers, Myers & Ye PEARSON,  Prentice Hall 7.- Introducción a la PROBABILIDAD Y ESTADÍSTICA Décima segunda edición Mendenhall, Beaver & Beaver  THOMSON 8.- PROBABILIDAD Y ESTADÍSTICA Sexta Edición Devore THOMSON
BIBLIOGRAFÍA 9.- Control Estadístico de Calidad Montgomery, Douglas C. Limusa, 2005 10.- Diseño y Análisis de experimentos Montgomery, Douglas C. Iberoamérica, 2001 11.- Probabilidad y Estadística aplicadas a la Ingeniería Montgomery, Douglas y Runger George Mc. Graw-Hill, 2003 12.- Métodos Cuantitativos para los Negocios Render, Stair &Hanna 9ª edición PEARSON Prentice-Hall 13.- ESTADÍSTICA Para las Ciencias del Comportamiento 7ª. Edición Pagano, Robert R. THOMSON

Lupita camarena

  • 1.
    Los Datos yla Estadística MATERIAL DIDÁCTICO REALIZADO POR: Dr. en C.D.H. Leopoldo Xavier Cárdenas González PARA LA MATERIA DE: HERRAMIENTAS DE APLICACIÓN ESTADÍSTICA AÑO 2010
  • 2.
    Objetivo El usode modelos probabilísticos y métodos estadísticos para analizar datos, se ha vuelto práctica común en casi todas las disciplinas científicas. Se pretende en este curso proporcionar una introducción completa a los modelos y métodos que los estudiantes de este módulo encontrarán en sus actividades profesionales. Los ejercicios y ejemplos están diseñados esencialmente con un adecuado análisis estadístico, con diferentes métodos y sus diversas aplicaciones al conocimiento científico.
  • 3.
    ¿Qué es laestadística? 1.- ¿Qué entiendes por Estadística? ¿Cuál es su utilidad? 2.- Describa tres aplicaciones de la estadística en su área de trabajo 3.- ¿Qué tipo de datos se manejan en la estadística? 4.- ¿Para qué se recopilan datos en una investigación? 5.- ¿Cuáles son las fuentes de datos para una investigación? 6.- Mencione algún experimento en donde existan variaciones en las mediciones con diferentes periodos de tiempo
  • 4.
    MAPA PARA SELECCIONARUN MÉTODO ESTADÍSTICO TIPO DE ANÁLISIS NUMÉRICOS CATEGÓRICOS TIPO DE DATOS Descripción de un grupo o diversos grupos Arreglo ordenado, diagrama de tallo y hoja, distribución de frecuencias, distribuciones de: frecuencia, frecuencia relativa, porcentajes, porcentajes acumulados; Histograma, polígono, polígono de porcentaje acumulado Tabla de resumen, gráfica de barras, gráfica de pastel, diagrama de Paretto Media, mediana, moda, cuartiles, media geométrica, rango, rango intercuartil, desviación estándar, varianza, coeficiente de variación, gráfica de caja y bigote
  • 5.
    MAPA PARA SELECCIONARUN MÉTODO ESTADÍSTICO TIPO DE ANÁLISIS NUMÉRICOS CATEGÓRICOS Inferencia acerca de un grupo Estimación del intervalo de confianza para la media Prueba Z para la media Prueba t para la media Estimación de intervalo de confianza para una proporción Prueba Z de hipótesis para la proporción Comparación de dos grupos Pruebas para la diferencia en las medias de dos poblaciones independientes Prueba t apareada Prueba F para la diferencia entre dos varianzas Prueba Z para la diferencia entre 2 proporciones Prueba Chi cuadrada para la diferencia entre 2 proporciones
  • 6.
    MAPA PARA SELECCIONARUN MÉTODO ESTADÍSTICO TIPO DE ANÁLISIS NUMÉRICOS CATEGÓRICOS Comparación de más de dos grupos Análisis de varianza de una vía Prueba chi cuadrada para las diferencias entre más de dos proporciones Análisis de la relación entre dos variables Diagrama de dispersión, gráfica de series de tiempo Covarianza, coeficiente de correlación Regresión lineal simple Prueba t de correlación Tabla de contingencia, gráfica de barras agrupadas Prueba de chi cuadrada de independencia Análisis de la relación entre dos o más variables Regresión múltiple
  • 7.
    Diferencias en lasaplicaciones de la estadística en las diversas disciplinas académicas La mayor diferencia radica en los ejemplos que se utiliza En la facultad de Administración nos interesan cosas como: ganancias, horas trabajadas y salarios. En el depto. de Psicología se interesan por las calificaciones obtenidas en las pruebas de algún test aplicado a determinada población de alumnos En la facultad de Ingeniería quizá se interesen por la cantidades de unidades que se fabrican en una máquina en particular. Sin embargo las 3 áreas se interesan en el valor típico y la variación que existe en la información. Quizá haya también una diferencia en el nivel de matemáticas que se requiere.
  • 8.
    Razones para estudiarEstadística 1.- La información está en todas partes 2.- Las técnicas estadísticas se emplean para tomar muchas decisiones que afectan nuestra vida 3.- Sin importar cuál sea su profesión, tomará decisiones más profesionales que comprenden información
  • 9.
    Razones para estudiarEstadística Como ciudadano, estará expuesto a, y tal vez incluso ayude a generar, descripciones estadísticas y análisis de datos que sean de vital importancia para su comunidad local, estatal, nacional y mundial. Como profesional de negocios, encarará mediciones estadísticas de desempeño y éxito, y conocerá empresarios que esperarán que ud. pueda utilizar las técnicas estadísticas y herramientas de software para computadora más recientes al trabajar con estas mediciones.
  • 10.
    Casos de NegociosEn todos los casos, la empresa u organización necesita apoyo estadístico para analizar su base de datos con el fin de ganar más dinero, tomar mejores decisiones o sencillamente llegar al siguiente año fiscal. Se deben tomar muy en cuenta algunos lineamientos en forma de preguntas o cuestiones específicas que el estudiante podría abordar al emplear la estadística para negocios como recurso, con el fin de formular observaciones y recomendaciones informativas o útiles para su “cliente”.
  • 11.
    ¿Qué se necesitaa fin de tomar una decisión adecuada? 1.- Determinar si la información existente es adecuada o si se necesita una información adicional 2.- Recopilar información adicional, en caso de ser necesaria, de manera que no proporcione resultados erróneos. 3.- Resumir la información en forma útil y organizada 4.- Analizar la información disponible 5.- Sacar conclusiones y hacer deducciones al tiempo que evalúa el riesgo de una conclusión incorrecta 6.- Debe existir ética en el análisis y preparación de los informes estadísticos
  • 12.
    LOS DATOS YLA ESTADÍSTICA ¿QUÉ ES LA ESTADÍSTICA ? Es el arte y ciencia de reunir, analizar, presentar e interpretar datos. La disciplina de la estadística enseña cómo razonar de manera lógica y tomar decisiones informadas en presencia de incertidumbre y variación. Sin estas dos últimas, habría poca necesidad de los métodos estadísticos o de los profesionales de la estadística EJEMPLOS QUE ILUSTRAN ALGUNAS APLICACIONES DE LA ESTADÍSTICA: a) Contabilidad b) Finanzas c) Mercadotecnia d) Producción e) Economía f) Educación g) Psicología h) Ingeniería i) Control estadístico de procesos y la calidad j) Administración k) Recursos Humanos l) Valuación
  • 13.
    Los datos Losdatos son los hechos y los números que se reúnen y resumen para su presentación. Al estar reunidos, los datos recopilados en determinado estudio se denominan conjunto de datos.
  • 14.
    Datos Cuantitativos yCualitativos Los datos cualitativos : son identificadores o nombres asignados a un atributo de cada elemento. Pueden ser numéricos o no numéricos: Ejemplo: los números de seguro social, como 310-22-7924 están formados por valores numéricos, sin embargo, son cualitativos, porque en realidad identifican a determinado individuo. Los datos cuantitativos : indican cuánto o cuántos. Siempre son numéricos. Ejemplo: Ventas de refrescos en determinada empresa, número de alumnos/grupo en la universidad, ganancias por acción, cantidad de agua que contiene el cuerpo humano, número de palabras/página promedio que contiene la obra Don Quijote de la Mancha.
  • 15.
    DIFERENCIA ENTRE DATOSCUALITATIVOS Y CUANTITATIVOS La diferencia consiste en que las operaciones aritméticas ordinarias sólo tienen sentido con los datos cuantitativos. Por ejemplo: cuando los datos son cuantitativos , sus valores se pueden sumar y después dividir entre la cantidad de valores para calcular el valor promedio de ellos. Este promedio tiene sentido y, por lo general se interpreta con facilidad. Sin embargo, cuando se registran datos cualitativos en forma de valores numéricos, esas operaciones aritméticas producen resultados sin importancia.
  • 16.
    Tipos de EstadísticaLa Estadística Descriptiva : estudia las técnicas que se utilizan para describir o caracterizar los datos obtenidos La Estadística Inferencial :incluye las técnicas que emplean los datos obtenidos en la muestra para, a partir de ellos, hacer inferencias sobre sus respectivas poblaciones.
  • 17.
    Ejemplos de EstadísticaDescriptiva Durante el 2009, los miembros del Congreso recibieron un total de 90 millones de mensajes por correo electrónico, más del doble de la cantidad recibida durante 2007 Más de 8.5 millones de habitantes viven en la ciudad de Nueva York (año 2007) y viven 10,000 personas por km 2 . Loving County (Texas) tiene 67 residentes y una densidad de población de una persona por 10 millas cuadradas. Más de 1800 plantas y animales están en la lista de especies en peligro de extinción del Departamento del Interior del gobierno de E.U. De enero de 2008 a la fecha, 80.6% de los vuelos de Continental Airlines arribó a tiempo.
  • 18.
    Ejemplos de estadísticainferencial Una investigación de Nielsen/NertRaitings estima que 162.8 millones de estadounidenses (58% de la población) tiene acceso a sitios web en su domicilio. A partir de un estudio de 340 mujeres divididas en 4 grupos según su ocupación, los investigadores de la Universidad de Pittsburg encontraron que las empleadas de oficina tienen el mayor riesgo de padecimientos cardiovasculares. De 1400 directores corporativos de finanzas encuestados, 38% dijo que “el reconocimiento frecuente de los logros” era el mejor modo de motivar a sus empleados. En una encuesta realizada a alumnos de último semestre de preparatoria que aspiraban a matricularse en una universidad, 33% dijo que “el nivel académico” era la característica más importante al elegir una universidad.
  • 19.
    Estadística Descriptiva Lamayor parte de la información estadística que aparece en los diarios, revistas, informes y demás publicaciones consiste en datos resumidos y presentados en forma comprensible para el lector. Esos resúmenes de datos, que puede ser tabulares, gráficos o numéricos, se llaman estadísticas descriptivas
  • 20.
    Inferencia Estadística Unode los mayores aportes de la estadística es que los datos de una muestra pueden emplearse para elaborar estimaciones y probar hipótesis ( indican lo que estamos buscando o tratando de lograr ) acerca de las características de una población. A este proceso se le denomina inferencia estadística.
  • 21.
    LA ESTADÍSTICA YEL MUNDO REAL En áreas de verdadera importancia para usted, debe preguntarse cosas como: ¿Están respaldadas estas afirmaciones por datos? ¿Qué tan confiables son esos datos? ¿Es el azar una explicación razonable para los datos?
  • 22.
    LA ESTADÍSTICA YEL MUNDO REAL Si no existen datos, o si éstos se presentan con expresiones como: “ mi experiencia es que……….” en lugar de haber sido obtenidos por medio de experimentos bien controlados, usted comenzará a cuestionarse si debe considerar en serio el consejo de esa autoridad.
  • 23.
    OBTENCIÓN DE DATOSMEDIANTE ENCUESTAS DE INVESTIGACIÓN Es muy probable que un especialista en estadística que realiza una encuesta desee desarrollar un instrumento que le permita hacer varias preguntas y manejar diversos fenómenos o características. A estos fenómenos o características se les denomina variables aleatorias
  • 24.
    TIPOS DE VARIABLESCualitativas Cuantitativas Marca de PC Discretas Continuas Estado civil Color del cabello *Hijos en la familia *Cantidad de *Letras del alfabeto impuesto pagado *TV en una casa *Peso de un alumno *Precipitación anual en Zapopan, Jal
  • 25.
    VARIABLES ALEATORIAS TIPOSDE DATOS TIPOS DE PREGUNTAS RESPUESTAS CUALITATIVOS ¿Posee actualmente bonos Si No de ahorro del gobierno? ¿Ud. es? Hombre Mujer Su cabello es: castaño, negro, rojizo, rubio o canoso CUANTITATIVO: DISCRETO : ¿A cuántas revistas está ______número suscrito actualmente? CONTÍNUO: ¿Cuál es su estatura? _______ cm ¿Cuál es el volumen de un líquido en un recipiente? _______ cm 3
  • 26.
    TIPOS DE DATOSLos datos cuantitativos discretos son respuestas numéricas que surgen de un proceso de conteo (su respuesta puede ser sólo un número finito de números) Por ejem: 8 personas, 3 revistas, 12 automóviles. Los datos cuantitativos continuos son respuestas numéricas que surgen de un proceso de medición (la respuesta puede tomar cualquier valor dentro de un intervalo). Por ejemplo: 1.75 mts, 16.97% de interés mensual, 19.4 lb/pulg 2 de presión
  • 27.
    ESCALAS DE MEDICIÓNLa asignación de un valor numérico a una variable es un proceso llamado medición. Por ejemplo: a) La temperatura en la cd. de Guadalajara en este momento es de 25°C b) 8 focos rotos en una caja c) 4 llantas radiales en un automóvil d) El volumen de una lata de refresco es de 100 ml Los números 25, 8, 4 y 100 constituyen mediciones
  • 28.
    NIVELES o ESCALASDE MEDICIÓN NOMINAL ORDINAL DE INTERVALO DE RAZÓN Los datos sólo Los datos se Diferencia significativa Punto “0” signi- se clasifican ordenan entre los valores ficativo y razón entre valores Números en las Su número de Temperatura Número de playeras de los lista en clase pacientes vistos jugadores de futbol Posición de Número de Marca de un auto llegada en una llamadas de carrera de ventas el dia de maratón hoy
  • 29.
    NIVELES o ESCALASDE MEDICIÓN Las Áreas Sociales utilizan normalmente el nivel cualitativo de medición: nominal y ordinal. ¿ Qué operaciones matemáticas se pueden realizar con estas escalas? proporciones, porcentajes y razones Cuando la variable puede medirse se utilizan las escalas de intervalo o de razón ¿ Qué operaciones matemáticas se pueden realizar con estas escalas? proporciones, porcentajes y razones, media aritmética, moda, mediana, rango y desviación estándar
  • 30.
    ESCALAS DE MEDICIÓN“Nominales, Ordinales, de Intervalos y de Razón” ESCALA NOMINAL : Representa el nivel mínimo de medición y se utiliza con frecuencia para variables de naturaleza cualitativa y no cuantitativa. Ejemplos de variables cualitativas : Marcas de zapatos deportivos, distintos tipos de frutas o música, los días de la semana, la nacionalidad, creencias religiosas y el color de los ojos. Al utilizar una escala nominal, la variable se divide en sus diversas categorías. La medición con una escala nominal EQUIVALE en realidad, a clasificar los objetos y a darles el nombre de la categoría a la cual pertenecen.
  • 31.
    ESCALA DE MEDICIÓN: Nominal EJEMPLO DE ESCALA NOMINAL “ Zapatos deportivos Nike, Brooks y New Balance” VARIABLE: “marca de Zapatos Deportivos” TIPO: Cualitativo CATEGORÍA: (Diversas marcas de zapatos deportivos) Categoría zapatos deportivos 1 (Nike) Categoría zapatos deportivos 2 (Brooks) Categoría zapatos deportivos 3 (New Balance) De lo anterior podemos, contar el número de zapatos que pertenecen a cada categoría. Por ejemplo: Nike: 20 pares, Brooks: 26 pares y de New Balance: 17 pares, y con esta información tener las frecuencias que nos permitan comparar el número de zapatos en cada categoría.
  • 32.
    Ejemplo de lamedición en la escala nominal en un cuestionario EJEMPLO DE LA ESCALA NOMINAL EN UN CUESTIONARIO: Estado civil : soltero, casado, viudo, divorciado (son mutuamente excluyentes) Estos indicadores sólo pueden clasificarse, no medirse. Las operaciones matemáticas que se aplican en el análisis de estos datos son: razones, proporciones y porcentajes
  • 33.
    ESCALA DE MEDICIÓN: Ordinal Con esta escala ordenamos los objetos medidos, tomando como base si poseen más, menos o la misma cantidad de la variable medida. Así, una escala ordinal permite determinar si: A > B, A = B ó A < B Ejemplo: ordenamiento de los 5 mejores participantes en un concurso de Oratoria, según facilidad de palabra. Nombre de la persona Rango que ocuparon Karla Icela Méndez 1° Carolina Beltrán 2° Brian Muñoz 3° Felipe Solís 4°
  • 34.
    ESCALA DE MEDICIÓN: Ordinal Entre los oradores, la persona de rango 1 fue considerada mejor que la persona con rango 2, quien a su vez fue mejor que la de rango 3, etc. Es importante observar que aunque esta escala permite hacer comparaciones del tipo: “mejor que, igual que o menor que”, no dice nada sobre la magnitud de la diferencia entre las unidades adyacentes que pertenecen a dicha escala. Otros ejemplos : Clasificación de los corredores que participaron en el Maratón de Guadalajara según su orden de llegada. El orden de los maestros según su capacidad de enseñanza El orden de los estudiantes según su nivel de motivación
  • 35.
    Ejemplo de lamedición en la escala ordinal en un cuestionario ¿La clase de matemáticas es interesante? a) de acuerdo b) duda c) en desacuerdo Resultados de la encuesta a 100 alumnos en una universidad: 60% de acuerdo 15% en duda 25% en desacuerdo
  • 36.
    ESCALA DE MEDICIÓN: de Intervalo Representa un nivel superior de medición respecto a la escala ordinal. Posee las propiedades de magnitud e igualdad de intervalos entre las unidades adyacentes, pero no tiene un cero absoluto. Ejemplo: Escala Celsius para medir la temperatura. Tiene la propiedad de poseer intervalos iguales entre las unidades adyacentes, pero no tiene un punto correspondiente al cero absoluto. Así la cantidad de adicional de calor que provoca un cambio de lectura de la temperatura de 2° a 3° Celsius producirá también un cambio en la lectura de 51° a 52° o de 105° a 106° Celsius. Podemos determinar si: A = B, A > B ó A < B
  • 37.
    Ejemplo de lamedición en la escala de intervalo en un cuestionario ¿Cual es el intervalo en la edad de los alumnos de primer año? a) de 14 a 16 años b) de 17 a 19 años c) de 20 a 22 años ¿Qué operaciones matemáticas se pueden hacer en este tipo de escala? Media aritmética, mediana, moda, desviación estándar, etc.
  • 38.
    ESCALA DE MEDICIÓN: de Razón El siguiente y máximo nivel de medición es la Escala de Razón. Tiene todas las propiedades de una escala de intervalo y además, posee un cero absoluto. Ejemplos: Tiempo de reacción La longitud El peso La edad La frecuencia de cualquier evento La temperatura en °Kelvin (tiene un cero absoluto, ausencia completa de calor) Se pueden realizar todas las operaciones matemáticas asociadas por lo general con los números (+, -, x , /)
  • 39.
    ESCALA DE MEDICIÓN: de Razón Ejemplo para ilustrar la diferencia entre la escala de Intervalo y la de Razón: Experimento: Comparar la escala °C y la escala °K El cero en la escala Celsius es la temperatura a la cual se congela el agua El cero de la escala Kelvin es el cero absoluto La diferencia de calor entre 8° y 9° es igual a la diferencia entre 99° y 100° sin importar que la escala sea °C o °K Una lectura de 20°C no es el doble de caliente que 10°C, ¿porqué? Convertimos a calor real (°K) estas temperaturas: °K = °C + 273 = 20° + 273° = 293°K = 10° + 273° = 283°K Es obvio que 293° no es el doble que 283°
  • 40.
    ESCALAS DE MEDICIÓNEN LAS CIENCIAS DEL COMPORTAMIENTO Muchas de las escalas utilizadas se consideran con frecuencia como si fuesen de intervalo sin establecer con claridad que la escala, en realidad, posee intervalos iguales entre unidades adyacentes. Ejemplos: La medición del CI Las variables emocionales: ansiedad y depresión Las variables de personalidad: autosuficiencia, introversión, extroversión y la dominancia. Variables de eficiencia o logros terminales Variables de actitud Nota: Para todas estas variables, sus escalas no son de razón (no tienen un cero absoluto como referencia)
  • 41.
    Ejemplo del C.I.Si una persona ha obtenido un cero en la escala de inteligencia para adultos de Wechsler (WAIS), no podríamos decir que tiene inteligencia nula. Se supone que se encontrarían algunas preguntas que podría contestar el individuo en cuestión, de modo que tendría un CI > 0 Así la prueba WAIS no tiene un punto cero absoluto y la escala de razón no es adecuada Por lo tanto no es correcto decir que una persona con un CI de 160 es lo doble de inteligente que alguien con un CI de 80
  • 42.
    Influencia del nivelde escalas en la selección del tipo de prueba que se usará en el Análisis de Datos Existen 2 criterios: 1° El primero afirma que el uso de ciertas pruebas: “ t” de Student “ ANOVA” (análisis de varianza) deben limitarse a los datos que pertenecen a escalas de intervalo y de razón. 2° El segundo criterio no concuerda con lo anterior y afirma que esas pruebas también se pueden utilizar con datos nominales y ordinales
  • 43.
    Práctica # 1 Indicar cuáles de las siguientes variables son continuas y cuáles son discretas a) La hora del día b) Número de mujeres en este grupo c) Número de veces que una rata oprime la palanca en una caja de Skinner d) Edad de los sujetos en un experimento e) Número de palabras recordadas f) Peso del alimento ingerido g) % de estudiantes de su grupo que son mujeres h) Velocidad de los corredores en una carrera
  • 44.
    PRÁCTICA # 2Identificar la escala de cada una de las siguientes variables (Nominales, Ordinales, de Intervalos y de Razón) A) Número de automóviles que utilizan los alumnos de primer cuatrimestre B) Tipos de autos utilizados por los estudiantes de 2° cuatrimestre C) El C.I. de los maestros de la Universidad (suponga que utiliza una escala con intervalos iguales) D) El dominio de las matemáticas, clasificado en las categorías de: malo, regular y bueno E) Sensación de ansiedad al hablar en público, calificada según una escala de 0 a 100 (suponga que la diferencia en el grado de ansiedad entre las unidades adyacentes de toda la escala no siempre es la misma) F) El peso de un grupo de personas sometidas a una dieta
  • 45.
    PRÁCTICA # 2Identificar la escala de cada una de las siguientes variables G) El tiempo de reacción al escuchar un sonido H) El dominio de las matemáticas, medido en una escala de 0 a 100. La escala está bien normalizada y se puede considerar que tiene intervalos iguales entre las unidades adyacentes. I) Las calificaciones de los maestros asignados por los estudiantes, en una escala de 50 puntos. No existe una base suficiente para suponer que los intervalos entre las unidades adyacentes son iguales.
  • 46.
    PROCESO DE INFERENCIAESTADÍSTICA EN UN EJEMPLO DE UNA EMPRESA QUE FABRICA BOMBILLAS ELÉCTRICAS LA POBLACIÓN ES IGUAL A TODAS LAS BOMBILLAS FABRICADAS CON EL NUEVO FILAMENTO. SE ESCONOCE LA DURACIÓN PROMEDIO (1) SE FABRICA UNA MUESTRA DE 200 BOMBILLAS CON EL NUEVO FILAMENTO (2) EL RESUMEN DE LOS DATOS DE LA MUESTRA DA COMO RESULTADO UNA DURACIÓN PROMEDIO DE 76 HORAS POR BOMBILLA (3) EL VALOR DEL PROMEDIO DE LA MUESTRA SE EMPLEA PARA ESTIMAR EL PROMEDIO DE LA POBLACIÓN (4)
  • 47.
    POBLACIÓN Y MUESTRAPoblación: “ Es el conjunto completo de individuos, objetos o datos que el investigador está interesado en estudiar”. Muestra : “ Es un subconjunto de la población”.
  • 48.
    VARIABLES Variable: “Es cualquier propiedad o característica de algún evento, objeto o persona que puede tener diversos valores en diferentes instantes, según las condiciones”. Ejemplos : La altura, el peso, el tiempo de reacción y la dosis de un medicamento. Constante : “No asume diferentes valores en diferentes instantes”. Ejemplo : el símbolo matemático pi: Π
  • 49.
    Variable independiente Lavariable independiente de un experimento es aquella que es controlada en forma sistemática por el investigador. El experimentador controla los niveles de la variable y mide el efecto que produce sobre las demás variables. EJEMPLO : Un científico podría estar interesado en el efecto del alcohol sobre el comportamiento social. Para investigar esto, es probable que el experimentador varíe la cantidad de alcohol y mida sus consecuencias sobre la conducta social de las personas. La cantidad de Alcohol es la variable independiente .
  • 50.
    Variable dependiente Lavariable dependiente en un experimento es la que el investigador mide para determinar el efecto de la variable independiente. Ejemplo : En el experimento que estudia los efectos del alcohol sobre el comportamiento social, la variable dependiente es el comportamiento social . El comportamiento social de los sujetos se mide para ver si resulta afectado por la cantidad de alcohol consumida.
  • 51.
    Estadístico y ParámetroEstadígrafo : es un número calculado a partir de los datos de la muestra. ejemplo : promedio de un conjunto de datos de la muestra.(Muestra) Parámetro : es un número calculado sobre los datos de una población. ejemplo : valor promedio de un conjunto de datos poblacionales.(habla de la población)
  • 52.
    Práctica # 3 identificar: Variable independiente, dependiente, muestra, población, datos, estadístico y parámetro Un psicólogo clínico está interesado en evaluar tres métodos para tratar la depresión: la medicación, la reestructuración cognitiva y el ejercicio. Se incluye una cuarta condición de tratamiento: un grupo que sólo estará en espera de tratamiento, para tener un grupo de control de línea base. Se recluta a 60 personas deprimidas entre los estudiantes de licenciatura de una universidad, 15 de ellos son asignados a cada método de tratamiento.
  • 53.
    … .. continuaciónpráctica # 3 Los tratamientos se administran durante 6 meses, después de lo cual cada estudiante recibe un cuestionario diseñado para medir el grado de depresión. El cuestionario tiene una escala de 0 a 100, donde los puntajes mayores indican un mayor grado de depresión. Luego se calculan las medias de los valores de depresión para los 4 tratamientos y se comparan entre sí para determinar la eficiencia relativa de cada tratamiento.
  • 54.
    Práctica # 4Indicar cuáles de las siguientes afirmaciones representan una variable y cuáles una constante A) El número de letras del alfabeto B) El número de horas que tiene un día C) La hora en que Ud. come D) El número de estudiantes que se especializan en Administración cada año, en esta Universidad E) El número de cm en un metro F) La cantidad de horas que duerme usted cada noche G) Su peso H) El volumen de 1 litro de agua
  • 55.
    Práctica # 5Indicar cuáles de las siguientes situaciones corresponden a la estadística descriptiva y cuáles a la estadística inferencial A) Un informe anual para accionistas que detalla los bienes de la corporación B) Un maestro de Contabilidad que anuncia a su grupo el número de estudiantes que obtuvieron la máxima calificación en un examen reciente C) El cálculo de la media de un conjunto de datos de una muestra para caracterizarla. D) El uso de los datos de una muestra en una encuesta para estimar la opinión de la población E) Realizar un estudio de correlación sobre una muestra para determinar si el nivel educativo y el ingreso de la población están relacionados F) Un artículo de un periódico sobre los salarios promedio de los empleados federales a partir de los datos reunidos de todos los interesados.
  • 56.
    Practica # 6(en equipos) 1.- Diseñen un experimento y mencionen la metodología que utilizarían para obtener los datos necesarios. 2.- Estructuren una encuesta (10 preguntas) para obtener información necesaria en una investigación de mercado referente a la promoción de un producto de su preferencia. 3.- Den un ejemplo en un área de interés grupal, en la que los datos sean útiles para la toma de decisiones. ¿Que datos son utiles? ¿Cómo podrían obtenerse? ¿Cómo podrán usarse los datos en el proceso de toma de decisiones? 4.- ¿Qué significado tiene?: a) El Error de Muestreo b) Error de Medicion 5.- ¿Cuales son las ventajas y desventajas de las entrevistas personales, las encuestas telefónicas y las encuestas por correo?
  • 57.
    DISTRIBUCIONES DE FRECUENCIAUna distribución de frecuencias presenta los valores de los datos y la frecuencia con que se presentan. Al ser mostrados en una tabla, los valores de los datos se presentan en orden y, por lo general, el valor del dato más bajo aparece en la parte inferior de la tabla.
  • 58.
    Elaboración de unadistribución de frecuencias de datos agrupados Pasos: 1.- Encontrar el rango de los datos 2.- Determinación del número de intervalos de clase 5 < i < 18 3.- Determinar la amplitud (ancho) de cada intervalo de clase 4.- Formamos los intervalos de clase agregando i – 1 5.- Hacer una lista con los límites de cada intervalo de clase, colocando en la parte inferior de la misma al intervalo que contenga el dato más pequeño (mínimo) 6.- Contar los datos en bruto contenidos en los intervalos de clase correspondientes 7.- Sumar las cuentas de cada intervalo para obtener la frecuencia del intervalo
  • 59.
    ELABORE UNA DISTRIBUCIÓNDE FRECUENCIAS CON LOS SIGUIENTES DATOS DEL COSTO ANUAL (en miles de $) DE ENERGÍA ELÉCTRICA EN 70 EMPRESAS METAL MECÁNICAS EN MÉXICO EN EL AÑO 2009 95 57 76 93 86 80 89 76 76 63 74 94 96 77 65 79 60 56 72 82 70 67 79 71 77 52 76 68 72 88 84 70 83 93 76 82 96 87 69 89 77 81 87 65 77 72 56 78 78 58 54 82 82 66 73 79 86 81 63 46 62 99 93 82 92 75 76 90 74 67
  • 60.
    Pasos para la“Elaboración de la distribución de frecuencias” 1.- Determinación del rango: Rango = dato máximo menos dato mínimo = 99 – 46 = 53 2.- Determinamos el número de intervalos de clase: Nota: 5 < i < 18 para este caso tomamos 10 3.- Determinación de la amplitud (ancho) del intervalo de clase (i): i = rango = 53 = 5.3 5 Número de intervalos de clase 10 se redondea al mismo número de decimales que aparece en los datos en bruto
  • 61.
    Pasos para la“Elaboración de la distribución de frecuencias” 4.- Formamos los intervalos de clase agregando i – 1 tenemos: 5 – 1 = 4 (es decir a cada valor empezando por el límite inferior agregamos 4 unidades) 5.- La lista de los intervalos: debemos determinar el límite inferior de dicho intervalo. Requisitos: a) El límite inferior de este intervalo debe ser tal que el intervalo contenga al dato mínimo b) Se “acostumbra” hacer que el límite inferior de este intervalo sea exactamente divisible entre “i” Para nuestro ejemplo, el número más pequeño es 46 (no es exactamente divisible entre 5), por tanto el límite inferior del intervalo más bajo debe ser 45
  • 62.
    Diagrama de tallosy hojas Son una alternativa sencilla para acomodar los datos desagrupados y resultan sumamente útiles para resumir y describir datos cuando el número de éstos no es mayor de 100. En los diagramas de tallos y hojas no se pierde ninguno de los datos originales. Al hacer un diagrama de este tipo, cada dato es representado mediante un tallo y una hoja. El tallo se coloca a la izquierda de la línea vertical y la hoja a la derecha. Por ejemplo, los tallos y hojas de los dos primeros números de la primer columna serían: Tallo hoja 9 5 7 6
  • 63.
    Diagrama de tallosy hojas 4 6 5 2, 4, 6, 6, 7, 8 6 0, 2, 3, 3, 5, 5, 6, 7, 7, 8, 9 7 0, 0, 1, 2, 2, 2, 3, 4, 4, 5, 6, 6, 6, 6, 6, 6, 7, 7, 7, 7, 8, 8, 9, 9, 9 8 0, 1, 1, 2, 2, 2, 2, 2, 3, 4, 6, 6, 7, 7, 8, 9, 9 9 0, 2, 3, 3, 3, 4, 5, 6, 6, 9
  • 64.
    Construcción de unadistribución de frecuencias para el costo anual agrupado de las Empresas metal mecánica en México Intervalos de clase límites reales frecuencias 45-49 44.5-49.5 1 50-54 49.5-54.5 2 55-59 54.5-59.5 4 60-64 59.5-64.5 4 65-69 64.5-69.5 7 70-74 69.5-74.5 9 75-79 74.5-79.5 16 80-84 79.5-84.5 10 85-89 84.5-89.5 7 90-94 89.5-94.5 6 95-99 94.5-99.5 4
  • 65.
    Frecuencia relativa, frecuenciaacumulada y distribuciones de porcentajes acumulados Una distribución de frecuencias relativas : indica la proporción del número total de datos que aparecen en cada intervalo. Una distribución de frecuencias acumuladas : indica el número de datos que están por debajo del límite real superior de cada intervalo Una distribución de porcentajes acumulados : indica el porcentaje de datos que están por debajo del límite real superior de cada intervalo
  • 66.
    Distribuciones de frecuenciasrelativas, frecuencias acumuladas y porcentajes acumulados para los datos agrupados Intervalos de clase f f.a. f.r.(%) f.r.a. 45-49 1 1 1.43 1.43 50-54 2 3 2.86 4.29 55-59 4 7 5.71 10.00 60-64 4 11 5.71 15.71 65-69 7 18 10.00 25.71 70-74 9 27 12.85 38.56 75-79 16 43 22.85 61.41 80-84 10 53 14.28 75.69 85-89 7 60 10.00 85.69 90-94 6 66 8.57 94.26 95-99 4 70 5.71 100 70 100
  • 67.
    REPRESENTACIÓN GRÁFICA DELOS DATOS MÉTODOS GRÁFICOS USUALES EL HISTOGRAMA: Describe una distribución de frecuencias mediante una serie de rectángulos adyacentes, cada uno de los cuales tiene una amplitud proporcional a la frecuencia o la frecuencia relativa de la clase que representa. EL POLÍGONO DE FRECUENCIA: Está relacionado con el histograma y consiste en segmentos de líneas que conectan los puntos formados por las intersecciones de las marcas de clase y las frecuencias de clase. También se emplean las frecuencias relativas o los porcentajes para construir este tipo de gráfica. También se relaciona con el polígono de frecuencia la OJIVA, una representación gráfica de los valores acumulados de las frecuencias, las frecuencias relativas o los porcentajes.
  • 68.
    REPRESENTACIÓN GRÁFICA DELOS DATOS MÉTODOS GRÁFICOS USUALES LÁ GRÁFICA DE BARRAS: Igual que el histograma, la gráfica de barras representa las frecuencias de acuerdo con las alturas relativas de un conjunto de rectángulos, pero difiere del histograma en dos aspectos: a) El histograma se utiliza para representar datos cuantitativos b) La gráfica de barras representa datos cualitativos c) Los rectángulos adyacentes en el histograma comparten un lado común d) En la gráfica de barras tienen una separación entre ellos
  • 69.
    REPRESENTACIÓN GRÁFICA DELOS DATOS MÉTODOS GRÁFICOS USUALES LA GRÁFICA DE BARRAS MÚLTIPLES: En la gráfica de barras múltiples, cada periodo, empresa, subsidiaria u otra unidades se representa mediante dos o más barras, y así apreciar de un vistazo la relación de la información de dos tipos de datos. LA GRÁFICA DE LÍNEAS: La gráfica de líneas se construye para mostrar la dependencia entre dos variables cuantitativas (“y” en el eje vertical, y “x” en el eje horizintal). Ésta consiste en segmentos de rectas que conectan los puntos observados o medidos para ambas variables.
  • 70.
    REPRESENTACIÓN GRÁFICA DELOS DATOS MÉTODOS GRÁFICOS USUALES LA GRÁFICA DE PASTEL: Es un círculo dividido en secciones según la cantidad de observaciones que caen en cada una de ellas o los valores relativos de las mismas. Si la gráfica de pastel no se genera mediante computadora, puede construirse teniendo en cuenta que un círculo tiene 360°. El ángulo utilizado para cada sector del círculo se calcula del modo siguiente: Cantidad de grados Valor relativo de para la categoría = la categoría x 360 EL PICTOGRAMA: El pictograma describe las frecuencias u otros valores de interés empleando símbolos en lugar de barras.
  • 71.
    Histograma del CostoAnual de Energía Eléctrica en México en el año 2009 en diferentes empresas metal mecánicas
  • 72.
    Histograma de frecuenciasacumuladas del Costo Anual de Energía Eléctrica en México en el año 2009 en diferentes empresas metal mecánicas
  • 73.
    Histograma de FrecuenciasRelativas del Costo Anual de Energía Eléctrica en México en el año 2009 en diferentes empresas metal mecánicas
  • 74.
    Histograma de frecuenciasrelativas acumuladas del Costo Anual de Energía Eléctrica en México en el año 2009 en diferentes empresas metal mecánicas
  • 75.
    EJERCICIOS PARA ALUMNOSA continuación se presentan algunos ejercicios para que los resuelvas y los entregues al facilitador del módulo
  • 76.
    Ejercicio # 1Aplicaciones pág. 55, Estadística para Administración y Economía Anderson, Sweeney y Williams (THOMSON) La conclusión de una encuesta en 40 estados, que llevó a cabo el Joint Council on Economic Education fue que los alumnos no aprenden suficiente economía. Las conclusiones se basaron en resultados de pruebas a los alumnos de 2do. y 3ero. de Preparatoria, cada una con 46 preguntas de opción múltiple de respuesta acerca de conceptos económicos básicos, como por ejemplo las utilidades y la ley de la oferta y la demanda. La tabla siguiente es una muestra de datos sobre la cantidad de preguntas contestadas en forma correcta
  • 77.
    Continuación Ejercicio #1Aplicaciones pág. 55, Estadística para Administración y Economía Anderson, Sweeney y Williams (THOMSON) 12 10 16 24 12 14 18 23 31 14 15 19 17 9 19 28 24 16 21 13 20 12 22 18 22 18 30 16 26 18 16 14 8 25 22 15 33 24 17 19
  • 78.
    Continuación del Ejercicio#1: Resuma estos datos empleando: a) Un diagrama de tallo y hojas b) Una distribución de frecuencias c) Una distribución de frecuencias relativas d) Una distribución de frecuencias acumuladas e) Con base en estos datos, ¿concuerda usted con la afirmación de que los alumnos no aprenden suficiente economía? Explique su respuesta
  • 79.
    Ejercicio # 2Aplicaciones pág. 37, Estadística para Administración y Economía Anderson, Sweeney y Williams (THOMSON) El personal de un consultorio ha estudiado los tiempos de espera de pacientes que llegan solicitando servicio de emergencia. Los siguientes datos fueron reunidos en un periodo de un mes, con los tiempos de espera en minutos 2 5 10 12 4 4 5 17 11 8 9 8 12 21 6 8 7 13 18 3 Emplee clases de 0 a 4, 5 a 9, etc. a) Forme la distribución de frecuencias b) Forme la distribución de frecuencias relativas c) Forme la distribución de frecuencias acumuladas d) Forme la distribución de frecuencias relativas acumuladas e) ¿Qué proporción de pacientes que necesitan servicio de emergencia tienen tiempo de espera de 9 minutos o menos?
  • 80.
    Ejercicio num. 3Aplicaciones pág. 55, Estadística para Administración y Economía Anderson, Sweeney y Williams (THOMSON) A continuación se presentan las temperaturas máxima y mínima diarias (en grados Farhenheit) para 20 ciudades del mundo. Ciudad Máxima Mínima Ciudad Máxima Mínima Atenas 75 54 Melbourne 66 50 Bangkok 92 74 Montreal 64 52 Cairo 84 57 París 77 55 Copenhagen 64 39 Río de Janeiro 80 61 Dublin 64 46 Roma 81 54 Habana 86 68 Seúl 64 50 Hong Kong 81 72 Singapur 90 75 Johanesburgo 61 50 Sydney 68 55 Londres 73 48 Tokyo 79 59 Manila 93 75 Vancouver 57 43
  • 81.
    Continuación del ejercicio# 3 a) Elabore un diagrama de tallos y hojas para las temperaturas máximas b) Elabore un diagrama de tallos y hojas para las temperaturas mínimas c) Compare los diagramas de tallos y hojas de los incisos (a) y (b) y haga comentarios acerca de las diferencias entre las temperaturas máxima y mínima diarias d) Use el diagrama de tallos y hojas del inciso (a) para determinar el número de ciudades con temperatura alta de 80°F o más e) Forme la distribución de frecuencias para los datos de temperatura máxima y mínima con sus respectivas gráficas
  • 82.
    Datos para elaboraruna Gráfica de Barras Múltiple Tenencia de acciones en E.U. por tipo de inversionista 1995 1996 1997 1998 Households $3,995 $4,525 $5,319 $6,300 Institutions $4,337 $5,538 $7,457 $9,138
  • 83.
    Gráfico de BarrasMúltiple elaborado en Excel
  • 84.
    Datos para elaboraruna Gráfica de Barras Nonrecreational Airplane Pilot Certificates Certificate Type Number (thousands) Student 97.736 Private 247.226 Commercial 122.053 Transport 134.612
  • 85.
  • 86.
    Datos para elaboraruna Gráfica de Líneas Ejemplo de los ingresos de la compañía Mc. Donald´s Año Ingresos Totales ($Billones de U.S.D.) 1993 1.08 1994 1.22 1995 1.43 1996 1.57 1997 1.64 1998 1.55 1999 1.95 2000 1.98 2001 1.64 2002 0.89
  • 87.
  • 88.
    La Gráfica dePastel Ejemplo de las ventas ($millones de U.S.D.) de la compañía Black & Decker Segment Sales Power Tools 3,209 Hardware & Home 882 Fasteners 498
  • 89.
  • 90.
    Diagrama de ParetoEn un diagrama de Pareto las respuestas categorizadas se trazan en orden descendente de acuerdo con sus frecuencias y se combinan con la línea de porcentaje acumulado en la misma gráfica. El diagrama de Pareto permite separar a lo “poco vital” de lo “mucho trivial”, lo que nos permite enfocarnos en las categorías importantes. En las situaciones en las que los datos en estudio consisten en información “defectuosa” o “incompleta”, el diagrama de Pareto se convierte en una herramienta valiosa para dar prioridad a los esfuerzos de mejoramiento
  • 91.
    Diagrama de ParetoEl análisis de Pareto es una técnica para llevar la cuenta del número de defectos que aparecen dentro de un producto o servicio. Su concepto, con frecuencia denominado regla 80-20, es que 80% de la actividad se debe a 20% de los factores. Al concentrarse en 20% de los factores, los gerentes pueden dedicarse a 80% del problema.
  • 92.
    Ejemplo de Aplicacióna través del Diagrama de Pareto La siguiente tabla presenta datos de una gran compañía de moldeado de inyección que produce componentes moldeados de plástico para teclados de computadora, lavadoras, automóviles y televisores. Los datos presentados consisten en todos los teclados de computadora defectuosos producidos durante un periodo de tres meses. Se presenta un resumen para los defectos de los teclados de computadora, en las que las categorías están ordenadas de acuerdo con el porcentaje (y no alfabéticamente). Los porcentajes acumulados para las categorías ordenadas también forman parte de la tabla.
  • 93.
    Tabla ordenada deresumen de las causas de los defectos en los teclados de computadora en un periodo de 3 meses Causa Frecuencia Porcentaje Porc. Acum. Deformación 1,987 31.42 31.42 Daño 1,039 16.43 47.85 Marca de clavijas 834 13.19 61.04 Rasguños 442 6.99 68.03 Mancha negra 413 6.53 74.56 Raya plateada 413 6.53 81.09 Marca de hundimiento 371 5.87 86.96 Marca de spray 292 4.62 91.58 Impacto en el molde 275 4.35 95.93 Embarque 258 4.08 100.00 Total 6,324 100.01
  • 94.
    Defectos en elteclado de Computadoras para un periodo de tres meses
  • 95.
    Interpretación del Diagramade Pareto La figura anterior presenta las barras de forma vertical a lo largo de al línea de porcentaje acumulado. La línea acumulativa está trazada en el punto medio de cada barra a una altura semejante al porcentaje acumulado. Si sigue la línea, verá, por ejemplo, que las 3 primeras categorías abarcan más del 60% de las correcciones. Como las categorías del diagrama de Pareto están ordenadas por la frecuencia de ocurrencia, quienes toman decisiones podrán ver dónde concentrar sus esfuerzos para mejorar el proceso. Los intentos de reducir los defectos por deformación, daño y marcas de clavijas deberán generar el mayor gasto. Después podrán hacerse esfuerzos para reducir los rasguños y las manchas negras.
  • 96.
    Cómo construir unDiagrama de Pareto utilizando el programa MINITAB Ejemplo: (pág. 715, Lind-Marchal, edit. Mc. Graw-Hill, 13ª. Edic) El administrador de una ciudad, está preocupado por consumo de agua, en particular en los hogares unifamiliares. Le gustaría desarrollar un plan para reducir el consumo de agua en esa ciudad. Para investigar esto, selecciona una muestra de 100 hogares y determina el consumo normal de agua diario para diversos fines. En la siguiente diapositiva se muestran los resultados de la muestra:
  • 97.
    Cómo construir unDiagrama de Pareto utilizando el programa MINITAB Consumo de agua Galones por día Lavandería 24.9 Regar el jardín 143.7 Baño personal 106.7 Cocinar 5.1 Alberca 28.3 Lavar trastos 12.3 Lavar automóvil 10.4 Beber 7.9
  • 98.
    Pasos para realizarel Diagrama de Pareto en Minitab Un diagrama de Pareto es útil para identificar las áreas principales de consumo de agua y enfocarse en aquéllas donde se obtenga la mayor reducción. Es conveniente convertir cada actividad en porcentaje y luego, ordenarlas de mayor a menor. El consumo total de agua es de 339.3 galones
  • 99.
    Paso # 1 Escriba las razones del consumo de agua en la columna C 1 , los galones consumidos en C 2 y el porcentaje en C 3 . Anote los nombres adecuados en cada columna
  • 100.
    Paso 2 : Haga clic en Stat, Quality Tols, Pareto Chart y luego oprima enter
  • 101.
    Paso 3 :seleccione Chart defects table , e indique la ubicación de las clasificaciones y frecuencias
  • 102.
    Paso 4: Seanotan los datos de las columnas tal como se indicó en el paso anterior, en Chart defects table
  • 103.
    Paso 5: Hagaclic en Options y escriba el título de la gráfica, después haga clic en OK
  • 104.
    Paso 6 Seobserva como resultado de los pasos anteriores la gráfica del diagrama de Pareto
  • 105.
    Matriz de datosy la Tabla de distribución de Frecuencias Cuando los datos son cuantitativos, dos de las formas en que podemos organizar los datos son: a) La matriz de datos b) La tabla de distribución de frecuencias
  • 106.
    Representación de datosA continuación se lista la tasa de natalidad (nacimientos por cada 1000 habitantes) para 105 países. Al examinar estas cifras, observamos que algunos países tenían una tasa de natalidad más alta que otros. Si quisiéramos aprender más de esta información, sería útil que los datos se listaran de un modo más ordenado.
  • 107.
    (A) Datos originales42.7 29 45.1 19.5 14.1 11.2 22.1 34.6 13 11.5 47.3 31.6 21.2 11.8 48.1 28 43.4 44.4 40.4 13.7 42.1 20.3 17.8 21.9 46.2 14.5 13.5 12.4 24.1 25.1 28.7 32.4 46.7 12.2 13 15.8 11 43.6 10.6 34.7 43.4 38.6 34.1 12 12.7 27.8 24.1 34.9 43.6 20.4 10.9 10.7 19.3 41.7 23.3 15.6 44.9 44.8 49.8 28 51.9 26.6 27.9 44.6 37.3 12.4 54.8 43.3 41.8 31.5 24.9 30.4 13.3 11.7 13.7 12.6 48.5 38.8 42.9 14.2 14.5 45.5 33.4 11.2 18.1 41.3 13.2 12 43.2 15.3 34.1 45.3 18.9 22.5 25.3 48 12.3 13.2 29.5 25.1 26.3 44.9 48.3 45.5 36.4
  • 108.
    b) Matríz dedatos (de menor a mayor) 10.6 12.6 15.6 24.1 31.5 41.7 44.9 10.7 12.7 15.8 24.9 31.6 41.8 45.1 10.9 13 17.8 25.1 32.4 42.1 45.3 11 13 18.1 25.1 33.4 42.7 45.5 11.2 13.2 18.9 25.3 34.1 42.9 45.5 11.2 13.2 19.3 26.3 34.1 43.2 46.2 11.5 13.3 19.5 26.6 34.6 43.3 46.7 11.7 13.5 20.3 27.8 34.7 43.4 47.3 11.8 13.7 20.4 27.9 34.9 43.4 48 12 13.7 21.2 28 36.4 43.6 48.1 12 14.1 21.9 28 37.3 43.6 48.3 12.2 14.2 22.1 28.7 38.6 44.4 48.5 12.3 14.5 22.5 29 38.8 44.6 49.8 12.4 14.5 23.3 29.5 40.4 44.8 51.9 12.4 15.3 24.1 30.4 41.3 44.9 54.8
  • 109.
    c) Tabla deDistribución de Frecuencias (número de países en cada categoría) Nacimientos (por cada 1000 habitantes) Número de países 10 – menos de 15 29 15 – menos de 20 8 20 – menos de 25 10 25 – menos de 30 12 30 – menos de 35 10 35 – menos de 40 4 40 – menos de 45 18 45 – menos de 50 12 50 – menos de 55 2
  • 110.
    La matriz dedatos En comparación con la lista original de datos, la matriz de datos es útil porque presenta los datos en orden numérico creciente o decreciente. VENTAJAS: 1) Podemos determinar de un vistazo el menor y el mayor valor de los datos. Observamos con facilidad que las tasas de natalidad van desde un mínimo de 10.6 (Grecia) hasta un máximo de 54.8 (Nigeria) 2) Podemos identificar grupos de valores de datos similares. Por ejemplo, observamos que tres países tenían una tasa de natalidad menor que 11 y que dos tenían una tasa de natalidad mayor que 50 3) Apreciamos las diferencias entre los valores de los datos. Por ejemplo, el país con la más alta tasa de natalidad (54.8) está 2.9 unidades por encima del segundo lugar (51.9)
  • 111.
    Tasa de natalidadde 105 países 10.6 12.6 15.6 24.1 31.5 41.7 44.9 10.7 12.7 15.8 24.9 31.6 41.8 45.1 10.9 13 17.8 25.1 32.4 42.1 45.3 11 13 18.1 25.1 33.4 42.7 45.5 11.2 13.2 18.9 25.3 34.1 42.9 45.5 11.2 13.2 19.3 26.3 34.1 43.2 46.2 11.5 13.3 19.5 26.6 34.6 43.3 46.7 11.7 13.5 20.3 27.8 34.7 43.4 47.3 11.8 13.7 20.4 27.9 34.9 43.4 48 12 13.7 21.2 28 36.4 43.6 48.1 12 14.1 21.9 28 37.3 43.6 48.3 12.2 14.2 22.1 28.7 38.6 44.4 48.5 12.3 14.5 22.5 29 38.8 44.6 49.8 12.4 14.5 23.3 29.5 40.4 44.8 51.9 12.4 15.3 24.1 30.4 41.3 44.9 54.8
  • 112.
    Pasos para haceren Excel la Matriz de Datos 1. Acomodar en una sola columna los datos 2.- Seleccionar: Herramientas, Análisis de Datos, “Rango y Percentiles” y Aceptar 3.- En el Rango de entrada: seleccionar los datos dependiendo de la columna donde se encuentren 4.- Agrupar por columnas 5.- Si tenemos en la columna algún nombre, seleccionar “etiquetas en la primera fila” 6.- En Rango de salida: darle clic a cualquier casillero donde queramos que aparezcan los resultados de la matriz
  • 113.
    Resultados parciales delExcel de la matriz de datos Posición TASA DE NATALIDAD Jerarquía Porcentaje 105 54.8 1 100.00% 104 51.9 2 99.00% 103 49.8 3 98.00% 102 48.5 4 97.10% 101 48.3 5 96.10% 100 48.1 6 95.10% 99 48 7 94.20% 98 47.3 8 93.20% 97 46.7 9 92.30% 96 46.2 10 91.30% 94 45.5 11 89.40% 95 45.5 11 89.40% 93 45.3 13 88.40% 92 45.1 14 87.50% 90 44.9 15 85.50%
  • 114.
    “ Tabla deDistribución de Frecuencia” Presenta los datos de una manera condensada que se comprende con rapidez y se interpreta con facilidad En el programa EXCEL anotamos lo siguiente: a) Escribimos “clase” en la celda C1 b) Introduzca las divisiones de las clases: de 10 a 55 en múltiplos de 5 en alguna de las celdas (D24-D33) por ejemplo c) Haga clic en: Herramientas, Análisis de Datos. seleccione: Histograma y OK d) Escriba el rango de datos: A1:A106 en el Rango de Entrada Escriba en el Rango de clases: D24-D33 Haga clic para marcar el cuadro de etiquetas (si cada variable tiene su nombre en la primera celda de su bloque) e) Seleccione Rango de salida: E23
  • 115.
    Continuación de latabla de distribución de frecuencias en Excel f) Haga clic para marcar el cuadro: Porcentaje Acumulado Haga clic para marcar el cuadro: Crear Gráfica Haga clic en Aceptar (OK) h) Dentro de la gráfica, haga clic con botón derecho e irse a opciones de gráfico En Eje de categorías escribir: Tasa de Natalidad Haga doble clic en cualquiera de las barras de la gráfica Seleccione Opciones y ponga Ancho de separación en 0 Haga clic en Aceptar
  • 116.
    TABLA DE DISTRIBUCIÓNDE FRECUENCIAS (EXCEL)
  • 117.
    INFORMACIÓN QUE APARECEJUNTO CON LA TABLA DE DISTRIBUCIÓN DE FRECUENCIAS (EXCEL) CLASE 10 Frecuencia % acumulado 10 Frecuencia % acumulado 10 15 29 27.62% 15 29 27.62% 15 20 8 35.24% 45 18 44.76% 20 25 10 44.76% 30 12 56.19% 25 30 12 56.19% 50 12 67.62% 30 35 10 65.71% 25 10 77.14% 35 40 4 69.52% 35 10 86.67% 40 45 18 86.67% 20 8 94.29% 45 50 12 98.10% 40 4 98.10% 50 55 2 100.00% 55 2 100.00% 55 y mayor... 0 100.00% y mayor... 0 100.00%
  • 118.
    FORMAS DE LASCURVAS DE FRECUENCIA CALIFICACIÓN FRECUENCIA CALIFICACIÓN FRECUENCIA CALIFICACIÓN FRECUENCIA CALIFICACIÓN FRECUENCIA EN FORMA DE CAMPANA RECTANGULAR O UNIFORME EN FORMA DE U EN FORMA DE J
  • 119.
    FORMAS DE LASCURVAS DE FRECUENCIA FRECUENCIA FRECUENCIA CALIFICACIÓN CALIFICACIÓN SESGO POSITIVO SESGO NEGATIVO SESGO POSITIVO : LA MAYOR PARTE DE LOS DATOS SE CONCENTRA EN LOS VALORES BAJOS DEL EJE HORIZONTAL Y LA CURVA DISMINUYE HACIA EL EXTREMO DE LOS VALORES ALTOS SESGO NEGATIVO : LA MAYOR PARTE DE LOS DATOS SE CONCENTRA EN LOS VALORES ALTOS DEL EJE HORIZONTAL Y LA CURVA SE REDUCE HACIA EL EXTREMO DE LOS VALORES BAJOS
  • 120.
    TÉCNICAS DE OBSERVACIÓNDE FENÓMENOS O HECHOS
  • 121.
  • 122.
  • 123.
    PASOS PARA LASELECCIÓN DE UNA MUESTRA
  • 124.
  • 125.
    ESTRATEGIA DE MUESTREOPROBABILÍSTICA
  • 126.
    ESTRATEGIA DE MUESTREONO PROBABILÍSTICA
  • 127.
    Técnicas de MuestreoHay dos maneras de elegir los individuos de la muestra: Por muestreo Probabilístico Por muestreo No Probabilístico Solamente el muestreo Probabilístico permite generalizar (con determinado margen de error) en la población total los resultados obtenidos (hacer inferencias) El muestreo No Probabilístico no autoriza la generalización
  • 128.
    Requisitos para queuna muestra sea representativa en un estudio Para que una realmente la muestra sea representativa deberá cumplir con los requisitos que marca la teoría de la probabilidad, es decir: ¡ QUE SEAN ELEGIDOS AL AZAR !
  • 129.
    Cálculo del tamañode la Muestra El cálculo del tamaño de una muestra depende de 3 factores: El porcentaje de confianza con que se desea generalizar los datos en la población total El porcentaje de error que se está dispuesto a aceptar en tal generalización El nivel de variabilidad que se calcula para la comprobación de la hipótesis
  • 130.
    Porcentaje de ConfianzaEl 100% de confianza para generalizar los resultados indicaría que todos los individuos de la población, sin excepción, comparten las conclusiones obtenidas del estudio de los individuos de la muestra. Pero para lograr 100% de confianza hay que estudiar todos los casos de la población. Como esto resulta costoso en tiempo y dinero, lo que se hace es tolerar que haya algunos sujetos de cada cien (de la población) que no compartan las conclusiones del estudio de la muestra
  • 131.
    …… porcentajede confianza Si se eligiera 80% de confianza en la selección de una muestra, el tamaño resultante indicaría: Que existe la seguridad de generalizar sólo 80% de sujetos de la población. Cuanto mayor sea el % de confianza que se escoja, mayor será la cantidad de sujetos necesarios para la muestra. En investigaciones de tipo social, por lo general, se busca un 95% de confianza
  • 132.
    Porcentaje de errorElegir el porcentaje de error significa seleccionar la probabilidad de aceptar una hipótesis falsa, o a la inversa: rechazar una hipótesis verdadera Si se buscara un 0% de error, significaría que no se está dispuesto a correr este tipo de riesgos y entonces, la muestra podría ser igual a la población, por tanto, es preferible aceptar algún riesgo. Es frecuente que los investigadores acepten de 4 a 8% de error. Por ejemplo: 4 % de error significa que existen 4 de 100 posibilidades de equivocarse. NOTA : No debe entenderse que el porcentaje de error es complementario del porcentaje de confianza: ejemplo: se puede tener 96% de confianza y 6% de error
  • 133.
    Variabilidad Cuando seha aplicado el instrumento de recolección de datos en otros estudios, se puede esperar que la nueva contrastación en otro lugar sea similar a las anteriores. Ejemplo: suponga que se aplicó un cuestionario y se obtuvo que el 70% de los sujetos de la muestra confirmó la hipótesis, mientras que las respuestas del otro 30% sugerían que la hipótesis debía rechazarse. Suele darse un valor simbólico a la variabilidad : Se usa “p” para indicar los cuestionarios a favor de la hipótesis = 70% Se usa “q” para indicar los cuestionarios en contra de la hipótesis = 30% resumiendo: p = 0.7 y q = 0.3
  • 134.
    Variabilidad En casode que no se haya aplicado nunca el instrumento de recolección, se pueden seleccionar algunas personas de la población a encuestar (digamos 20 por ejemplo) para que contesten el instrumento y analizar sus respuestas a fin de conocer el grado de variabilidad que se espera en la población. Cuando no se dispone de tiempo suficiente para realizar esta «preprueba» o «piloteo» lo que se recomienda es aceptar la máxima variabilidad que consiste en: p = 0.5 y q = 0.5
  • 135.
    TAMAÑO DE LAMUESTRA Cuando se desconoce el tamaño de la población Fórmula: n= (Z 2 pq) (e 2 ) Donde: n = tamaño de la muestra Z 2 = nivel de confianza p = variabilidad positiva q = variabilidad negativa e 2 = precisión o error
  • 136.
    Ejemplo del cálculodel tamaño de la muestra cuando se desconoce el tamaño de la población Datos: Nivel de confianza del 95%: Z = 1.96 (tablas de curva normal) Máxima variabilidad: p= 0.5 y q = 0.5 Nivel de error = 5% = 0.05 n = (1.96) 2 (0.5)(0.5) = 384.16 (.05) 2
  • 137.
    TAMAÑO DE LAMUESTRA Cuando se conoce el tamaño de la población Fórmula: n = (Z 2 pq N)__ (Ne 2 + Z 2 pq) Donde: n = Tamaño de la muestra Z = nivel de confianza p = variabilidad positiva q = variabilidad negativa N = tamaño de la población e = precisión o error
  • 138.
    CÁLCULO DEL TAMAÑODE LA MUESTRA Cuando se conoce el tamaño de la población Datos: n = Tamaño de la muestra = ? Z = nivel de confianza = 95% = 1.96 p = variabilidad positiva = 0.5 q = variabilidad negativa = 0.5 N = tamaño de la población = 11,730 e = precisión o error = 5% = 0.05 n = [(1.96 2 ) (0.5)(0.5)(11,730)] [(11,730)(.05 2 ) + (1.96 2 )(0.5)(0.5)] n = 371.977
  • 139.
    Ejercicios para elalumno 1.- Calcule el tamaño de una muestra en que se pide 4% de error, 94% de confiabilidad y la máxima variabilidad 2.- Con estos mismos datos del ejercicio anterior, calcule el tamaño de una muestra en la que además, se conoce que el tamaño de la población es de 3,267 3.- Calcule el nivel de error si tenemos 250 elementos en la muestra, 92 % de confiabilidad y variabilidad positiva del 60% 4.- Calcule el nivel de confianza si tenemos un nivel de error del 3%, la muestra se compone de 500 elementos y existe una máxima variabilidad
  • 140.
    ¿A quiénes dela población se debe escoger si ya tenemos la muestra calculada? Para esta situación, se tienen diversas técnicas de muestreo Tipos (técnicas) de Muestreo : a) Probabilístico : consiste en escoger al azar cada uno de los individuos en la muestra b) No probabilístico : este tipo de muestreo no permite generalizar los resultados a la población, por tanto se usa en estudios de tipo exploratorios, de casos o cualquier otro que no requiera generalizar
  • 141.
    Muestreo Probabilístico Técnicas:muestreo aleatorio simple, muestreo aleatorio estratificado y muestreo sistemático a) Muestreo aleatorio simple : garantiza, en teoría, que cada uno de los individuos de la población tenga la misma oportunidad de aparecer en la muestra. Por ejemplo : se selecciona totalmente al azar a los sujetos de una población, escribimos su nombre en un papelito, luego todos los nombres se ponen en una esfera abierta, se revuelven y después se van sacando de uno en uno hasta completar la cantidad deseada. Otra manera de hacerlo es a través de generar números aleatorios para conformar la muestra necesaria de una población Por ejemplo para generar números aleatorios menores que 100 escribimos en el programa excel: =ALEATORIO()*100
  • 142.
    Paso I: Imagende una hoja en el programa Excel para empezar a generar números aleatorios menores que 100
  • 143.
    Paso II Vamosa suprimir las decimales que aparecen en la generación de los números aleatorios, dando clic botón derecho a la celda generada
  • 144.
    Paso III secuenciapara quitar los decimales que aparecen en las celdas
  • 145.
    Paso IV Yagenerado el primer número aleatorio, podemos copiar desde la primer celda hacia abajo la cantidad que se requiera
  • 146.
    Uso del Análisis de Datos en Excel Muestreo Aleatorio Simple Las sritas. Alexandra y Myriam administran “El Popeye Inn”, una pensión donde dan alojamiento y desayuno, localizada en cd. Guzmán, Jal. Se rentan ocho habitaciones en esta pensión. A continuación aparece el número de estas ocho habitaciones rentadas diariamente durante el mes de Octubre del 2009. Utilice el programa “Análisis de datos” en Excel para seleccionar una muestra de cinco noches de Octubre
  • 147.
    Tabla con losdatos de las habitaciones en renta en el mes de Octubre del 2009, en la pensión “El Popeye Inn”
  • 148.
    Paso 1 :en el Análisis de Datos de Excel para seleccionar una muestra de 5 noches de Octubre: dar clic en: Datos, Análisis de datos y Muestra
  • 149.
    Paso 2: llenar el cuadro de la Muestra : Rango de entrada: B1: B31; dar clic en Rótulos Método de muestreo: Aleatorio Número de muestras: 5 Rango de Salida: D1
  • 150.
    Paso 3: Revisarque la información capturada esté correcta posteriormente darle clic en Aceptar
  • 151.
    Paso 4: Larespuesta por parte del programa Excel es la siguiente NOTA: Excel toma muestras con reemplazo, así que es posible que el valor de una población aparezca más de una vez en la muestra
  • 152.
    b) Muestreo aleatorioestratificado (muestreo probabilístico) Implica el mismo procedimiento que el aleatorio simple; la diferencia radica en que la población se subdivide en grupos o estratos más pequeños. Por ejemplo : encuestar a los trabajadores de una empresa de polímeros. La subdividimos en obreros y empleados administrativos. El total de trabajadores es = 836 El estrato de obreros es = 489 El estrato de empleados = 347 Confiabilidad = 90% Precisión o error = 5% Máxima variabilidad: p = 0.5 y q = 0.5
  • 153.
    b) Muestreo aleatorioestratificado (muestreo probabilístico) Fórmula: n = (Z 2 pq N)/(Ne 2 + Z 2 pq) Cálculo: n = [(1.65 2 )(0.5)(0.5)(836)] = 205.34 [(836)(.05 2 ) + (1.65 2 )(0.5)(0.5)] Cálculo de la cantidad de elementos en los estratos: % obreros = (489/836) = 0.5849 % administrativos = (347/836) = 0.415 Muestra estratificada: Obreros: 205.34 (0.5849) = 120 Empleados: 205.34 (0.415) = 85
  • 154.
    Tabla de lamuestra estratificada Población Tamaño de población por estratos Tamaño de muestra por estratos Obreros 489 120 Empleados 347 85 Total 836 205
  • 155.
    Muestreo no probabilísticoLas técnicas de muestreo no probabilísticos que vamos a estudiar son dos: 1.- MUESTREO POR CUOTAS 2.- MUESTREO POR ACCIDENTE Nota: hay que recordar que este tipo de muestreo no permite generaliza r los resultados a la población. Este tipo de muestreo se usa en estudios de tipo: EXPLORATORIO DE CASOS CUALQUIER OTRO TIPO QUE NO REQUIERA GENERALIZAR
  • 156.
    Muestreo por CUOTAS(no probabilístico) En el muestreo por cuotas se determina la cantidad (cuota) de individuos de una población, para que sean miembros de la muestra. No hay un procedimiento especial para establecer la cuota. El criterio es arbitrario, simplemente puede determinarse encuestar, por ejemplo, a 35 hombres y a 35 mujeres que compartan ciertas características específicas según la definición que el estudio señale.
  • 157.
    Muestreo por accidente(no probabilístico) Consiste en seleccionar de manera arbitraria los individuos para la muestra. Por ejemplo , los investigadores que se van a una plaza comercial y, sin ningún otro criterio, encuestan a cualquier persona que se encuentre de paso por ahí. Por eso se denomina muestreo accidental . Las conclusiones que obtenga el investigador con este tipo de muestreo impiden suponer que «las personas que van a la plaza comercial piensan y opinan de tal forma», ya que la muestra no es aleatoria.
  • 158.
    Técnicas de Recolecciónde Datos Objetivo Presentar un procedimiento para diseñar instrumentos de recolección: desde la hipótesis hasta el instrumento
  • 159.
    Técnicas e instrumentosde recolección Método : es el camino que se que se sigue para lograr una meta u objetivo; es el procedimiento que se recorre en la investigación para obtener conocimientos. Cabe mencionar que existen muchos métodos y, por ello, una gran variedad de formas de lograr los objetivos. Es casi imposible hablar de «todos los pasos» de cada método, ya que dependen del objeto de estudio y de los objetivos que se pretendan alcanzar en una investigación
  • 160.
    Técnicas e instrumentosde recolección Técnica se define como: «un conjunto de reglas y operaciones para el manejo de los instrumentos que auxilian al individuo en la aplicación de los métodos» (Rojas Soriano, R. 1991, p.63) El instrumento puede entenderse como el dispositivo o conector que permite captar los datos que se obtendrán para, después de analizarlos, decidir si se acepta o se rechaza la hipótesis de investigación. Ejemplo de Instrumento : Un cuestionario
  • 161.
    Técnicas e instrumentosde recolección La captación de datos es válida, si el o los instrumentos se aplican con las condiciones de la técnica respectiva. Por ejemplo: Que un conjunto de personas conteste un cuestionario ( instrumento ), a través de la indicación de las normas técnicas de la encuesta (indicaciones iguales a todos, un tiempo igual para contestar, condiciones iguales de aplicación, etc). El instrumento es sólo el listado de preguntas. Hacer que los datos sean válidos y confiables depende de que se sigan los preceptos de la técnica, en este caso de la encuesta.
  • 162.
    Instrumentos de recolecciónde datos Operacionalización es el nombre que recibe el proceso mediante el cual se determina el instrumento El término &quot;Indicador&quot; en el lenguaje común, se refiere a datos esencialmente cuantitativos, que nos permiten darnos cuenta de cómo se encuentran las cosas en relación con algún aspecto de la realidad que nos interesa conocer. Los Indicadores pueden ser medidas, números, hechos, opiniones o percepciones que señalen condiciones o situaciones específicas.
  • 163.
    ¿Cuál es laimportancia de los indicadores? Permite medir cambios en esa condición o situación a través del tiempo. Facilitan mirar de cerca los resultados de iniciativas o acciones Son instrumentos muy importantes para evaluar y dar surgimiento al proceso de desarrollo. Son instrumentos valiosos para orientarnos de cómo se pueden alcanzar mejores resultados en proyectos de desarrollo.
  • 164.
    Ejemplos de indicadoresAdministrativos: Eficiencia, efectividad y eficacia Económicos: PIB, inflación, Devaluación, tasa de interés, exportaciones, imprtaciones, IED, tasa de la deuda neta del Gobierno Federal (% PIB), tipo de cambio, etc. Calidad : satisfacción del cliente, evaluación, seguimiento y comparación de los servicios, tiempo de entrega, tiempo de demora. Salud: la tasa de hemorragias cerebrales en pacientes con infarto agudo de miocardio sometidos a fibrinolisis; número de pacientes que reingresa en urgencias en las 48 siguientes al alta o proporción de salidas falsas en servicios de emergencia.
  • 165.
    Técnicas e instrumentosde recolección Los analistas utilizan una variedad de métodos a fin de recopilar los datos sobre una situación existente, como Observación Entrevista Encuesta Tests Cuestionarios Generalmente, se utilizan dos o tres para complementar el trabajo de cada una y ayudar a asegurar una investigación completa
  • 166.
    Técnicas de recolecciónde datos: « Observación » La observación es por excelencia la técnica de investigación de cualquier ciencia La observación científica se define como: «la percepción dirigida de los objetos o fenómenos de la realidad» Para la Observación , se pueden emplear los siguientes instrumentos para recolectar datos: El cuaderno de notas El diario Grabador y reproductor de sonidos Video-grabadora
  • 167.
    Técnicas de recolecciónde datos: « Observación » En el acto de la observación se puede distinguir: El objeto de la observación El sujeto de la observación Los medios para la observación Las condiciones de la observación El sistema de conocimientos a partir del cual se formula la finalidad de la observación y se interpretan los resultados de ésta
  • 168.
    Técnicas de recolecciónde datos: « Tipos de Observación » Observación No participante : En este paradigma de observación el investigador intenta actuar como una cámara fotográfica, como una mente con manos que registra la naturaleza tal como ocurre, sin perturbarla o modificándola lo menos posible. La objetividad consiste en que el observador se convierta casi en una máquina que únicamente registre lo que ve y oye.
  • 169.
    Técnicas de recolecciónde datos: « Tipos de Observación » Observación participante : Se parte del supuesto, en las ciencias sociales, de que « lo observado » tiene las mismas características que el observador y, por ello, es mucho más difícil ser objetivos. Cuando se actúa con el mismo esquema de objetividad que en las ciencias naturales se pierde objetividad, debido a que se capta al sujeto de manera distorsionada, es decir, « participa » con los sujetos que observa.
  • 170.
    Técnicas de recolecciónde datos: « Tipos de Observación » El observador participante tiene que cumplir dos papeles o roles: Ubicarse como uno más entre los objetos que observa Por otra parte, excluirse para registrar, de la forma más objetiva, lo que allí ocurre
  • 171.
    Técnicas e instrumentosde recolección « Entrevista Abierta » Entrevista abierta o no estructurada Se trata de una conversación que dirige el entrevistado, pero que controla el entrevistador. Este tipo de entrevistas se privilegian en la investigación clínica. Generalmente, el entrevistado informará respecto de sí mismo: su desempeño, capacidad, personalidad, síntomas o enfermedades, etc. según el tipo de especialista que lo entrevista. La información vertida se analiza y se evalúa después.
  • 172.
    Técnicas e instrumentosde recolección « Entrevista Abierta » En la mayor parte de los estudios lo más común es la entrevista semiabierta. Esto significa que sí se tipifican algunas preguntas que sirven como guía de la entrevista (instrumento), pero que conforme se formulan pueden conducir a otras no previstas inicialmente. Esto es más común en profesionales como periodistas, trabajadores sociales, sociólogos, economistas, entre otros.
  • 173.
    Técnicas e instrumentosde recolección « Entrevista Cerrada » Se conduce de manera rígida por medio de una lista de preguntas que funciona como una guía, de la cual el entrevistador no puede desviarse. El entrevistador memorizará un formulismo que repetirá exactamente igual con todos sus entrevistados. Este tipo de entrevistas, por ejemplo, puede tener el propósito de recabar opiniones de grupos con características similares para conocer su posición respecto de algo o bien recabar opiniones de grupos diferentes para comparar efectos de alguna decisión tomada antes
  • 174.
    Técnicas e instrumentosde recolección « Entrevista Cerrada » En este tipo de entrevistas, el instrumento es exactamente igual que el de una encuesta. La diferencia consiste en que, en esta técnica de recolección, el entrevistador contesta el cuestionario, no el entrevistado. Suele usarse para censos en que se parte del supuesto de que no todas las personas saben leer
  • 175.
    Técnicas e instrumentosde recolección « Encuesta » La técnica de la encuesta consiste en la interrogación sistemática de individuos a fin de generalizar. Se usa para conocer la opinión de un determinado grupo de personas respecto de un tema que define el investigador. Se usa principalmente para conocer la opinión de las personas respecto a una variedad de temas: servicios públicos, desempeño de profesores en una universidad, productos comerciales, etc.
  • 176.
    Técnicas e instrumentosde recolección « Encuesta » En la técnica de la encuesta, primero se selecciona una cantidad de sujetos que sea representativa de la población (o clase de sujetos) de interés. Esa muestra contestará un cuestionario (instrumento) y después la información recabada se usará para generalizar a todos los individuos de la población Al procedimiento de seleccionar sólo algunos sujetos de la población se le denomina «muestreo».
  • 177.
    Diseño de CuestionarioEl cuestionario es el listado de preguntas que deberán contestar los sujetos de la muestra. Las preguntas o los reactivos que contiene el instrumento se deducen de las hipótesis y de los objetivos de la investigación. El instrumento de la encuesta o cuestionario debe diseñarse de modo que resulte de fácil comprensión y que no sea necesaria ninguna información adicional.
  • 178.
    Diseño de CuestionarioAntes de escribir las preguntas debe decidirse si para lograr los objetivos y probar las hipótesis es más conveniente usar preguntas cerradas o abiertas, o bien una combinación de ambas.
  • 179.
    Preguntas cerradas Sellama pregunta cerrada a la que proporciona opciones de respuesta para que el sujeto respondedor elija la que más se acerque a su situación. El investigador puede diseñar diferentes formas de preguntas cerradas: Opción mutuamente excluyente Opción múltiple con más de una elección Elección de un número determinado de opciones Ordenación jerárquica de opciones
  • 180.
    Preguntas cerradas Opciónmutuamente excluyente En esta opción el encuestado deberá seleccionar una de las dos o más opciones de respuesta. Por ejemplo: verdadero o falso; si o no; solero, casado, divorciado, viudo etc. Lo importante es que al elegir una se excluyan las demás.
  • 181.
    Preguntas cerradas 2) Opción múltiple con más de una elección El encuestado elige más de una opción, por ejemplo, ante la indicación: «de las siguientes materias, subraya las que te gusten más: Matemáticas Psicología Economía Administración Literatura» Nota: aquí el respondedor pude elegir más de una opción
  • 182.
    Preguntas cerradas 3) Elección de un número determinado de opciones En este caso, las preguntas podrían ser como en el caso # 2, con la única diferencia de que se indica la cantidad y el orden en la instrucción Una opción de pregunta sería la siguiente: «enumere en orden de importancia las tres materias que le gusten más»
  • 183.
    Preguntas cerradas 4) Ordenación jerárquica de opciones Aquí se ofrecen opciones de respuesta que el sujeto debe numerar en orden de importancia, según su opinión. La diferencia entre este tipo de ítem y el anterior consiste que en éste se deben ordenar todas las opciones
  • 184.
    Preguntas Abiertas Laspreguntas abiertas son las que se formulan sin escribir opciones de respuesta. En éstas el encuestado contestará lo que le parezca pertinente. Este tipo de preguntas se usan con mayor frecuencia en los estudios exploratorios. Habrá tantas respuestas como personas encuestadas. Es usual clasificar las respuestas en grupos, de acuerdo con un criterio que impone el investigador, según lo requiera el estudio. Este procedimiento recibe el nombre de cerrar preguntas
  • 185.
    Redacción de laspreguntas Debe cuidarse en el diseño del cuestionario la redacción de las preguntas (ítems o reactivos). Aunque los indicadores estén bien definidos, de acuerdo con el marco referencial de la investigación, es preciso que el lenguaje se adecue al tipo personas que se consultarán. La redacción de las preguntas debe ser sencilla, clara y concisa. Evitar en lo posible cansar al que responde el cuestionario con preguntas que exigen de él muchos datos .
  • 186.
    Redacción de laspreguntas La pregunta debe redactarse con ideas afirmativas, evitando negaciones. Por ejemplo: ¿no está satisfecho con su empleo actual? Será mejor cambiarla por: ¿está satisfecho con su empleo actual? Es mejor la redacción desprovista de carga emocional, es decir, seleccionar palabras que no sean peyorativas (que indica una idea desfavorable o despectiva) Redactar la pregunta de manera que no sugiera la respuesta Deben evitarse las preguntas en las que sea muy probable que todos contesten igual. Por ejemplo: ¿te gustaría ganar más sueldo? Deben evitarse las preguntas sin relación directa con el estudio actual (de relleno)
  • 187.
    Validez y Confiabilidadde un cuestionario Validez: Es la capacidad de captar de manera significativa y con un grado de exactitud satisfactoria, las variables de la hipótesis que se ponen a prueba. Se trata que el instrumento mida aquello para lo que se diseñó. Cuando existe otro instrumento validado, se aplican ambos y luego se comparan los resultados, así se juzga el nivel de precisión con que el cuestionario capta aquello para lo que se diseñó. En la mayoría de las veces, no se cuenta con este recurso de comparación externa.
  • 188.
    Validez y Confiabilidadde un cuestionario … . Validez Una segunda manera de validar un cuestionario es aplicarlo a personas con actitud conocida, conocimiento u opinión respecto al tema que el instrumento mide y comprobar su validez de ese modo Una tercera forma, es la «administración de los reactivos o preguntas a jueces». Este método parte del supuesto de que todo instrumento de recolección es producto del proceso de operacionalización.
  • 189.
    Derivación de uncuestionario a partir de la operacionalización de variables A B a1 a2 b1 b2 Variables dimensiones indicadores Las preguntas del cuestionario captan todos los indicadores
  • 190.
    Confiablidad La confiabilidades la capacidad de un instrumento de arrojar resultados equivalentes entre los que responden, independientemente de quién lo aplique Para lograr esto, el instrumento (cuestionario) debe aplicarse exactamente en las mismas condiciones a todos los sujetos. Esto significa que cada uno recibe una copia del mismo instrumento y, por tanto, la presentación y el orden de las preguntas será el mismo para todos. Se deben cuidar las condiciones de aplicación: espacio, horario, iluminación, actitud del encuestado, etc.
  • 191.
    Confiablidad Cuando quienesestán respondiendo un cuestionario preguntan mucho respecto de los ítems, se puede deducir que no está bien diseñado, ya que un buen instrumento no requiere información adicional. Para evitar este tipo de problemas debe realizarse una prueba piloto antes de la aplicación definitiva.
  • 192.
    Confiablidad Los cuestionarioscon preguntas cerradas pueden contener un promedio de 50 preguntas, sin que con ello se corran riesgos de sesgo debido al cansancio. Las preguntas abiertas suelen despertar incomodidad en quien responde, debido a que le exigen mayor cuidado y esfuerzo. Cuando el instrumento de recolección tiene preguntas abiertas, el agotamiento llega primero que con las cerradas, de modo que no es conveniente que incluya más de 20
  • 193.
    Confiablidad Si sequiere realizar otra prueba de confiabilidad se pueden seleccionar 2 muestras de la misma población y comparar los resultados. Si en ambas muestras las diferencias no son significativas, se deducirá que el instrumento es fiable.
  • 194.
    Preparación del Análisisdel cuestionario Se deben determinar el número y orden de las preguntas en el instrumento Se fotocopiará tantas veces necesario, según la cantidad de la muestra a analizar. Se deben de numerar cada uno de ellos Las preguntas abiertas es conveniente cerrarlas.
  • 195.
    Proceso del cierrede las preguntas abiertas Una vez que se aplica a todos los sujetos, los investigadores estudian las respuestas Esta actividad debe hacerse por separado (dos o más investigadores) para no viciar su interpretación Ante la misma pregunta los investigadores tipificarán o clasificarán los modos en que pueden agruparse las diferentes respuestas
  • 196.
    Proceso del cierrede las preguntas abiertas Por ejemplo ante las diferentes preguntas, un investigador puede clasificar las respuestas en digamos 10 modos distintos y otro investigador en 14 formas. Después de revisar encontrarán concordancias y divergencias respecto al modo de clasificar cada uno. Las concordancias se adoptan, mientras que las divergencias se pasan a un apartado con el título de “otras”
  • 197.
    FÓ RMULA PROBABILÍSTICAPARA DETERMINAR EL TAMAÑO DE LA MUESTRA
  • 198.
  • 199.
    PREPARACIÓN PARA LARECOPILACIÓN DE DATOS
  • 200.
    CONSTRUCCIÓN DE FORMASDE RECOPILACIÓN DE DATOS
  • 201.
    Ejemplo: los primeroscinco de 200 casos en el conjunto de puntajes de competencia
  • 202.
  • 203.
  • 204.
    Los 10 mandamientosde la recopilación de datos
  • 205.
  • 206.
    MEDIDAS DE TENDENCIACENTRAL Las medidas de tendencia central (también llamadas medidas de localización) son: Media aritmética, Mediana, Moda, cuartiles y percentiles Las medidas de variabilidad son: Rango, Desviación estándar y Varianza La tendencia central y la variabilidad son las dos características de las distribuciones que son objeto de cuantificación más frecuentemente
  • 207.
    Introducción Anteriormente analizamosla forma de organizar y presentar los datos de manera significativa. La distribución de frecuencias son útiles a este respecto, pero en sí mismas, no nos permiten hacer afirmaciones cuantitativas que caractericen a la distribución como un todo, ni tampoco permiten realizar comparaciones cuantitativas entre dos o más distribuciones. Por ejemplo : suponga que una psicóloga ha realizado un experimento para averiguar si los hombres y las mujeres tienen aptitudes matemáticas diferentes. Esta investigadora cuenta con 2 conjuntos de calificaciones (uno para hombres y otro para mujeres) del experimento. ¿Cómo puede comparar esas distribuciones? Para hacerlo ella necesita ¨cuantificarlas¨
  • 208.
    Introducción La formaen que esto se realiza más a menudo consiste en calcular la calificación promedio de cada grupo y después comparar el resultado. La cantidad calculada es una medida de la tendencia central de cada distribución. Una 2da. característica de las distribuciones que resulta de gran utilidad para cuantificarlas es la variabilidad de la distribución. La variabilidad especifica la medida en la cual los datos son diferentes unos de otros debido a su dispersión.
  • 209.
    Media aritmética Sedefine como la suma de los datos dividida entre el número de los mismos. En forma de ecuación X = Σ X i = X 1 + X 2 + X 3 + ….. X n media de una muestra n n µ = Σ X i = X 1 + X 2 + X 3 + ….. X N media de una población N N
  • 210.
    La media globalEsta ecuación establece que la media global es igual a la suma de la media de cada grupo multiplicada por el número de datos del grupo, entre la suma del número de datos de cada grupo X global = Suma de todos los datos N = Σ X 1 (primer grupo) + Σ X 2 (segundo grupo) + Σ X 3 (primer grupo) + … Σ X i (primer grupo) n 1 + n 2 + n 3 + ….. n k
  • 211.
    Ejemplo de MediaUn analista estadístico toma una muestra aleatoria de n=11 laboratorios de investigación tecnológica de una Empresa con la siguiente información: Laboratorio Num. Investigadores Laboratorio Num. Invest. A 54 G 43 B 39 H 57 C 26 I 28 D 45 J 61 E 36 K 54 F 52 Calcule la media
  • 212.
    Ejemplo de lamedia global Un investigador realizó un experimento con tres grupos de sujetos. La media del primer grupo fue de 75 y había en él 50 sujetos. La media del segundo grupo fue de 80 y estaba integrado por 40 sujetos. En el tercer grupo había 25 sujetos y la media fue de 70. Calcule la media global de los tres grupos combinados Solución: X global = n 1 X 1 + n 2 X 2 + n 3 X 3 n 1 + n 2 + n 3 = 50(75) + 40(80) + 25(70) = 75.65 50 + 40 + 25
  • 213.
  • 214.
    Efecto de losdatos extremos sobre la media y la mediana Datos Media Mediana 3, 4, 6, 7, 10 6 6 3, 4, 6, 7, 100 24 6 3, 4, 6, 7, 1000 204 6
  • 215.
    Ejemplo de MedianaCalcule la mediana de la siguiente serie de datos a) Calificaciones de 11 alumnos en la materia de Epistemología: 8.5, 8.9, 9.4, 7.5, 9.1, 9.6, 7.7, 8.3, 9.5, 8.2, 9.3 b) Calificaciones de 14 alumnos en la materia de Metodología de la Investigación: 9, 10, 8, 9, 10, 8, 7, 6, 6, 7, 8, 9, 9, 10 NOTA: Recuerde que debe acomodar los datos en orden ascendente
  • 216.
  • 217.
    EJEMPLO: CALCULAR LAMEDIA, MEDIANA Y MODA
  • 218.
    Medidas de tendenciacentral y simetría Asimetría negativa Media Mediana Moda Frecuencia
  • 219.
    Medidas de tendenciacentral y simetría Curva en forma de campana Frecuencia Media Mediana Moda
  • 220.
    Medidas de tendenciacentral y simetría Moda Mediana Media Frecuencia Asimetría positiva
  • 221.
  • 222.
  • 223.
    Propiedades de laDesviación Estándar 1º Nos proporciona una medida de la dispersión con respecto a la media. 2º Es sensible a cada uno de los datos de la distribución : a) Si se cambiara un dato por un valor más cercano a la media, entonces la desviación estándar sería menor. b) Inversamente, si se le cambiara por otro más alejado de la media, entonces la desviación estándar aumentaría. 3º Es estable con respecto a las variaciones debidas al muestreo .
  • 224.
    La varianza Lavarianza de un conjunto de datos es simplemente el cuadrado de la desviación estándar. La varianza no se usa muy a menudo en Estadística Descriptiva porque proporciona unidades de medición elevadas al cuadrado. Sin embargo, se utiliza muy frecuentemente en Estadística Inferencial
  • 225.
    Desviación estándar Engeneral, la desviación estándar se emplea como una medida para comparar la dispersión en 2 o más conjuntos de observaciones. En una distribución de frecuencias simétrica, con forma de campana, aproximadamente 68% de las observaciones estarán entre más una y menos una desviación estándar desde la media; aproximadamente 95% de las observaciones se encontrarán entre dos y menos dos desviaciones estándar desde la media; prácticamente todas las observaciones (99.7%) se hallarán entre más tres y menos tres desviaciones estándar, a partir del valor medio.
  • 226.
    Gráfica simétrica decampana, que muestra las relaciones entre la desviación estándar y la media 34.13% 34.13% 13.59% 13.59% 2.15% 2.15% 0.13% 0.13% µ µ + µ + µ + µ µ µ
  • 227.
    Cuartiles Confrecuencia se dividen los datos en cuatro partes, cada una con aproximadamente la cuarta parte, o el 25% de las observaciones. A los puntos de división se les llama cuartiles y se definen como sigue: Q 1 = primer cuartil o percentil 25 Q 2 = segundo cuartil o percentil 50 (mediana) Q 3 = tercer cuartil o percentil 75
  • 228.
    Cuartiles (lasfórmulas dan las posiciones o ubicación) Q 1 = N/4 Q 2 = N/2 Q 3 = 3N/4 NOTA: Si el resultado es un número entero, entonces el cuartil es el promedio entre ese valor y el siguiente. Si el resultado contiene decimales, entonces el cuartil es el siguiente valor de la serie acomodada en orden ascendente.
  • 229.
    Localización de losCuartiles Q 1 Q 2 Q 3 Percentil 25 Percentil 50 Percentil 75 25% 25% 25% 25%
  • 230.
    Ejemplo para calcularlos Cuartiles Millones de personas se levantan cada mañana en Norteamérica y trabajan en sus propias casas. Se sugiere que el uso creciente de computadoras es una de las razones por las que las personas pueden trabajar en empresas caseras. A continuación vemos una muestra de datos sobre las edades de esas personas: 22 58 24 50 29 52 57 31 30 41 44 40 46 29 31 37 32 44 49 29 a) Calcule los 3 cuartiles: Q 1 , Q 2 y Q 3
  • 231.
    Solución al ejercicioanterior (cuartiles): primero acomodaremos en orden ascendente los datos 22, 24, 29, 29, 29, 30, 31, 31, 32, 37, 40, 41, 44, 44, 46, 49, 50,52, 57, 58 Q 1 = N/4 = 20/4 = 5, entonces el primer cuartil es el promedio entre la 5a y 6ta posición: (29 + 30)/2 = 29.5 Q 2 = N/2 = 20/2 = 10, entonces el 2do cuartil es el promedio entre la 10a y 11ava posición: (37 + 40)/2 = 38.5 Q = 3N/4 = 3(20)/4 =15, entonces el 3er cuartil es el promedio entre la 15ava y 16ava posición: (46+49)/2 = 47.5
  • 232.
    Percentiles El p-ésimopercentil es un valor tal que por lo menos “p” por ciento de las observaciones son menores o iguales que este valor y por lo menos (100 – p) por ciento de las observaciones son mayores o iguales que este valor.
  • 233.
    Percentiles Por ejemplo,suponga que un solicitante alcanza una calificación bruta de 54 en la parte verbal del examen de admisión en una Universidad mexicana. No se sabe con facilidad cómo se desempeñó ese alumno en relación con otros que presentaron la misma prueba; sin embargo, si la calificación bruta de 54 corresponde al percentil 70, sabemos que, aproximadamente, 70% de los alumnos tuvo calificaciones menores que este valor y más o menos el 30% tuvo calificaciones mayores que él.
  • 234.
    ¿Cómo calcular Percentiles?Paso 1: Ordene los datos de manera ascendente Paso 2: Calcule un índice i: i = (p/100)*n en donde “p” es el percentil de interés y “n” la cantidad de observaciones. Paso 3: a) Si “i” no es entero, se redondea. El valor entero inmediato mayor que “i” indica la posición del p-ésimo percentil b) Si “i” es entero, el p-ésimo percentil es el promedio de los valores de los datos ubicados en los lugares i e i + 1
  • 235.
    Ejemplo del cálculodel percentil Determinar el percentil 85 de los datos de salarios de una compañía acerera: Paso 1: acomodamos los datos en orden ascendente: $2,710 2,755 2,850 2,880 2,880 2,890 2,920 2,940 2,950 3,050 3,130 3,325 Paso 2: i = (p/100)*n = (85/100)*12 = 10.2 Paso 3: como i no es entero, redondeamos. El lugar del percentil 85 es el siguiente entero mayor que 10.2, o sea, el lugar 11 (es = 3130)
  • 236.
    Continuación del ejemplodel cálculo del percentil Ahora calculemos el percentil 50 del mismo ejemplo anterior: i = (50/100)*12 = 6 Como i es entero, el paso 3b) establece que el percentil 50 es el promedio de los valores de los datos sexto y séptimo; es por lo tanto: (2890 + 2920)/2 = 2,905. Observe que el percentil 50, es también la mediana
  • 237.
  • 238.
    EJEMPLO DEL CÁLCULODE LA DESVIACIÓN ESTÁNDAR
  • 239.
    Ejemplo num 1MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN DE UNA POBLACIÓN (Medidas descriptivas) Los siguientes datos representan las razones de PU (precio/utilidad) de las 20 compañías que participan en la rama industrial de procesamiento de alimentos, publicados por el ¨Bussines Week Corporate Scoreboard¨ (Año 2008)
  • 240.
    Continuación ejemplo 1°Compañía: Razón PU : Compañía: Razón PU : 1 11 11 19 2 13 12 20 3 14 13 20 4 17 14 21 5 17 15 21 6 17 16 21 7 17 17 21 8 18 18 22 9 18 19 24 10 19 20 25
  • 241.
    Calcular del ejemplonúm. 1 a) Media aritmética b) Mediana c) Moda d) El rango medio (dato mayor – dato menor)/2 e) El rango f) Varianza g) Desviación estándar h) Coeficiente de variación CV = (desv. estándar/media) x 100 i) Cuartiles j) Rango intercuartílico (Q 3 – Q 1 ) k) Eje medio (Q 3 + Q 1 )/2
  • 242.
    Solución a) Media= 375/20= 18.75 b) Mediana = (n+1)/2 * debemos ordenar de menor a mayor los datos para hacer este cálculo: Mediana = (20 + 1)/2 = 10.5 *esto significa que debemos obtener la media entre la posición 10 y la 11: (19 + 19)/2 = 19 c) Moda: 17 y 21 d) Rango Medio: (25 – 11)/2 =14/2 = 7 e) Rango: 25 – 11 = 14
  • 243.
    Solución e) Varianza= 12.09 g) Desv. Estándar = 3.47 h) Coeficiente de variación = (3.47/18.75)x100 = 18.5% i) Cuartiles: (posiciones) Q 1 = 20/4 = 5 prom. entre 5 y 6 posición = 17 Q 2 = 20/2 = 10 prom. entre 10 y 11 posición = 19 Q 3 = 3(20)/4 = 15 prom. entre 15 y 16 posición = 21
  • 244.
    Solución j) Rango intercuartílico: Q 3 - Q 1 = 21 – 17 = 4 k) Eje medio : (Q 3 + Q 1 )/2 = (21+ 17)/2 = 19
  • 245.
    RESULTADOS en EXCELdel ejercicio anterior Herramientas-Análisis de datos-estadística descriptiva Media 18.75 Error típico 0.777563671 Mediana 19 Moda 17 Desviación estándar 3.477370452 Varianza de la muestra 12.09210526 Curtosis 0.290848679 Coeficiente de asimetría -0.434437474
  • 246.
    RESULTADOS en EXCELdel ejercicio anterior Herramientas-Análisis de datos-estadística descriptiva Rango 14 Mínimo 11 Máximo 25 Suma 375 Cuenta 20 Mayor (1) 25 Menor(1) 11 Nivel de confianza(95.0%) 1.627459974
  • 247.
    Prácticas para losalumnos Resolver los ejercicios siguientes y entregarlos al facilitador del módulo
  • 248.
    Ejercicio # 1de Aplicación de Estadística Descriptiva en EXCEL (ALUMNOS) Evalúe las medidas de tendencia central La compensación anual total para un miembro del consejo en una de las 100 compañías públicas más grandes de E.U. se basa en parte en la cuota fija, un pago anual por servir al consejo. Además de la cuota fija de efectivo, un miembro del consejo podría recibir una cuota fija de acciones, un subsidio accionario, una opción de compra de acciones y una cuota por asistir a las reuniones del consejo. La compensación fácilmente puede ser mayor de $100,000 dólares, incluso con una cuota fija anual tan baja como $15,000 dólares. Los datos siguientes muestran la cuota fija de efectivo para una muestra de 20 de las compañías públicas más grandes de E.U. ( USA Today, 14 de Mayo del 2008)
  • 249.
    Continuación del Ejercicio# 1 de Aplicación Estadística en EXCEL (ALUMNOS) Compañía Cuota fija de efectivo American Express 64 Bank of América 36 Boeing 26 Chevron 35 Dell Computer 40 DuPont 35 ExxonMobil 40 Ford Motor 30 General Motors 60 International Paper 36
  • 250.
    Continuación del Ejercicio# 1 de Aplicación Estadística en EXCEL (ALUMNOS) Compañía Cuota fija de efectivo Kroger 28 Lucent Technologies 50 Motorola 20 Procter & Gamble 55 Raytheon 40 Sears Roebuck 30 Texaco 15 United Parcel Service 55 Wal-Mart Stores 25 Xerox 40
  • 251.
    Ejercicio # 2de Aplicación de Estadística Descriptiva en EXCEL (ALUMNOS) Evalúe las medidas de tendencia central Se efectuó una encuesta acerca de la capacidad de los fabricantes de computadoras para resolver con rapidez sus problemas ( PC Computing, noviembre de 1977). Se obtuvieron los siguientes resultados: Empresa Días para resolver el problema Compaq 13 Packard Bell 27 Quantex 11 Dell 14 NEC 14 AST 17 Acer 16
  • 252.
    Continuación ejercicio #2 Empresa Días para resolver el problema Gateway 21 Digital 27 IBM 12 Hewlett-Packard 14 AT & T 20 Toshiba 37 Micron 17
  • 253.
    Ejercicios # 3y # 4 Calcule la Desviación estándar y la varianza e interprete los resultados 3.- Una organización de protección al consumidor se preocupa por las deudas de las tarjetas de crédito. Una encuesta entre 10 adultos jóvenes que tienen deudas de más de $2,000 con tarjetas de crédito mostró que pagaban un promedio de poco más de $100 al mes. A continuación se presenta una lista de las cantidades que cada adulto joven abonó a su saldo el mes pasado: $110 $126 $103 $93 $99 $113 $87 $101 $109 $100 4.- Los siguientes son los números de cambios de aceite durante los últimos 7 días en un taller mecánico de la cd. de Guadalajara, Jal. 41 15 39 54 31 15 33
  • 254.
    DATOS AGRUPADOS Medidasde tendencia central Media, Mediana, Moda, Desviación Estándar y Varianza
  • 255.
    MEDIA, MEDIANA YMODA, DE DATOS AGRUPADOS Con frecuencia los datos relacionados con ingresos, edades y demás, se agrupan y presentan en forma de distribución de frecuencias. Por lo general, resulta imposible obtener los datos originales. De modo que si interesa un valor típico que represente a los datos, es necesario “ estimarlo” basándose en la distribución de frecuencias.
  • 256.
    MEDIA ARITMÉTICA DEDATOS AGRUPADOS x = Σ fX n X = es la media aritmética X = es el valor central o punto medio, de cada clase f = es la frecuencia de cada clase n = es el número total de frecuencias
  • 257.
    Cálculo de laMedia del precio de venta de 80 vehículos que se vendieron el mes pasado en una agencia VW Precio de venta (miles de dólares) Frec. (f ) Punto medio (X) fX 12 hasta 15 8 $13.50 $108 15 hasta 18 23 16.5 379.5 18 hasta 21 17 19.5 331.5 21 hasta 24 18 22.5 405 24 hasta 27 8 25.5 204 27 hasta 30 4 28.5 114 30 hasta 33 2 31.5 63 total 80 $1,605
  • 258.
    Cálculo de laMedia del precio de venta de 80 vehículos que se vendieron el mes pasado en una agencia VW X = Σ fX = $ 1,605 = $20.1 miles n 80 Por tanto se concluye que la media del precio de venta de los vehículos es aproximadamente $20,100.
  • 259.
    MEDIANA DE DATOSAGRUPADOS Mediana = L + (n/2 – FA) (i) f L = es el límite inferior de la clase que contiene a la mediana n = número total de frecuencias f = es la frecuencia de la clase que contiene a la mediana FA = es el número acumulado de frecuencias en todas las clases que preceden a la clase que contiene a la mediana i = es la amplitud (o anchura) de la clase en que se encuentra la mediana
  • 260.
    Cálculo de laMediana del precio de venta de 80 vehículos que se vendieron el mes pasado en una agencia VW Precio de venta Número vendido Frecuencia acumulada (miles de dólares) ( f ) (FA) 12 hasta 15 8 8 15 hasta 18 23 31 18 hasta 21   17   48 21 hasta 24 18 66 24 hasta 27 8 74 27 hasta 30 4 78 30 hasta 33 2 80 total 80
  • 261.
    Cálculo de laMediana del precio de venta de 80 vehículos que se vendieron el mes pasado en una agencia VW Mediana = L + (n/2 – FA) (i) f Mediana = $18,000 + (80/2 – 31) ($3,000) 17 Mediana = $18,000 + $1,588 = $19,588
  • 262.
    Moda de datosagrupados Recuérdese que la moda se define como el valor que ocurre con más frecuencia. Para datos agrupados en una distribución de frecuencias, es posible aproximar la moda usando “el punto medio de la clase que contiene el mayor número de frecuencias de clase”
  • 263.
    Ejemplo del cálculode la Moda (datos agrupados) Ventas netas (millones de $) Porcentaje del total 1 hasta 4 13 4 hasta 7 14 7 hasta 10 40 10 hasta 13 23 13 y superior 10
  • 264.
    Resultado del ejemplodel cálculo de la Moda (datos agrupados) Moda = (7 + 10)/2 = 8.5 millones
  • 265.
    Desviación estándar dedatos agrupados en una distribución de frecuencias S = Σ fx 2 – ( Σ fX) 2 n n – 1 s = desv. estándar X = punto medio de una clase f = es la frecuencia de clase n = num. total de observaciones en la muestra
  • 266.
    Calcule la desviaciónestándar de una muestra de las inversiones quincenales realizadas por empleados de acuerdo con el plan de participación de utilidades Cantidad Inv. Frecuencia f Punto Medio X fX fX 2 $30 hasta $35 3 $32.5 $97.50 3,168.75 35 hasta 40 7 37.5 262.5 9,843.75 40 hasta 45 11 42.5 467.5 19,868.75 45 hasta 50 22 47.5 1045 49,637.50 50 hasta 55 40 52.5 2100 110,250 55 hasta 60 24 57.5 1380 79,350 60 hasta 65 9 62.5 562.5 35,156.25 65 hasta 70 4 67.5 270 18,225 total 120 $6,185 325,500
  • 267.
    Obtenemos ahora ladesviación estándar muestral con los resultados de la tabulación anterior S = 325,500 – (6185) 2 /120 (120 – 1) S = $7.51
  • 268.
    Ejercicio # 1para el alumno (DATOS AGRUPADOS) Calcular: la media, la mediana, la moda, la desviación estándar y la varianza En una gasolinera se formó la siguiente distribución de frecuencias de galones de gasolina vendidos por automóvil, en una muestra de 680 vehículos: Gasolina (galones) Frecuencia 0-4 74 5-9 192 10-14 280 15-19 105 20-24 23 25-29 6 Total 680
  • 269.
    Ejercicio # 2para el alumno (DATOS AGRUPADOS) Calcular: la media, la moda, la mediana, la desviación estándar y la varianza Las cuestiones de salud son de interés para directores, o gerentes de empresa, en especial porque evalúan el costo del seguro médico. En un estudio reciente con 150 ejecutivos de varias empresas de polímeros, una gran aseguradora y financiera localizada en una cd. de los E.U., aparecieron las cifras de sobrepeso en libras de los ejecutivos. Sobrepeso (libras) frecuencia 0 hasta 6 14 6 hasta 12 42 12 hasta 18 58 18 hasta 24 28 24 hasta 30 8
  • 270.
    Ejercicio # 3para el alumno (DATOS AGRUPADOS) Calcular: la media, la desviación estándar y la varianza A continuación se presenta una distribución de frecuencias de la duración de 20 llamadas telefónicas de larga distancia, en minutos. Duración de la llamada (min) Frecuencia 4 – 7 4 8 – 11 5 12 – 15 7 16 – 19 2 20 – 23 1 24 – 27 1 Total 20
  • 271.
    Ejercicio # 4para el alumno (DATOS AGRUPADOS) Calcular: la media, la desviación estándar y la varianza Un radar policiaco vigila la velocidad de los automóviles que viajan por la carretera transversal del estado de Nueva York. En la tabla siguiente se presenta una distribución de frecuencia de las velocidades: Velocidad (millas/hr) Frecuencia 45 – 49 10 50 – 54 40 55 – 59 150 60 – 64 175 65 – 69 75 70 – 74 15 75 – 79 10 Total 475
  • 272.
    Diagramas de Controlde Calidad Los diagramas de control identifican el momento en que entran al proceso las causas asignables de variación o los cambios. Estos diagramas indican a los trabajadores, líderes de grupos, ingenieros de control de calidad, supervisores de producción y gerentes, si la producción de la parte o el servicio está “bajo control” o “fuera de control”. Si algo está fuera de control, la persona responsable ajustará la máquina, fabricará la pieza o hará lo que sea necesario para poner la producción “bajo control”.
  • 273.
    Ejemplo La compañía “ G ξ L ” que produce artículos de papelería, ofrece un número telefónico de larga distancia sin costo al cual los clientes pueden llamar todos los días, de 7 a.m. a 11 p.m., para resolver problemas con sus productos. Es imposible que un representante técnico conteste de inmediato, pero es importante que los clientes no esperen demasiado en línea. Los clientes se molestan cuando escuchan demasiadas veces el mensaje “su llamada es importante para nosotros. En breve le contestará un representante”
  • 274.
    Ejemplo Para comprenderel proceso, la compañía decidió elaborar una tabla de control con el tiempo total desde el momento en que se recibe una llamada hasta que el representante la responde y soluciona el problema del cliente. El día de ayer se tomó una muestra de cinco llamadas cada hora durante las 16 horas de operación del servicio de atención al cliente. Con base en esa información, elabore una tabla de control para la duración media de la llamada. ¿Parece existir una tendencia en las horas de las llamadas? ¿Hay algún periodo donde parece que los clientes esperan más que otros?
  • 275.
    Tabla de laduración de 16 muestras de cinco sesiones de ayuda
  • 276.
    Pasos en Minitabpara realizar el Diagrama de Control de Rangos Paso 1 : Haga clic en Stat, Control Charts, Variables Charts for subgroups, Xbar-R y oprima enter
  • 277.
    Paso 2 :Seleccione Observations for a subgroup are in one row of columns ; seleccione las columnas C2, C3, C4, C5 y C6 con un clic a c/u
  • 278.
    Paso 3: dar clic a Labels , para poner el nombre de la gráfica, después darle clic en OK dos veces
  • 279.
    Xbar-R Chart ofMinutes Paso 4, Resultado : Diagrama de Control de Rangos de la duración de las llamadas de los clientes en la compañía “ G ξ L ”
  • 280.
    Comentarios acerca delos resultados del Diagrama de control de rangos La media es de 9.413 minutos, el límite de control superior se ubica en 13.093 minutos y el límite de control inferior en 5.732 minutos. Hay una variación en la duración de las llamadas, pero todas las medias de la muestra están dentro de los límites de control. Por tanto, con base en 16 muestras de 5 llamadas, la conclusión es que, 99.74% (seis sigmas) de las veces, la duración media de una muestra de 5 llamadas estará entre 5.732 min y 13.093 min
  • 281.
    Conclusión Puesto quela teoría estadística se basa en la normalidad de muestras grandes, los diagramas de control deben tener como base un proceso estable, es decir, una muestra muy grande tomada durante un periodo. Una regla básica es diseñar el diagrama después de seleccionar al menos 25 muestras.
  • 282.
    BIBLIOGRAFÍA 1.- EstadísticaBásica en Administración Conceptos y Aplicaciones 6ª Edición Berenson/Levine Ed. Prentice-Hall 2.- Estadística para Administración y Economía Anderson, Sweeney y Williams 8. Edición Ed. Thomson 3.- Estadística para Administradores Richard Levin Ed. Prentice-Hall 4.- Estadística para Administradores y Economía Mason y Lind Ed. Alfaomega
  • 283.
    BIBLIOGRAFÍA 5.- EstadísticaAplicada a los Negocios y a la Economía 12ª. Edición Lind, Marchal & Wathen Ed. Mc. Graw-Hill 6.- Probabilidad & Estadística 8ª Edición Walpole, Myers, Myers & Ye PEARSON, Prentice Hall 7.- Introducción a la PROBABILIDAD Y ESTADÍSTICA Décima segunda edición Mendenhall, Beaver & Beaver THOMSON 8.- PROBABILIDAD Y ESTADÍSTICA Sexta Edición Devore THOMSON
  • 284.
    BIBLIOGRAFÍA 9.- ControlEstadístico de Calidad Montgomery, Douglas C. Limusa, 2005 10.- Diseño y Análisis de experimentos Montgomery, Douglas C. Iberoamérica, 2001 11.- Probabilidad y Estadística aplicadas a la Ingeniería Montgomery, Douglas y Runger George Mc. Graw-Hill, 2003 12.- Métodos Cuantitativos para los Negocios Render, Stair &Hanna 9ª edición PEARSON Prentice-Hall 13.- ESTADÍSTICA Para las Ciencias del Comportamiento 7ª. Edición Pagano, Robert R. THOMSON