MODULO DE ESTADÍSTICA
1 LA INVESTIGACIÓN ESTADÍSTICA
1.1 DEFINICIÓN DE ESTADÍSTICA
Aunque difícil de lograr un consenso ge...
Un parámetro es una característica numérica de una población. Los parámetros
generalmente se denotan por letras griegas. A...
Por lo general se acepta la existencia de cuatro escalas de medición, ellas son: nominal,
ordinal, de intervalo y de razón...
En la Pedagogía para comparar la eficiencia de dos métodos de enseñanza.
En la Política para predecir el resultado de una ...
SYSINFO, R y SAS.
La Estadística se puede caracterizar brevemente como la ciencia de la descripción y
análisis de datos. D...
a) informática: utilización y manejo de paquetes de programas estadísticos;
b) interpretativa: interpretación de resultado...
definición clara de cómo son los elementos de dicha población.
Ejemplos de poblaciones hipotéticas:
1. Los clientes del su...
d. Identifique el estadístico utilizado e indique cuál es su valor.
e. ¿Se conoce el valor del parámetro?.
2.- Un técnico ...
c. El número de llamadas telefónicas recibidas en un conmutador cada 10 minutos.
d. La distancia a la que puede llegar un ...
2 MÉTODOS TABULARES Y GRÁFICOS PARA LA ORGANIZACIÓN Y
PRESENTACIÓN DE LOS DATOS
Próxima SlideShare
Cargando en…5
×

Capitulo i

80 visualizaciones

Publicado el

0 comentarios
0 recomendaciones
Estadísticas
Notas
  • Sé el primero en comentar

  • Sé el primero en recomendar esto

Sin descargas
Visualizaciones
Visualizaciones totales
80
En SlideShare
0
De insertados
0
Número de insertados
2
Acciones
Compartido
0
Descargas
1
Comentarios
0
Recomendaciones
0
Insertados 0
No insertados

No hay notas en la diapositiva.

Capitulo i

  1. 1. MODULO DE ESTADÍSTICA 1 LA INVESTIGACIÓN ESTADÍSTICA 1.1 DEFINICIÓN DE ESTADÍSTICA Aunque difícil de lograr un consenso general sobre la definición de estadística, todos los estadísticos están de acuerdo en clasificar la materia en dos grandes áreas; que son Estadística descriptiva y Estadística Inferencial. 1.1.1 Estadística descriptiva En los primeros tiempos de su desarrollo, el estudio de la estadística consistía de técnicas para recolectar, organizar y presentar datos numéricos. El objetivo de este tipo de tratamiento, fue el de describir las características principales de los datos reunidos. 1.1.2 Estadística inferencial El enfoque del término estadística consiste de técnicas para hacer inferencias a partir de los datos analizados en la estadística descriptiva y a la toma de decisiones en base a los resultados obtenidos de una muestra. Una vez consideradas las funciones de las dos áreas en que se clasifica la Estadística, se puede resumir el concepto de estadística como se menciona a continuación: 1.1.3 Estadística La estadística es un conjunto de métodos y teorías que han sido desarrolladas para tratar la recolección, el análisis y la descripción de datos muestrales con el objeto de tomar decisiones en base a los resultados obtenidos. En los conceptos previamente mencionados se observa como la estadística evolucionó de las técnicas de recolectar, organizar y presentar los datos muestrales a las técnicas de hacer inferencias en base a los resultados de una muestra. Esta idea que se tiene de la estadística, no quiere decir, que el tema de la estadística se haya vuelto estable e inflexible, sino por el contrario, se siguen creando nuevas técnicas estadísticas para satisfacer necesidades específicas. Por ejemplo, recientemente se han creado algunas nuevas técnicas descriptivas conocidas con el nombre de "análisis exploratorio de los datos". Estas técnicas permiten antes de efectuar cualquier otro tipo de análisis, examinar de manera preliminar el comportamiento de nuestros datos y de acuerdo con este comportamiento ajustar a tales datos el modelo más adecuado. 1.2 CONCEPTOS BÁSICOS En virtud de que para estudiar los Métodos Estadísticos es de vital importancia el conocimiento del lenguaje estadístico, a continuación se definen algunos de los conceptos básicos más usuales. (Estas definiciones son de naturaleza descriptiva y no necesariamente son matemáticamente formales). 1.2.1 Población Una población es un conjunto de elementos con alguna característica en común. Una lista de los empleados de una fábrica es un ejemplo de una población. El número de elementos de una población generalmente se denota por N. 1.2.2 Muestra Una muestra es un subconjunto de la población. El número de elementos de una muestra lo indicaremos con n. 1.2.3 Parámetro
  2. 2. Un parámetro es una característica numérica de una población. Los parámetros generalmente se denotan por letras griegas. Algunos parámetros comúnmente de interés son: el de la media, el total, la proporción, la varianza y la desviación estándar poblacional que se denotan respectivamente por 1.2.4 Estadístico Medida numérica que describe la característica de una muestra. 1.2.5 Variable Una variable es una característica que puede tomar diferentes valores. De esta manera, el ingreso, la producción y el sexo son variables dado que pueden tomar diferentes valores cuando se estudian diferentes elementos de una población. Las variables pueden ser discretas y continuas. (En métodos estadísticos como en diseños de experimentos y regresión, las variables se clasifican en dependientes e independientes.). 1.2.6 Variable discreta Una variable discreta es aquella para la cuál sus resultados se pueden numerar, por ejemplo, el número de clientes atendidos diariamente durante un mes en una institución bancaria, el número de ventas efectuadas por 20 agentes de seguros de una compañía, el número de hijos por matrimonio de cierta ciudad, etc. Obsérvese que estos valores generalmente son obtenidos a través de un proceso de contar. 1.2.7 Variable continua Una variable continua es aquella variable que puede tomar cualquier valor dentro de un rango de valores. Obsérvese que estos valores son obtenidos a través de un proceso de medir, por ejemplo, el tiempo que esperan en ser atendidos 10 personas en un consultorio médico, el consumo de energía eléctrica de las viviendas de una colonia durante un bimestre, el peso de un grupo de alumnos de secundaria, etc. 1.2.8 Constante Una variable se diferencia de una constante ya que al valor de ésta última nunca se puede alterar. Algunos ejemplos de constantes son: el número de días del mes de mayo indistintamente del año, el número de centímetros que tiene un metro y el número de lados que tiene un pentágono. 1.2.9 Dato Un dato es un resultado de observar, contar o medir una característica específica de interés. Generalmente existen dos tipos de datos: Cualitativos y cuantitativos. 1.2.10 Dato cualitativo (o atributo) Es el resultado de un proceso que categoriza o describe un elemento de una población (La profesión, el lugar de nacimiento, el estado civil, etc.). 1.2.11 Dato cuantitativo (o numérico) Es el resultado de un proceso que cuantifica, es decir que cuenta o mide (Longitud, peso, ingreso, etc.) 1.3 ESCALAS DE MEDICIÓN Los métodos estadísticos que se utilizan para describir un conjunto de datos depende de la forma en que éstos se midieron ya que su desconocimiento conduce a serios errores en la interpretación de los resultados. A continuación se expone la forma de clasificar los datos de acuerdo a una escala de medición.
  3. 3. Por lo general se acepta la existencia de cuatro escalas de medición, ellas son: nominal, ordinal, de intervalo y de razón. 1.4 APLICACIONES DE LOS MÉTODOS ESTADÍSTICOS En años recientes la estadística y desde luego los métodos estadísticos han tenido un desarrollo amplio en las diferentes áreas del conocimiento, de tal manera que es más difícil mencionar un campo en el que no se haga uso de los métodos estadísticos que mencionar uno en el que si se haga uso de los métodos estadísticos. Con éstos antecedentes, los métodos estadísticos encuentran su aplicación en una variedad tan grande de campos, que es necesario advertir, a manera de comentario, que en el presente apartado no pretende, ni lejanamente, exponer el tema de manera exhaustiva; sino que el propósito principal es de mencionar, algunos campos de aplicación que estimulen al estudiante para que se compenetre al estudio de los métodos estadísticos. Resumiendo, los métodos estadísticos pueden ser aplicados.En una investigación de mercado cuando se desea saber la proporción de compradores potenciales que prefieren un determinado artículo. En ingeniería para conocer el coeficiente de dilatación térmico de un metal o bien para comparar la resistencia de dos aleaciones. En la Psicología para conocer el coeficiente intelectual promedio de los empleados de una empresa.
  4. 4. En la Pedagogía para comparar la eficiencia de dos métodos de enseñanza. En la Política para predecir el resultado de una cierta elección popular. En la Sociología para conocer la proporción de casas rurales que cuentan con energía eléctrica. En la Industria para conocer la proporción de artículos producidos que resultan defectuosos. Por el economista que quiere obtener ecuaciones de predicción que servirán en la predicción del crecimiento económico o de alguna otra medida de sanidad económica. Por el agrónomo al experimentar cual de las diferentes variedades del cultivo de maíz recomienda para obtener una mayor producción. • En medicina para comparar la efectividad de dos medicamentos 1.5 IDENTIFICACIÓN DE PROBLEMAS EN LOS QUE NO SE UTILIZA LA ESTADÍSTICA PARA RESOLVERLOS La estadística no es una panacea que nos sirva para resolver cualquier problema. La estadística se aplica al estudio de variables; es decir, datos que se caracterizan por su variación y no tiene sentido cuando la característica es constante. De acuerdo a lo mencionado en el punto anterior, la estadística no es de utilidad en problemas de física, química, etc., en los que no existe incertidumbre en los resultados, ya que estos generalmente se obtienen al despejar la incógnita de una ecuación. 1.6 ETAPAS DE UNA INVESTIGACIÓN ESTADÍSTICA Las etapas de una investigación estadística ideal pueden citarse como sigue: 1. Asegurarse de que se entienda el problema y de formularlo en términos estadísticos. Aclarar los objetivos de la investigación muy cuidadosamente. 2. Planear la investigación y recopilar los datos de una manera apropiada. Es importante lograr un equilibrio adecuado entre el esfuerzo necesario para recopilar los datos y analizarlos; el método de recolección es esencial para los resultados. 3. Evaluar la estructura y calidad de los datos. Revisar los datos en cuanto a errores y valores faltantes. 4. Llevar a cabo un examen inicial de los datos para obtener un resumen de la estadística descriptiva y así tal vez, obtener mejores ideas para un análisis más formal. 5. Seleccionar y llevar a cabo un procedimiento estadístico formal para analizar los datos; dicho procedimiento con frecuencias asume un modelo particular y puede involucrar estimación de parámetros y efectuar pruebas de hipótesis. 6. Comparar los hallazgos con resultados previos y adquirir datos adicionales, si es necesario. 7. Interpretar y comunicar los resultados. Los hallazgos deben entenderse tanto por los estadísticos como por los no estadísticos y se requiere cuidado extra en la presentación de las gráficas, tablas de resumen y salidas de computadora. 1.7 HACIA UNA “ESTADÍSTICA INFORMÁTICA” En años recientes la computadora ha tenido un gran efecto en casi todos los aspectos de la vida. El campo de la estadística no es la excepción. Como se verá, en la estadística se emplean muchas técnicas repetitivas: fórmulas utilizadas para calcular magnitudes estadísticas descriptivas, procedimientos para obtener representaciones gráficas de datos, y métodos para formular inferencias estadísticas. La computadora es muy útil en la realización de tales operaciones repetitivas. Es muy común que alguien que necesite analizar un conjunto de datos busque la ayuda de otra persona que sepa emplear una computadora. Si en esa computadora está instalado algún programa de análisis estadístico, será fácil llevar a cabo los cálculos deseados. Algunos de los programas más conocidos son: SYSTAT, SPSS, STATA, STATISTICA, JMP, STATGRAPHICS, MINITAB,
  5. 5. SYSINFO, R y SAS. La Estadística se puede caracterizar brevemente como la ciencia de la descripción y análisis de datos. Dentro de la Estadística se pueden distinguir dos grandes vertientes: Estadística Matemática y Estadística Aplicada. Se entiende por Estadística Matemática aquella parte de la matemática que se ocupa de los fundamentos teóricos de la estadística, sin preocuparse de las aplicaciones prácticas que puedan derivarse. Los estudios de esta ciencia suelen cursarse en las Facultades de Matemáticas. La Estadística Aplicada, como su nombre indica, se ocupa de las aplicaciones de la estadística a las investigaciones de carácter empírico, se deriva de la estadística matemática. Son los investigadores empíricos los que se han preocupado de la estadística aplicada. Por ejemplo, las investigaciones de carácter empírico en Ciencias Sociales, Psicología, Pedagogía, Economía, Medicina, Biología, etc. Suele recurrir a métodos estadísticos aplicados en la fase de análisis de datos. Los manuales de estadística aplicada suelen exponer los diversos conceptos para que el investigador pueda realizar los cálculos manualmente, ayudándose como máximo de una calculadora de bolsillo. Pero, como ya hemos apuntado, actualmente no se hace así, sino que se aplican procedimientos informáticos. La estadística aplicada a la investigación empírica ha recibido un impulso revolucionario con la generalización del uso de los ordenadores. El ordenador libera de las tareas manuales de la mente, de las rutinas repetitivas; gracia a él la mente queda descargada para aplicarse a las funciones superiores de enjuiciar y conocer. La informática realiza el proceso mecánico de cálculo. Así, análisis estadísticos que antes eran impensables, se pueden realizar con cierta facilidad y rapidez mediante el uso de paquetes estadísticos. En la actualidad nos encontramos con un crecimiento progresivo de ciencias interdisciplinarias; que armonizan diversas ramas del saber en una sola. Así, se habla de psicolingüistica, bioestadística, bioquímica, neurolinguística, psicofisiología, psicología matemática, ingeniería genética, etc. Análogamente, proponemos, de forma provisional, el concepto de Estadística Informática para referirnos al estudio de la estadística aplicada a la investigación empírica mediante paquetes de programas estadísticos, y por ende a través de procedimientos informáticos. La Estadística Informática trata de los análisis más adecuados para cada investigación, de la forma de realizarlos mediante paquetes de programas estadísticos y de la interpretación de resultados, sin preocuparse demasiado del proceso mecánico del cálculo ni de la demostración de las fórmulas matemáticas. Es decir, la Estadística Informática se ocupa de la informatización de la Estadística. Estos conocimientos son la confluencia de la estadística aplicada y de la informática. La justificación del uso del término Estadística Informática está en que : a) permite utilizar un concepto distintivo para un nuevo enfoque de la estadística aplicada; b) el cambio de enfoque pone el énfasis más en la interpretación de resultados que no en el proceso mecánico de cálculo; c) supone una ampliación de los métodos estadísticos al incorporar los más modernos y sofisticados análisis multivariables, que antes era impensables. Dentro de la Estadística Informática se pueden distinguir dos grandes vertientes:
  6. 6. a) informática: utilización y manejo de paquetes de programas estadísticos; b) interpretativa: interpretación de resultados. La vertiente informática consiste en conocer los paquetes estadísticos existentes, seleccionar el más adecuado para el análisis que se propone y dominar las instrucciones de uso. Estas instrucciones son específicas de cada paquete y varían según el sistema operativo que tenga el ordenador que se esta utilizando. Por otra parte, la interpretación de resultados es la misma, independientemente del paquete y del ordenador utilizado. En el estudio de la Estadística Informática se pueden seguir las siguientes fases: 1) proceso mecánico de calculo de técnicas elementales (frecuencias, medidas de tendencia central y variabilidad, ji-cuadrado, t de Student, ANOVA, correlación de Pearson, áreas bajo la curva normal, grado de significación, etc.); 2) interpretación de listados de ordenador sobre los temas anteriores para comprender el paralelismo del proceso; 3) comprensión de las instrucciones sencillas de los paquetes estadísticos 4) ejecución de análisis sencillos por ordenador 5) ejecución de análisis complejos por ordenador 6) dominio de las utilidades de los paquetes. De estas fases, las tres primeras se pueden realizar sin ordenador. De todas formas, un programa complejo de Estadística Informática es impensable sin prácticas de ordenador. Imaginemos una autoescuela en al que para enseñar a conducir se explica con todo detalle lo que es el motor de explosión, de dos y de cuatro movimientos, el funcionamiento del carter, el delco, el sistema eléctrico, etc. Pero no se dispone de un coche para practicar. De esta forma, los que superan el examen teórico consiguen el permiso para conducir, sin haber conducido nunca. Este programa parecería estar más encaminado a formar mecánicos, o incluso ingenieros, y no conductores. Algo parecido podría pasar en investigación educativa si no se dispone de aulas de ordenadores para practicar el enfoque informático de la estadística.; se estarán formando matemáticos pero no investigadores en el campo de la educación. El estudio de la Estadística Informática requiere de unos medios mínimos, que incluyen la utilización de ordenadores y el disponer de materiales adecuados. 1.8 COLECTIVOS ESTADISTICOS Se llama población objetivo o de referencia al colectivo del cual interesa conocer generalmente una serie de características. Esta puede ser concreta o hipotética. Una población objetivo es concreta, si está delimitada e identificada en el sentido de conocer quienes y cuales son sus elementos. Ejemplo de poblaciones concretas son: 1. Los egresados de la Facultad de Estadística son la población objetivo, si se desea hacer un estudio sobre la aplicación de la estadística en su centro de trabajo. 2. Los productores del cultivo de maíz del estado de Veracruz son la población objetivo si se desea hacer un estudio sobre este cultivo. Nótese que en estos ejemplos la población objetivo son finitas, esto es, se conoce el número de elementos N que la conforman. Una población objetivo es hipotética si sus elementos se caracterizan a través de las propiedades que los conforman. Esto es, no es necesario otra cosa más que tener una
  7. 7. definición clara de cómo son los elementos de dicha población. Ejemplos de poblaciones hipotéticas: 1. Los clientes del supermercado Tia pueden ser la población objetivo si se desea efectuar un estudio sobre hábitos de consumo. 2. Los ciudadanos en edad de votar pueden ser la población objetivo si se desea efectuar un estudio sobre sus preferencias electorales. Nótese que para estos ejemplos los colectivos se caracterizan como un conjunto: U= x | x es un elemento del colectivo, en el que desconocemos cuántos elementos conforman la población, e incluso no se tiene un conglomerado de elementos ubicados en algún lugar. En general debe decirse que para estas poblaciones, que se denominan hipotéticas lo importante es caracterizar con precisión cuándo un elemento pertenece o no a ella, lo cual establece los limites de integración. Otro aspecto importante de notar es que en el ejemplo 1, no se conoce el número de elementos que conforman el colectivo, tal situación es muy común en los estudios de mercado y de opinión pública. En el segundo ejemplo, se hace referencia a un proceso que está funcionando, y se desea conocer el funcionamiento del proceso. 1.9 TIPOS DE ESTUDIOS ESTADÍSTICOS Esencialmente hay tres clases de estudios estadísticos: Estudios observacionales o descriptivos Estudios experimentales. Estudios de muestreo. Estudios prospectivos En las tres clases de estudio se realiza la fase del diseño, que consiste en la planeación de las actividades hasta que se han colectado los datos. En los estudios experimentales el investigador cuenta con una serie de unidades de estudio a las que asigna un conjunto de tratamientos (estímulos) y observa una serie de variables respuesta. En el caso de los estudios de muestreo el investigador selecciona de una población mayor las unidades a estudiar, y se registran tanto las variables a estudiar. Un estudio experimental se puede combinar con un muestreo. Este caso se presenta en situaciones en los que las unidades experimentales son considerablemente grandes. Por otro lado, los estudios observacionales son aquellos en los que las unidades ya están dadas y se observan las características de interés. Típicos ejemplos son aquellos en los que se usan expedientes, sistemas periódicos de información, estudios con voluntarios, etc. 1.10 EJERCICIOS PROPUESTOS 1.- Un fabricante de medicamentos desea conocer la proporción de personas cuya hipertensión (aumento de presión sanguínea) puede ser controlada con nuevo producto fabricado por la compañía. Al realizar un estudio en 5000 individuos hipertensos, se encontró que el 80% de ellos pudo controlar su hipertensión utilizando el nuevo medicamento. Suponiendo que esas 5000 personas son representativas del grupo de pacientes de hipertensión, conteste las siguientes preguntas: a. ¿Cuál es la población? b. ¿Cuál es la muestra? c. Identifique el parámetro de interés.
  8. 8. d. Identifique el estadístico utilizado e indique cuál es su valor. e. ¿Se conoce el valor del parámetro?. 2.- Un técnico de control de la calidad selecciona partes de una línea de ensamble y anota para cada una de ellas la siguiente información: a. Si está o no defectuosa. b. El número de identificación de la persona que armó la pieza. c. El peso de la pieza. Identifica para cada inciso el tipo de dato que se obtiene. 3.- Se quiere saber el costo de la educación. Uno de los gastos que hace un estudiante es la compra de sus libros de texto. Sea X el costo de todos los libros comprados este semestre por cada estudiante que ingreso a la Universidad. Describa cuidadosamente: a. La población. b. La variable. 4.- Con respecto al ejercicio anterior, considere que desea evaluar el costo promedio de los libros por estudiante que ingresos a la Universidad. a. Describa el parámetro poblacional. b. Si se seleccionaron 500 estudiantes y se les pidió que tomaran nota en su gastos de libros de texto y que informaran la cantidad total. Las 500 cantidades resultantes forman una muestra. Mencione el estadístico de interés en el presente estudio. 5.- El experimento llamado del "primer siete" consiste en tirar dos dados repetidamente hasta observar que la suma de sus caras sea siete. La variable que interesa es el número de tiradas necesarias para que caiga el primer siete. a. ¿Cuáles son los valores posibles de la variable respuesta?. b. ¿Tal variable es discreta o continua?. 6.- Identifique cada uno de los siguientes casos como ejemplo de variable (1) de atributo, (2) discreta, o (3) continua. a. La resistencia de la ruptura de un determinado tipo de cuerda. b. EL color del cabello de los niños que estén viendo por televisión una película. c. EL número de señales de tránsito en poblados con menos de 500 habitantes. d. Si una llave de lavabo está defectuosa o no. e. El número de preguntas contestadas correctamente en un examen. f. El tiempo que se necesita para contestar una llamada telefónica en una oficina de bienes raíces. 7.- Identifique cada uno de los siguientes casos como ejemplo de variable: (1) de atributo, (2) discreta o (3) continua. a. El resultado de la encuesta a un votante posible acerca del candidato de su preferencia. b. El tiempo necesario para que una herida cicatrice cuando se utiliza un nuevo medicamento
  9. 9. c. El número de llamadas telefónicas recibidas en un conmutador cada 10 minutos. d. La distancia a la que puede llegar un balón de fútbol al ser pateado por las jóvenes del primer grado de la Universidad. e. El número de páginas escritas por cada trabajo en una impresora de computadora. 8.- Supóngase que un niño de doce años quiere saber la diferencia entre muestra y población. a. ¿Qué información daría como respuesta? b. ¿Qué razones se le daría sobre el porqué se debe tomar una muestra en ves de estudiar todos los miembros de la población?. 9.- Se quiere describir al estudiante típico de cierta Universidad. Describa una variable que mida alguna característica de un estudiante y resulte en: a. Datos de atributo b. Datos discretos. Datos continuos 10.- Un candidato a ocupar un cargo público asegura que ganará la elección. Un sondeo de opinión indica que 35 de 150 electores votarán por él, 100 favorecerán a su oponente y 15 están indecisos. a. ¿Cuál es el parámetro poblacional de interés?. b. ¿Cuál es la estadística muestral que debe utilizarse para estimar el parámetro poblacional?. c. Tomando como base los resultados del sondeo, ¿cree que es cierta la afirmación del candidato? 11.- Una pequeña encuesta consta de tres preguntas: a. ¿Cuál es su religión: cristiana, musulmana u otra?. b. ¿A cuántos ritos religiosos asiste usted anualmente?. c. ¿Cuánto dinero donó a organizaciones religiosas el año pasado? Clasifique las respuestas a estas preguntas como datos cuantitativos o atributos, datos de variable discreta o datos de variable continua. 12.- Describa con sus propias palabras cada uno de los términos siguientes, dando además un ejemplo diferente de los que se han visto en clase. a. Variable b. Dato c. Muestra d. Población e. Estadístico f. Parámetro
  10. 10. 2 MÉTODOS TABULARES Y GRÁFICOS PARA LA ORGANIZACIÓN Y PRESENTACIÓN DE LOS DATOS

×