METODOS ESTADISTICOS PARA LA
                          INVESTIGACION.




             40




             30
Porcentaje




             20




             10




              0
                   Bajo            Intermedio     Alto

                              Hábito de estudio




                                PARTE I



              Dr. CLETO DE LA TORRE DUEÑAS

                          cletounsaac@gmail.com
                                   2011
1RA EDICION




Hecho el Depósito Legal en la Biblioteca Nacional del Perú
REGISTRO Nº : 2009-09684



Todos los derechos reservados.
Prohibida la reproducción total o parcial de este libro en forma idéntica o
modificada por cualquier medio mecánico o electrónico, incluyendo fotocopia,
grabación o cualquier sistema de almacenamiento y recuperación de
información no autorizada por el autor.


Impreso en Perú.
CAPITULO I
                         INVESTIGACION CIENTIFICA.


1.1 INVESTIGACIÓN CIENTÍFICA
La investigación científica, se puede entender como un conjunto de actividades
que realizamos para obtener conocimientos nuevos, sobre problemas nuevos
que afectan la realidad, pero que sean nuevos, respecto a la ciencia, es decir,
respecto al conjunto de conocimientos ya provisionalmente establecidos y
sistematizados por la humanidad, conocimientos nuevos que, como aportes, se
sumarán a la Ciencia.
¿Qué es investigar?
Investigar viene del latín investigare.
    Es la forma más adecuada de aproximarse al conocimiento de la verdad
       mediante verdades parciales.
    Desarrollar actividades con el objetivo de registrar, indagar o descubrir
       la verdad.
    En términos generales, es agregar algo nuevo a los conocimientos
       humanos.
    Es un proceso que, mediante la aplicación del método científico, procura
       obtener información relevante y fidedigna.      De entender, verificar,
       corregir o aplicar el conocimiento
1.2 PROBLEMA DE INVESTIGACIÓN
Es un hecho, fenómeno o situación que incita a la reflexión o al estudio y es
importante puesto que permite conocer la situación que se va a          estudiar
mostrando sus   principales rasgos.
CRITERIOS BASICOS PARA IDENTIFICAR PROBLEMAS.
    De manera general se considera que hay un problema cuando lo que
      DEBERÍA SER, difiere de lo que ES.
    El DEBERÍA SER, es el marco referencial, el patrón comparativo, el
      ideal, el modelo, el paradigma.
    Lo que ES, representa la realidad, es la práctica.
    DEBERÍA SER diferente a ES, entonces existe Problema




ESQUEMA DEL PROBLEMA DE INVESTIGACION.
Para la presentación del POI, es necesario considerar cuatro momentos: el
diagnóstico, el pronóstico, el control del pronóstico y la formulación de la
pregunta o preguntas o la redacción de un texto a manera de pregunta.
 El diagnóstico es la descripción de los síntomas o problemas.
         El pronóstico es la serie consecuencias de los problemas.
         El control del pronóstico es la serie de acciones para superar las
           consecuencias de los problemas.
         Formulación del problema




ELEMENTOS DE DEL TITULO DE UN PROBLEMA

Especificidad      Situación        Unidad de     Espacio       Tiempo
                   problemática     estudio


    Situación problemática

      Responde a la pregunta ¿Qué investigar?
      Por ejemplo: Rendimiento académico, gestión educativa, desempeño
      profesional,..
    La especificidad
Es el aspecto o los aspectos concretos que se quiere investigar acerca
     del hecho o situación problemática.
     Por ejemplo: causas, consecuencias, características, importancia,
     influencia, tendencia, modalidades, incidencia, prevalencia, implicancias,
     estructura, función, nivel, relación, evolución, etc.
   Unidades de estudio.
     Son aquella en las se ponen de manifiesto los hechos o situaciones
     problemáticas y constituyen, desde el punto de vista estadístico, la
     población o muestra a la que se refiere la investigación. Son: Personas,
     grupos    sociales,   seres,     acontecimientos,       instituciones,   objetos,
     procesos.
   Espacio
     Esta referido al lugar en el que ocurre el hecho o situación problemática.
     Puede ser geográfico o administrativo. ¿Dónde?; Perú, Ciudad del
     Cusco, Zona Franca, Aceros Arequipa, etc.
   Tiempo
     Está referido al momento en que ocurre el hecho o situación
     problemática. ¿Cuándo?.

1.3 FORMULACION DE OBJETIVOS
     Son los propósitos o fines que se pretenden lograr al realizar la
     investigación.
   Los objetivos son de dos tipos:
     El objetivo general (singular)
     Los objetivos específicos (plural)
   Los objetivos deben ser verificables
   Al definir los objetivos, debemos pensar inmediatamente en la manera
     de verificar si éstos se han cumplido o no (pensar en métodos o
     herramientas para ello)
   Lo anterior nos permitirá ir dibujando el perfil metodológico de nuestra
     investigación
   Los objetivos se convierten así en la carta de navegación de la
     investigación a realizar
 Los objetivos deben ser precisos y no muy ambiciosos: deben ser
         acordes con los recursos disponibles (tiempo) y ello delimitará el nivel de
         detalle esperable.


Elementos a tomar en cuenta para redactar un objetivo
 Sujeto       : Beneficiario de la propuesta.

 Contenido: Expresa el cambio requerido y
  Acción       : Conjunto de actividades que se desarrollan.


Ejemplo 1: Reforzar la capacidad de gestión en los centros de educación inicial
del país para la atención de los dominios del aprendizaje de los niños de 4 y 5
años de edad.
Acción      : Reforzar la capacidad de gestión en los centros de
educación inicial del país.
Contenido: La atención de los dominios del aprendizaje.
Sujeto      : Niños de 4 a 5 años de edad

1.4 JUSTIFICACION Y DELIMITACION DE LA INVESTIGACIÓN
Criterios de justificación.
               Originalidad
               Relevancia
               Interés
               Factibilidad

 Criterios para delimitar
               Espacial - Geográfica
               Cronológica



1.5 MARCO TEORICO
En el marco teórico se integra con las teorías, enfoque teóricos, estudios y
antecedentes en general que se refieran al problema de investigación.
Para elaborar el marco teórico es necesario detectar, obtener y consultar la
literatura y otros documentos pertinentes para el problema de investigación,
así como extraer y recopilar de ellos la información de interés.
          La revisión de la literatura puede iniciarse manualmente o
             acudiendo a un banco de datos al que se tenga acceso por
             computadora.
          La     construcción    del   marco   teórico     depende   de   lo   que
             encontremos en la revisión de la literatura:
        Marco Teórico: Fundamentación teórica dentro de la cual se
           enmarca la investigación
        Marco Conceptual: Definición de conceptos relevantes utilizados en
           el estudio
        Marco Normativo: Normas, leyes referentes al estudio

¿Qué funciones cumple el marco teórico?
        Sirve de guía al Investigador
        Provee un marco para la interpretación de resultados

1.6 HIPOTESIS DE INVESTIGACION


      Afirmaciones o suposiciones que hace el investigador respecto al
      problema de investigación.
      Es una suposición que permite establecer relaciones entre hechos. El
      valor de una hipótesis reside en su capacidad de establecer esas
      relaciones entre los hechos y de esa manera, explicarnos por qué se
      produce el fenómeno de estudio.


¿Qué Funciones cumple?
        Direccionar el problema objeto de investigación
        Identificar variables objeto de análisis
        Orientar el uso de métodos y técnicas de obtención de información

Elementos estructurales de la hipótesis
      1. Las unidades de análisis, que puedan ser los individuos, grupos,
      viviendas, instituciones, etc.
2. Variables, las características o propiedades cualitativas o
      cuantitativas que presentan las unidades de análisis.
      3. Los elementos lógicos, son los que relacionan las unidades de
      análisis con las variables y estas entre sí.

Requisitos para estructurar las hipótesis
           Las hipótesis deben referirse sólo a un ámbito determinado de la
             realidad social. Las hipótesis en las ciencias sociales sólo pueden
             someterse a prueba en un universo y contexto bien definidos.
           Los conceptos de las hipótesis deben ser claros y precisos. En las
             hipótesis, los conceptos son las variables y las unidades de
             análisis.
           Los conceptos de las hipótesis deben contar con realidades o
             referencias empíricas observables (verificables).
           El planteamiento de las hipótesis deben prever las técnicas para
             probarlas. Se deben formular hipótesis que están relacionadas
             con técnicas disponibles para su verificación.



1.7 NIVELES DE INVESTIGACIÓN.


El nivel de una investigación viene dado por el grado de profundidad y alcance
que se pretende con la misma


INVESTIGACIÓN DESCRIPTIVA
Orientada al descubrimiento de las propiedades particulares del hecho o
situación problemática y también a la determinación de la frecuencia con que
ocurre el hecho o situación problemática.
Responde a las preguntas ¿Cómo son? ¿Cuántos son? ¿Dónde están? Se
refiere a las características cualidades internas y externas, propiedades y
rasgos de la población de estudio
Ejemplo 2:

Nivel de conocimiento de las estrategias cognitivas por los profesores, de la
población de la ciudad de Cusco, 2011.
INVESTIGACIÓN EXPLICATIVA
      Orientada al descubrimiento de las causas o consecuencias o
       condicionantes de la situación problemática
      Está dirigida a responder a las causas de los eventos físicos o sociales y
       su interés se centra en explicar por qué y en qué condiciones ocurre un
       fenómeno, o por qué dos o más variables se relacionan.
      ¿Por qué? La finalidad es determinar por qué un hecho o fenómeno de
       la realidad tiene tales y cuales características.
Ejemplo 3:
Principales causas de la deserción escolar en la región andina del Perú, 2010.


INVESTIGACIÓN COMPARATIVA
Orientada al estudio de las semejanzas o diferencias de un hecho o situación
problemática en dos circunstancias diferentes.
Ejemplo 4:
Nivel de aplicación de metodologías de enseñanza por los profesores de las
instituciones educativas A y B de Cusco, 2010.


INVESTIGACIÓN RELACIONAL
Orientada al descubrimiento de la influencia de un hecho o situación
problemática en otro hecho o situación problemática.


Ejemplo 5:
Influencia de la internet en la lectura de los estudiantes de secundaria de la
Ciudad del Cusco, 2011.


INVESTIGACIÓN CORRELACIONAL
Orientada a descubrir la covariación o correspondencia entre los valores de dos
hechos o situaciones problemáticas.
Ejemplo 6:
Correlación entre hábitos de estudio y aprendizaje en los estudiantes de la
Universidad de Nacional San Antonio Abad del Cusco, 2011.
INVESTIGACIÓN EXPERIMENTAL
       Orientada a descubrir la validez de un hecho para la modificación de una
       situación problemática.
       ¿Qué cambios y modificaciones se han producido? ¿Qué mejoras se
       han logrado?.
Ejemplo 7:
Evaluación del efecto del uso de tres tipos de materiales didácticos en el
rendimiento académico, en las I.E de la ciudad de Cusco, 2011.


1.8 TIPOS DE INVESTIGACION
Los Tipos de investigación se determinan mediante la aplicación de distintos
criterios, a continuación se refieren algunos de ellos.


INVESTIGACION BASICA. Solo busca aplicar y profundizar el conocimiento
científico existente acerca de la realidad.


INVESTIGACION APLICADA.             Se investiga    para transformar, modificar o
producir cambios en un determinado sector de la realidad.


INVESTIGACION SUSTANTIVA. Se orienta a resolver problemas facticos, su
propósito es dar respuesta objetiva a interrogantes que se plantea en un
determinado fragmento      de la realidad y del conocimiento con el objeto de
contribuir en la estructuración de las teorías científicas.


INVESTIGACION        TECNOLOGICA.          Se   relaciona     esencial,   objetiva   y
metodológicamente con el nivel experimental, se busca cambios mediante la
aplicación de nuevos sistemas.


1.9 DISEÑOS DE INVESTIGACION.
         Conjunto de estrategias procedimentales y metodológicas definidas
             y elaboradas para el desarrollo del proceso de investigación.
 El diseño de investigación puede ser pensado como la estructura
   de la Investigación.
 El investigador debe seleccionar un diseño de investigación. Esto
   se refiere a la manera práctica y precisa que el investigador adopta
   para cumplir con los objetivos de su estudio, ya que el diseño de
   investigación indica los pasos a seguir para alcanzar dichos
   objetivos. Es necesario por tanto que previo a la selección del
   diseño de investigación se tengan claros los objetivos de la
   investigación.
 Las maneras de cómo conseguir respuesta a las interrogantes o
   hipótesis   planteadas dependen de la investigación. Por esto,
   existen diferentes tipos de diseños de investigación, de los cuales
   debe elegirse uno o varios para llevar a cabo una investigación
   particular (Hernández, Fernández y Baptista, 2000; Castillo, 2005).
 La precisión, la profundidad así como también el éxito de los
   resultados de la investigación dependen de la elección adecuada
   del diseño de investigación. He aquí un esquema donde se
   resumen los diferentes tipos de investigación según Hernández,
   Fernández y Baptista (2000).
Diseños experimentales
 Son aquellos en los que se cumple que:
       Los grupos a ser investigados han sido asignados al azar, por
       procedimientos aleatorios y los grupos resultantes son equivalentes, de
       tal manera que se tiene un grupo control equivalente a los grupos
       experimentales.
Diseños cuasi-experimentales.
  Entendemos por diseños cuasi-experimentales cuando se cumplen las
   siguientes condiciones:
           Los grupos sobre los que se lleva a cabo la investigación no han
              podido establecerse como equivalentes en las características
              fundamentales. Los grupos no han sido asignados al azar, sino
              que han sido establecidos por algún otro procedimiento de
              muestreo.

           Como dice Hernández et al.“En los diseños cuasi-experimentales
              los sujetos no son asignados al azar a los grupos no
              emparejados; sino que dichos grupos ya estaban formados antes
              del experimento, son grupos intacto (la razón por la que surgen y
              la manera como se formaron fueron independientes o aparte del
              experimento.”
           También algunos autores denominan CUASI-EXPERIMENTAL,
              cuando el investigador aplica un tratamiento a un solo grupo de
              sujetos, sin grupo de control, observándolo antes y después de
              aplicar el tratamiento.

Diseños no-experimentales.
Se establece que un diseño no-experimental es: “la que se realiza sin
manipular deliberadamente variables. Es decir, se trata de investigación donde
no hacemos variar intencionadamente las variables independientes. Lo que
hacemos en la investigación no experimental es observar fenómenos tal y
como se dan en su contexto natural, para después analizarlos.” (Hernández,
184)
La diferencia con los diseños experimentales y cuasi- experimentales se ve con
claridad, porque en estos dos siempre hay algún tipo de intervención del
investigador, que manipula las variables independientes para averiguar su
influencia en las variables dependientes.


Método transversal: Es el diseño de investigación que recolecta datos de un
solo momento y en un tiempo único. El propósito de este método es describir
variables y analizar su incidencia e interrelación en un momento dado.


Diseños transversales descriptivos: son aquellos que tienen como objetivo
indagar la incidencia y los valores en que se manifiesta una o más variables.


Diseños transversales correlacionales: Se encargan de describir relaciones
entre dos o más variables en un momento determinado.


 Diseños transversales        explicativos: Son aquellos en los cuales las
 causas y efectos ya ocurrieron en la realidad (estaban dados y manifestados)
y el   investigador los observa y explica.


Diseños longitudinales: Son aquellos que analizan cambios a través del
tiempo (en variables o sus relaciones), dentro de alguna población en general.


1.10 VARIABLES
A las características objeto de estudio en la población se les llama variables, ya
que pueden variar de un individuo a otro y se representara por letras
mayúsculas: X, Y, Z,. . ., debemos distinguir los distintos tipos de variables que
hay, lo cual nos va a permitir utilizar las herramientas estadísticas apropiadas.


TIPOS DE VARIABLES.
Las variables estadísticas pueden ser de dos tipos:
       Variables cualitativas o atributos: describen cualidades y no toman
       valores numéricos, estas a su vez pueden ser:
         Nominales.- Las cualidades no presentan ningún orden. Ejemplo Sexo
         del estudiante (Femenino, Masculino), Procedencia, I.E.
Ordinales.- Este tipo de variables presentan orden Ejemplo: Grado de
        estudios   (Analfabeto,    primaria,   secundaria,   superior),   Nivel   de
        conocimiento de Docentes.


     Variables cuantitativas: toman valores numéricos. A su vez pueden ser:
        Discretas.- Solo toman un número finito o infinito numerable de valores
        distintos (generalmente números naturales o enteros). Ejemplos:
        número de estudiantes por secciones, número de profesores, número
        de aulas, etc.
        Continuas.-      Toman     valores     en   un   intervalo.   Generalmente
        corresponden a medir magnitudes continuas. Ejemplo, Rendimiento
        académico, altura, ingreso del docente, etc.


Una característica esencial de este tipo de variables es que sus valores nunca
son observables con exactitud, sino que dependen (las observaciones) de la
precisión del instrumento de medida.


Ejemplo 7


Un especialista estudia, el nivel de introversión en niños menores de 4 años en
las instituciones educativas de la ciudad de Cusco.          Defina los conceptos
previos para este estudio.
Solución:
Población: Niños menores de 4 años de las I.E de la ciudad de Cusco.
Muestra: Niños de 3 años de las I.E de la ciudad de Cusco.
Variable: Nivel de Introversión.
Tipo de variable: Cuantitativa
Unidad de estudio: Niño menor de 4 años.


1.11 ESCALAS DE MEDICION
Se llama medición        al proceso de atribuir números a las características.
Tenemos las        siguientes escalas de medición: nominales, ordinales,
cuantitativas de intervalo y cuantitativas de razón.
Escala nominal: la clave de estas escalas de medida es que sólo informan
de la igualdad o desigualdad de los individuos en una característica, pero
no de posibles ordenaciones, puesto que la característica a la que se
refieren no se tiene en mayor o menor medida, sino que simplemente
adopta formas cualitativamente distintas. Los números solo sirven para
distinguir valores o categorías diferentes de la variable.
Esta escala se emplea para variables cualitativas nominales.


Ejemplo 8: El sexo 1=Masculino y 2=Femenino esto simplemente es un
proceso de codificación pero no significa que la mujer sea mayor que el
hombre, ni el doble, ni que existe sexo intermedio.


Escala Ordinal: Los números además de servir para distinguir reflejan un
orden existente sobre los valores de la variable.
Se obtiene clasificando objetos o arreglándolos en un orden con respecto
a alguna variable común. La pregunta es simplemente, si el objeto tiene
más o menos de esta variable que algún otro objeto.
Esta escala se emplea para variables cualitativas ordinales.


Ejemplo 9: Nivel de conocimientos de estrategias cognitivas por parte de
los docentes. Excelente=5, bueno =4, regular =3 y malo = 2.” es cierto la
relación de orden 2<3<4<5.


Escala de Intervalo: La ubicación del punto origen no es fija, puesto que
0 no denota la ausencia del atributo. Aquí los números para clasificar los
objetos representan también incrementos iguales del atributo que se esta
midiendo. Esto significa que los números pueden ser comparados. La
diferencia en 1 y 2 es la misma que entre 2 y 3, pero es solo la mitad de
la diferencia entre 2 y 4.
Las temperaturas Fahrenheit y Centígrados son medidas que tiene
diferentes escalas de intervalo y diferentes puntos de 0.
Escala de Razón: Medida numéricas en las cuales cero es un valor fijo
en cualquier escala y la diferencia entre valores es diferente
Además de la distancia de orden e intervalo, se añade un origen absoluto
de forma que no solo cabe hallar distancias (ya en la escala de intervalo),
si no también múltiplos exactos. En este caso, el valor representado por 4
tiene doble cantidad medida que él representado por un 2.
Ejemplo 10: Edad del profesor expresada en años.
   40 años y 20 años son edades distintas y 40 años es superior a 20
años
   Entre 40 y 20 hay una diferencia de 20, la misma que entre 50 y 30.
   El 0 tiene sentido. Una persona con 0 años, realmente no tiene edad
   todavía no ha nacido.
En el siguiente cuadro se muestra un resumen de las características de
las escalas de medición.
                         Resumen de escalas de medición
            Información       Transform.    Significa Significa   Significa
  Tipo                                                                           Ejemplos
             deducible        admisibles    orden     distancia Origen
                                               No        No          No       Procedencia
            Relaciones
                             Aplicaciones                                     del Profesor,
Nominal “igual que” o
                             inyectivas                                       tipo de
            “distinto que”
                                                                              metodologia
                                               Si        No          No       Grado de
                                                                              planificación,
            Relaciones
                             Funciones                                        Nivel de
Ordinal     “mayor que”
                             crecientes                                       utilización de
            o “igual que”
                                                                              materiales
                                                                              educativos.
            Igualdad o                         Si         Si         No
            desigualdad      A + b.x                                          Temperatura,
Intervalo
            de               (b     0)                                        inteligencia
            diferencias
                                               Si         Si         Si       Rendimiento
            Igualdad o
                             B .x                                             académico,
 Razón      desigualdad
                             (b     0)                                        Número de
            de razones
                                                                              estudiantes.
ESCALAS PARA LA MEDICION DE ACTITUDES
La escala de clasificación por categorías es la que usan ampliamente los
investigadores de ciencias de la salud y sociales.


     Escala de clasificación por categorías:
     Existen cuatro categorías a partir de las cuales los entrevistados pueden
     elegir para señalar su nivel general de satisfacción.
     - Muy satisfecho (+2)
     - Satisfecho (+1 )
     - Algo satisfecho (0)
     - No del todo satisfecho (-1)


    Escala De Comparación:
    Es una versión de la escala de categorías, califica a estas categorías
    como: “excelente”, “muy bueno”, “bueno”, “regular” y “deficiente”,
    eliminando de esta forma la comparación implícita. El problema con tal
    escala es que el punto de referencia es poco claro y diferentes
    entrevistados pueden usar diferentes puntos de referencia o estándares.


    Escala de Likert:
    La escala de Likert requiere que un entrevistado indique un grado de
    acuerdo o desacuerdo con respecto a una variedad de afirmaciones
    (reactivos) relacionadas con el objeto de las actitudes.


      Es un tipo de instrumento de medición o de recolección de datos que
      disponemos en la investigación social.

      Es una escala para medir las actitudes.

      Consiste en un conjunto de ítems bajo la forma de afirmaciones o juicios
      ante los cuales se solicita la reacción (favorable o desfavorable, positiva
      o negativa) de los individuos.
Alternativas o puntos en la escala de Likert
Asignación Asignación               Alternativa          Alternativa         Alternativa          Alternativa
Numérica          Numérica                 A                   B                    C                    D
     I                  II
     2                  5          Muy de              Totalmente           Definitivamen Completame
                                   acuerdo             de acuerdo           te sí                nte
                                                                                                 verdadero
     1                  4          De acuerdo          De acuerdo           Probablemen          Verdadero
                                                                            te sí
     0                  3          Ni de               Neutral o            Indeciso             Ni falso, ni
                                   acuerdo, ni         indiferente                               verdadero
                                   en
                                   desacuerdo
     -1                 2          En                  En                   Probablemen          Falso
                                   desacuerdo          desacuerdo           te no
     -2                 1          Muy en              Totalmente           Definitivamen Completame
                                   desacuerdo          en                   te no                nte falso
                                                       desacuerdo


Para obtener las puntuaciones de la escala de Likert, se suman los valores
obtenidos respecto de cada items. El puntaje mínimo resulta de la
multiplicación del número de ítems por 1. Una puntuación alta está dada por el
número de ítems o afirmaciones multiplicado por 5.


              PM--------------------I----------------------I----------------------I------------------
PA

Donde: PM: Puntaje mínimo y PA: Puntaje Máximo.


Ejemplo 11: Ha encontrado en la institución educativa el apoyo y las
facilidades necesarias para que usted desarrolle de modo óptimo su trabajo.

         ( ) Definitivamente sí

         ( ) Probablemente sí
( ) Indeciso

        ( ) Probablemente no

        ( ) Definitivamente no


Ejemplo 12: El Director de la UGEL se preocupa por el bienestar del recurso
humano.
  Categorías de Respuesta              Frecuencia     Porcentaje    Asignación de
                                                                    puntajes
  Totalmente de acuerdo          (5)   2              4.4%          2(5)
  De acuerdo                     (4)   4              9%            4(4)
  Indeciso                       (3)   7              15.6%         7(3)
  En desacuerdo                  (2)   9              20%           9(2)
  Totalmente en desacuerdo (1)         23             51%           23(1)
                                       n=45           100%          Total=88


Para interpretar el puntaje se ubica en los tramos de la escala de likert.
  Totalmente           En                  Indeciso   De acuerdo   Totalmente de
  En     desacuerdo desacuerdo              (3)         (4)        Acuerdo (5)
  (1)                  (2)
  45*1=45              45*2=90             45*3=135 45*4=180       45*5=225
La puntuación 88 se aproxima a 90, por lo tanto se ubica en la parte que indica
en desacuerdo.




1.12 TIPOS DE VARIABLES UTILIZADAS EN LA INVESTIGACION
CIENTIFICA.


        Variable independiente
         Es aquella que juega un rol determinante, causal o de influencia en
            otra u otras variables, supone cierta autonomía con relación a las
            demás variables, pero es necesario, señalar que las variables
            independientes en determinados problemas, pueden cambiar, según
sea la posición que ocupen en el enunciado, debido a que la realidad
   está en movimiento y que todos los hechos están concatenados.


 Este tipo de variable se encuentra en las siguientes investigaciones:
 1. Explicativa,
 2. Relacional
 3. Experimental ( en la experimental se le conoce como estímulo)


Variable dependiente


 Es aquella que juega un rol de consecuencia, al ser determinada,
   originada o influida por la variable independiente. Esto significa que
   no pueden existir variables dependientes sin las independientes.


 Considerando el tiempo, las independientes son más antiguas que
   las dependientes. Se encuentran en las siguientes investigaciones:
 1. Explicativa
 2. Relacional
 3. Experimental (La variable dependiente en una investigación
    experimental se le conoce como respuesta)
 Ejemplo 13:
 En el problema influencia del uso de mapas mentales en el rendimiento
 académico de los estudiantes de las I.E de la región de Cusco, 2011.
   Variable independiente: Rendimiento Académico
   Variable dependiente: Uso de mapas mentales


Variable Intermedia
 Es aquella que juega un rol de factor condicionante, pues su
   presencia entre la variable independiente y variable dependiente
   hace que sin tener el carácter de factor causal o determinante,
   modifique le resultado más complejas y de mayor profundidad.
Ejemplo 14:
   En el estudio de formación académica y rol de la experiencia en el
   desempeño profesional, Quillabamba. 2011.
   Variable independiente: formación académica.
   Variable Dependiente: Desempeño profesional
   Variable Intermedia : Experiencia


Variable interviniente
 Es aquella que en ciertas medida juega un rol pasivo en el problema,
   pues permite medir las características, atributos, estructuras,
   incidencia, elementos o aspectos que se son inherentes.


 La variable interviniente, la encontramos en investigaciones:
     1. Descriptiva
     2. Comparativa.


   Ejemplo 15:
   En el problema: Niveles de desnutrición de los estudiantes de las
   instituciones educativas de la ciudad de Sicuani, 2011.
   Variable interviniente : Nivel de desnutrición.
Variables Asociadas
 Son aquellas que no guardan mayor nivel de dependencia, no hay
   relación causal entre ellas y considerando el criterio tiempo vienen a
   ser más o menos contemporáneas, pues para que aparezca el
   problema surgen de manera simultánea.


 Este tipo de variables, se encuentra en la investigación descriptiva
   multivariable, se trata de dos o más variables intervinientes, por lo
   que nunca van acompañadas de algún otro tipo de variables.


   Ejemplo 16:
   En el problema: Rasgos sociales y culturales de los profesores de la
   ciudad de Cusco , 2011.
 Las variables asociadas son rasgos sociales y rasgos        culturales


       Variables Interdependientes
        Son aquellas que indistintamente pueden ser consideradas como
          causa o como consecuencia una de otra. Corresponden a la
          investigación correlacional.


          Ejemplo 17:
          En el problema: Correlación entre tipo de alimentación y obesidad
          de los estudiantes de la ciudad de Cusco, 2010.
          Las variables interdependientes, son tipo de alimentación y obesidad


        Resumen del tipo de variables según tipo de investigación.


            Descriptiva                   Comparativa                   Explicativa
             Interviniente                  Interviniente                Independiente(s)
             Asociada                                                    Dependiente(s)


            Relacional                    Correlacional                Experimental
             Independiente                  Interdependiente             Estimulo (Factor)
             Dependiente                    Interdependiente             Respuesta


       Observaciones:
       1. Las variables según su naturaleza se clasifican en cuantitativas y
          cualitativas.
       2. Las   variables    según   su    relación   casual   se   clasifican    en:
          independiente, dependiente, interviniente.
       En el área de las ciencias de la salud, se tiene los siguientes tipos de
       investigación biomédica.


1.13   RECOPILACIÓN DE DATOS.
Dentro de un proceso de investigación una de las actividades que se realizan
es la recopilación de datos, la cual es el acopio de información y se incluye
desde elaborar fichas bibliográficas hasta la aplicación de cuestionarios con el
empleo de técnicas de muestreo.
Para Hernández et.al. (2006) un instrumento de medición es un recurso que
utiliza el investigador para registrar información o datos sobre las variables que
tiene en mente.
La construcción de instrumento consiste en generar un número suficiente de
ítems para medir todas las variables con todas sus dimensiones.


      La recopilación de datos, se puede realizar mediante:
      Investigación documental
      Investigación de campo


      La investigación documental. Consiste en el estudio de documentos
      escritos sobre un objeto determinado, es decir son todos aquellos
      documentos registrados en diferentes dispositivos físicos a los que
      podemos tener acceso en forma directa o indirecta para su consulta y se
      puede clasificar en:
      1.- Documental bibliográfica       4.- Documental audiográfica
      2.- Documental hemerográfica        5.- Documental videográfica
      3.- Documental escrita             6.- Documental iconográfica


      La investigación de campo. Consiste en obtener información directa
      mediante diferentes actividades por contacto directo con el hecho que se
      quiere investigar así como las personas relacionadas y se puede
      realizar:
      a) Por observación directa
      b) Por interrogación


      La observación. Es el procedimiento empírico básico, el cual consiste
      en realizar la    percepción intencionada de una actividad determinada
      mediante la experimentación la cual consiste en la obtención de datos
      cuantitativos por medio de la medición del fenómeno que se este
      observando.      Para   realizar   la   observación   se   utilizan   diversos
      instrumentos auxiliares los cuales son:
1.- La ficha de campo        3.- La entrevista
      2.- Estudio de Actividades 4.- La encuesta


      La Entrevista. Es una de las técnicas más comunes y es considerada
      como la relación directa entre el investigador y el objeto de estudio a
      través de individuos o grupos con el fin de obtener testimonios reales.
      a) Entrevistas formales
      b) Entrevistas informales


      La Encuesta. Consiste en recopilar información sobre una parte de la
      población.
      La información recopilada puede emplearse para un análisis cuantitativo
      con el fin de identificar las magnitudes del problema.


      El Cuestionario. Es un eficaz auxiliar en la observación científica que
      contiene aspectos del fenómeno esenciales, las cuales son preguntas
      formuladas por escrito y no es necesaria la presencia del investigador.
      - Cuestionarios por correo
      - Cuestionario administrado por el entrevistado
      - Cuestionario administrado por el entrevistador


      La Cedula. Tiene carácter de anónimo, donde el encuestador es quien
      llena la cedula de entrevista, además de que es posible aclara la
      información sobre las preguntas y es utilizada cuando una persona tiene
      un bajo nivel cultural.


1.14 VALIDACIÓN DEL INSTRUMENTO


La validación de los instrumentos se realiza con el fin de conseguir una mayor
objetividad al seleccionar los ítems en los respectivos cuestionarios.
VALIDEZ DE CONTENIDO
El proceso de validación de contenido es eminentemente lógico, si bien pueden
utilizarse jueces expertos en el tema para valorar la congruencia entre los
diversos items y los diversos objetivos.
Existen procedimientos cuantitativos diversos para que cada experto valore el
grado en que un ítem sirve para evaluar el objetivo al que corresponde. El
procedimiento cuantitativo más sencillo sería el siguiente:


    Especificar los diversos objetivos (v.gr. áreas diferentes de contenidos)
      que se Pretenden evaluar.
    Elaborar varios ítems para cada objetivo.
    Seleccionar una muestra de expertos en el contenido del test.
    Pedirles que, según su opinión, asignen cada ítem al objetivo que
      pretende medir.
    Seleccionar los ítems en los que los expertos manifiestan mayor acuerdo
      en sus clasificaciones.
CRITERIO DE EXPERTOS

      Método 1:
      HOJA DE PREGUNTAS PARA LA VALIDACIÓN
PREGUNTAS                                                  ESCALA DE VALORACION
1. ¿Considera usted que los ítems del instrumento          1     2       3        4       5

miden lo que se pretende medir?
2. ¿Considera usted que la cantidad de ítems
registrados en esta versión son suficientes para
tener una comprensión de la materia de estudio?            1     2       3        4       5

3,   ¿Considera   usted    que   los   ítems contenidos
en este instrumento, son una muestra representativa del
universo materia del estudio?                              1     2       3        4       5

4. ¿Considera usted que si aplicamos en reiteradas
oportunidades este instrumento a muestras similares,
obtendríamos también datos similares?                      1     2       3        4       5

5. ¿Considera usted que los conceptos utilizados en
este instrumento, son todos y cada uno de ellos, propios
de las variables del estudio?                              1     2       3        4       5


6. ¿Considera usted que todos y cada uno de los ítems
contenidos en este instrumento tienen los mismos
objetivos?                                                 1     2       3        4       5

7. ¿Considera usted que el lenguaje utilizado en
el presente instrumento es claro, sencillo y no da lugar
a diversas interpretaciones?                               1     2       3        4       5

8. ¿Considera usted que la estructura del presente
instrumento es adecuada al tipo de usuario a quien se      1     2       3        4       5

dirige el instrumento?

9. ¿Estima usted que las escalas de medición
utilizadas son pertinentes a los objetos materia de        1     2       3        4       5

estudio?
10. ¿Que aspectos habría que modificar, que aspectos tendrían que incrementarse o que aspectos
habría que suprimirse?
……………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………
……………………………………………………………………………………………………
PROCEDIMIENTO
El método DPP mide la adecuación de los instrumentos, para medir la variable
de interés, en función a la valoración de los expertos.
Ejemplo 18.
En el presente estudio la valoración de los expertos es:



                  EXPERTOS
    Item          1            2             3              4    Promedio
    1             5            4             5              5    4.75
    2             5            5             5              5    5
    3             5            4             5              4    4.5
    4             5            5             4              4    4.5
    5             5            5             5              5    5
    6             5            5             5              5    5
    7             4            5             3              4    4
    8             4            4             5              4    4.25
    9             4            4             5              5    4.5


2. Con los promedios hallados, se determina la distancia de punto múltiple
(DPP), mediante la siguiente ecuación:

DPP = (X 1 Y1 )2 +(X 2 Y2 )2 + ................(X 9 Y9 )2

Donde:
Xi = Valor máximo en la escala para el ítem i.
Yi = El promedio del ítem i.

DPP = ( 5 4.75 )2 +( 5 5 )2 + ................( 5 4.5 )2 1.541

Determinar la distancia máxima (Dmax) del valor obtenido respecto al punto de
referencia Cero (0), con la ecuación:
    2
D
M x
a (1
x 1  (1... n 2
      2
        2
   )x .... )
       ) ... x
         ...(1
          ...
          ...

Donde:
Xi = Valor máximo en la escala concedido para el ítem i.
1 = Valor mínimo de la escala para cada ítem.
DMax       (5 1) 2   (5 1) 2   ...................(5 1) 2   12

La Dmax hallada fue de 12
La Dmax se divide entre el valor máximo de la escala, lo que nos da un valor
de 12/5=2.4
5. Con el valor hallado anteriormente (apartado 4) se construye una nueva
escala valorativa a partir de cero, hasta llegar a Dmax. Dividiéndose en
intervalos Iguales entre si, llamándose con las letras A, B, C, D, y E.
      Siendo:
                        Valoración                               Valoración de
Escala                                                      Expertos
         0-             A = Adecuación Total                     DPP=1.541
2.4
         2.4-           B = Adecuación en gran
4.8             medida
         4.8-           C = Adecuación
7.2             Promedio
         7.2-           D = Escasa Adecuación
9.6
         9.6-           E = inadecuación
12


6. El punto DPP debe caer en las zonas A o B; en caso contrario, la encuesta
requiere reestructuración y/o modificación, luego de las cuales se somete
nuevamente a juicio de expertos. El valor hallado del DPP fue de 1.541
cayendo en la zona A, lo que indica la Adecuación del instrumento y que
puede ser aplicado.
Método 2
Cuadro 1. Formato para validar instrumentos a incluir en el instrumento de
validación.


      ÍTEM                              Criterios a evaluar                          observaciones

                Claridad    Coherencia      Inducción      Lenguaje       Mide lo    (    si    debe
                                                                          que        eliminarse      o
                En     la   interna         a         la   Adecuado
                                                                          pretend    modificarse un
                redacció                    respuesta
                                                           Con el nivel   e medir    favor indique)
                n
                                            (sesgo)
                                                           Del
                                                           informante

                Si    No    Si     No       Si      No     Si      No     Si    No

      1

      ..

      n

      Aspectos generales                                                  Si    No   *************

      El instrumento contiene instrucciones claras y precisas
      para responder el cuestionario
      Los ítems permiten el logro del objetivo de la investigación

      Los ítems están distribuidos en forma lógica y secuencial

      El número de ítems es suficiente para recoger la
      información. En caso de ser negativa su respuesta, sugiera
      los ítems a añadir
      Validez

      Aplicable ( )              No aplicable ( )

      Validado por:

      Firma:
1.5.10 CONFIABILIDAD del INSTRUMENTO
Antes de iniciar el trabajo de campo, es imprescindible probar el cuestionario
sobre un pequeño grupo de población. Esta prueba piloto ha de garantizar las
mismas condiciones de realización que el trabajo de campo real. Se
recomienda un pequeño grupo de sujetos que no pertenezcan a la muestra
seleccionada pero sí a la población o un grupo con características similares a la
de la muestra del estudio, aproximadamente entre 14 y 30 personas. De esta
manera se estimará la confiabilidad del cuestionario.
La confiabilidad responde a la pregunta ¿con cuánta exactitud los ítems,
reactivos o tareas representan al universo de donde fueron seleccionados?. El
término confiabilidad “…designa la exactitud con que un conjunto de puntajes
de pruebas miden lo que tendrían que medir” (Ebel, 1977, citado por Fuentes,
op. cit., p. 103).


Entre los métodos para estimar la confiabilidad, se tienen:


Método Test-Retest: una forma de estimar la confiabilidad de un test o
cuestionario es administrarlo dos veces al mismo grupo y correlacionar las
puntuaciones obtenidas.
El coeficiente que se obtiene recibe el nombre de coeficiente de estabilidad
porque denota la coherencia de las puntuaciones en el tiempo
Para un desarrollo adecuado y sean confiables deben variar entre 0,80 y 0,95
(Popham, 1980, citado por Fuentes, op. cit.).
Se usa la correlación por el método de los puntajes directos (Correlación r de
Pearson):

                           n   xi yi       xi    yi
        rxy
                                       2                   2
                n    xi2       xi * n           yi2   yi


        Donde:

        rxy : es el coeficiente de correlación
         n: número de sujetos
         X: valores de X (1ª aplicación)
Y: valores de Y (2ª aplicación)
Método común de división por mitades o Hemitest: este método computa el
coeficiente de correlación entre los puntajes de las dos mitades del test o
cuestionario aplicado. Esto supone que las dos test mitades son paralelos,
tienen igual longitud y varianza entre sí. Se estima a través del coeficiente de
confiabilidad de Spearman-Brown:
Se establece la correlación entre los dos puntajes de las dos mitades del test a
través del método de los puntajes directos, Correlación r de Pearson:

                           n   x1 x2       x1    x2
       r12
                                       2                   2
               n     x12        x1 * n           2
                                                x2    x2
       Estimación del test completo (Spearman-Brown) con la fórmula:

              2r12
       rtt
             1 r12
Se interpreta la prueba de hemitest como coeficiente de consistencia
interna, ya que una sola prueba contiene las dos formas equivalentes y su
énfasis lo pone en las puntuaciones de los sujetos, no en los ítemes.


El método de división por mitades de Rulon: utiliza la división del test en
mitades, pero su método no supone necesariamente varianzas iguales en los
sub-tests. coeficiente de consistencia interna.
                2
               sd
       rtt   1 2
               st

Donde:

rtt : coeficiente de confiabilidad
 2
sd : varianza de la diferencia entre las puntuaciones de las mitades

st2 : varianza de las puntuaciones del test total


El método de división por mitades de Guttman: también se denomina
coeficiente de consistencia interna. Su fórmula es:
sa sb2
                    2
         rtt   2 1
                      st2

Donde:

rtt : coeficiente de confiabilidad
 2
sa : varianza de las puntuaciones de los ítemes pares
 2
sb : varianza de las puntuaciones de los ítemes impares

st2 :varianza de las puntuaciones del test total


ALFA DE CRONBACH


Para evaluar la confiabilidad o la homogeneidad de las preguntas o ítems es
común emplear el coeficiente alfa de Cronbach cuando se trata de alternativas
de respuestas policotómicas, como las escalas tipo Likert; la cual puede tomar
valores entre 0 y 1, donde: 0 significa confiabilidad nula y 1 representa
confiabilidad total. El coeficiente α de Cronbach puede ser calculado por medio
de la varianza de los ítems y la varianza del puntaje total (Hernández Sampieri
et al, 2003). Para calcular el coeficiente de confiabilidad se usó el
”COEFICIENTE ALFA DE CROMBACH ( )” Córdova (2009), cuya ecuación
es:




donde:
 : coeficiente de confiabilidad de la prueba o cuestionario
  número de ítems del instrumento
  : Varianza total del instrumento.
      : Sumatoria de las varianzas de los ítems.


Método de Kuder-Richarson 21: permite obtener la confiabilidad a partir de
los datos obtenidos en una sola aplicación del test. La suposición básica es
considerar que todos los ítemes presentan igual varianza. Coeficiente de
consistencia interna.
n         M n M
       KR21           1
               n 1           nst2

Donde:
n: número total de ítems
M: media aritmética de las puntuaciones obtenidas por los individuos
st2 : varianza de las puntuaciones totales
Para la interpretación de la confiabilidad se utiliza el siguiente cuadro:


TABLA DE CATEGORÍAS
                  ESCALA                            CATEGORÍA
                                             Confiabilidad muy alta
                                             Confiabilidad alta
                                             Confiabilidad aceptable
                                             Confiabilidad moderada
                                             Confiabilidad baja
                                             Confiabilidad muy baja
                                             Confiabilidad despreciable
Ejemplo 19.
Determine la confiabilidad, utilizando alfa de cronbach, para la siguiente
información


  Encuestados                                Preguntas (Ítems)                    Puntos
                  1     2      3      4     5      6      7      8     9     10
  1               0     0      0      1     1      1      0      0     0     0    3
  2               0     1      1      1     2      1      1      1     2     2    12
  3               0     1      0      2     1      1      0      0     0     0    5
  4               0     0      0      1     1      0      0      1     0     0    3
  5               0     0      1      1     1      1      2      1     0     0    7
  6               0     0      0      1     1      1      0      1     0     0    4
  7               0     0      0      2     1      2      2      1     0     2    10
  8               0     0      0      0     0      1      0      0     0     0    1
  9               1     0      0      1     1      0      0      0     0     0    3
  10              0     1      0      2     2      2      0      2     2     2    13
  11              0     0      1      1     1      1      0      1     2     2    9
  12              0     1      0      1     2      2      0      2     0     1    9
  13              0     0      0      1     2      2      0      0     0     0    5
  14              1     0      0      2     2      0      0      1     0     0    6
  15              1     1             0     0      0      0      1     0     0    3
  Total           3     5      3      17    18     15     5      12    6     9    93
                  0.17 0.24 0.17 0.42 0.45 0.57 0.53 0.46 0.69 0.83




   varianza del instrumento
Varianza de cada pregunta




El índice de confiabilidad es alto de conformidad con la tabla de categorías.


BAREMACIÓN DEL INSTRUMENTO, UTILIZANDO ESCALA DE LIKERT.


Para medir la variable de estudio se aplico una encuesta utilizando la escala de
likert, la misma que presenta en cada ítems cinco alternativas, a partir de las
cuales los entrevistados pueden elegir, con la finalidad de señalar su nivel de
acuerdo.

     - Alternativa a (5)
     - Alternativa b (4)
     - Alternativa c (3)
     - alternativa d (2)
     -alternativa e (1)
Para obtener las puntuaciones de la variable de estudio, se suman los valores
obtenidos respecto de cada ítem. El puntaje mínimo (PM) resulta de la
multiplicación del número de ítems (x) por 1. Una puntuación alta (PA) está
dada por el número de ítems o afirmaciones multiplicado por 5.


           PM--------------------I----------------------I----------------------I------------------PA
Para facilitar la interpretar las   puntuaciones   de la variable de estudio se
transforman a una escala cualitativa, según el siguiente criterio.


                     Puntaje Obtenido          Categoría
                      Puntaje 1.5x             Deficiente

                      1.5x   Puntaje 2.5x      Malo

                      2.5x   Puntaje 3.5x      Regular

                      3.5x   Puntaje 4.5x      Bueno

                      Puntaje 4.5x             Muy bueno
5.11 MATRIZ DE CONSISTENCIA.
Esta referido a la estructura del proyecto de Investigación desarrollado y que para fines didácticos se presenta en el siguiente
esquema:
TITULO:………
   PROBLEMA                           OBJETIVO                                    HIPOTESIS                    VARIABLES
   General                            General                                     General                      Variable
   ¿…………………….?                                                                                                 independiente
   Formulación de problemas           ……………                                       ………….                        ……………
   específicos.                                                                   Formulación de hipótesis
   1. ¿………………….?                      Objetivo específico                         operativas.                  Variable Dependiente
   2. ¿………………                         ..                                          …
   3. ¿…………………?                       ..                                          …..                          …………….
                                      …                                           …..                          …………..
TIPO DE ESTUDIO                 POBLACIÓN Y   RECOLECCIÓN DE DATOS PRUEBAS ESTADISTICAS
                                MUESTRA
Nivel de investigación….        Población….   Guía de observación
Tipo de investigación………….                    Cuestionario encuestas
Diseño de investigación………      Muestra…………   Entrevistas
VARIABLES         DIMENSIONES   INDICADORES                            Ubicación de ítems


1                 1             …….                                    ………..
                                ………….


                  2


2
MODELO DE TESIS
TÍTULO DE LA TESIS:
CAPITULO I: PROBLEMA DE INVESTIGACIÓN
PLANTEAMIENTO DEL PROBLEMA
FORMULACIÓN DEL PROBLEMA DE INVESTIGACIÓN
OBJETIVOS
JUSTIFICACIÓN
       ORIGINALIDAD:
       PERTINENCIA:
       RELEVANCIA:
       OPORTUNIDAD:
       FACTIBILIDAD:

IMPORTANCIA
LIMITACIÓN
ÁREA DE ESTUDIO
DELIMITACIÓN
DELIMITACIÓN ESPACIAL
DELIMITACIÓN TEMPORAL
CAPITULO II: MARCO TEÓRICO
ANTECEDENTES DE ESTUDIO
MARCO CONCEPTUAL
MARCO NORMATIVO
MARCO TEÓRICO
CONCEPTUALIZACIÓN EN TÉRMINOS
HIPÓTESIS DE INVESTIGACION.
CAPITULO III: DISEÑO METODOLÓGICO
NIVEL DE INVESTIGACIÓN
TIPO DE NVESTIGACION.
DISEÑO DE INVESTIGACIÓN
POBLACIÓN Y MUESTRA
VARIABLES
OPERACIONALIZACIÓN DE VARIABLES
TÉCNICAS E INSTRUMENTOS DE RECOLECCIÓN DE DATOS
CLETO DE LA TORRE DUEÑAS                                                          41




TÉCNICAS DE ANÁLISIS DE DATOS.


CAPITULO IV: PRESENTACION DE RESULTADOS
CONCLUSIONES
RECOMENDACIONES
BIBLIOGRAFIA
ANEXOS


                             EJERCICIOS PROPUESTOS.


1.   Influencia del uso de materiales didácticos en el rendimiento académico de los
     estudiantes de la ciudad de Cusco. Especifique.
          a. La(s) variable(s) de estudio y el tipo de variable.
          b. La escala de medición a emplear.
          c. Nivel de investigación.
          d. Tipo de investigación
          e. Diseño de investigación
2.    Se realizo el estudio de la calidad de vida y servicio educativo de los profesores
      de las I.E de la UGEL Cusco. Especifique
          a. Proponer un titulo para esta investigación.
          b. La(s) variable(s) de estudio y el tipo de variable.
          c. La escala de medición a emplear.
          d. Nivel, tipo y diseño de investigación.
3.    Se hizo una encuesta a una muestra representativa de profesores de la UGEL
      La Convención sobre el nivel de acuerdo con la carrera pública magisterial
      propuesta por el gobierno.
             Carrera publica magisterial.                          Frecuencia
             Totalmente de acuerdo                                 15
             De acuerdo                                            40
             Indeciso                                              25
             En desacuerdo                                         10
             Totalmente en desacuerdo                              6
      En base a la información, realice el análisis correspondiente.
42                                ESTADISTICA




4.   Clasificar cada una de las siguientes variables :
      a.    Rendimiento Académico (Bajo, Medio, Alto).
      b.    Sexo.
      c.    Edad.
      d.    Nivel educativo (primario secundario, superior).
      e.    Años de estudios completados.
      f.    Tipo de enseñanza (privada o pública).
      g.    Estrato social (bajo, medio o alto).
      h.    Numero Telefónico
      i.    Numero de DNI de un profesor.
      j.    Método de enseñanza.
      k.    Nivel de congruencia entre la sumilla y el silabo.


5.    Se aplico un test para medir la competitividad del magisterio a una muestra
      piloto de 5 profesores, obteniendo los siguientes resultados.
     Profesor                                      Ítems
                    1         2           3              4       5     6
     1              1         0           1              0       0     0
     2              0         0           1              1       0     1
     3              1         0           0              1       1     1
     4              1         0           1              1       0     0
     5              0         0           1              0       1     1


     Determine la confiabilidad y validez del instrumento.
CLETO DE LA TORRE DUEÑAS                                                           43




                                     CAPITULO II
                  ORGANIZACIÓN Y PRESENTACIÓN DE DATOS
2.1 ESTADISTICA.
La Estadística es la ciencia que se ocupa de los métodos y procedimientos de
colección, clasificación, organización, análisis, síntesis e interpretación de datos;
siendo su característica que la distingue, la de hacer generalizaciones o inferencias en
base a una muestra.
Se define la estadística como:
      Una ciencia que se ocupa de la recolección, organización, procesamiento y
      análisis de la información.
      Una ciencia que permite tomar de decisiones
      Herramienta de la investigación científica.


En términos generales la estadística aborda dos tipos de problemas:
      ♦ Resumir, describir y explorar datos.
      ♦ Utilizar datos de una muestra para inferir la naturaleza del conjunto del cual se
        selecciono la muestra.


   DIVISION DE LA ESTADISTICA
     La estadística se divide en dos partes íntimamente relacionadas:
     Estadística Descriptiva: Esta es la parte de la estadística que se dedica a la
     organización, síntesis y descripción de conjuntos de datos.
     Esta es importante, ya que antes de que la mente humana pueda interpretar
     (hacer inferencias) un conjunto de datos, especialmente cuando estos son
     demasiados, es necesario resumirlos o representarlos de manera clara,
     simplificada o reducida.
44                                  ESTADISTICA




      Estadística Inferencial: Esta rama de la estadística trata el problema de inferir la
      naturaleza de un conjunto de datos a partir de una muestra de dichos datos.




                            El problema general de la Estadística


                                        Muestra                    Inferencias
           Población

                                                               Que tan reales
                                                               es.
                       Figura 2.1: Relación entre población y muestra.


     CONCEPTOS BASICOS
      Población. Es cualquier conjunto de datos, objetivo de nuestro interés, sobre los
      cuales interesa observar una o más características. Esta puede ser finita o infinita.
      El tamaño de la población es el número de individuos que esta tiene.
      Muestra. Una muestra es un conjunto de individuos de la población que refleja las
      características de ésta lo mejor posible. Si las características quedan bien
      reflejadas, se dice que la muestra es representativa. El tamaño de una muestra es
      el número de individuos que tiene, lo denotamos por n.
      Unidad de estudio. Es cada elemento que va a ser estudiado, normalmente se
      trate de individuos, pero no tiene por qué ser así.
      Data. Es cualquier medida resultado de haber observado una variable en una
      unidad de alguna población.
      Parámetro. Es una propiedad descriptiva de una población. Ejemplo media y
      varianza poblacional
      Estadístico. Es una propiedad descriptiva de una muestra. Ejemplo media y
      varianza muestral.
      Variable. Cualquier característica de Interés en el estudio.
                               Variable cualitativa: Ordinal y Nominal
                               Variable cuantitativa: Discreta y continua.


      Por otra parte, el reporte de las variables medidas requiere de los siguientes
      conceptos:
CLETO DE LA TORRE DUEÑAS                                                           45




2.2 ORGANIZACIÓN DE DATOS
La presentación de datos a través de tablas estadísticas es una actividad importante
dentro de los sistemas de información, estas se fortalecen significativamente cuando se
la acompañan con gráficos descriptivos ilustrativos. En el contexto de los sistemas de
información, en más de una oportunidad se encontrara que un buen grafico resume y
expresa mucho más que párrafos completos de comentarios e interpretaciones
literales.
Resumir los datos es un procedimiento útil para conseguirlo y puede hacerse mediante
tablas, gráficos o valores numéricos. A lo largo de este tema veremos las principales
técnicas numéricas y gráficas que nos permiten describir una característica de interés
observada en una población, poniendo en relieve sus rasgos más importantes.


  2.3 TABLA DE FRECUENCIAS.
      Un primer resumen de la información contenida en un conjunto de datos
      observado se obtiene al organiza los datos, en una tabla de frecuencias. En ésta
      se recogen los distintos valores (números o categorías) que toma la variable junto
      con sus correspondientes frecuencias de aparición.


   TABLA DE FRECUENCIAS PARA VARIABLES CUALITATIVAS
      Si en una muestra de n elementos, se observa k categorías diferentes C1, C2,…,
      Ck de una variable cualitativa X.
      Para resumir la información, previamente definimos algunos conceptos:


      La frecuencia absoluta de un valor Ci es el número de veces que dicho valor
      aparece en la muestra. Se representa por fi y cumple
        k
             fi        f1    f 2 ......    fk   n
       i 1


      La frecuencia relativa de un valor Ci es el cociente de la frecuencia absoluta (fi)
      entre el tamaño de la muestra (n), se representa por hi
                                      k
                  fi
       hi              , se cumple
                                           hi 1
                  n                  i 1
46                                    ESTADISTICA




         La frecuencia absoluta acumulada del valor i-ésimo es la suma de las
         frecuencias absolutas hasta dicho valor, se denota por Fi

         Fi      f1     f 2 ...... fi

         La frecuencia relativa acumulada del valor i-ésimo es la suma de las
         frecuencias relativas hasta dicho valor, se denota por Fi

         Hi      h1 h2 ...... hi              ,

                Fi
         Hi
                n
         La tabla de frecuencias tiene la siguiente estructura:


                Categoría de X           fi        hi      pi        Fi     Hi
                        C1               f1        h1     p1         F1     H1
                        C2               f2        h2      pi        F2     H2
                        ….              …          …      …          …      …
                        Ck               fk        hk     pk      Fk=n     Hk=1
                Total                    n        1.00   100




         GRAFICAS PARA VARIABLES CUALITATIVAS.
         Las representaciones gráficas prácticamente están orientadas de acuerdo con las
         necesidades del investigador o estadístico, de todas formas se tienen algunas
         normas de trabajo y representación, que tienen por objeto facilitar la lectura de los
         datos e información que se maneja estadísticamente.
         La calidad de un gráfico estadístico consiste en comunicar ideas complejas con
         precisión, claridad y eficiencia, de tal manera que:
     •    Induzca a pensar en el contenido más que en la apariencia
     •    No distorsione la información proporcionada por los datos
     •    Presente mucha información (números) en poco espacio
CLETO DE LA TORRE DUEÑAS                                                             47




    •    Favorezca la comparación de diferentes grupos de datos o de relaciones entre
         los mismos (por ejemplo una secuencia temporal)


        La finalidad de los gráficos estadísticos es:
             –     Organizar los datos.
             –     Observar patrones.
             –     Observar agrupamientos.
             –     Observar relaciones.
             –     Comparar distribuciones.
             –     Visualizar rápidamente la distribución de los datos.
             –     Visualizar, obtener y comparar medidas estadísticas.


        La tabla de frecuencias para variables cualitativas, se puede representar
        utilizando los siguientes gráficos.


       Diagrama de barras o rectangulos
        Es la representación gráfica usual para variables cualitativas.
        Para el caso de variables cualitativas se construye dibujando sobre la categoría
        correspondiente un rectángulo con altura igual a la frecuencia (absoluta o
        relativa). También es válido para variables cuantitativas discretas, considerando
        en el eje de abscisas los valores de la variable en orden creciente en lugar de las
        categorías, sobre cada valor levantamos una barra de altura igual a la frecuencia
        (absoluta o relativa).
        Este grafico es recomendable, cuando            la variable de estudio tiene muchas
        categorías.


       Diagrama de Pareto.
        Se ordenan las categorías de mayor a menor importancia y se dibujan los
        rectángulos correspondientes.
        Este grafico se recomienda para jerarquizar los factores considerados en el
        estudio.
48                                  ESTADISTICA




     Diagrama de sectores.
      Es el más usual en variables cualitativas.    Se representan    mediante círculos.
      A cada valor de la variable se le asocia el sector circular proporcional a su
      frecuencia.
      Para hallar el ángulo usamos la siguiente proporción: al tener una circunferencia
      360º, el cociente entre la frecuencia absoluta (o relativa) total y la frecuencia
      absoluta (o relativa) que queramos representar será igual al cociente entre los
      360º de la circunferencia y el ángulo a determinar, así:


                               n      360º                 1     360º
                               fi                          hi

      Donde    es el ángulo a determinar.
      Este grafico es recomendable, cuando la variable tiene pocas categorías.


     Pictogramas.
      Expresan con dibujos alusivos al tema de estudio las frecuencias de las
      modalidades de la variable. La escala de los dibujos debe ser tal que el área de
      cada uno de ellos sea proporcional a la frecuencia de la modalidad que
      representa.




     TABLA      DE     FRECUENCIAS           PARA     VARIABLES         CUANTITATIVAS
      DISCRETAS
      Una vez obtenida una muestra de cualquier población y observados los valores
      que toma la variable en los individuos de la muestra, estos valores se suelen
      ordenar. Si la variable es cuantitativa la ordenación será de menor a mayor.
CLETO DE LA TORRE DUEÑAS                                                      49




    Dada una variable X, consideramos una muestra de tamaño n que toma k valores
    distintos, x1, . . . , xk (x1 < x2 < . . . < xk).
    La organización es en forma similar al caso cualitativo.


               Valores de X              fi       hi    pi     Fi     Hi
               x1                        f1      h1     p1     F1     H1
               x2                        f2      h2     pi     F2     H2
               ….                       …        …      …      …      …
               xk                        fk       hk    pk    Fk=n   Hk=1
               Total                     n      1.00    100


    La grafica para representar esta información es Bastones.


    Existe otros gráficos, tales como:


   Diagrama de cajas(box-plot)
    Presentación visual que describe al mismo tiempo varias características
    importantes de un conjunto de datos, tales como el centro, la dispersión, el
    alejamiento de la simetría, y la identificación de valores extremos (puntos
    atípicos), es decir, de valores que se alejan de una manera poco usual del resto
    de los datos. Presenta los tres cuartiles, (y los valores mínimos y máximos)
    alineados sobre una caja vertical u horizontalmente. El procedimiento Para el
    diagrama de cajas y bigotes es:


    1. Dibujar un segmento con extremos en los valores menor y mayor que aparecen
       en la muestra paralelo a uno de los ejes.
    2. Dibujamos una caja con extremos en el primer y tercer cuartil y marcamos en
       ella la mediana.
    3. Se hallan los límites interiores (Q1 – 1.5 IQR y Q3 + 1.5 IQR) y los límites
       exteriores (Q1 – 3 IQR y Q3 + 3 IQR).
       Donde Qi : Cuartiles que seran desarrollados más adelante.
    4. Se unen, con unos segmentos (bigotes), Q1 y Q3 con los valores adyacentes de
       la muestra.
50                                 ESTADISTICA




      5. Por último se indican los valores atípicos


     Tallos y Hojas (stem & leaf)
      Procedimiento semigráfico para el que se preparan los datos resumiéndolos en
      dos o tres cifras (expresándolos en las unidades adecuadas). A continuación se
      disponen en una tabla de dos columnas del siguiente modo:


      1. Si los datos son de dos dígitos, a la izquierda (en el tallo) aparece la cifra de las
        decenas, a la derecha separada por una línea aparecen las hojas y se escriben
        ordenadas y todas seguidas.
      2. Si hay tres dígitos el tallo está formado por los dos primeros. Las hojas son las
        unidades.


     TABLA DE FRECUENCIAS PARA VARIABLES CUANTITATIVAS CONTINUAS
      A veces se hace necesario trabajar con datos agrupados. Definimos entonces
      como clase a cada uno de los intervalos en que se agrupan los datos. Las
      frecuencias harán ahora referencia al número de datos que hay en cada intervalo.


      Para construir distribución de frecuencias por intervalos, se tiene los siguientes
      pasos:


     Elegir un número de intervalos de clase (K)

      Puede utilizar la regla de Sturges,   k 1 3.3log(n)
      Donde k: Número de intervalos.
      n: Número de datos.


     Determinar el rango.

      R     xmax     xmin

     Determinar la amplitud de las clases.

       A    R/k
CLETO DE LA TORRE DUEÑAS                                                             51




   Determinación de los intervalos i :   I

       I1        xmin , xmin    A     LI1, LS1

      I2         xmin       A, xmin 2 A          LI2 , LS2

      
      Ik         xmin (k 1) A, xmin kA                    LI k , LSk

   Determinación de las marcas de clase.


               LI i       LSi
     mi
                      2
      Donde LI : Limite inferior
                  LS : Limite superior.




   Realizar la clasificación y el conteo de datos en cada clase construida.


          Ii          mi        fi         hi        hi          pi     Fi     Hi

          I1          m1        f1         h1        h1          p1     F1     H1
          I2          m2        f2         h2        h2          pi     F2     H2
       ….             …         …         …          …           …      …      …
          Ik          mk        fk         hk        hk          pk    Fk=n   Hk=1
      Total                     n         1.00      1.00        100


    Cuando las variables son continuas, utilizamos como diagramas diferenciales los
    histogramas y los polígonos de frecuencias.
52                               ESTADISTICA




    Histograma de frecuencias
     Un histograma es la representación más frecuente con datos agrupados, se
     construye a partir de la tabla estadística, representando sobre cada intervalo, un
     rectángulo que tiene a este segmento como base. El criterio para calcular la altura
     de cada rectángulo es el de mantener la proporcionalidad entre las frecuencias
     absolutas (o relativas) de cada intervalo y el área de los mismos.


    Polígono de frecuencias
     El polígono se construye fácilmente si tenemos representado previamente el
     histograma, ya que consiste en unir mediante líneas rectas los puntos del
     histograma que corresponden a las marcas de clase. Para representar el polígono
     de frecuencias en el primer y último intervalo, suponemos que adyacentes a ellos
     existen otros intervalos de la misma amplitud y frecuencia nula, y se unen por una
     línea recta los puntos del histograma que corresponden a sus marcas de clase.


    Curva de frecuencias.
     Resulta de suavizar el polígono de frecuencias, en sus puntos angulosos.


    Ojivas
     Es una poligonal construida uniendo los puntos cuyas abscisas son los límites
     superiores de clases y las ordenadas son las frecuencias absolutas acumuladas
CLETO DE LA TORRE DUEÑAS                                               53




                            Resumen de gráficos.
              Variable                 Tipo                Gráfico
             Cualitativa             Nominal        Sectores circulares,
                                     Ordinal        barras, pictogramas,
                                                           pareto.
             Cuantitativa            Discreta      Bastones, barras, box
                                                     plots, tallos y hojas
                                     Continua      Histogramas, polígonos
                                                   de frecuencia, Ojivas,
                                                   Grafico de cajas, Box-
                                                    plots, tallos y hojas.
54                                                ESTADISTICA




                                         EJERCICIOS DESARROLLADOS


     1. En una encuesta de opinión, respecto a las preferencias                                     del método de
        enseñanza: Clásico(A), Nuevo enfoque (B), Ambos métodos(C), 30 docentes
        dieron las siguientes respuestas:
      A, B, B, B, C, B, B, B, A, A, B, B, C, A, B, C, B, A, A, B, B, B, C, C, B, B, C, C, C, B
      Construir la distribución de frecuencias y represente la información mediante un
      grafico.
      Solución.

                                     Método                       fi               hi          pi
                                     Clásico                                                   20
                                                                  6               0.2
                               Nuevo Enfoque                                                  53.33
                                                                 16             0.5333
                               Ambos métodos                                                  26.67
                                                                  8            0.2667
                 Total                                    n=30               1.00            100.00




                                                       Barchart for Metodo

                                16


                                12
                   frequency




                                8


                                4


                                0
                                       Ambos metodos         Clasico         Nuevo enfoque
CLETO DE LA TORRE DUEÑAS                                                                           55




                                         Pie Chart of C1
                                                                                   Category
                                                                                   Ambos metodos
                                                                                   Clasico
                                                                                   Nuevo enfoque




   2. En un estudio realizado de los hábitos estudio de los estudiantes de I.E de la
      ciudad de Cusco, se                obtuvo los siguientes resultados que se muestra en el
      cuadro siguiente.


                              Hábito de estudio        Frecuencia     Porcentaje
                                 Bajo                          96           38,4
                                 Intermedio                    83           33,2
                                 Alto                          71           28,4
                                 Total                        250          100,0

    Representa la información mediante dos gráficos adecuados.




                         40




                         30
            Porcentaje




                         20




                         10




                          0
                                  Bajo                 Intermedio             Alto

                                                  Hábito de estudio
56                                 ESTADISTICA




     3. El Director de una institución educativa desea analizar el número de tardanzas
        presentadas por los estudiantes. Para ello, se toma una muestra aleatoria de
        50 estudiantes obtenido los siguientes datos de tardanzas:
        2 4 2 3 1 2 4 2 3 0 2 2 2 3 2 6 2 3 2 2 3 2 3 3 4
        3 3 4 5 2 0 3 2 1 2 3 2 2 3 1 4 2 3 2 4 3 3 2 2 1
       En base a la información:
       a) ¿Cuál es la población objeto de estudio?
       b) ¿Qué variable estamos estudiando?
       c) ¿Qué tipo de variable es?
       d) Construir la tabla de frecuencias?
       Solución:
       a) La población objeto de estudio es el total de estudiantes de la I.E.
       b) La variable (x) que estamos estudiando es el número de tardanzas
       c) El tipo de variable es discreta ya que el número de tardanzas solo puede
          tomar determinados valores enteros
     d) Para construir la tabla de frecuencias tenemos que analizar el número de
       tardanzas de los estudiantes. Podemos ver que el número de tardanzas, toma
       los valores existentes entre 0 y 6 hijos:
               Xi           fi            Fi            hi             Hi
                0           2             2            0.04           0.04
                1           4             6            0.08           0.12
                2           21            27           0.42           0.54
                3           15            42           0.30           0.84
                4           6             48           0.12           0.96
                5           1             49           0.02           0.98
                6           1             50          0.024            1
                          n = 50                        1




     4. En la UGEL de la región Cusco, se realizo un estudio sobre el conocimiento de
        estrategias cognitivas. Los resultados se muestran a continuación.
CLETO DE LA TORRE DUEÑAS                                                         57




                                              Conocimiento


                                                       Frecuencia   Porcentaje
                                         Deficiente            26         63.4
                                         Regular                8         19.5
                                         Bueno                  7         17.1
                                         Total                 41        100.0

   Represente la información mediante un grafico.
  Solución:




                    60,0%
       Porcentaje




                    40,0%




                    20,0%




                    0,0%
                            Deficiente            Regular             Bueno

                                            Conocimiento




   5. Por encargo del nutricionista, se debe dar la siguiente cantidad de calorías a un
      grupo de 50 estudiantes de una institución educativa.


                                3255       2123       3525     2123     3453
                                1895       2740       4525     3215     2593
                                2155       3255       2460     1985     3530
                                2456       3772       4220     2971     4685
                                1525       3847       3005     2224     2646
                                4450       2793       1965     2327     4525
                                4243       4124       4595     2643     3797
                                3024       3214       4509     3727     4134
                                4244       4955       3925     2220     2335
                                1255       4675       4580     3437     2702
58                                  ESTADISTICA




     a) Organice la información en una tabla de frecuencias.
     b) Represente la información utilizando: Histograma de frecuencias porcentuales
       acumuladas y Ojiva.
     c) Trace el histograma y polígono de frecuencias porcentuales.


     Solución.
     a) Construiremos la tabla de frecuencias.


        Número de clases.
             Usando la relación de sturges se tiene:

             k 1 3.3log(n) 1 3.3log(50) 6,6 7

        Determinar la amplitud de los intervalos

             R     xmax    xmin    4955 1255 3700

        Determinar el tamaño del intervalo de clases (A),
                  R    3700
              A                528,57
                  k     7


         Clase    Intervalo        mi      fi              hi       pi     Pi
         1     [1255,0 - 1783,57 ) 1519,29 1               0,0400   4%     4%

         2         [1783,57 - 2312,14 ) 2047,86 8          0,1600   16%    20%

         3         [2312,14 - 2840,71 ) 2576,43 10 0,2000           20%    40%

         4         [2840,71 - 3369,29 ) 3105,0         7   0,1400   14%    54%

         5         [3369,29 - 3897,86) 3633,57 8           0,1600   16%    70%

         6         [3897,86 - 4426,43) 4162,14 6           0,1200   12%    82%

         7         [4426,43 - 4955 )      4690,71 9        0,1800   18%    1OO%

         Total                                         50 1         100%
CLETO DE LA TORRE DUEÑAS                                                                          59




             b) La grafica muestra el histograma de frecuencias porcentuales acumuladas y la
                                             Histograma
                                    ojiva
  Frecuencia Porcentual Acumulada

                          100

                                    80
                                                                 Ojiva
                                    60
                                                    Histograma

                                    40

                                    20

                                     0
                                         0         1         2              3   4         5
                                                                                    (X 1000,0)
                                                                 Calorias

                                                             Histograma

                            20

                                             Polígono de
   Frecuencia Porcentual




              16
             c) En el grafico se muestra, el polígono de frecuencias.
                                             frecuencias

                            12

                                    8

                                    4

                                    0
                                         0         1         2              3   4         5
                                                                                     (X 1000,0)
                                                                 Calorias
60                                            ESTADISTICA




     6. Un investigador recopila información del peso de 50 profesores. Los datos
        obtenidos fueron los siguientes.
          65    63      65       63       69      67     53                    58    60        61
          64    65      64       72       68      66     55                    57    60        62
          64    65      64       71       68      66     56                    59    61        62
          63    65      63       70       67      66     57                    59    61        62
          64    64      63       69       67      66     58                    60    61        62
      a. Construya la tabla de distribución de frecuencias
      b. Represente la información obtenida, mediante un grafico.


      Solución.
      a. Para construir una tabla de frecuencia se tiene los siguientes pasos.
        Elegir el número de clases.
       Usando la relación de sturges se tiene:
           k 1 3.3log(n) 1 3.3log(50) 7
        Determinar la amplitud de los intervalos
            R     xmax    xmin    72 53 19
        Determinar el tamaño del intervalo de clases (A),
                  R      19
           A                  2, 7
                  k       7
           Consideramos A=3
        Establecimiento de los límites y construcción de la tabla:


                LI - LS              fi        mi       Fi        hi= fi/n     pi         Hi
               [52 – 55)                  2     53.5         2       0.04       4     0,04
               [55 – 58)                  5     56.5         7           0.1   10     0,14
               [58 – 61)                  9     59.5         16      0.18      18     0,32
               [61 – 64)              15        62.5         31          0.3   30     0,62
               [64 – 67)              12        65.5         43      0.24      24     0,86
               [67 – 70)                  5     68.5         48          0.1   10     0,96
               [70 – 73)                  2     71.5         50      0.04       4    1,0000
                TOTAL            n=50                                1         100
CLETO DE LA TORRE DUEÑAS                                             61




    b.    Histograma de frecuencias relativas.


                                          Histogram

                      30

                      25

                      20
         percentage




                      15

                      10

                      5

                      0
                           52   56   60      64       68   72   76
                                            Peso
62                                ESTADISTICA




                             EJERCICIOS PROPUESTOS.


     1. Un investigador realiza una investigación con la finalidad de comparar la
       eficiencia de los siguientes métodos de comprensión lectora:
        A: Enseñanza directa.
        B: Enseñanza recíproca.
        C: Combinación de los métodos de enseñanza directa y enseñanza recíproca.
       Si se aplico cada método en forma independiente en tres secciones diferentes
       de 50 alumnos cada uno, obteniéndose, que 30 alumnos con el método de
       enseñanza directa, 20 con método de enseñanza reciproca y 35 con la
       combinación de estos métodos presenta una buena comprensión lectora. En
       base a estos resultados cual es su conclusión del estudio.


     2. Se aplico una encuesta a directores de I.E con la finalidad de          evaluar la
        influencia de los programas de capacitación de docentes fomentados por el
        Estado en la calidad de servicio educativo. Los resultados son los siguientes:
        I.E     X      Y              I.E    X       Y              I.E     X       Y
        1       R      R              8      MB      MB             15      R       R
        2       M      M              9      R       R              16      R       M
        3       M      R              10     R       M              17      M       R
        4       R      M              11     M       M              18      M       M
        5       B      B              12     M       R              19      M       M
        6       M      M              13     R       R              20      B       B
        7       R      R              14     MB      B              21      B       R
        Donde
        X: Programas de capacitación.
        Y: Calidad del servicio educativo.
        M: Mala, R: Regular, B: Buena, MB: Muy buena.
        Cuál es su conclusión del estudio


     3. Se ha medido la comprensión lectora de una muestra de 50 profesores de la
        UGEL A, Los resultados son los siguientes: 30, 35, 34, 38, 40, 42, 43, 43,
CLETO DE LA TORRE DUEÑAS                                                         63




      44,44,45,45,46,46,46, 47, 48, 50, 55, 56, 58, 59, 60, 63, 65, 66, 67, 67, 68, 70,
      72, 74, 75, 77,78,78,78,78, 78, 79, 79, 79, 80,82, 82, 83, 88, 90, 96,99
       a) Organiza y representa adecuadamente la información.
       b) Redacte sus conclusiones del estudio.


   4. Los siguientes datos corresponden a una muestra de 30 estudiantes de un
      centro educativo de la ciudad de Cusco, en los cuales se midieron tres
      características: Peso en libras (X), Número de tardanzas en el año escolar (Y) y
      Estrato socioeconómico (Z)


                X                Y              Z
               138               3           MEDIO
               164               5           MEDIO
               150               1            ALTO
               132               4            BAJO
               144               3           MEDIO
               125               2           MEDIO
               149               0            BAJO
               157               1            BAJO
               146               5           MEDIO
               158               3            ALTO
               140               4            BAJO
               147               2           MEDIO
               136               2           MEDIO
               148               4            ALTO
               152               5            BAJO
               149               4           MEDIO
               168               4           MEDIO
               126               0           MEDIO
               138               1            ALTO
               176               2            BAJO
               163               2           MEDIO
               119               3           MEDIO
               154               5            BAJO
               165               2            BAJO
64                                       ESTADISTICA




                          146              3             BAJO
                          173              4             MEDIO
                          142              1             BAJO
                          147              1             ALTO
                          135              2             MEDIO
                          153              2             MEDIO

       I.    Identifique los siguientes conceptos:
            a) Población.
            b) Muestra.
            c) Unidad de análisis.
            d) Variables o características de interés
            e) Clasifique las variables definidas anteriormente
 II.         Construya una tabla de frecuencias para presentar el estrato socioeconómico de
             los estudiantes con su correspondiente título y anéxele un gráfico adecuado.
III.         Construya una tabla de frecuencias para presentar el número de tardanzas al año
             de los estudiantes con su correspondiente título y anéxele un gráfico adecuado.
IV.          Construya una tabla de frecuencias de 5 intervalos para presentar el peso de los
             estudiantes con su correspondiente título y anéxele un gráfico adecuado.
V.           De las tablas construidas anteriormente responda las siguientes consultas:
            a) ¿Qué porcentaje de estudiantes corresponde al estrato socioeconómico bajo?
            b) ¿Cuantos estudiantes realizan, presentaron a lo más dos tardanzas al año?
            c) ¿Qué porcentaje de estudiantes no presento tardanzas en el año?
            d) ¿Cuántos estudiantes tienen un peso a lo más de 167?
            e) ¿Qué porcentaje de estudiantes tiene un peso mayor a 127 y menor o igual a
               159?
            f) ¿Cuántos estudiantes tienen un peso mayor a 159?


 5. Una encuesta realizada en un grupo de profesores sobre el uso de los distintos
            tipos de estrategias metodológicas, dio los siguientes resultados


                 A        D       B       A          D     D      A        C     D
                 B        A       B       A          C     A      A        D     D
                 D        A       D       C          A     C      C        D     A
CLETO DE LA TORRE DUEÑAS                                                                             65




              B         A        D         B         A         B        C         C         A
              D         C        A         D         A         B        A         B         A


          Confeccionar una tabla de frecuencias que recoja esta información y elabora dos
          tipos de gráficos distintos a partir de ella. ¿Qué porcentaje de profesores utiliza
          cada estrategia?
6.        Los datos siguientes representan el número de gestiones realizadas en
          instituciones públicas o privadas de 52 Directores de igual número de centros
          educativos en el año 2009:
           0 2 0 1 3 4 0 2 1 3 0 2 2 1 0 5 2 6 1 2 1 4 1 1 0 1 1
           2 0 5 2 0 4 3 2 4 3 2 1 6 2 3 3 5 1 3 6 1 3 4 5 0 2 3
     a)     Identifique los siguientes conceptos:
             i) Población analizada.
             ii) Elementos de la población.
             iii) Característica en estudio.
             iv) Tipo de dato analizado.
     b)     Construya una tabla de frecuencias completa para estos datos y escríbale un
             título.
     c)     Trazar una grafica adecuada.
     d)     Con la tabla construida en c) entregue la siguiente información al Director de la
             UGEL:
            i) ¿ Cuántos Directores , realizaron a lo más 3 gestiones?.
            ii) ¿Qué porcentaje de Directores, realizo exactamente 5 gestiones?.


7.        Se ha realizado una encuesta a 30 familias en la que se les pregunta el nº de
          integrantes. Las respuestas obtenidas han sido las siguientes:
          1, 4, 4, 1, 3, 5, 3, 2, 4, 1, 6, 2, 3, 4, 5, 5, 6, 2, 3, 3, 2, 2, 1, 8, 3, 5, 3, 4, 7, 2, 3.
     1.     Calcule la distribución de frecuencias de la variable obteniendo las frecuencias
            absolutas, relativas y sus correspondientes acumuladas.
     2.     ¿Qué proporción de familias está compuesta por tres o menos personas?
     3.     Dibuje el diagrama de barras de frecuencias.


8.        Se le aplico una prueba de inteligencia a los estudiantes de un centro educativo,
          obteniendo los siguientes datos.
66                                 ESTADISTICA




 87 105    88 103 114 125 108 107 118 114 129 100 106 113 105 111                        94
115   89   82 141   92 132 112        97 135 101 104 130           99 114      91 145    95
101 115 104    87 108 115 103 132 110 113 102 109 124                       98 140 107   93
108 122 117 114 141 116 108 102 101 118 138                    99 105 112      94   96 132
118 123 108 131 127 100         91
a) Agrupe los datos en y confeccione una tabla de frecuencias
b) Trace las graficas adecuadas.


9. Represente gráficamente la siguiente información


                         Comprensión Literal     Frecuencia    Porcentaje
                            Malo                           2          4.0
                            Regular                      18          36.0
                            Bueno                        30          60.0
                            Total                        50         100.0
CLETO DE LA TORRE DUEÑAS                                                         67




                                   CAPITULO III
         MEDIDAS DESCRIPTIVAS DE UNA DISTRIBUCIÓN DE DATOS.


3.1 INTRODUCCION.
   Las técnicas estudiadas anteriormente permiten una descripción visual de la
   distribución de una variable. En muchos casos, el resumen puede hacerse
   eficazmente de una forma más sencilla y precisa, utilizando valores numéricos que
   den idea de la ubicación o del centro de los datos (medidas de posición). Usando
   cantidades que informen de la concentración de las observaciones alrededor de
   dicho centro (medidas de dispersión) y mediante números que reflejen la forma
   (asimetría y apuntamiento) de la distribución (medidas de forma). La conjunción de
   técnicas numéricas y gráficas permite una buena descripción de la variable.
   Los estadísticos resúmenes tratan de reflejar numéricamente distintos aspectos de
   la variable en estudio. Podemos distinguir 4 aspectos o características principales
   que pueden resumirse en una distribución. (Ver cuadro siguiente)
68                              ESTADISTICA




                             Media                        Nos dan un centro de
               Centralización Mediana                     la distribución de
                             Moda                         frecuencias
                             Percentiles                  Son valores de la
                             Cuartiles                    distribución que
               Posición                                   dividen en partes
                             Deciles                      iguales
                             Varianza                     Las medidas de
 Medidas                     Desviación típica            dispersión cuantifican
descriptivas                 Coeficiente de variación     la separación, la
                             Rango                        dispersión, la
               Dispersión                                 variabilidad de los
                                                          valores de la
                                                          distribución respecto al
                             Recorrido Intercuartilico    valor central
                             Coeficiente de Asimetría     Comparan la forma
               Forma         Coeficiente de Apuntamiento que tiene la
                             o Curtosis                   representación gráfica



3.2 MEDIDAS DE TENDENCIA CENTRAL
     Los promedios o medidas de tendencia central son valores representativos de un
     conjunto de datos. Pretenden resumir todos los datos en un único valor. Las
     medidas de tendencia central son fundamentales ya que permiten localizar
     cuantitativamente la zona central o de mayor acumulación de información de un
     conjunto de datos correspondientes a una variable, obtenidos de una muestra
     seleccionada de una población específica o de un conjunto de resultados del
     espacio muestral de un experimento aleatorio.


     Definimos tres medidas de tendencia central más importantes: media, mediana y
     moda.
CLETO DE LA TORRE DUEÑAS                                                        69




    Media ( x )

    Media para datos sin agrupar:

    Dado un conjunto de observaciones x1, . . . , xn, la media se representa mediante

     x,   se obtiene mediante:

                                      n
                                              xi
           x1       x2 ..... xn      i 1
     x
                       n                  n
    Media para datos agrupados

    Consideremos el caso en que tenemos una distribución de frecuencia           para
    variables cuantitativas discretas, en este caso la media es:

                                                   k
            f1 x1      f 2 x2 ..... f k xk
     x                                                   xi hi
                             n                     i 1
    Si los datos están agrupados por intervalos, para hallar la media tomamos la
    marca de las clases,
                                                                 k
                     f1m1    f 2 m2 ..... f k mk
            x                                                          hi mi
                                   n                             i 1


    La media se mide en las mismas unidades que la variable, y tiene el
    inconveniente de verse muy afectada por la presencia de datos que sean
    extremadamente grandes o pequeños (datos atípicos).


    Mediana (Me)
    Se calcula para variables cuantitativas; es el valor de la serie de datos que se
    sitúa justamente en el centro de la muestra una vez se ha ordenado ésta,
    corresponde a un 50% de valores son inferiores y otro 50% son superiores.
70                                                 ESTADISTICA




     Mediana para datos sin agrupar
     La mediana es el valor del dato central y depende del tamaño de la muestra.



     Me       xn          1       , para n impar
                      2

              x   n
                              x     n
                                      1
                  2                 2
     Me                                       , Si n es par.
                              2

     Mediana para datos agrupados
     Cuando trabajamos con variables agrupadas por intervalos es imposible
     determinar con precisión los valores que toman los datos, ya que esa información
     se ha perdido en privilegio del agrupamiento intervalo. Por lo tanto, en este caso,
     debemos buscar otro método para determinar el valor de la mediana.

                                                   n
                                                      Fi 1             0.5 H i 1
                          Me LI                    2       A LI                  A
                                                     fi                   hi

     La mediana sólo tiene en cuenta la posición de los valores en la muestra y por lo
     tanto tiene mejor comportamiento que la media cuando hay observaciones
     anómalas.


     Moda (Mo)
     Es el valor con mayor frecuencia. Si hay más de una moda, la variable se dice
     multimodal y puede calcularse para cualquier tipo de variable (Cuantitativas o
     cualitativas).
     Si los datos están agrupados hablamos de clase modal y será aquella para la que
     la frecuencia absoluta sea mayor.



                                          1                                  fi   fi   1
        Mo        LI                                A    LI                                          A
                                     1         2                  fi    fi   1         fi   fi   1
CLETO DE LA TORRE DUEÑAS                                                          71




    Donde:


       1      fi      fi   1


        2      fi      fi      1




            Unimodal                   Bimodal                     Multimodal


   ¿Cómo elegir entre las medidas de tendencia central?- En general, la media es
   la medida de tendencia central más útil y más empleada. El uso de la media es el
   más apropiado cuando y la distribución de los datos es unimodal y
   aproximadamente simétrica. Cuando valores extremos distorsionan la distribución
   de los datos, el uso de la mediana es más apropiado pues se ve menos afectada,
   pero en la práctica esta medida de tendencia central no se utiliza demasiado. Si se
   trata de una variable ordinal, o sólo necesitas una descripción rápida y aproximada
   de la tendencia central, puedes utilizar la moda, que también es útil cuando la
   distribución está distorsionada por valores extremos o la distribución es bimodal.


3.3 CLASES DE DISTRIBUCIONES
   Distribución Simétrica: Se presenta si todas las observaciones están concentradas
   en un solo valor de la variable, en este caso la media, mediana y moda coincidirían
   en el mismo.

                                   x     Me         Mo

   Distribución asimétrica sesgada a la izquierda
72                                     ESTADISTICA




      Supongamos ahora que las observaciones de la parte izquierda se alejan del valor
      central más que las observaciones de la parte derecha, generando una distribución
      asimétrica hacia la izquierda; en este caso como la media es la suma de los valores
      de las observaciones dividido por la cantidad total de observaciones, su valor se
      correrá a la izquierda también y por el mismo motivo, la media será menor que la
      mediana y ambas menor que la moda, es decir:

                                        x    Me       Mo

      Distribución asimétrica sesgada a la derecha.
      En este caso la media, es mayor que la mediana y que la moda.

                                        Mo       Me     x




       .


3.4    MEDIDAS DE POSICIÓN.
       Cuartiles
       Dividen la muestra, ordenada de menor a mayor, en 4 partes iguales, y se
       denotan por Qi , i=1,2,3

                                                     i.n
                                                           Fk   1
                                  Qi      LI i        4             A
                                                         fk
CLETO DE LA TORRE DUEÑAS                                                              73




      -   Q1, primer cuartil, al menos el 25% de los datos son menores o iguales que él
          y al menos el 75% de los datos son mayores o iguales que él.
      -   Q2, segundo cuartil, es la mediana, Q2 = Me.
      -   Q3, tercer cuartil, al menos el 75% de los datos son menores o iguales que él
          y al menos el 25% de los datos son mayores o iguales que él.


      Percentiles
      Dividen la muestra ordenada en 100 partes iguales.

                                                 i.n
                                                        Fk    1
                                Pi     LI i     100               A
                                                     fk


      El i-ésimo percentil, Pi ( 1 i   99 ) es un valor tal que al menos el i% de los datos
      son menores o iguales que él y al menos el (100-i) % de los datos son mayores o
      iguales que él.


      A partir de las definiciones de los cuartiles y percentiles, es claro que Q1 = P25, Q2
      = P50 =Me y que Q3 = P75.


      Deciles
      Dividen el conjunto de datos en 10 partes iguales y se denota con Di , i=1,…9

                                              i.n
                                                    Fk    1
                           Di        LI i     10                  A
                                                  fk


3.5   MEDIDAS DE DISPERSIÓN
      Mientras los estadísticos de tendencia central nos indican los valores alrededor de
      los cuales se sitúan un grupo de observaciones, los estadísticos de variabilidad o
      dispersión muestran si los valores de las observaciones están próximos entre sí o
74                                              ESTADISTICA




     están muy separados. Dos conjuntos de datos pueden tener la misma localización
     central y no obstante, ser muy distintos si uno se halla más disperso que el otro.
     La dispersión es el grado en que los datos numéricos tienden a extenderse
     alrededor de           un valor medio. La dispersión de la distribución suministra
     información complementaria que permite juzgar la confiabilidad de nuestra medida
     de tendencia central. Si los datos están ampliamente dispersos, la localización
     central será menos representativa de los datos en su conjunto de lo que sería en
     el caso de datos que se acumulasen más alrededor de la media. Además, si no
     conviene tener una amplia dispersión de valores respecto al centro o si esa
     dispersión implica un riesgo inaceptable, deberemos ser capaces de reconocerlo
     y no escoger las distribuciones que presentan la máxima dispersión.
     Las medidas más importantes son: Varianza, desviación típica, coeficiente de
     variación muestral, rango y rango semiintercuartilico. Las mismas que se
     desarrolla a continuación:


     Varianza.
     Sólo tienen sentido para variables cuantitativas y se define:
              n                                n
                                     2
                   xi        x                         xi2
     S2      i 1                               i 1
                                                                   x2   , Para datos no tabulados.
                    n                              n
             n                                         n
                                 2
                   xi       x             fi                   fi xi2
     S2      i 1                                     i 1
                                                                         x 2 , Para datos tabulados de variable
                        n                                   n
                                                                         discreta
             n                                     n
                                 2
                   mi       x            fi                f i mi2
     S2     i 1                                 i 1
                                                                        x2,   Para datos tabulados por intervalos,
                        n                                  n
                                                                        para variables continuas.




     Observaciones sobre la varianza:
CLETO DE LA TORRE DUEÑAS                                                        75




    Las unidades de la varianza son los cuadrados de las unidades de los datos y
      en muchas ocasiones no son fáciles de interpretar.
    Puede sufrir un cambio desproporcionado por la existencia de valores extremos
      en el conjunto.
    Si la muestra es pequeño, se recomienda utilizar en el denominador de la
      ecuación de la varianza n-1 en reemplazo de n.


    Desviación típica (S)
    Es la raíz cuadrada positiva de la varianza

                                        s         s2
    La desviación típica poblacional suele denotarse por   .


    Observaciones sobre la desviación típica:
    Nos permite determinar con mayor grado de precisión dónde se sitúan los
      valores de una distribución de frecuencia en relación con la media.
    Las unidades de la desviación típica se expresan en las mismas unidades de los
      datos.
    Puede sufrir un cambio desproporcionado por la existencia de valores extremos
      en el conjunto.


    Variables tipificadas
    Los distintos conjuntos de datos están asociados por lo general a diferentes
    medias, ya sea porque son de naturaleza diferente (escalas de medidas
    diferentes). Con el propósito de reducir los datos a un mismo punto de referencia
    y a una escala común, se realiza entre ellos una transformación llamada
    tipificación.
    Se conoce por tipificación de una variable “x” a efectuar el cambio de origen y de
    escala de la variable:

          x x
      z              para muestras
            s
          x-
     z              para población
76                              ESTADISTICA




     Esta nueva variable (z), carece de unidades de medida y permite comparar dos o
     más cantidades que en un principio no son comparables porque aluden a
     conceptos diferentes. También es aplicable a casos en que se quieran comparar
     individuos semejantes de poblaciones diferentes.


     Ejemplo 1: Un estudiante obtuvo 84 puntos en el examen final de matemáticas,
     en el que la nota media fue 76, y la desviación típica 10. En el examen final de
     física obtuvo 90 puntos, siendo la media 82 y la desviación típica 16. ¿En qué
     examen sobresalió más?.


                 Examen de matemática            Examen de física

                  x = 76                        x = 82
                 s = 10                        s = 16
                 x = 84                        x = 90
                      84 76                         90 82
                 z=            0,8             z=           0,5
                        10                            16




     Sobresalió más en matemáticas.


     Coeficiente de variación Muestral de Pearson
     Las medidas de dispersión anteriores dependen de las unidades de medida, el
     coeficiente de variación es, en cambio, una medida de dispersión relativa y
     adimensional.

                                           S
                                     CV       *100%
                                          |X|

     CV es apropiado en poblaciones donde los datos son positivos.
     Si 0<CV<15%, los datos provienen de una población homogénea
     Si CV>15%, los datos provienen de una población heterogénea.


     El coeficiente de variación es útil, en razón de su carácter adimensional, para
     comparar muestras con medias desiguales, donde las unidades de medida de las
CLETO DE LA TORRE DUEÑAS                                                              77




      observaciones son diferentes. También para decidir cual muestra es más
      homogénea o menos variable


      Recorrido o rango
      Es la diferencia entre el mayor y menor valor de una muestra.

                                        R x max            x min

      Rango semiintercuartílico y amplitud intercuartil
      El rango semiintercuartílico es la mitad de la diferencia entre el tercer y primer
      cuartil, Q = (Q3 – Q1)/2.
      La amplitud intercuartil es el doble del valor anterior,
      2Q = IQR = (Q3 – Q1).


      ¿Cómo elegir entre las medidas de dispersión?- La medida de dispersión más
      útil es la desviación típica. Sólo debes usar el rango cuando dispones de pocas
      medidas o cuando todo lo que necesitas conocer es la dispersión general de las
      medidas. Utiliza el coeficiente de variación cuando quieras tener una idea de la
      variabilidad relativa de dos o más variables cuyas medias son muy diferentes en
      magnitud. Esto se ve facilitado por su carácter adimensional, es decir, no depende
      de las unidades en que se mida la media



3.6   MEDIDAS DE FORMA
      Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda y
      Hacen referencia a la forma de la distribución, simétrica, asimetría a la derecha o
      a la izquierda. En general la mejor manera de verlo es por la representación
      gráfica, pero si no la tenemos existen coeficientes que nos indican la forma de la
      distribución. Los más utilizados son:


       Coeficiente de asimetría de Pearson,
       El coeficiente de asimetría de una variable mide el grado de asimetría de la
       distribución de sus datos en torno a su media, es adimensional y se define como
       sigue:
78                                     ESTADISTICA




                          x Mo
                  Ap
                            S
          Este coeficiente puede ser:

          Ap     0 , entonces la media igual que la moda, distribución simétrica

          Ap     0 , entonces la media mayor que la moda, asimetría a la derecha positiva

          Ap    0 , entonces la media menor que la moda, asimetría a la izquierda
          negativa.


         Curtosis
         El Coeficiente de Curtosis mide el grado de concentración que presentan los
         valores alrededor de la zona central de la distribución.


         La curtosis hace referencia al mayor o menor apuntamiento que tiene una
         distribución de frecuencias respecto a una distribución Normal, por lo tanto sólo se
         estudia en comparación con la campana de Gauss, se determina mediante:



                                          P75 P25
                                   K                      0.5
                                          P90 P10
         Se definen 3 tipos de distribuciones según su grado de curtosis:

          K    0 , la curva es igual que la normal, se llama Mesocúrtica
          K    0 , la curva es más puntiaguda que la normal se llama Leptocúrtica
          K    0 , la curva es más aplastada que la normal, se llama Platicúrtica
CLETO DE LA TORRE DUEÑAS   79
80                                        ESTADISTICA




                                EJERCICIOS DESARROLLADOS


     1. La siguiente tabla muestra los coeficientes de inteligencia de 480 niños.

C.I     70      74   78    82   86    90         94   98      102 106 110 114 118 122 126

fi      4       9    16    28   45    66         85   72      54      38        27     18       11   5   2


     Calcule:
     a) El C.I. medio de los niños.
     b) Su desviación típica.
     c) Si una madre afirma que exactamente la mitad de los niños del colegio tienen un
        C.I. superior al de su hijo, ¿qué C.I. tiene el niño?
     d) Supongamos que se quieren hacer estudios sobre el proceso de aprendizaje de
        los niños con mayor C.I., pero que el psicólogo solo puede atender al 15% de los
        niños del centro. ¿Qué C.I. deberá tener un niño como mínimo para ser
        considerado dentro de ese grupo de elegidos?
     e) Se van a preparar unas clases de apoyo, para un 25% de los niños del centro,
        precisamente para aquellos que tengan menor C.I. ¿Hasta que niños de qué C.I.
        deberemos considerar en estas clases?
      Solución:
      La variable de estudio es el cociente intelectual (X)
             xi            fi             fixi             fixi2           Fi              Hi
                      70             4            280              19600              4         0.0083
                      74             9            666              49284              13        0.0271
                      78             16           1248             97344              29        0.0604
                      82             28           2296        188272                  57        0.1188
                      86             45           3870        332820                 102        0.2125
                      90             66           5940        534600                 168          0.35
                      94             85           7990        751060                 253        0.5271
                      98             72           7056        691488                 325        0.6771
                     102             54           5508        561816                 379        0.7896
                     106             38           4028        426968                 417        0.8688
                     110             27           2970        326700                 444         0.925
                     114             18           2052        233928                 462        0.9625
CLETO DE LA TORRE DUEÑAS                                                                                        81




                118                    11             1298         153164              473         0.9854
                122                        5              610          74420           478         0.9958
                126                        2              252          31752           480              1
                1470           n=480                 46064        4473216


     a) Media

                f 1x1 f 2 x2 ..... fkxk                                    46064
         x                                                                       95.96
                           n                                                480
     b) Varianza y desviación.
                 n                             n
                                   2
                      xi       x       fi            fi xi2
                                                                           4473216                 2
         S2     i 1                            i 1
                                                                  x2                    95.96          110.88
                           n                         n                       480

         s       110.88 10.52
     c) Mediana.
         n=480 ( Par)

                 xn            xn              x 480            x 480
                      2            2
                                       1
                                                      2                2
                                                                           1   x 240       x 241       94 94
         Me                                                                                                          94
                           2                                  2                        2                 2

      d) Percentil 85

        P 106
         85

      e) Percentil 25

         P25     90

2.   Un centro educativo particular requiere los servicios de un Profesor. De los
      expedientes presentados, se han seleccionado 2 candidatos: A y B, los cuales
      reúnen los requisitos mínimos requeridos. Para decidir cual de los 2 se va a
      contratar, los miembros del Jurado deciden tomar 7 pruebas a cada uno de ellos.


     Los resultados se dan a continuación:
82                                            ESTADISTICA




     Candidato                                                                         Prueba
                                                      1                 2          3          4      5    6    7
     A                                                57                55       54          52      62   55   59
     B                                                80                40       62          72      46   80   40


     a) Halle e interprete la media, mediana y moda de los dos candidatos.
     b) Estadísticamente ¿Cuál de los candidatos debe ser contratado? Fundamente su
         respuesta.


         Solución:
                              XA              XB                    XA2                xB2
                                         57                80                 3249            6400
                                         55                40                 3025            1600
                                         54                62                 2916            3844
                                         52                72                 2704            5184
                                         62                46                 3844            2116
                                         55                80                 3025            6400
                                         59                40                 3481            1600
                                        394               420                22244           27144


     a) Estadísticos de A.
                                                           n
                                                                   xi
                 x1 x 2 ..... xn                          i 1                394
          xA                                                                            56.28
                        n                                      n              7
          MeA        xn       1       , para n impar n=7
                          2

          MeA         xn          1
                                         x7       1
                                                                x4            55
                              2               2

          MoA        55
CLETO DE LA TORRE DUEÑAS                                                                              83




      Estadísticos de B.
                                                                  n
                                                                          xi
              x1 x 2 ..... xn                                    i 1             420
      xB                                                                                60
                     n                                                n           7
       MeB          xn              1
                                         , para n impar n=7
                                2

      MeB          xn       1
                                        x7       1
                                                             x4            62
                        2                    2

      MoB1         40
      MoB 2        80

   b) Calcular la varianza
               n                                     n
                                         2
                    xi              x                      xi2
       2                                                            2           22244
      SA      i 1                                i 1
                                                                   xA                 (56.28) 2   10.27
                        n                                n                        7
                 S                  10.27
       CVA                                               0.057
               | XA |               56.28
               n                                     n
                                         2
                    xi              x                      xi2
       2                                                               2        27144
      SB      i 1                                    i 1
                                                                      xB                602   277.7
                        n                                n                        7
                 S                      277.7
      CVB                                                  0.277
               | XB |                    60


      La información se ilustra en el grafico siguiente.
84                                        ESTADISTICA




                                 Boxplot of Puntaje vs Postulante

                    80



                    70
          Puntaje




                    60



                    50



                    40

                                      A                              B
                                                   Postulante




     3. En un examen de matemáticas los 30 alumnos de una clase han obtenido las
        puntuaciones recogidas en la siguiente tabla:


                         Calificaciones        Alumnos
                             [0, 1>                2
                             [1, 2>                2
                             [2, 3>                3
                             [3, 4>                6
                             [4, 5>                7
                             [5, 6>                1
                             [6, 7>                1
                             [7, 8>                1
                             [8, 9>                1


     a) Halla la media, varianza, la desviación típica y coeficiente de variación.
     b) Mediana
     c) Moda.
CLETO DE LA TORRE DUEÑAS                                                                          85




     Solución:
                   I        fi                mi            mifi           mi2fi        Fi
            [0, 1>               2                 0.5              1            0.5         2
            [1, 2>               2                 1.5              3            4.5         4
            [2, 3>               3                 2.5             7.5      18.75            7
            [3, 4>               6                 3.5             21           73.5         13
            [4, 5>               7                 4.5        31.5         141.75            20
            [5, 6>               1                 5.5             5.5      30.25            21
            [6, 7>               1                 6.5             6.5      42.25            22
            [7, 8>               1                 7.5             7.5      56.25            23
            8, 9                 1                 8.5             8.5      72.25            24
            Total                24            40.5                92           440




a) Media, varianza, desviación y coeficiente de variación.
   Media.


                                                   fi mi
                                                             92
                                 x                                       3.83
                                               n             24
   Varianza.

                                      mi2 fi
                                                           440
                       S2                          x2                3.83        3.66
                                      n                    24
   Desviación.

                                          s          3.66 1.91

   Coeficiente de Variación.
                                                S          1.91
                                      CV                            0.498
                                               |X|         3.83
86                                  ESTADISTICA




     Mediana

                                            12 7
                            Me 3                 *1 3.833
                                              6
     Moda


                                                           1
                                  Mo    Li                         A
                                                      1        2


                                         1    7 6 1
                                         2    7 1 6
                                                  1
                                   Mo   4                 *1 4.14
                                              1 6


4.      En una institución educativa, se ha medido el nivel de depresión que presentan
        los adolescentes en una escala de 0- 20, obteniendo los siguientes resultado.


                             Nivel de                 Nro de
                            depresión             adolescentes.
                        [ 0-5 >               10
                        [ 5-10 >              15
                        [ 10-13 >             25
                        [13-18 >              8
                        [ 18-20               2


     a) Calcule la media, varianza y la desviación.
     b) Determine la mediana y la moda
     c) Determine e interprete Q1, Q3, P10 y P90
     d) Coeficiente de curtosis y de asimetría.
CLETO DE LA TORRE DUEÑAS                                                                          87




    Solución:
                I        fi.                Fi            mi           mifi          mi2fi
         [ 0-5 >               10                10            2.5            25           62.5
         [ 5-10 >              15                25            7.5      112.5         843.75
         [ 10-13 >             25                50        11.5         287.5        3306.25
         [13-18 >              8                 58        15.5            124         1922
         [ 18-20               2                 60            19             38           722
                               60                              56          587        6856.5


   a) Media y varianza
    Media.


                                                  fi mi
                                                           587
                                    x                                 9.78
                                                 n          60

    Varianza.

                                    mi2 fi
                                                      6856.5
                     S2                          x2                  9.782         18.63
                                    n                   60

    Desviación.

                                        s         18.63              4.31

   b) Mediana y moda
      Mediana

                                                          n
                                                                 Fk    1
                                    Me           Li       2                   A
                                                                fK

                     n         60
      Determinamos                      30
                     2          2
88                                   ESTADISTICA




                                      n
                                         Fk
                                      2
                                                  1              30 25
                         Me Li                        A 10             3 10.6
                                        fK                         25


        Moda

                                                             1
                                     Mo       Li                         A
                                                         1       2


                                         1    25 15 10

                                         2    25 8 17

                                     1                         10
                Mo Li                         A 10                 3 11.11
                                 1       2                   10 17


     c) Determine e interprete Q1, Q3, P10 y P90
               Para obtener los cuarteles se tiene la relación.

                                                      i.n
                                                           Fk        1
                                 Qi          Li        4                 A
                                                          fK

        Cuartil 1

                                 1.n
                                       Fk
                                  4
                                                  1              15 10
                    Q1    Li                          A 5              5 6.67
                                     fK                            15

            El 25% de los adolescentes presentan niveles de depresión menores a 6.67
CLETO DE LA TORRE DUEÑAS                                                      89




      Cuartil 3

                                   3.n
                                         Fk
                                    4
                                               1               45 25
                  Q3     Li                        A 10              3 12.4
                                       fK                        25

          El nivel de depresión máximo del 75% de los adolescentes es de 12.4.




           Para obtener los percentiles se tiene la relación.

                                                    i.n
                                                          Fk   1
                                   Pi    Li        100              A
                                                        fK

      Percentil 10

                                        10.n
                                                Fk
                                        100
                                                     1             6 0
                       P10    Li                         A 0           5 3
                                             fK                     10

      El 10% de los adolescentes tienen niveles de depresión entre 0 a 3


      Percentil 90

                               90.n
                                       Fk
                               100
                                               1               54 50
            P90        Li                            A 13            5 15.5
                                    fK                           8


   d) Coeficiente de Asimetría.

                                        x Mo       9.78 11.11
                              Ap                              -0.308
                                          s            4.31
90                               ESTADISTICA




     Puesto que Ap < 0  la distribución es asimétrica negativa o a izquierdas
     (desplazada hacia la izquierda).


     Coeficiente de curtosis de fisher.

                          Q3 Q1              12.4 6.67
                     K                0.5              0.5 -0.0416
                          P90 P10             15.5 3


     Si   k   0   , entonces la distribución es platicúrtica.
CLETO DE LA TORRE DUEÑAS                                                                               91




                                     EJERCICIOS PROPUESTOS.


1.       Se desea evaluar el efecto de un programa de intervención educativa en el nivel
         de conservación del medio ambiente, para este fin se aplico un instrumento
         antes y después de la aplicación del programa, obteniéndose los siguientes
         resultados:


          Estudiante         1        2        3         4         5       6        7    8        9
            Antes           10       13        11        09       13       12   11       14       08
           Después          13       18        14        15       13       17   13       16       12
         Cuál es su conclusión del estudio.
2.       Se realiza un experimento en una I.E, con la finalidad de determinar el efecto de
         dos métodos de enseñanza (Tradicional y ABP) en el rendimiento académico.
          Tradicional       12       14        04        09       13       16   13       05       15
             ABP            14       13        12        15       15       14   16       14       16
         Cuál de los métodos presenta mayor confianza. Fundamente su respesta


3.       En 20 Unidades de gestión escolar, seleccionados aleatoriamente se contabilizó
         el número de libreta de notas, incorrectamente llenadas durante un año escolar,
         obteniéndose los siguientes resultados:
            3           4        2         3        6         1        4        3        2        6
            4           2        4         1        4         3        4        4        4        3
     a) Calcule e interprete la media, mediana y moda
     b) ¿Que tipo de distribución es?


4.       Las puntuaciones de un test de inteligencia de 198 Profesores dieron los
         siguientes resultados:
                Puntuación           [30,40] (40,50] (50,60] (60,70] (70,80] (80,90]
                Nº de                  6            17        76           68       22        9
                personas
     a) Calcula la media, la mediana y la moda.
     b) Calcule la varianza, desviación y el coeficiente de variación
     c) Calcule el coeficiente de curtosis y de asimetría.
92                                  ESTADISTICA




5.     El Director de un centro educativo esta interesado en firmar un contrato de larga
       duración para el aprovisionamiento de suministros. El encargado de realizar la
       operación desea llevarla a cabo con la empresa que menos se retrase en
       proporcionar dichos suministros por termino medio. Tras un periodo de prueba
       con dos compañías, se han obtenido los siguientes datos referidos a retrasos en
       suministros, medidos en hora


                        Empresa 1                        Empresa 2
              110 15 147 93 104 95 108         80 41 3 325 19 93 115 23


       Asumiendo que el periodo de prueba es representativo del futuro desempeño de
       la actividad ¿por que empresa debería decidirse?




6.     Se mide la altura en metros de 110 estudiantes, obteniendo la siguiente tabla:
                              Altura              Nº de jóvenes
                           [1,55-1,60)                 18
                           [1,60-1,70)                 31
                           [1,70-1,80)                 24
                           [1,80-1,90)                 20
                           [1,90-2,00)                 17
     a) Construye la tabla de frecuencias.
     b) Calcule Q1, D7 y P40 , e interprete dichos valores.
     c) Se consideran “bajos” aquellos alumnos cuya estatura está sobre el percentil
        30. ¿Cuál es la altura máxima que pueden alcanzar?
     d) Se consideran “altos” aquellos alumnos cuya altura está sobre el percentil 82.
        ¿Cuál será su altura mínima?
     e) ¿En qué percentil está un joven cuya altura es 1,78 m.?


7.     Se registra el tiempo en minutos que utilizan 30 alumnos para ejecutar una tarea,
       resultando los siguientes:
CLETO DE LA TORRE DUEÑAS                                                             93




         19,15,26,17,11,23,26,22,18,20,11,18,23,25,20,16,9,22,12,23,13,18,12,13,15,20,
         21,15,18,22
      a) Construir una distribución de frecuencias de 5 intervalos, de amplitud constante.
      b) Calcule el tiempo debajo del cual se encuentran el 25% de las tareas.


8.       En un examen final de estadística, la puntuación media de un grupo de 150
         estudiantes fue de 78 y la desviación típica fue de 8 puntos. En álgebra, sin
         embargo, la media final del grupo fue de 73 y la desviación típica 7,6. ¿En qué
         asignatura hubo mayor dispersión absoluta y en cuál mayor dispersión relativa?
9.       En un estudio se anotó el número de palabras leídas en 15 segundos por un
         grupo de 120 sujetos que habían recibido previamente un adiestramiento y 120
         individuos que no habían recibido dicha instrucción. Los resultados fueron los
         siguientes:




                       Número de palabras leídas No instruidos Instruidos
                                  25                   56          1
                                  26                   24          9
                                  27                   16          21
                                  28                   12          29
                                  29                   10          28
                                  30                      2        32
         Compare la variabilidad en ambos grupos.


10.      En un examen final de microeconomía, la puntuación media de 150 estudiantes
         fue 12,8 puntos y la desviación típica 2,3 puntos. En estadística el promedio fue
         10,2 puntos y la desviación típica 1,6 puntos.
         a) En qué materia hay mayor dispersión relativa?
         b) ¿En qué materia destaca más un alumno que obtuvo 14 puntos en ambas?


11.      La siguiente tabla representa los resultados en la prueba de aptitud académica
         de un grupo de 1000 jóvenes que aspiran ingresar a cierta universidad:
94                                      ESTADISTICA




Calificación        300-350)     350-400)          400-450)      450-500)          500-550)    550-600)
       %Hi              6              28            45               63             95            100
         Hallar:
      a) Porcentaje de aspirantes cuya calificación es superior a 420 puntos pero inferior
         a 510
      b) N° de estudiantes que obtuvieron 500 puntos o más
      c) La mayor nota del 30% que obtuvo la nota más baja
      d) Porcentaje que obtuvo más de 480 puntos
      e) Coeficiente de asimetría de Pearson e interprete
      f) La curtosis e interprete.


12.      Un Especialista de educación desea comparar                        el rendimiento académico
         generado por dos métodos de enseñanza, A y B. El especialista piensa que el
         método de enseñanza A presenta mayor eficiencia que el método B. Para
         comprobar esta sospecha se toma una muestra aleatorias de 10 alumnos que
         utilizaron el método de enseñanza A y de 10 con el método B, obteniéndose los
         siguientes rendimientos en una escala vigesimal :
         Método A           14   15         13     11       10    17         18      16       15     05
         Método B           12   13         13     14       13    14         14      12       15     14


          a)       Estadísticamente. Cuál de los métodos es más recomendable para el
                   especialista que está interesado en:
                   Mayor rendimiento Académico.
                   Mayor nivel de confianza. Fundamente su respuesta.
          b)       Cuál es su conclusión respecto de la afirmación del especialista.



13.      Se han tabulado el nivel de gestión de los directores de las instituciones
         educativas, obteniendo los siguientes resultados.
                    Nivel de gestión        0-20    20-40     40-60        60-80   80-100
                       Frecuencia            6       12        14            9       3

          Con la finalidad de una capacitación de los directores, el ministerio de
          educación agrupara los directores según sus niveles de gestión                           en tres
          categorías: El 25% de los directores con menores niveles de gestión en la
CLETO DE LA TORRE DUEÑAS                                                        95




       categoría A, el 30% de los que presentan mayores niveles de gestión en la
       categoría C y el resto en la categoría B. Cuáles son los limites para cada
       categoría.


14.   En cierta evaluación para optar por una beca, Juan Perez obtuvo una calificación
      de 310 puntos en habilidad verbal y 218 puntos en habilidad numérica. Los
      parámetros de c/u son:
      Habilidad verbal:            x   245       s2   900
      Habilidad numérica: x 150        s   24
      a. ¿En cuál de las dos pruebas obtuvo mejor calificación?
      b. ¿En cuál de las dos pruebas el grupo es más homogéneo?


15.   Una gran compañía llevó a cabo un estudio para ubicar las variables que
      pudieran determinar el sueldo de un egresado universitario dos años después de
      haberse graduado en un área Administrativa. Los datos recogidos se presentan
      en la siguiente tabla:
      (La columna del sueldo es en cientos de miles de soles.)


                        Edad Sexo E. Civil            Sueldo
                    1     24   F           C           6,75
                    2     25   M           C           6,90
                    3     26   M             S         6,90
                    4     27   F           C           6,80
                    5     27   M           D           7,10
                    6     27   F           C           6,50
                    7     27   M             S         7,25
                    8     25   F           C           6,80
                    9     23   M             S         6,75
                 10       24   M             S         6,80
                 11       26   F           C           6,75
                 12       29   F           D           7,00
                 13       25   M           C           7,15
                 14       31   F           D           7,50
96                               ESTADISTICA




                 15    26      M         S       6,20
                 16    24      F         D       7,40
                 17    26      F         C       6,70
                 18    28      F         S       6,95
                 19    25      M         C       6,95
                 20    29      M         C       7,10


     a) Utilice la técnica de estadística descriptiva más apropiada para analizar cada
       variable individualmente. Interprete lo obtenido.
     b) Realice diagramas de cajas que le ayuden a visualizar como influye cada una
       de las variables en el sueldo que gana el individuo.
CLETO DE LA TORRE DUEÑAS                                                                  97




                                       CAPITULO IV
                         DISTRIBUCIONES BIDIMENSIONALES


Si resumir la información de una variable es de por si interesante, en investigación lo es
mucho más el poner de manifiesto la posible relación entre dos de ellas.
El análisis de la relación de dos variables, X e Y, depende del tipo de variables y Según
sean los tipos de cada una de ellas se usa técnicas estadísticas diferentes.


4.1 CUALITATIVA-CUALITATIVA.
     Cuando las variables de estudio son           cualitativas (categóricas) o cuantitativas
     discretas con poca       modalidades, se suele presentar las observaciones de las
     variables X e Y, mediante pares ordenados (xi, yi), esta forma de presentaciones
     se denomina tablas de contingencia. Las tablas de contingencia son de doble
     entrada organizada por filas y columnas y donde se presenta la distribución de
     frecuencias conjuntas de las dos variables.
     Dada una variable bidimensional ( X, Y ), consideramos una muestra de tamaño n
     en la que X toma k valores distintos, x1, . . . , xk, e Y toma l valores distintos, y1, . . ,
     yl, obtenemos, por tanto, observaciones del tipo (xi, yj).


   La frecuencia absoluta de un valor (xi, yj) es el número de veces que dicho valor
   aparece en la muestra. Se representa por fij , se cumple
                                         k    l
                                                  fij    n
                                        i 1 j 1
98                                   ESTADISTICA




     La frecuencia relativa de un valor (xi , yj) es el cociente de la frecuencia absoluta fij
     entre el tamaño de la muestra n, se representa por hij
                                                           k    l
                                 fij
                        hij                                          hij    1
                                 n ,       se cumple:
                                                           i 1 j 1




     Distribuciones marginales
     Nos indican el comportamiento aislado de cada una de las variables X e Y que dan
     lugar a una variable bidimensional.
     Frecuencia absoluta marginal de xi,

                                                                     l
                         fi.      f i1     f i 2  f il                    fij
                                                                     j 1
     Frecuencia relativa marginal de xi,

                                                    fi .
                                           hi .
                                                    n
     Frecuencia absoluta marginal de yj,
                                                                     k
                          f. j     f1 j    f 2 j  f kj                    fij
                                                                     i 1
     Frecuencia relativa marginal de yj,

                                                    f. j
                                           h. j
                                                    n

     Una tabla de doble entrada de una variable bidimensional sigue la estructura que
     se presenta a continuación, en la que tienen cabida las frecuencias marginales
     (representadas en la última fila y última columna). Puede ser de frecuencias
     absolutas o relativas.
CLETO DE LA TORRE DUEÑAS                                                                               99




                                                              Y
                      X
                                  y1           y2          .....            yl           ni.

                      x1          f11          f12         .....            f1l          f1.

                      x2          F21          f22         .....            f2l          f2.

                      ..          ..            ..         .....            ..           ..

                      xk    fk1                fk2         .....            fkl          fk.

                      n.j         f.1           f.2        .....            f.l          n


Ejemplo 1:
En una encuesta aplicada a los profesores egresados de una Universidad respecto a
la comprensión lectora y hábitos de estudio se obtuvo los siguientes resultados.


                                                      Comprensión lectora
    Habito de estudio                   Deficitario        Dependiente            Independiente
    Bajo                                     12                    3                           0
    Intermedio.                               1                    13                          0
    Alto.                                     3                    3                           5
     Interprete la información.
     Solución.

                                                           Compresión Lectora
            Habitos de
            Estudio                          Deficitario    Dependiente     Independiente      Total
                Bajo        Frecuencia               12                3                 0        15
                            Porcentaje           80.0%            20.0%               .0%      100%
               Intermedio   Frecuencia                 1              13                 0        14
                            Porcentaje
                                                    7.1%           92.9%              .0%      100%

               Alto         Frecuencia                 3                3                5        11
                            Porcentaje            27.3%            27.3%             45.5%     100%
            Total           Frecuencia                16               19                5        40
                            Porcentaje            40.0%            47.5%             12.5%     100%
            Chi-cuadrado=32,805     P-valor=0,000
100                                ESTADISTICA




Del 100% de estudiantes con el hábito de estudio bajo, 80% de estos presentan un
deficitario nivel de comprensión lectora, en cambio del 100% de estudiantes con un
hábito de estudio intermedio, 92.9% de ellos presenta una comprensión lectora
dependiente y del 100% de estudiantes con un habito de estudio alto, el 45.5%
presenta una comprensión lectora independiente.

       La información se muestra en el siguiente grafico:

                                                            Com prension lectora
               100
                                                                    Deficitario
                      90                                            Dependiente
                      80                                            Independiente

                      70
         Porcentaje




                      60

                      50

                      40

                      30

                      20

                      10

                      0
                           Bajo           Intermedio             Alto

                                      Habitos de estudio




   4.2 CUALITATIVA-CUANTITATIVA.
      Supongamos que tenemos          datos cuantitativos (numéricos)             para varias
      cualitativas (categorías), por ejemplo en un experimento donde hacemos
      mediciones numéricas en dos o más grupos. En estos casos, lo que se realiza es
      un estudio descriptivo de la variable numérica en cada una de las muestras y se
      comparamos los resultados.


      Ejemplo 2:
      Un investigador esta analizando el efecto que tiene en el rendimiento académico
      el uso de tres métodos de enseñanza, para tal efecto solicito a 30 docentes para
      que participen en el estudio. En el cuadro siguiente se muestra el rendimiento
      promedio de los alumnos de cada Docente.
CLETO DE LA TORRE DUEÑAS                                                         101




                            Método de enseñanza
                                         Nuevo
                        Clásico         Enfoque    Ambos
                            8              15       13
                            9              16       12
                           10              13       17
                           13              16        9
                           14              17       10
                            5              16       11
                           12              14       13
                           11              13        8
                            9              16        9
                            7              17       10


      a) Calcule el rendimiento promedio para cada método de enseñanza.
      b) Cual de los métodos, genera rendimientos más homogéneos.
      c) Represente la información mediante un grafico.


      SOLUCION:
     Método          Mean         S     Variance   CV       Median Kurtosis
     Ambos            11.200    2.658      7.067    23.74      10.500    1.38
     Clásico          9.800     2.781      7.733    28.38       9.500    -0.53
     Nuevo enfoque 15.300       1.494      2.233    9.77       16.000   -0.99
102                                           ESTADISTICA




                                       Boxplot of Rendimiento vs Metodo
                     17.5



                     15.0
       Rendimiento




                     12.5



                     10.0



                      7.5



                      5.0

                                    Ambos             Clasico             Nuevo enfoque
                                                      Metodo




4.3 CUANTITATIVA-CUANTITATIVA.
      Análisis de dos variables cuantitativas y establecimiento de una relación entre
      ellas. La forma más sencilla de estudiar la posible asociación entre estas variables
      es el diagrama de dispersión (Nube de puntos). Si reconocemos una tendencia,
      entonces el interés ahora será el análisis de regresión.


      Media y varianza
      La información de las dos variables X e Y se puede resumir usando la media y la
      varianza como se muestra a continuación:


      Media de la variable X:

                            fi xi
      x
                            n
      Media de la variable Y:

                            fi yi
      y
                            n
      Varianza de la variable X:
CLETO DE LA TORRE DUEÑAS                                                            103




         2
                   fi xi2       2
     s   x                  x
                 n

    Varianza de la variable Y:

      2
                   fi yi2       2
     sy                     y
                 n

    La covarianza
    Es una medida de la asociación lineal existente entre dos variables. Resume la
    información contenida en el diagrama de dispersión. Presenta la siguiente
    expresión:

                                                    fi xi yi
                    cov( x, y)       sxy                         x. y
                                                    n
    Si la covarianza está muy próxima a cero, no existe relación entre las variables o
    si existe es marcadamente no lineal, si es positiva, hay asociación lineal positiva, y
    si es negativa, hay asociación lineal negativa. Sin embargo, como la covarianza
    depende de las unidades de medida de las variables, no nos permite cuantificar el
    grado de asociación lineal ni comparar la asociación existente entre distintos
    pares de variables. Para dar solución a este problema se obtiene el coeficiente de
    correlación.


    Correlación.
    Estudia la relación o dependencia que existe entre dos variables que intervienen
    en una distribución bidimensional.


    Coeficiente de correlación lineal.
    Es un número que mide el grado de dependencia entre las variables X e Y.
    Se mide mediante la siguiente fórmula:
104                                                         ESTADISTICA




                 s xy
      r
            s x .s y
      Su valor está comprendido entre – 1 y 1.
           Si r = -1 ó r = 1 todos los valores de la variable bidimensional se encuentran
           situados sobre una recta.
           Si – 1< r < 0 se dice que las variables X e Y están también en dependencia
           aleatoria. La correlación es negativa.
           Si 0 < r < 1 la correlación es positiva. Las variables X e Y están también en
           dependencia aleatoria.


      La correlación es tanto más fuerte a medida que r se aproxima a –1 ó 1 y es tanto
      más débil a medida que se aproxima a 0.


4.3.1 Análisis de Regresión.
      Regresión: conjunto de técnicas que son usadas para establecer una relación
      entre una variable cuantitativa llamada variable dependiente y una o más
      variables independientes, llamadas predictoras. Estas también deberían ser
      cuantitativas, sin embargo algunas de ellas podrían ser cualitativas.


      Modelo de regresión. Ecuación que representa la relación entre las variables

      Y                           X

      Estimación de la línea de regresión usando Mínimos Cuadrados
      Minimizando el error cuadrático medio:
                              n                n
                                      2
      Q     ,                     e   i              ( yi            xi )2   , se tiene:
                           i 1                 i 1

                n                     n         n
           n          xi yi               xi         yi
       ˆ        i 1               i 1          i 1
                                                              S xy
                      n              n
                                                              S xx
                n         xi2 (             xi ) 2
                    i 1               i 1
CLETO DE LA TORRE DUEÑAS                                                           105




     ˆ    y      ˆx


    La pendiente
                    ˆ , indica el cambio promedio en la variable de respuesta cuando
    la variable predictora aumenta en una unidad adicional.

    El intercepto   ˆ   , indica el valor promedio de la variable de respuesta cuando la
    variable predictora vale 0. Sin embargo carece de interpretación práctica si es
    irrazonable pensar que el rango de valores de x incluye a cero.

    A partir de la recta   ˆ
                           Y   ˆ    ˆX   podemos calcular los valores de y conocidos
    los de x. La fiabilidad que podemos conceder a los cálculos obtenidos viene dada
    por el coeficiente de correlación: si r es muy pequeño no tiene sentido realizar
    ningún tipo de estimaciones.
    Si r es próximo a – 1 ó 1, las estimaciones realizadas estarán cerca de los valores
    reales.
    Si r = 1 o r = -1, las estimaciones realizadas coincidirán con los valores reales.




    Ejemplo 3:
    Se   aplicó un test para medir el conocimiento (X) y           la aplicación (Y) de
    estratégicas cognitivas en el proceso de enseñanza en una escala de 0- 120. Los
    datos que se obtuvo fueron los siguientes:
106                                    ESTADISTICA




                                        X        Y
                                         51.3        102.5
                                         49.9        104.5
                                            50       100.4
                                         49.2         95.9
                                         48.5         87
                                         47.8         95
                                         47.3         88.6
                                         45.1         89.2
                                         46.3         78.9
                                         42.1         84.6
                                         44.2         81.7
                                         43.5         72.2
                                         42.3         65.1
                                         40.2         68.1
                                         31.8         67.3
                                            34        52.5
      a)         Trace un diagrama de dispersión.
      b)         Ajuste una recta de regresión.
      c)         Calcule la correlación lineal e interprete dicho valor.
      Solución:

           110


           100


           90


           80
      Y




           70


           60


           50
                 30             35               40             45         50
                                                      X
CLETO DE LA TORRE DUEÑAS                                                         107




                          X                Y       X.Y       X2         Y2
                        51.3              102.5   5258.25   2631.69   10506.25
                        49.9              104.5   5214.55   2490.01   10920.25
                          50              100.4     5020      2500    10080.16
                        49.2              95.9    4718.28   2420.64    9196.81
                        48.5               87      4219.5   2352.25      7569
                        47.8               95       4541    2284.84      9025
                        47.3              88.6    4190.78   2237.29    7849.96
                        45.1              89.2    4022.92   2034.01    7956.64
                        46.3              78.9    3653.07   2143.69    6225.21
                        42.1              84.6    3561.66   1772.41    7157.16
                        44.2              81.7    3611.14   1953.64    6674.89
                        43.5              72.2     3140.7   1892.25    5212.84
                        42.3              65.1    2753.73   1789.29    4238.01
                        40.2              68.1    2737.62   1616.04    4637.61
                        31.8              67.3    2140.14   1011.24    4529.29
                          34              52.5      1785      1156     2756.25
                          713.5           1333.5 60568.34 32285.29 114535.33



                 xi       713.5
     x                                     44.59375 ;
             n             16
                 yi       1333.5
     y                           83.34375 ;
             n              16
        2
                 xi2          2       32285.29
    s   x                 x                    44.593752     29.228
             n                           16

         2
                  yi2             2      114535.33
     s   y                    y                    83.343752      212.277 ;
             n                              16
                  xi yi                   60568.34
     sxy                          x. y             (44.59375).(83.34375) 68.9
                 n                           16
108                                              ESTADISTICA




      Recta de regresión
                    n                n          n
              n          xi yi             xi         yi
       ˆ           i 1              i 1         i 1
                                                            S xy      68.9
                         n             n
                                                                                   2.357
                                                            S x2     29.228
                   n          xi2 (         xi )2
                        i 1           i 1


       ˆ       y         ˆx       83.34375 2.357(44.59375)                              21.76
      ˆ
      Y        ˆ         ˆX          21.76 2.357 X
               sxy                    68.9
      r                                                             0.8747
              sx .s y            29.228. 212.277

Ejemplo 4:
Las calificaciones de 40 alumnos en psicología evolutiva y en estadística han sido las
siguientes:

                                     X                        Y           Número
                              calif. en psicol.        calif. en estad.   de alumnos.
                                      3                       2               4
                                      4                       5               6
                                      5                       5               12
                                      6                       6               4
                                      6                       7               5
                                      7                       6               4
                                      7                       7               2
                                      8                       9               1
                                     10                      10               2
      a)           Determina la media y varianza de X e Y.
      b)           Calcule la covarianza de X e Y
      c)           Calcule e interprete el coeficiente de correlaciones.
CLETO DE LA TORRE DUEÑAS                                                                                                     109




             Solución:
             Disponemos los datos de la siguiente forma:
               xi                          yi           ni             nixi        niyi           nixi2     niyi2   nixiyi
               3                           2            4                 12        8             36        16       24
               4                           5            6                 24       30             96        150     120
               5                           5            12                60       60             300       300     300
               6                           6            4                 24       24             144       144     144
               6                           7            5                 30       35             180       245     210
               7                           6            4                 28       24             196       144     168
               7                           7            2                 14       14             98        98       98
               8                           9            1                 8         9             64        81       72
               10                          10           2                 20       20             200       200     200
                                                        40             220         224            1314      1378    1336


                              ni xi             220                                     ni yi     224
              x                                     5,5 ;                      y                      5,6
                            N                   40                                      N         40

    2
               ni xi2              2        1314
s   x                          x                 (5,6) 2       32,85 30,25 2,6
               N                             40
               2
sx            sx            2,6            1,61

     2
                   ni yi2              2        1378
 s   y                          y                    (5,6) 2    3,09 ;
                   N                             40
        sy         3,09 1,75

                   ni xi yi                       1336
s xy                                   x.y             (5,3).(5,6)         33,4 30,8        2,6
                   N                               40
                                                                s xy
El coeficiente de correlación: r
                                                               s x .s y

              2,6
r                                      0,92
         (1,61).(1,75)


La correlación es positiva, es decir, a medida que aumenta la nota de estadística
aumenta también la nota en psicología. Su valor está próximo a 1 lo que indica que se
trata de una correlación fuerte, las estimaciones realizadas están cerca de los valores
reales.
110                                     ESTADISTICA




                                  EJERCICIOS PROPUESTOS.


1.      De la evaluación censal, desarrollado a los docentes de la ciudad de Cusco, se
      registro la información del conocimiento y aplicación de metodologías de
      enseñanzas de 10 Docentes.


                        Docentes        Conocimiento           Aplicación.
                              1              16                    16,5
                              2              14                    14,5
                              3              18                      17
                              4              15                      15
                              5             13,5                     14
                              6              17                      18
                              7              15                      17
                              8              10                      10
                              9              15                      16
                             10              14                      15


      a)   Calcula la covarianza, las varianzas y el coeficiente de correlación.
      b)   ¿Existe correlación entre las dos variables?
      c)   Calcula la recta de regresión. ¿Interprete adecuadamente los resultados?


2.    En una encuesta realizada a los alumnos de los centros educativos de la ciudad de
      Cusco, respecto al conocimiento de los docentes de las materias que regenta,
      proporciona la siguiente información:



             Recuento
                                           El profesor de la asignatura conoce
                                                         el curso
                                           Regular         Bien        Muy Bien    Total
             Area    Comunicacion                  5             12            7        24
                     Matematica                   84             16            1       101
                     Biologia                     30             10           10        50
                     Educacion fisica             17             19           32        68
             Total                                70           138            35       243
CLETO DE LA TORRE DUEÑAS                                                            111




      a)     Analice la información de forma adecuada
      b)     Interprete los resultados obtenidos y redacte algunas conclusiones.


3.    Un especialista en Educación, desea analizar si la metodología de los Docentes
      esta relacionado con su preparación académica, para tal efecto aplica un test, los
      resultados se muestran a continuación.


                                  Preparación
                                  Académica     Metodología
                                           50            50
                                           75            66
                                           50            75
                                           75            25
                                           50            66
                                           58            58
                                           66            66
                                           83            41
                                           83            83
                                           66            41
                                           50            75
                                           75            75
                                           75            41
                                           75            66
                                           75            66


     a)    Trace el diagrama de dispersión ¿Que tipo de relación se observa?
     b)    Ajuste una recta de regresión
     c)    Calcula el coeficiente de correlación. ¿Interprete adecuadamente dicho
           resultado?


4.        La siguiente tabla muestra las distribuciones de frecuencias de las puntuaciones
          finales de 100 estudiantes en matemáticas y física:
112                                      ESTADISTICA




                Física                         Matemáticas
                          40-49        50-59   60-69   70-79   80-89   90-99
                90-99                                   2       4       4
                80-89                            1      4       6       5
                70-79                            5      10      8       1
                60-69          1        4        9      5       2
                50-59          3        6        6      2

                40-49          3        5        4


      a) Número de alumnos que recibieron puntuación entre 70 y 79 en matemáticas y
            entre 80 y 89 en física.
      b) Porcentaje de estudiantes con puntuación en matemáticas inferior a 70.
      c) Porcentaje de que un estudiante obtenga 70 ó más puntos en física y menos
            de 80 en matemáticas.
      d) Porcentaje de estudiantes que aprobó al menos una de las dos asignaturas,
            suponiendo 60 la puntuación mínima para aprobar.
      e) Porcentaje de que un estudiante tenga aprobadas las dos asignaturas.
      f)     Porcentaje de que un estudiante, que sabemos que tiene aprobada las
            matemáticas, tenga aprobada también física.
      g) Porcentaje de estudiantes que tienen aprobada matemáticas de entre los que
            tienen aprobada física.
      h) Sobre qué puntuación en física tendrá un estudiante del que sabemos que ha
            obtenido 86 puntos en matemáticas.
      i) Da una medida de la exactitud del resultado obtenido en h).


5.         Se ha recogidos datos sobre la puntuaciones que en una encuesta dieron los
           alumnos   de cuatro grupos a un profesor. La información se muestra en el
           cuadro siguiente:
CLETO DE LA TORRE DUEÑAS                                                            113




           NOTA                                   GRUPO
                             A               B             C              D
              2              20              0            10             30
              4              30              30           20             30
              6              30              40           40             20
              8              10              20           10             20
             10              10              10           20              0


     a) En que grupo tuvo el profesor mejor calificación media.
     b) En cual de los grupos hubo menos divergencia de opiniones.
     c) Interprete adecuadamente la tabla.
6.     La tabla siguiente muestra el CI (coeficiente intelectual) de un grupo de personas
      y su capacidad lectora (HL).
                                      CI          HL
                                      109         31,8
                                      138         24,5
                                      86          11,8
                                      153         18,8
                                      156         17,3
                                      40          11,0
                                      70          12,2
                                      126         20,6
                                      68          10,8
                                      99          5,3
                                      112         29,3
                                      138         8,0
                                      103         35,8
                                      127         19,6
                                      63          21,4
      a) Trace una diagrama de dispersión
      b) Ajuste los datos a una recta de regresión.
      c) Predecir la capacidad lectora de una persona con cociente intelectual de 120
      d) Calcule la correlación entre ambas variables. interprete dicho valor.
114                                ESTADISTICA




                                      CAPITULO V
                                   PROBABILIDADES


El Cálculo de Probabilidades se ocupa de estudiar ciertos experimentos que se
denominan aleatorios, cuya característica fundamental es la incertidumbre del
resultado, esto significa que es imposible predecir los resultados porque hay más de
uno posible.
En nuestra vida cotidiana asociamos usualmente el concepto de probabilidad a su
calificativo probable, considerando probable a aquellos eventos en los que tenemos
alto grado de creencia en su ocurrencia. En esta línea probabilidad es un concepto
asociado a una medida del azar.
El objetivo de la probabilidad es cuantificar las posibilidades que tengan ciertos eventos
inciertos.


5.1 EXPERIMENTO ALEATORIO.
      Es una acción que da lugar a resultados identificables y se caracteriza por:
      Todos los posibles resultados son conocidos previamente.
      Repeticiones en situaciones análogas pueden dar resultados diferentes.
      No se puede predecir el resultado del mismo antes de realizarlo, es decir, no se
      sabe cuál de los posibles resultados aparecerá al final.
      Los experimentos pueden ser aleatorios o deterministas. Aleatorio significa
      relativo a todo acontecimiento incierto, por depender de la suerte o del azar,
      mientras que los deterministas son aquellos que se caracterizan por el hecho de
      que las mismas causas producen los mismos efectos.
CLETO DE LA TORRE DUEÑAS                                                            115




    Espacio muestral.
    Es el conjunto de todos los resultados posibles del experimento y se denota por
       . A cada elemento de       se denomina punto muestral w , es decir:


                                   w / w es un punto muestral .
    Evento o Suceso Aleatorio.
    Un evento aleatorio es un subconjunto del espacio muestral y se denota con
    letras mayúsculas.
    El evento seguro        , es aquel que ocurre siempre al realizar el experimento.

    El evento imposible        , es aquel que no ocurre nunca.
    Los eventos elementales solo tienen un punto muestral.


    El evento complementario       Ac , esta dado por todo los puntos muestrales que
      no están en   A

5.2 OPERACIONES DE EVENTOS.
    Unión de eventos: Dados dos eventos A y B de un mismo espacio muestral su
    unión se representa por A        B y es el evento que contiene los elementos que
    están en A o en B o en ambos. El evento       A    B     ocurre si al menos uno de los
    dos eventos ocurre.


    Intersección de eventos: Dados dos eventos A y B de un mismo espacio

    muestral su intersección se representa por     A     B    y es el evento que contiene
    los elementos que están en A y B al mismo tiempo.

    El evento   A   B     ocurre cuando ambos eventos ocurren simultáneamente.



    Evento Complemento: El complemento de un evento A se representa por             Ac y
    es el evento que contiene todos los elementos que no están en A. El evento       Ac
    ocurre si A no ocurre.
116                                              ESTADISTICA




5.3   DEFINICIÓN CLÁSICA DE PROBABILIDAD:
      La probabilidad de un suceso A se calcula como el número de casos favorables
      al suceso A, dividido por el número de casos posibles del experimento aleatorio.
                                           casos favorables
                             P( A)
                                            casos posibles


5.4   DEFINICIÓN AXIOMÁTICA DE PROBABILIDAD.
      La probabilidad es una función que asigna a cada suceso A                    un número real
      que varia entre 0 a 1.



       P:                             y que verifica:
              A            P(A)

        i)    0        P( A) 1              A

        ii)   P             1
       iii) Si A y B son sucesos incompatibles,

                  P A B           P A            P B
      Como consecuencia de estos tres axiomas, se verifican además las siguientes
      propiedades:

       iv)        P( Ac ) 1 P A
       v)         P( ) 0

       vi)        Si   A        B,          P( A)      P( B)

       vii)       P( A  B)          P( A) P( A                B) ,    A,B
       viii) Si A1, A2, ...... , An son incompatibles dos a dos, entonces

            P A1            A2       ...        An     P A1           P A2   ... P An
       ix)        Si A, B         son dos sucesos cualesquiera, entonces

                  P A B                    P A          P B           P A B
       x)         Si A, B         son dos sucesos cualesquiera, entonces
CLETO DE LA TORRE DUEÑAS                                                                  117




             P( A)        P A       Bc      P A      B


5.5   PROBABILIDAD CONDICIONADA.
      Queremos estudiar como cambia la probabilidad de ocurrencia de A cuando se
      conoce que otro evento B ha ocurrido. En este caso habrá que redefinir el espacio
      muestral considerando solamente los elementos de B como posibles resultados.


      La probabilidad de A condicionada a B, esta definido como la probabilidad de
      que ocurra A sabiendo que ha ocurrido B, y se define mediante:
                                             P( A B)
                              P( A | B)              , P(B)        0.
                                               P( B)
      En consecuencia,

                                    P(A     B) =P( A) P( B )
                                                          A


      Independencia.
      Dos sucesos A, B             se dicen independientes si:

                           P( A)      P( A | B) , o bien P( B)      P( B | A)

      Es decir, se cumplirá que:

                                   P( A     B)     P( B).P( A)

      Si A y B son independientes, entonces A y BC son independientes, AC y B son
      independientes, y AC y BC son independientes.


      Observación.

      Decimos que n sucesos           A1, A2, An         son independientes si para cada par

      (Ai, Aj),   P( Ai     Aj )     P( Ai ) P( Aj ) si   i   j , si para cada trío (Ai, Aj, Ak)

      P( Ai         Aj      Ak )         P( Ai ) P( Aj ) P( Ak )
      Si i   j    k y así sucesivamente. En general,
118                                            ESTADISTICA




       P( A1               A2                 An)     P( A1) P( A2) P( An)

      Teorema de la probabilidad compuesta.
      Dados n sucesos A1, A2, ......., An se verifica:

            P( A1 A2  An) P( A1)P( A2 | A1)P( A3 | A1 A2)P( An | A1 A2  An 1)


5.6 TEOREMA DE LA PROBABILIDAD TOTAL
      Si suponemos que los eventos A1, A2, A3, ...., An, forman una partición de un
      espacio muestral             ; esto es, que los eventos Ai son mutuamente excluyentes y

      su unión es             .


                                  E


                                       A1       A2    A3     …… An




      La partición A1, A2, ......, An , cumple con las siguientes propiedades:

      i)     A1  A2               i     j ( disjuntos dos a dos)
                    n

      ii)            Ai
                    i 1


      iii)    P( Ai ) 0 ,              i 1,....n .

      La probabilidad de un suceso B cualquiera es:

            P( B)         P( A1 ) P( B        ) P( A2 ) P( B        ) ....... P( An ) P( B        )
                                         A1                    A2                            An
CLETO DE LA TORRE DUEÑAS                                                                        119




                                     n
                           P( B)          P( Ai) P( B | Ai)
                                    i 1



5.7 TEOREMA DE BAYES
    El procedimiento que se utiliza para encontrar probabilidades posteriores, a partir
    de probabilidades previas, se llama regla Bayesiana. Las probabilidades a priori o
    previas se conocen antes de obtener información alguna del experimento en
    cuestión. Las probabilidades a posteriori se determinan después de conocer los
    resultados del experimento.
    El teorema de Bayes consiste en un método para encontrar la probabilidad de una
    causa específica cuando se observa un efecto particular. Esto es, si el evento B
    ha ocurrido, ¿Cuál es la probabilidad de que fue generado por el evento A1 (que
    es una causa posible ) o por el A2 (otra causa posible)?.



    Si A1, A2, ......., An es una partición del espacio muestral tal que             p( Ai ) 0 ,
        i 1,....n , entonces para un suceso B cualquiera se verifica:
                            P( Ai B)            P( Ai ) P( B | Ai )
              P( Ai | B)                         n                          , i = 1, ...., n.
                              P( B)                    P( Ai ) P( B | Ai)
                                                 i   1

                                           P( Ai ) P( B | Ai)
            P( Ai | B)
                         P( A1 ) P( B ) P( A2 ) P( B ) ....... P( An ) P( B )
                                     A1             A2                     An
120                                     ESTADISTICA




                             EJERCICIOS DESARROLLADOS.


   1) Un director de una institución educativa mixta, tiene 3 vacantes para el quinto
      año de secundaria.
      a) Cual es el espacio muestral.
      b) Si el interés del director es matricular, exactamente dos estudiantes de sexo
           masculino ¿Cual es la probabilidad asociado a este evento?
      c) Cual es la probabilidad de que el primer estudiante aceptado sea de sexo
           masculino y el último de sexo femenino.
      d) Cual es la probabilidad de admitir por lo menos un estudiante de sexo
           masculino
      e) Cual es la probabilidad de admitir a lo más 1 estudiantes de sexo femenino.


      Solución.
      a)       M1M2 F3 , M1M2 M3 , M1F2 F3 , M1F2 M3 , F1M2M3 , F1M2 F3 , F1F2M3 , F1F2 F3

      b) Sea el evento A: Estudiantes de sexo masculino
                                    A     M1M 2 F3 , M1F2 M3 , F1M 2 M3

                                                        n( A)        3
                                              p( A)
                                                        n( )         8
      c) Sea el evento B: Primer estudiante aceptado de sexo masculino y el último de
      sexo femenino.
                                          C     M1M2 F3 , M1F2 F3

                                                        n(C )        2
                                              p(C )
                                                        n( )         8
      d) Sea el evento D: Se admite por lo menos un estudiante de sexo masculino.
                  D    M1M2 F3 , M1M2 M3 , M1F2 F3 , M1F2 M3 , F1M2 M3 , F1M2 F3 , F1F2 M3

                                                        n( D )       7
                                              p( D)
                                                        n( )         8
      e) Sea el evento E: Se admite a lo más un estudiante de sexo femenino.
                              E     M1M2 F3 , M1M2 M3 , M1F2 M3 , F1M2 M3

                                                      n( E )     4       1
                                           p( E )
                                                      n( )       8       2
CLETO DE LA TORRE DUEÑAS                                                            121




   2) La biblioteca municipal de una provincia compra libros de 3 editoriales: el 45%
      de los libros son compradas del editorial A resultando defectuoso el 1%, la
      editorial B suministra el 30% de los libros y de ellas es defectuoso el 2%. Las
      restantes son adquiridas de la editorial C, siendo defectuoso el 3% de las
      mismas. En un control de recepción de libros se selecciona un libro al azar cual
      es la probabilidad:
 a)    De que sea defectuosa.
 b)   De que sea defectuosa y haya sido adquirido de la editorial B
 c)   Calcular la probabilidad de que el libro haya sido adquirido de la editorial C, dado
            que es defectuoso.


 Solución
                                                               Defectuoso
                                                 1%

                                                      99%
                                                                     Bueno
                                             A

                               40%
                                                      2%             Defectuoso

                                                               98%
                  Libro              30%          B                   Bueno

                                                          3%
                                                                      Defectuoso
                                     30%
                                                      C

                                                          97%           Bueno




 Sean los eventos.
 A: Libro adquirido de la editorial A, B: Libro adquirido de la editorial B.
 C: Libro adquirido de la editorial C, D: Libro defectuoso, E: libro Bueno.


 a) p( D)    p( A) p( D )    p( B) p( D )   p(C ) p( D )
                       A               B              C
                            p( D) 0.4*(0.01) 0.3*(0.02) 0.3*(0.03)



 b) p(B     D) =p( B) p( D )
                          B
                                      p(B    D) =0.3*(0.02)
122                                            ESTADISTICA




                  p(C D)                                p(C ) p( D | C )
 c) p(C | D)
                    p( B)          p( A) p( D | A)      p( B) p( D | B) p(C ) p( D | C )


                                                         0.3*(0.03)
                                p(C | D)
                                              0.4*(0.01) 0.3*(0.02) 0.3*(0.03)




3) En un estante hay 7 libros de historia y 3 de matemáticas. De los libros de historia,
   tres están empastados de amarillo y el resto de rojo; mientras que de los libros de
   matemáticas, uno está empastado en amarillo y dos en rojo. Suponiendo que del
   estante se elige un libro al azar, ¿cuál es la probabilidad de que sea de :
   a) Historia
   b) Color amarillo.
   c) matemáticas y de color rojo
   d) matemáticas o de color rojo
   d) Historia, dado que es de color amarillo.


   Solución.
                                             Historia         Matemática              Total

               Amarillo                 3                    1                   4
               Rojo                     4                    2                   6

               Total                    7                    3                   10


   Sean los eventos:
   A: Libro de matemáticas. B: Libro de historia. C: Color amarillo, D: Color rojo.
                n( B )      7
   a) p( B)                      0.7
                n( )       10
                 n(C )      6
   b) p(C )                       0.6
                 n( )      10
                         n( A D )        2
   c) p( A     D)                             0.4
                           n( )         10
CLETO DE LA TORRE DUEÑAS                                                                         123




                                                                 n( A)   n( D )    n( A D )
   d) p( A     D)        p( A)    p ( D)    p( A        D)
                                                                 n( )    n( )        n( )
                                                              3 6 2                7
                                           p( A     D)                                     0.7
                                                             10 10 10             10
                                     n( B C )
                       P( B C )        n( )             n( B C )         4
  e) P ( B | C )
                         P (C )        n(C )              n(C )          7
                                       n( )
4) En una ciudad se publican los periódicos A, B y C. Una encuesta reciente de
   lectores indica lo siguiente: 20% lee A, 16% lee B, 14% lee C, 8% lee A y B, 5% lee
   A y C, 2% lee A, B y C, y 4% lee B y C. Para un adulto escogido al azar, calcular la
   probabilidad de que:
  a) No lea ninguno de los periódicos.
  b) Lea exactamente uno de los periódicos.
  c) Lea A y B.


  Solución.
  Sean los eventos
  A: Lee el periódico A.
  B: Lee el periódico B.
  C: Lee el periódico C.
                                                   A



                                                   9%
                                                                 6%
                                                                                       B
                                                   3%       2%           6%

                                                             2%
                                                   7%




                                                    C

                            c
  a) p A           B    C         p(U ) p A             B    C

                                               c
                          p A       B      C        100% (9 6 6 3 2 2 7)% 75%
124                                   ESTADISTICA




     b) p(Lea exactamente un periódico)=9%+6%+7%=22%

     c) p A      B      6%


5)    En una Universidad, se conoce a través de una muestra, que en los estudiantes
     varones: 50 son de aspiraciones elevadas y 20 de aspiraciones modestas.
     Asimismo, en los estudiantes 60 son de aspiraciones elevadas y 30 de aspiraciones
     modestas. Si se selecciona         dos estudiantes¿ Cual es la probabilidad de
     seleccionar:


          Dos estudiantes de aspiraciones elevadas?
          Un estudiante con aspiraciones elevadas y uno de aspiraciones modestas.
          El primer seleccionado sea de sexo masculino y el segundo de sexo
            femenino.


     Solución.
                                       Masculino     Femenino           Total

          Aspiraciones elevadas            50           60               110
          Aspiraciones modestas            20           30               50

          Total                            70           90               160


     Sean los eventos
     A: Estudiante se sexo masculino.
     B: Estudiante se sexo femenino.
     C: Estudiante de aspiraciones elevadas.
     D: Estudiante de aspiraciones modestas.
                         110
                        C2
     a) p(C1     C2 )    160
                        C2

     b) p(Uno aspiraciones elevadas y uno modestas)     p(C1    D2 ) p(D1       C2 )

                                                    C1 * C150
                                                     110
                                                                C150 * C1110

                                                         160         160
                                                      C2           C2
                        C170 * C190
     c) p( A1    B2 )        160
                           C2
CLETO DE LA TORRE DUEÑAS   125
126                                   ESTADISTICA




                                   Problemas Propuestos.


1)      Calcular la probabilidad de que al lanzar un dado se obtenga un número que
        sea múltiplo de dos o tres.
2)      Si se lanzan dos dados, encontrar la probabilidad de obtener un 5 en el primero
        y 3 en el segundo.
3)      En una encuesta entre alumnos de maestría en administración se obtuvieron los
        datos siguientes acerca de “el principal motivo del alumno para solicitar su
        ingreso a la escuela donde está matriculado”.


            Motivo           Calidad de la          Costo o        Otros
           Tipo est.            escuela           comodidad                  Totales
       Tiempo completo             421               393             76        890
        Tiempo parcial             400               593             46       1039
            Totales                821               986             122      1929


     a. Si un alumno es de tiempo completo. ¿Cuál es la probabilidad de que la calidad
        de la institución sea el principal motivo para elegir su escuela?.
     b. Si un alumno es de tiempo parcial. ¿Cuál es la probabilidad de que la calidad de
        la escuela sea el motivo para elegirla?
     c. Sea A el evento en que el alumno es de tiempo completo y sea B el evento que
        el alumno menciona que la calidad de la escuela es el 1 er motivo de su solicitud.
        ¿Son independientes los eventos A y B?. Justifique su respuesta.


4)      Antes de que un libro sea lanzado al mercado se recogen las reacciones de un
        grupo de personas a las que se les permite leer el libro previamente.
        Posteriormente a las ventas del libro se les asigna el calificativo de altas,
        moderadas o bajas de acuerdo a las noemas del mercado. Los resultados se
        muestran en la siguiente tabla:
CLETO DE LA TORRE DUEÑAS                                                             127




             Reacciones          Favorables            Neutral            Desfavorables
     Ventas
     Altas                          173                  101                     61
     Moderadas                      88                   211                     70
     Bajas                          42                   113                    141


       a) ¿Cuál es la probabilidad de que las ventas sean altas?
       b) ¿Cuál es la probabilidad de que las reacciones sean favorables?
       c) Si la reacción del grupo es favorable?. ¿Cuál es la probabilidad de que las ventas
          sean altas?
       d) Si las ventas son bajas ¿Cual es la probabilidad de que las opiniones hayan sido
          desfavorables?
       e) ¿Cuál es la probabilidad de que las opiniones sean favorables y las ventas sean
          altas?
       f) ¿Cuál es la probabilidad de que las ventas sean favorables o desfavorables?.
          ¿Son esos sucesos mutuamente excluyentes? Justifique
       g) ¿Son los sucesos “Opiniones desfavorables” y “Ventas Bajas” independientes?
          Justifique.


5)      Una prueba de selección consta de dos preguntas tipo test. Se consideran aptos
        aquellos individuos que contesten correctamente a la segunda pregunta,
        independientemente de cómo hayan contestado a la primera.
        La primera pregunta tiene cuatro posibles respuestas. A los individuos que
        contestan correctamente a la primera pregunta, se les plantea una segunda
        pregunta con dos posibles respuestas, mientras que a quienes fallan la primera
        pregunta les proponen una segunda cuestión con ocho posibles respuestas.
        Si un individuo que se presenta a la prueba y contesta a las preguntas al azar,
        a) ¿cuál es la probabilidad de que sea considerado apto?
        b) ¿cuál es la probabilidad de que conteste correctamente a la primera pregunta y
             mal a la segunda?


     6) En un instituto hay 320 alumnos de primer curso, 280 de segundo y 200 de tercero.
        Al final de curso han suspendido 60 alumnos de primero, 48 de segundo y 72 de
128                                ESTADISTICA




   tercero. Hallar la probabilidad de que al elegir un alumno al azar y resultando que
   está suspendido, sea de 1º, de 2º o de 3º.


7) En una clase de 30 alumnos hay 18 que han aprobado matemáticas, 16 que han
   aprobado inglés y 6 que no han aprobado ninguna de las dos.
      Elegimos al azar un alumno de esa clase:
      a) ¿Cuál es la probabilidad de que haya aprobado inglés y matemáticas?
      b) Sabiendo que ha aprobado matemáticas, ¿cuál es la probabilidad de que haya
        aprobado inglés?
      c) ¿Son independientes los sucesos "Aprobar matemáticas" y "Aprobar inglés"?


8) La probabilidad de que un alumno estudie para su examen es 0.75. Si estudia, la
   probabilidad de que apruebe el examen es 0.80. Si el alumno no estudia la
   probabilidad de que no apruebe el examen es 0.90.
   a. ¿Cual es la probabilidad de que el alumno apruebe el examen?
   b. Si el alumno aprueba el examen ¿Cual es la probabilidad de que haya
        estudiado?


9) Una dirección departamental de educación recibe 25 solicitudes para una vacante
   de director de una UGEL. Entre los solicitantes 10 son hombres. Diecisiete de ellos
   acreditan titulo de maestría y ocho son licenciados. Además se sabe que 7
   aspirantes son mujeres que tienen grado de magíster.
       ¿Cual es la probabilidad de que sea seleccionado una mujer o una persona con
         titulo de licenciado?
       Si el postulante seleccionado es magíster ¿Cual es la probabilidad de que sea
         varón?


10) 200 alumnos de la Facultad de Educación están distribuidos de acuerdo a su sexo
       y lugar de procedencia de la siguiente forma: 70 son mujeres, 110 son de Cusco y
       30 son mujeres y de provincias. Si se elige dos alumnos al azar calcular la
       probabilidad de que:
    Ambos sean mujeres y de Cusco.
    Al menos uno de los dos escogidos sea hombre.
CLETO DE LA TORRE DUEÑAS                                                           129




11) En la entrada de una facultad hay tres fotocopiadoras, A, B y C cuyos porcentajes
    de fallo son 3%, 5% y 4% respectivamente. Un alumno entra en la facultad y,
    como las tres fotocopiadoras están libres, elige una al azar, para realizar su
    fotocopia. Al llegar a clase observa que la fotocopia es defectuosa. ¿Cuál es la
    probabilidad de que fuera hecha en la máquina B?.
12) En una clase, el 20% de los chicos y el 5% de las chicas juega al tenis. El 60% de
    la clase son chicos. Se eligió al azar un estudiante de la clase y resultó ser de los
    que jugaban al tenis. ¿ Cuál es la probabilidad de que el estudiante elegido sea
    chico?.
13) En una asignatura de una carrera el 10% de los alumnos reciben una nota final de
    sobresaliente. El 70% de los estudiantes que la reciben ya la habían obtenido en
    un examen realizado a mitad de curso. Además, el 10% de los alumnos que no
    reciben sobresaliente al final de curso lo habían obtenido en el examen parcial.
    ¿Qué porcentaje de alumnos obtiene sobresaliente en el examen parcial?. ¿Cuál
    es la probabilidad de que un alumno que recibe un sobresaliente en el parcial
    obtenga esa calificación en el examen final?
130                                 ESTADISTICA




                                       CAPITULO VI
           VARIABLE ALEATORIA Y DISTRIBUCIONES DE PROBABILIDAD


6.1 VARIABLE ALEATORIA.
      Definición.- Una variable aleatoria (v.a) X es cualquier función, que transforma
      cada elemento del espacio muestral     , en un número real.



                                     X:            R
                                             X

      Al conjunto de posibles valores de X se le llama rango de X (Rx)
       Si Rx es finito o enumerable (rango discreto), entonces X es una v.a Discreta.
       Si Rx no es enumerable (rango continuo), entonces X es una v.a Continua.


      Función de Probabilidad.- Si X es una v.a discreta, la función de probabilidad de
      X viene dada por:

      PX x         P X       x     P             /X          x      ,


      tal que
                       PX ( x) 1
                x Rx
CLETO DE LA TORRE DUEÑAS                                                                           131




   Función de densidad.- Si X es una v.a continua, la función de densidad de X es
                                                                                  b

   una aplicación        fX : X          0,      tal que    P a      X   b             f X ( x)dx    ,tal
                                                                                  a



   que        f X ( x)dx 1


   Función de distribución.- La función de distribución de una v.a X esta dada por:

    FX ( x)     P( X       x)     P(           / X( )           x)
   Propiedades.
    F es continua por la derecha y es creciente
    Si X es una v.a discreta , entonces

       P a      X    b     F b           F a     P X        a

    Si X es una v.a continua , entonces         P a        X        b    F b            F a
                                                            dF ( x)
    Si X es una v.a continua , entonces         F ' ( x)                f ( x)
                                                             dx

      limx          FX ( x) 0 y lim x                      FX ( x) 1

6.2 ESPERANZA Y VARIANZA.
   Esperanza

   La esperanza o media de una variable aleatoria               X, denotada por       E( X )   o         X
   se define según sea la variable discreta o continua, mediante:

                                         x.P X      x , si X es discreta
                                  x Rx
                    E X
                                         x. f ( x)dx, si X es continua
                                  x Rx

   Propiedades.
    El valor esperado de una constante es dicha constante
132                                         ESTADISTICA




         E a bX            a bE X

      Varianza
      La varianza de una variable aleatoria X cuya media o esperanza es              X   , se define

      como


                   2                         2                  2              2
      V X          X    E X             X        E X      E X           E X        E2 X


      Propiedades.


       La raíz cuadrada de la varianza se llama desviación estándar.
           2            2       2
          X     E X            X


         V aX b            a2V ( X )

      Desigualdad de Chebyshev.

      Si X es una variable aleatoria, entonces para cualquier       k         se cumple

                                            1
      P X          X   k    X       1
                                            k2

      Ejemplo 1:
      Sea X la variable aleatoria definida como la suma de los valores que aparecen al
      lanzar dos dados.


      a) Determine la distribución de probabilidad.
      b) Calcule la probabilidad P(5<X<8)
      c) La media y su varianza.
CLETO DE LA TORRE DUEÑAS                                                                                                                        133




      Solución.
      a)
                        Resultados en Resultados en el segundo dado
                        el primer dado
                                                       1         2            3             4             5              6
                        1                              2         3            4             5             6              7
                        2                              3         4            5             6             7              8
                        3                              4         5            6             7             8              9
                        4                              5         6            7             8             9              10
                        5                              6         7            8             9             10             11
                        6                              7         8            9             10            11             12


  X: Suma de los valores de los dos dados
       Rx           2            3        4           5      6            7             8             9             10            11     12
       P(X)         1/36 2/36 3/16 4/16 5/36 6/36 5/36 4/36 3/36 2/36 1/36



      b)        p(5          X       8)         p(6)         p(7) 5/ 36 6 / 36 11/ 36
      c)    Media

                             E X                       x.P X              x , si X es discreta
                                                x Rx

              1               2            3           4          5                6              5                 4               3           2           1
E X        2            3            4           5          6             7                 8             9                  10          11           12
             36              36           36          36         36               36             36                36              36          36           36
           252
E X
           36
Varianza.
  2                 2
  X        E X              E2 X

                1             2            3            4             5             6              5                 4               3           2           1
E X2       22           32           42          52         62             72               82                92             102         112          122
               36            36           36           36            36            36             36                36              36          36           36
           1974
E X2
            36
                                                                      2
  2                 2            2             1974         252
  X        E X               E       X
                                                36          36
134                                     ESTADISTICA




6.3 DISTRIBUCIONES DE PROBABILIDAD.
      Existen otras variables cuyas funciones de probabilidad o densidad resultan ser
      modelos de mucha utilidad para una serie de aplicaciones. Se cita brevemente
      algunos de los modelos de mayor importancia.


      6.3.1   Distribuciones discretas.
   Un experimento de Bernoulli, es un experimento aleatorio con solo dos posibles
   resultados: Éxito y Fracaso. Sea p = P (Éxito).


         Distribución Binomial.
        La distribución binomial aparece cuando se dan las condiciones siguientes:
        -Tenemos un experimento aleatorio simple, con una situación dicotómica, es
        decir   Éxito y Fracaso.
        - Repetimos este experimento simple n veces de manera independiente.


        X = Número de Éxitos en n experimentos independientes de Bernoulli.
        Función de Probabilidad:
                                                    n x
                                  Cx p x 1 p
                                   n
                                                              , si x   0,1,2,..., n
                   PX x
                                         0                   , en otro caso.
                                                      2
         Valor esperado:   X      np. Varianza:       X     np 1 p .
         Notación: X   B(n, p).


         Distribución de Pascal o Binomial Negativa. Notación: X         BN(r, p).
         X = Número de ensayos (experimentos independientes de Bernoulli) hasta
         conseguir el r-ésimo Éxito.
         Función de Probabilidad:

                                             x r
                           Crx 11 1 p              pr       , si x r , r 1, r 2,...
                PX x
                                    0                     , en otro caso.
CLETO DE LA TORRE DUEÑAS                                                                     135




                              r                   2       r1 p
      Valor esperado:   X       . Varianza:       X                 2
                                                                          .
                              p                                 p
      Nota: Si r = 1, X se dice que es una variable aleatoria con distribución
      geométrica de parámetro p, y se le denota por X           G(p).


      Distribución Hipergeométrica. Notación: X           H(N, M, n).
      Considérese una población de N elementos, M de los cuales son de un tipo A, y
      supongamos se extraen sin reemplazo una muestra de n elementos de esta
      población. Entonces:


      X = Número de elementos de tipo A en la muestra.
      Función de Probabilidad:

                                 C x Cn xM
                                   M N

                                      N
                                                          , si x         0,1,2,..., n
                   PX x              Cn
                                       0                   , en otro caso.
                                  M                   2         M   M                N n
      Valor esperado:   X     n     . Varianza:       X     n     1                      .
                                  N                             N   N                N 1
      Notas:
                                                       b
      1. En PX se esta usando la convención que       Ca            0,   si a > b.

      2. Si la elección de la muestra fuera con reemplazo, entonces

                             M
          X  B n, p           .
                             N

      Distribución de Poisson.
     La distribución de Poisson aparece en situaciones en las que se cuenta el
     número de apariciones de un determinado suceso o bien en un intervalo de
     tiempo dado (como el número de partículas emitidas en un segundo por un
     material radioactivo, o el número de pacientes que llegan a un servicio en un
     intervalo de tiempo dado) o bien en un recinto físico (como el número de fallos
     en un metro de alambre de hierro producido.
136                                 ESTADISTICA




      X = Número de eventos en 0, t .


      Función de Probabilidad:
                                        x
                                            e
                                                              , si x              0,1,2,...
                        PX x                x!
                                                 0             , en otro caso.
                                                      2
      Valor esperado:     X        . Varianza:        X               .


      6.3.2    Distribuciones continuas.
      Distribución Uniforme. Notación: X             U a,b .
      Esta distribución se da cuando la variable aleatoria X puede tomar
      indistintamente cualquier valor en el intervalo a, b .
      Función de densidad:

                                             1
                                                              , si x              a, b
                              fX x          b a
                                                     0 , en otro caso.
                                 a b                              2           b a2
      Valor esperado:     X          . Varianza:                  X                .
                                  2                                            12

                                                          2
      Distribución Normal. Notación: X           N( ,     ).
      Función de densidad:
                                                                      1              2
                                                  1                       2
                                                                              x
                              fX x                        e       2
                                                 2
                                                  2       2
      Valor esperado:    X     . Varianza:        X           .
                               2
      Nota: Cuando      =0y        = 1, a X se le denota por Z y se le llama una variable
      aleatoria con distribución normal estándar; vale decir, Z                          N (0, 1). Toda v.a.
      normal       X    N( , 2) puede convertirse con una v.a. normal estándar
      (estandarizarse) a través de la transformación:
CLETO DE LA TORRE DUEÑAS                                                                             137




                                                             X
                                                    Z


      1. Teorema del limite central (TLC).                         Si       X1 , X 2 ,..., X n son n v.a.s
         independientes, donde cada Xi tiene la misma distribución de valor esperado                       y
                      2
         varianza     , entonces para n suficientemente grande (en la práctica n                     30) se
         cumple que aproximadamente
                                    n
                                          Xi n               X
                          Z         i 1
                                                                             N (0, 1)
                                            n                    / n

      2. Aproximación de la Binomial por la Normal. Si X                                B (n, p) y n es
         suficientemente grande, entonces aproximadamente:

                                                    X np
                                        Z                             N (0, 1).
                                                    np 1 p
         Aquí, para el cálculo de probabilidades, se recomienda utilizar la llamada
         corrección por continuidad: Si a                b son dos números naturales, entonces
         aproximadamente:

                                                                        b    1    np         a   1   np
                                        1                1                   2                   2
          Pa     X        b   P a               X    b           Fz                     Fz                 .
                                        2                2               np 1 p               np 1 p


6.4      OTRAS DISTRIBUCIONES CONTINUAS IMPORTANTES
         DISTRIBUCION CHI-CUADRADO.
         Una v.a. X tiene distribución chi-cuadrado con n grados de libertad, y se le

         denota por       X            2
                                            (n) .
         PROPOSICION.

      1. Si Z   N (0, 1), entonces          Z2          2
                                                             (1)
138                                       ESTADISTICA




                                                 2       2                2
   2. Propiedad reproductiva. Si                 1       2      ...       k   son k variables aleatorias

      independientes         con      distribuciones           chi-cuadrado        de   respectivamente

      n1 , n2 ,..., nk      grados de libertad, entonces

                                                         k
                                                 2                2
                                                                 i
                                                         i 1

                                                                                         k
      Es también una v.a. con distribución chi-cuadrado de                     n            n
                                                                                         i 1 i grados
      de libertad.

   3. Si    X1 , X 2 ,..., X n    es una m.a de X            N ( , 2), entonces

                                              n 1 S2
                                  W                  2
                                                                     2
                                                                          (n-1)


      DISTRIBUCION T DE STUDENT.
      Una v.a. X tiene distribución t de Student con n grados de libertad, y se le denota

      por       X  t(n) .
      PROPOSICION.

  1. Sea     X  t(n) . Si n es grande, entonces aproximadamente X                         N (0, 1).

  2. Si Z      N (0, 1) y
                              2
                                         2
                                              (n) son v.a independientes, entonces
                   Z
      T                2
                              t(n). En particular, dada una m.a.               X1 , X 2 ,..., X n   de X,
                     n

      extraída de una población N ( , 2), se cumple que:

                                              X
                                      T             t (n -1) .
                                              S/ n
CLETO DE LA TORRE DUEÑAS                                                                     139




      DISTRIBUCION F DE FISHER.
      Una v.a. X tiene distribución F de Fisher con n grados de libertad en el
      numerador y m grados de libertad en el denominador, y se le denota por

      X  F (n, m) .

      PROPOSICION.

   1. Si   X  F (n, m)           entonces:

      1
      X         F (m, n).


            2         2
                              2       2
   2. Si    1         (n) y   2       (m) son v.a’s independientes, entonces

                  2
                      /n
      F          1
                 2
                          F (m, n) .
                 2    /m


      En particular, si       X1 , X 2 ,..., X n       es una v.a. de      X      N ( 1,    2
                                                                                           1 ),    e

      Y1 , Y2 ,...,Ym             una m.a de una v.a. Y         N ( 2,    2
                                                                         2 ),   donde X e Y son

      independientes, entonces

                                          S12   2
                                  F         2
                                                2
                                                2
                                                     F (n -1, m - 1)
                                          S2    1



               2    2
      Siendo S1 y S 2 las varianzas muestrales asociadas a las poblaciones

      estadísticas determinadas por X e Y, respectivamente.


      Nota: La distribución normal estándar, t de Student, chi-cuadrado y F de Fisher
      poseen todas tablas en la que se tabulan algunos valores de su función de
      distribución.
140                                   ESTADISTICA




                                   EJERCICIOS DESARROLLADOS


1.    Una prueba de inteligencia está compuesta por 10 preguntas, cada una de las
      cuales tiene 4 respuestas y solo una de ellas correcta. Un alumno tiene prisa por
      acabar la prueba y decide contestar aleatoriamente. Se pide
     a) Probabilidad de acertar exactamente 4 preguntas
     b) Probabilidad de no acertar ninguna
     c) Probabilidad de acertar todas
     d) Probabilidad de acertar al menos 8
     e) Probabilidad de acertar a los sumo 6
     f) Media y varianza


      Solución
      Consideremos los sucesos
      A = Contestar bien P (A) = 0.25
       A = No contestar bien P ( A ) = 0.75
      Se trata de una distribución Binomial de parámetros B (10, 0.25 )
      Sea X la variable aleatoria que representa el número de preguntas contestadas
      correctamente


                                     10
     a) P(acertar 4) = P X     4        (0.25)4 (0.75)6         0.1460
                                      4

                                                  10
     b) P (no acertar ninguna) = P X       0         (0.25)0 (0.75)10            0.0563
                                                   0

                                          10
     c) P(acertar todas) = P X      10       (0.25)10 (0.75)0        0
                                          10


     d) P(acertar al menos 8) = P X       8       PX    8       PX       9       PX    10

        10                   10
           (0.25)8 (0.75)2      (0.25)9 (0.75) 0       0.005
         8                    9


     e) P( acertar a lo sumo 3) = P X         3    PX       0     PX         1    PX      2   PX   3
CLETO DE LA TORRE DUEÑAS                                                                                      141




           10                        10                         10                     10
                (0.25)0 (0.75)10             (0.25)1 (0.75)9         (0.25)2 (0.75)8        (0.25)3 (0.75)7   0.7759
           0                             1                      2                      3


     f) Media y Varianza
            np 10 (0.25)           2.5
       2
               np(1 p) 10(0.25)(0.75) 1.875


2.    La probabilidad de que un estudiante obtenga el título de licenciado en Geografía
      e Historia es de 0.3. Halla la probabilidad de que de un grupo de siete estudiantes
      matriculados en primer curso.
     a) Ninguno de los 7 finalice la carrera
     b) Finalicen todos la carrera
     c) Al menos 2 acaben la carrera
     d) Halla la media y la desviación típica


Solución
Consideremos los sucesos:
A = Finalizar la carrera P(A) = 0.3
A = No finalizar la carrera P ( A ) = 0.7
Por tanto se trata de una distribución Binomial de parámetros B (7, 0.3)
Sea X la variable aleatoria que representa el número de estudiantes que obtienen el
título de licenciado en Geografía e Historia
                         7
 a)        PX      0       (0.3)0 (0.7)7         0.0824
                         0

                         7
 b)        PX      7       (0.3)7 (0.7)0         0.0002
                         7

                                                                              7                   7
 c) P X           2     1 PX        1        1 PX       0      PX    1   1      (0.3)0 (0.7)7       (0.3)1 (0.7)6   0.6705
                                                                              0                   1
           Media y desviación típica
                 np     7(0.3)     2.1

                      np(1 p)        7(0.3)(0.7)       1.21
142                                     ESTADISTICA




3) El peso medio de los estudiantes de un colegio es 60 kg y la desviación típica es 6
   kg. Suponiendo que los pesos están distribuidos normalmente.
   a) Cual es la probabilidad de que un estudiante pese menos de 64k g?
   b) Cual es la probabilidad de que un estudiante pese 57 kg o más?
   c) Cual es la probabilidad de que un estudiante pese más de 63 Kg?
   d) Cual es la probabilidad de que un estudiante pese entre 57 a 65 kg?
   e) Cual es la probabilidad de que un estudiante pese menos de 50 Kg?
   f) Cual es la probabilidad de que un estudiante pese entre 64 a 70 kg?
   g) Si los estudiantes son 200, .Cuantos cabe esperar que pesen más de 57 kg y
   menos de 64k g?.
                                  Solución.
   X: Peso de los trabajadores.
       60 (Media poblacional)
       6     (Desviación)
                         X         64                     64 60
   a) P( X    64)   P(                      )   P( Z            )            P( Z   0.67)
                                                            6




                                                                  (0.67)




                                                              0     z=0.67

                         0.5     (0.67) 0.5 0.24857=0.74857=74.857%




                         X        57                      57 60
   b) P( X   57)    P(                  )       P( Z            )          P( Z     0.5)    (0.5) 0.5
                                                            6




                                                  (0.5)



                                        z= 0.5            0
                             0.19146+0.5=0.69146=69.146%
CLETO DE LA TORRE DUEÑAS                                                                                                      143




                               X           63                            63 60
  c) P( X       63)     P(                            )    P( Z                )             P( Z    0.5)     0.5     (0.5)
                                                                           6




                                                                                    (0.5)



                                                                          0                  z=0.5

                                 0.5 0.19146=0.30854=30.854%
                                    57           X               65                        57 60            65 60
d) P(57      X      65)        P(                                             )      P(              Z            )
                                                                                             6                6
                        X
          P( 0.50                     0.83)          (0.50)           (0.83) 0.19146+0.29373=0.48519=48.519%




                                                                 (0.5)            (0.83)




                                                      z= 0.50             0
                                                                                        z=0.83

                           X             50                           50 60
e) P( X     50)       P(                          )       P( Z              )               P( Z     0.167)
                                                                        6




                                                            (0.167)



                                                  z= 0.167                0

                               0.5        (0.167) 0.5 0.0675=0.4325=43.25%
                                 64           X             70                          64 60            70 60
f) P(64     X     70)       P(                                            )        P(                Z         )
                                                                                          6                6


                           X
            P(0.67                       1.67)        (1.67)             (0.67) 0.45254-0.24857=0.20397=20.397%
144                                             ESTADISTICA




                                                              0         z=0.67 z=1.67
                                                                   (0.67)
                                                                        (1.67)

                              57           X           64               57 60        64 60
g) P(57    X   64)       P(                                    )   P(            Z         )
                                                                          6            6


                     X
          P( 0.5                   0.67)       (0.5)        (0.67) 0.19146+0.24857=0.44003=44.003%

Cabe esperar el 44.003% de estudiantes, es decir 0.44003* 200 88
CLETO DE LA TORRE DUEÑAS                                                             145




                                EJERCICIOS PROPUESTOS.
1) En un grupo de 10 alumnos de un centro educativo se ha comprobado que cada uno
de ellos falta a clase el 5% de los días. Calcula la probabilidad de que en un día
determinado. .
a) no se registre ninguna ausencia.
b) falten a clase más de 5 alumnos.
c) no asista a clase ningún alumno.
d) falte a clase un único alumno.
e) falten a clase menos de 3 alumnos.


2) La probabilidad de que un estudiante obtenga el grado de magíster es de 0.3.
Calcular la probabilidad de que de un grupo de siete estudiantes matriculados. . .
a) los siete obtenga el grado de magíster.
b) al menos dos obtengan el grado.


3) La probabilidad de que un estudiante de ingeniería fracase en sus estudios es de
0.7.
a) De un grupo de 7 estudiantes de ingeniería, calcula la probabilidad de que los 7
fracasen en sus estudios.
b) En el mismo caso que en el apartado anterior, calcula la probabilidad de que al
menos 2 acaben la carrera.
c) Se el grupo se aumenta a 40 estudiantes, calcular la probabilidad de que fracasen
entre 20 y 30 de ellos


4) Un examen tipo test tiene 100 preguntas y cada pregunta 4 respuestas diferentes, de
las que sólo una es correcta.
a) Calcular la probabilidad de que un estudiante que responde al azar acierte más de
20 preguntas.
b) Calcular la probabilidad de que de las 20 primeras preguntas acierte a lo sumo
5) Las puntuaciones de un test se distribuye normalmente con media 80 y varianza
   49 ¿Cuál es la probabilidad de obtener en el test una puntuación entre 79 y 88
   puntos ?.
146                                  ESTADISTICA




6) Se llama cociente intelectual (C.I.) al cociente entre la edad mental y la edad real.
   Se sabe que la distribución del C.I. se distribuye normalmente con media 0.95 y
   desviación típica 0.22. En una población con 2600 personas se desea saber:
   a) Cuantas tendrían un C.I. superior a 1.3?
   b) Cuantas tendrían un C.I. inferior a 0.07?
   c) Cuantas tendrían un C.I. entre 0.8 y 1.15?
7) Tras realizar un test de cultura general entre los habitantes de cierta población, se
   observa que las puntuaciones siguen una distribución normal, de media 68 y
   desviación típica 18. Se desea clasificar a los habitantes en tres grupos (de baja
   cultura general, de cultura general aceptable y de cultura general excelente), de
   manera que el primer grupo abarque un 20% de la población, el segundo un 65% y
   el tercero el 15% restante. .Cuales son las puntuaciones que marcan el paso de un
   grupo a otro?
8) Se ha aplicado un test de fluidez verbal a 500 alumnos de la UNSAAC. Se supone
   que las puntuaciones obtenidas se distribuyen según una normal de media 80 y
   desviación típica 12. Se pide:
   a) .Que puntuación separa el 25% de los alumnos con menos fluidez verbal?
   b) .A partir de que puntuación se encuentra el 25% de los alumnos con mayor
   fluidez verbal?
9) El peso medio de 500 estudiantes de cierta universidad es 72 Kg y la desviación
      típica es 7. Si los pesos se distribuyen según una normal, halla:
  a) El número de estudiantes que pesan entre 68 y 75 Kg.
  b) El número de estudiantes que pesan más de 72 Kg.
  c) El número de estudiantes que pesan menos de 62 Kg.
10) En una clase de Ingeniería Técnica se sabe que las calificaciones de Estadística se
      distribuyen según una N(4, 2). Si el profesor desea aprobar al 70% de la clase, ¿a
      partir de qué nota se debe considerar aprobado el examen?
11) La nota media de un examen es 5,25 y la desviación típica 2. El 10% de la clase
      recibirá la calificación de sobresaliente. ¿Cuál es la nota mínima para optar a él?
      Se eligen cinco alumnos al azar, ¿cuál es la probabilidad de que dos de ellos hayan
      Obtenido un sobresaliente?
CLETO DE LA TORRE DUEÑAS                                                                           147




                   APENDICE
                  TABLA NORMAL ESTÁNDAR
 8,5Z     0       0.01      0.02       0.03     0.04       0.05     0.06      0.07      0.08      0.09
  0           0   0.00399   0.00798   0.01197   0.01595   0.01994   0.02392    0.0279   0.03188   0.03586
  0.1   0.03983   0.04395   0.04776   0.05172   0.05567   0.05962   0.06356    0.0675   0.07124   0.07534
  0.2   0.07926   0.08617   0.08706   0.09095   0.09483   0.09871   0.10257   0.10642   0.11026   0.11409
  0.3   0.11781   0.12172   0.12552    0.1293   0.13307   0.13683   0.14058   0.14431   0.14803   0.15173
  0.4   0.15542    0.1591   0.16276    0.1664   0.17003   0.17364   0.17724   0.18082   0.18439   0.18793
  0.5   0.19146   0.19497   0.19847   0.20194    0.2054   0.20884   0.21226   0.21566   0.21904    0.2224
  0.6   0.22575   0.22907   0.23237   0.23565   0.23891   0.24215   0.24537   0.24857   0.25175    0.2549
  0.7   0.25804   0.26115   0.26424    0.2673   0.27035   0.27337   0.27637   0.27935    0.2823   0.28524
  0.8   0.28814   0.29103   0.29389   0.29373   0.29955   0.30234    0.3051   0.30785   0.31057   0.31327
  0.9   0.31594   0.31859   0.32124   0.32381   0.32639   0.32894   0.33147   0.33398   0.33646   0.33891
  1     0.34134   0.34375   0.34614   0.34849   0.35083   0.35314   0.35543   0.35769   0.35993   0.36214
  1.1   0.36433    0.3665   0.36864   0.37076   0.37286   0.37923   0.37698     0.379     0.381   0.38298
  1.2   0.38493   0.38686   0.38877   0.39065   0.39251   0.39435   0.39616   0.39796   0.39973   0.40147
  1.3    0.4032    0.4049   0.40658   0.40824   0.40988   0.41149   0.41308   0.41466   0.41621   0.41774
  1.4   0.41924   0.42073    0.4222   0.42364   0.42507   0.42647   0.42785   0.42922   0.43056   0.43189
  1.5   0.43319   0.43448   0.43574   0.43699   0.43822   0.43943   0.44062   0.44179   0.44295   0.44408
  1.6    0.4452    0.4463   0.44738   0.44845    0.4495   0.45053   0.45154   0.45254   0.45352   0.45449
  1.7   0.45543   0.45637   0.45728   0.45818   0.45907   0.45994   0.46079   0.46164   0.46246   0.46327
  1.8   0.46407   0.46485   0.46562   0.46637   0.46712   0.46784   0.46856   0.46926   0.46995   0.47062
  1.9   0.47128   0.47193   0.47257    0.4732   0.47381   0.47441     0.475   0.47558   0.47615    0.4767
  2     0.47725   0.47778   0.47831   0.47882   0.47932   0.47982    0.4803   0.48077   0.48124   0.48169
  2.1   0.48214   0.48257   0.48299   0.48341   0.48382   0.48422   0.48461     0.485   0.48537   0.48574
  2.2    0.4861   0.48645   0.48679   0.48713   0.48745   0.48778   0.48809    0.4884    0.4887   0.48899
  2.3   0.48928   0.48956   0.48983   0.49001   0.49036   0.49061   0.49086    0.4911   0.49134   0.49158
  2.4    0.4918   0.49202   0.49224   0.49245   0.49266   0.49286   0.49305   0.49324   0.49343   0.49361
  2.5   0.49379   0.49396   0.49413    0.4943   0.49446   0.49461   0.49477   0.49491   0.49506    0.4952
  2.6   0.49534   0.49547    0.4956   0.49573   0.49585   0.49597   0.49609   0.49621   0.49632   0.49643
  2.7   0.49653   0.49664   0.49674   0.49683   0.49693   0.49702   0.49711    0.4972   0.49728   0.49736
  2.8   0.49744   0.49752    0.4976   0.49767   0.49774   0.49781   0.49788   0.49795   0.49801   0.49807
  2.9   0.49813   0.49819   0.49825    0.4983   0.49836   0.49841   0.49846   0.49851   0.49856    0.4986
  3     0.49865   0.49869   0.49874   0.49878   0.49882   0.49886   0.49889   0.49893   0.49897     0.499
  3.1   0.49903   0.49906    0.4991   0.49913   0.49916   0.49918   0.49921   0.49924   0.49926   0.49929
  3.2   0.49931   0.49934   0.49936   0.49938    0.4994   0.49942   0.49944   0.49946   0.49948    0.4995
  3.3   0.49952   0.49953   0.49955   0.49957   0.49958    0.4996   0.49961   0.49962   0.49964   0.49965
  3.4   0.49956   0.49968   0.49969    0.4997   0.49971   0.49972   0.49973   0.49974   0.49975   0.49976
  3.5   0.49977   0.49978   0.49978   0.49979    0.4998   0.49981   0.49981   0.49982   0.49983   0.49983
  3.6   0.49984   0.49985   0.49985   0.49986   0.49986   0.49987   0.49987   0.49988   0.49988   0.49989
  3.7   0.49989    0.4999    0.4999    0.4999   0.49991   0.49991   0.49992   0.49992   0.49992   0.49992
  3.8   0.49993   0.49993   0.49993   0.49994   0.49994   0.49994   0.49994   0.49995   0.49995   0.49995
  3.9   0.49995   0.49995   0.49996   0.49996   0.49996   0.49996   0.49996   0.49996   0.49997   0.49997
148                                ESTADISTICA




                                      BIBLIOGRAFIA.


  1. Briones, G. (1998). Métodos y técnicas de investigación para las Ciencias
      Sociales. México: Trillas.
  2. Blalock, H. (1994). Estadística Social. México: Fondo de Cultura Económica.
  3. Carrasco, J. B. y Calderero, J. F: (2000). Aprendo a investigar en educación.
      Madrid: Ediciones Rialp, S.A.
  4. Cordova, Manuel (2003). Estadística descriptiva e inferencial. Editorial
      Mosqueira Lima.
  5. Guilford J. P. Y Fruchter B. 1984. “Estadística aplicada a la Psicología y a la
      Educación”. Editorial Mc Graw Hill.
  6. JESUS AMON, Estadística para Psicólogos 1, estadística descriptiva.
  7. JESUS AMON, Estadística para Psicólogos 2, estadística inferencial.
  8. 5PAGANO, Robert, ESTADÍSTICA PARA LAS CIENCIAS DEL
      COMPORTAMIENTO, Edit. Thomson, 7ma edición, 2006, México D.F.
  9. Peña D. Y Romo J. 1997. Introducción a la estadística para las Ciencias
      sociales. Editorial Mc Graw Hill. Interamericana de España.
  10. Siegel, S. (1956). Non Parametric Statistics for the Behaviral Sciences. New
      Cork: McGraw Hill Book Company.
  11. Valdivieso Serrano Luis (2004) Estadística aplicada, editorial PUCP.

Estadistica maestria parte i

  • 1.
    METODOS ESTADISTICOS PARALA INVESTIGACION. 40 30 Porcentaje 20 10 0 Bajo Intermedio Alto Hábito de estudio PARTE I Dr. CLETO DE LA TORRE DUEÑAS cletounsaac@gmail.com 2011
  • 2.
    1RA EDICION Hecho elDepósito Legal en la Biblioteca Nacional del Perú REGISTRO Nº : 2009-09684 Todos los derechos reservados. Prohibida la reproducción total o parcial de este libro en forma idéntica o modificada por cualquier medio mecánico o electrónico, incluyendo fotocopia, grabación o cualquier sistema de almacenamiento y recuperación de información no autorizada por el autor. Impreso en Perú.
  • 3.
    CAPITULO I INVESTIGACION CIENTIFICA. 1.1 INVESTIGACIÓN CIENTÍFICA La investigación científica, se puede entender como un conjunto de actividades que realizamos para obtener conocimientos nuevos, sobre problemas nuevos que afectan la realidad, pero que sean nuevos, respecto a la ciencia, es decir, respecto al conjunto de conocimientos ya provisionalmente establecidos y sistematizados por la humanidad, conocimientos nuevos que, como aportes, se sumarán a la Ciencia. ¿Qué es investigar? Investigar viene del latín investigare.  Es la forma más adecuada de aproximarse al conocimiento de la verdad mediante verdades parciales.  Desarrollar actividades con el objetivo de registrar, indagar o descubrir la verdad.  En términos generales, es agregar algo nuevo a los conocimientos humanos.  Es un proceso que, mediante la aplicación del método científico, procura obtener información relevante y fidedigna. De entender, verificar, corregir o aplicar el conocimiento
  • 4.
    1.2 PROBLEMA DEINVESTIGACIÓN Es un hecho, fenómeno o situación que incita a la reflexión o al estudio y es importante puesto que permite conocer la situación que se va a estudiar mostrando sus principales rasgos. CRITERIOS BASICOS PARA IDENTIFICAR PROBLEMAS.  De manera general se considera que hay un problema cuando lo que DEBERÍA SER, difiere de lo que ES.  El DEBERÍA SER, es el marco referencial, el patrón comparativo, el ideal, el modelo, el paradigma.  Lo que ES, representa la realidad, es la práctica.  DEBERÍA SER diferente a ES, entonces existe Problema ESQUEMA DEL PROBLEMA DE INVESTIGACION. Para la presentación del POI, es necesario considerar cuatro momentos: el diagnóstico, el pronóstico, el control del pronóstico y la formulación de la pregunta o preguntas o la redacción de un texto a manera de pregunta.
  • 5.
     El diagnósticoes la descripción de los síntomas o problemas.  El pronóstico es la serie consecuencias de los problemas.  El control del pronóstico es la serie de acciones para superar las consecuencias de los problemas.  Formulación del problema ELEMENTOS DE DEL TITULO DE UN PROBLEMA Especificidad Situación Unidad de Espacio Tiempo problemática estudio  Situación problemática Responde a la pregunta ¿Qué investigar? Por ejemplo: Rendimiento académico, gestión educativa, desempeño profesional,..  La especificidad
  • 6.
    Es el aspectoo los aspectos concretos que se quiere investigar acerca del hecho o situación problemática. Por ejemplo: causas, consecuencias, características, importancia, influencia, tendencia, modalidades, incidencia, prevalencia, implicancias, estructura, función, nivel, relación, evolución, etc.  Unidades de estudio. Son aquella en las se ponen de manifiesto los hechos o situaciones problemáticas y constituyen, desde el punto de vista estadístico, la población o muestra a la que se refiere la investigación. Son: Personas, grupos sociales, seres, acontecimientos, instituciones, objetos, procesos.  Espacio Esta referido al lugar en el que ocurre el hecho o situación problemática. Puede ser geográfico o administrativo. ¿Dónde?; Perú, Ciudad del Cusco, Zona Franca, Aceros Arequipa, etc.  Tiempo Está referido al momento en que ocurre el hecho o situación problemática. ¿Cuándo?. 1.3 FORMULACION DE OBJETIVOS Son los propósitos o fines que se pretenden lograr al realizar la investigación.  Los objetivos son de dos tipos: El objetivo general (singular) Los objetivos específicos (plural)  Los objetivos deben ser verificables  Al definir los objetivos, debemos pensar inmediatamente en la manera de verificar si éstos se han cumplido o no (pensar en métodos o herramientas para ello)  Lo anterior nos permitirá ir dibujando el perfil metodológico de nuestra investigación  Los objetivos se convierten así en la carta de navegación de la investigación a realizar
  • 7.
     Los objetivosdeben ser precisos y no muy ambiciosos: deben ser acordes con los recursos disponibles (tiempo) y ello delimitará el nivel de detalle esperable. Elementos a tomar en cuenta para redactar un objetivo Sujeto : Beneficiario de la propuesta. Contenido: Expresa el cambio requerido y Acción : Conjunto de actividades que se desarrollan. Ejemplo 1: Reforzar la capacidad de gestión en los centros de educación inicial del país para la atención de los dominios del aprendizaje de los niños de 4 y 5 años de edad. Acción : Reforzar la capacidad de gestión en los centros de educación inicial del país. Contenido: La atención de los dominios del aprendizaje. Sujeto : Niños de 4 a 5 años de edad 1.4 JUSTIFICACION Y DELIMITACION DE LA INVESTIGACIÓN Criterios de justificación. Originalidad Relevancia Interés Factibilidad Criterios para delimitar Espacial - Geográfica Cronológica 1.5 MARCO TEORICO En el marco teórico se integra con las teorías, enfoque teóricos, estudios y antecedentes en general que se refieran al problema de investigación.
  • 8.
    Para elaborar elmarco teórico es necesario detectar, obtener y consultar la literatura y otros documentos pertinentes para el problema de investigación, así como extraer y recopilar de ellos la información de interés.  La revisión de la literatura puede iniciarse manualmente o acudiendo a un banco de datos al que se tenga acceso por computadora.  La construcción del marco teórico depende de lo que encontremos en la revisión de la literatura:  Marco Teórico: Fundamentación teórica dentro de la cual se enmarca la investigación  Marco Conceptual: Definición de conceptos relevantes utilizados en el estudio  Marco Normativo: Normas, leyes referentes al estudio ¿Qué funciones cumple el marco teórico?  Sirve de guía al Investigador  Provee un marco para la interpretación de resultados 1.6 HIPOTESIS DE INVESTIGACION Afirmaciones o suposiciones que hace el investigador respecto al problema de investigación. Es una suposición que permite establecer relaciones entre hechos. El valor de una hipótesis reside en su capacidad de establecer esas relaciones entre los hechos y de esa manera, explicarnos por qué se produce el fenómeno de estudio. ¿Qué Funciones cumple?  Direccionar el problema objeto de investigación  Identificar variables objeto de análisis  Orientar el uso de métodos y técnicas de obtención de información Elementos estructurales de la hipótesis 1. Las unidades de análisis, que puedan ser los individuos, grupos, viviendas, instituciones, etc.
  • 9.
    2. Variables, lascaracterísticas o propiedades cualitativas o cuantitativas que presentan las unidades de análisis. 3. Los elementos lógicos, son los que relacionan las unidades de análisis con las variables y estas entre sí. Requisitos para estructurar las hipótesis  Las hipótesis deben referirse sólo a un ámbito determinado de la realidad social. Las hipótesis en las ciencias sociales sólo pueden someterse a prueba en un universo y contexto bien definidos.  Los conceptos de las hipótesis deben ser claros y precisos. En las hipótesis, los conceptos son las variables y las unidades de análisis.  Los conceptos de las hipótesis deben contar con realidades o referencias empíricas observables (verificables).  El planteamiento de las hipótesis deben prever las técnicas para probarlas. Se deben formular hipótesis que están relacionadas con técnicas disponibles para su verificación. 1.7 NIVELES DE INVESTIGACIÓN. El nivel de una investigación viene dado por el grado de profundidad y alcance que se pretende con la misma INVESTIGACIÓN DESCRIPTIVA Orientada al descubrimiento de las propiedades particulares del hecho o situación problemática y también a la determinación de la frecuencia con que ocurre el hecho o situación problemática. Responde a las preguntas ¿Cómo son? ¿Cuántos son? ¿Dónde están? Se refiere a las características cualidades internas y externas, propiedades y rasgos de la población de estudio
  • 10.
    Ejemplo 2: Nivel deconocimiento de las estrategias cognitivas por los profesores, de la población de la ciudad de Cusco, 2011. INVESTIGACIÓN EXPLICATIVA Orientada al descubrimiento de las causas o consecuencias o condicionantes de la situación problemática Está dirigida a responder a las causas de los eventos físicos o sociales y su interés se centra en explicar por qué y en qué condiciones ocurre un fenómeno, o por qué dos o más variables se relacionan. ¿Por qué? La finalidad es determinar por qué un hecho o fenómeno de la realidad tiene tales y cuales características. Ejemplo 3: Principales causas de la deserción escolar en la región andina del Perú, 2010. INVESTIGACIÓN COMPARATIVA Orientada al estudio de las semejanzas o diferencias de un hecho o situación problemática en dos circunstancias diferentes. Ejemplo 4: Nivel de aplicación de metodologías de enseñanza por los profesores de las instituciones educativas A y B de Cusco, 2010. INVESTIGACIÓN RELACIONAL Orientada al descubrimiento de la influencia de un hecho o situación problemática en otro hecho o situación problemática. Ejemplo 5: Influencia de la internet en la lectura de los estudiantes de secundaria de la Ciudad del Cusco, 2011. INVESTIGACIÓN CORRELACIONAL Orientada a descubrir la covariación o correspondencia entre los valores de dos hechos o situaciones problemáticas.
  • 11.
    Ejemplo 6: Correlación entrehábitos de estudio y aprendizaje en los estudiantes de la Universidad de Nacional San Antonio Abad del Cusco, 2011. INVESTIGACIÓN EXPERIMENTAL Orientada a descubrir la validez de un hecho para la modificación de una situación problemática. ¿Qué cambios y modificaciones se han producido? ¿Qué mejoras se han logrado?. Ejemplo 7: Evaluación del efecto del uso de tres tipos de materiales didácticos en el rendimiento académico, en las I.E de la ciudad de Cusco, 2011. 1.8 TIPOS DE INVESTIGACION Los Tipos de investigación se determinan mediante la aplicación de distintos criterios, a continuación se refieren algunos de ellos. INVESTIGACION BASICA. Solo busca aplicar y profundizar el conocimiento científico existente acerca de la realidad. INVESTIGACION APLICADA. Se investiga para transformar, modificar o producir cambios en un determinado sector de la realidad. INVESTIGACION SUSTANTIVA. Se orienta a resolver problemas facticos, su propósito es dar respuesta objetiva a interrogantes que se plantea en un determinado fragmento de la realidad y del conocimiento con el objeto de contribuir en la estructuración de las teorías científicas. INVESTIGACION TECNOLOGICA. Se relaciona esencial, objetiva y metodológicamente con el nivel experimental, se busca cambios mediante la aplicación de nuevos sistemas. 1.9 DISEÑOS DE INVESTIGACION.  Conjunto de estrategias procedimentales y metodológicas definidas y elaboradas para el desarrollo del proceso de investigación.
  • 12.
     El diseñode investigación puede ser pensado como la estructura de la Investigación.  El investigador debe seleccionar un diseño de investigación. Esto se refiere a la manera práctica y precisa que el investigador adopta para cumplir con los objetivos de su estudio, ya que el diseño de investigación indica los pasos a seguir para alcanzar dichos objetivos. Es necesario por tanto que previo a la selección del diseño de investigación se tengan claros los objetivos de la investigación.  Las maneras de cómo conseguir respuesta a las interrogantes o hipótesis planteadas dependen de la investigación. Por esto, existen diferentes tipos de diseños de investigación, de los cuales debe elegirse uno o varios para llevar a cabo una investigación particular (Hernández, Fernández y Baptista, 2000; Castillo, 2005).  La precisión, la profundidad así como también el éxito de los resultados de la investigación dependen de la elección adecuada del diseño de investigación. He aquí un esquema donde se resumen los diferentes tipos de investigación según Hernández, Fernández y Baptista (2000).
  • 13.
    Diseños experimentales Sonaquellos en los que se cumple que: Los grupos a ser investigados han sido asignados al azar, por procedimientos aleatorios y los grupos resultantes son equivalentes, de tal manera que se tiene un grupo control equivalente a los grupos experimentales. Diseños cuasi-experimentales. Entendemos por diseños cuasi-experimentales cuando se cumplen las siguientes condiciones:  Los grupos sobre los que se lleva a cabo la investigación no han podido establecerse como equivalentes en las características fundamentales. Los grupos no han sido asignados al azar, sino que han sido establecidos por algún otro procedimiento de muestreo.  Como dice Hernández et al.“En los diseños cuasi-experimentales los sujetos no son asignados al azar a los grupos no emparejados; sino que dichos grupos ya estaban formados antes del experimento, son grupos intacto (la razón por la que surgen y la manera como se formaron fueron independientes o aparte del experimento.”  También algunos autores denominan CUASI-EXPERIMENTAL, cuando el investigador aplica un tratamiento a un solo grupo de sujetos, sin grupo de control, observándolo antes y después de aplicar el tratamiento. Diseños no-experimentales. Se establece que un diseño no-experimental es: “la que se realiza sin manipular deliberadamente variables. Es decir, se trata de investigación donde no hacemos variar intencionadamente las variables independientes. Lo que hacemos en la investigación no experimental es observar fenómenos tal y como se dan en su contexto natural, para después analizarlos.” (Hernández, 184)
  • 14.
    La diferencia conlos diseños experimentales y cuasi- experimentales se ve con claridad, porque en estos dos siempre hay algún tipo de intervención del investigador, que manipula las variables independientes para averiguar su influencia en las variables dependientes. Método transversal: Es el diseño de investigación que recolecta datos de un solo momento y en un tiempo único. El propósito de este método es describir variables y analizar su incidencia e interrelación en un momento dado. Diseños transversales descriptivos: son aquellos que tienen como objetivo indagar la incidencia y los valores en que se manifiesta una o más variables. Diseños transversales correlacionales: Se encargan de describir relaciones entre dos o más variables en un momento determinado. Diseños transversales explicativos: Son aquellos en los cuales las causas y efectos ya ocurrieron en la realidad (estaban dados y manifestados) y el investigador los observa y explica. Diseños longitudinales: Son aquellos que analizan cambios a través del tiempo (en variables o sus relaciones), dentro de alguna población en general. 1.10 VARIABLES A las características objeto de estudio en la población se les llama variables, ya que pueden variar de un individuo a otro y se representara por letras mayúsculas: X, Y, Z,. . ., debemos distinguir los distintos tipos de variables que hay, lo cual nos va a permitir utilizar las herramientas estadísticas apropiadas. TIPOS DE VARIABLES. Las variables estadísticas pueden ser de dos tipos: Variables cualitativas o atributos: describen cualidades y no toman valores numéricos, estas a su vez pueden ser: Nominales.- Las cualidades no presentan ningún orden. Ejemplo Sexo del estudiante (Femenino, Masculino), Procedencia, I.E.
  • 15.
    Ordinales.- Este tipode variables presentan orden Ejemplo: Grado de estudios (Analfabeto, primaria, secundaria, superior), Nivel de conocimiento de Docentes. Variables cuantitativas: toman valores numéricos. A su vez pueden ser: Discretas.- Solo toman un número finito o infinito numerable de valores distintos (generalmente números naturales o enteros). Ejemplos: número de estudiantes por secciones, número de profesores, número de aulas, etc. Continuas.- Toman valores en un intervalo. Generalmente corresponden a medir magnitudes continuas. Ejemplo, Rendimiento académico, altura, ingreso del docente, etc. Una característica esencial de este tipo de variables es que sus valores nunca son observables con exactitud, sino que dependen (las observaciones) de la precisión del instrumento de medida. Ejemplo 7 Un especialista estudia, el nivel de introversión en niños menores de 4 años en las instituciones educativas de la ciudad de Cusco. Defina los conceptos previos para este estudio. Solución: Población: Niños menores de 4 años de las I.E de la ciudad de Cusco. Muestra: Niños de 3 años de las I.E de la ciudad de Cusco. Variable: Nivel de Introversión. Tipo de variable: Cuantitativa Unidad de estudio: Niño menor de 4 años. 1.11 ESCALAS DE MEDICION Se llama medición al proceso de atribuir números a las características. Tenemos las siguientes escalas de medición: nominales, ordinales, cuantitativas de intervalo y cuantitativas de razón.
  • 16.
    Escala nominal: laclave de estas escalas de medida es que sólo informan de la igualdad o desigualdad de los individuos en una característica, pero no de posibles ordenaciones, puesto que la característica a la que se refieren no se tiene en mayor o menor medida, sino que simplemente adopta formas cualitativamente distintas. Los números solo sirven para distinguir valores o categorías diferentes de la variable. Esta escala se emplea para variables cualitativas nominales. Ejemplo 8: El sexo 1=Masculino y 2=Femenino esto simplemente es un proceso de codificación pero no significa que la mujer sea mayor que el hombre, ni el doble, ni que existe sexo intermedio. Escala Ordinal: Los números además de servir para distinguir reflejan un orden existente sobre los valores de la variable. Se obtiene clasificando objetos o arreglándolos en un orden con respecto a alguna variable común. La pregunta es simplemente, si el objeto tiene más o menos de esta variable que algún otro objeto. Esta escala se emplea para variables cualitativas ordinales. Ejemplo 9: Nivel de conocimientos de estrategias cognitivas por parte de los docentes. Excelente=5, bueno =4, regular =3 y malo = 2.” es cierto la relación de orden 2<3<4<5. Escala de Intervalo: La ubicación del punto origen no es fija, puesto que 0 no denota la ausencia del atributo. Aquí los números para clasificar los objetos representan también incrementos iguales del atributo que se esta midiendo. Esto significa que los números pueden ser comparados. La diferencia en 1 y 2 es la misma que entre 2 y 3, pero es solo la mitad de la diferencia entre 2 y 4. Las temperaturas Fahrenheit y Centígrados son medidas que tiene diferentes escalas de intervalo y diferentes puntos de 0. Escala de Razón: Medida numéricas en las cuales cero es un valor fijo en cualquier escala y la diferencia entre valores es diferente
  • 17.
    Además de ladistancia de orden e intervalo, se añade un origen absoluto de forma que no solo cabe hallar distancias (ya en la escala de intervalo), si no también múltiplos exactos. En este caso, el valor representado por 4 tiene doble cantidad medida que él representado por un 2. Ejemplo 10: Edad del profesor expresada en años. 40 años y 20 años son edades distintas y 40 años es superior a 20 años Entre 40 y 20 hay una diferencia de 20, la misma que entre 50 y 30. El 0 tiene sentido. Una persona con 0 años, realmente no tiene edad todavía no ha nacido. En el siguiente cuadro se muestra un resumen de las características de las escalas de medición. Resumen de escalas de medición Información Transform. Significa Significa Significa Tipo Ejemplos deducible admisibles orden distancia Origen No No No Procedencia Relaciones Aplicaciones del Profesor, Nominal “igual que” o inyectivas tipo de “distinto que” metodologia Si No No Grado de planificación, Relaciones Funciones Nivel de Ordinal “mayor que” crecientes utilización de o “igual que” materiales educativos. Igualdad o Si Si No desigualdad A + b.x Temperatura, Intervalo de (b 0) inteligencia diferencias Si Si Si Rendimiento Igualdad o B .x académico, Razón desigualdad (b 0) Número de de razones estudiantes.
  • 18.
    ESCALAS PARA LAMEDICION DE ACTITUDES La escala de clasificación por categorías es la que usan ampliamente los investigadores de ciencias de la salud y sociales. Escala de clasificación por categorías: Existen cuatro categorías a partir de las cuales los entrevistados pueden elegir para señalar su nivel general de satisfacción. - Muy satisfecho (+2) - Satisfecho (+1 ) - Algo satisfecho (0) - No del todo satisfecho (-1) Escala De Comparación: Es una versión de la escala de categorías, califica a estas categorías como: “excelente”, “muy bueno”, “bueno”, “regular” y “deficiente”, eliminando de esta forma la comparación implícita. El problema con tal escala es que el punto de referencia es poco claro y diferentes entrevistados pueden usar diferentes puntos de referencia o estándares. Escala de Likert: La escala de Likert requiere que un entrevistado indique un grado de acuerdo o desacuerdo con respecto a una variedad de afirmaciones (reactivos) relacionadas con el objeto de las actitudes. Es un tipo de instrumento de medición o de recolección de datos que disponemos en la investigación social. Es una escala para medir las actitudes. Consiste en un conjunto de ítems bajo la forma de afirmaciones o juicios ante los cuales se solicita la reacción (favorable o desfavorable, positiva o negativa) de los individuos.
  • 19.
    Alternativas o puntosen la escala de Likert Asignación Asignación Alternativa Alternativa Alternativa Alternativa Numérica Numérica A B C D I II 2 5 Muy de Totalmente Definitivamen Completame acuerdo de acuerdo te sí nte verdadero 1 4 De acuerdo De acuerdo Probablemen Verdadero te sí 0 3 Ni de Neutral o Indeciso Ni falso, ni acuerdo, ni indiferente verdadero en desacuerdo -1 2 En En Probablemen Falso desacuerdo desacuerdo te no -2 1 Muy en Totalmente Definitivamen Completame desacuerdo en te no nte falso desacuerdo Para obtener las puntuaciones de la escala de Likert, se suman los valores obtenidos respecto de cada items. El puntaje mínimo resulta de la multiplicación del número de ítems por 1. Una puntuación alta está dada por el número de ítems o afirmaciones multiplicado por 5. PM--------------------I----------------------I----------------------I------------------ PA Donde: PM: Puntaje mínimo y PA: Puntaje Máximo. Ejemplo 11: Ha encontrado en la institución educativa el apoyo y las facilidades necesarias para que usted desarrolle de modo óptimo su trabajo. ( ) Definitivamente sí ( ) Probablemente sí
  • 20.
    ( ) Indeciso ( ) Probablemente no ( ) Definitivamente no Ejemplo 12: El Director de la UGEL se preocupa por el bienestar del recurso humano. Categorías de Respuesta Frecuencia Porcentaje Asignación de puntajes Totalmente de acuerdo (5) 2 4.4% 2(5) De acuerdo (4) 4 9% 4(4) Indeciso (3) 7 15.6% 7(3) En desacuerdo (2) 9 20% 9(2) Totalmente en desacuerdo (1) 23 51% 23(1) n=45 100% Total=88 Para interpretar el puntaje se ubica en los tramos de la escala de likert. Totalmente En Indeciso De acuerdo Totalmente de En desacuerdo desacuerdo (3) (4) Acuerdo (5) (1) (2) 45*1=45 45*2=90 45*3=135 45*4=180 45*5=225 La puntuación 88 se aproxima a 90, por lo tanto se ubica en la parte que indica en desacuerdo. 1.12 TIPOS DE VARIABLES UTILIZADAS EN LA INVESTIGACION CIENTIFICA. Variable independiente  Es aquella que juega un rol determinante, causal o de influencia en otra u otras variables, supone cierta autonomía con relación a las demás variables, pero es necesario, señalar que las variables independientes en determinados problemas, pueden cambiar, según
  • 21.
    sea la posiciónque ocupen en el enunciado, debido a que la realidad está en movimiento y que todos los hechos están concatenados.  Este tipo de variable se encuentra en las siguientes investigaciones: 1. Explicativa, 2. Relacional 3. Experimental ( en la experimental se le conoce como estímulo) Variable dependiente  Es aquella que juega un rol de consecuencia, al ser determinada, originada o influida por la variable independiente. Esto significa que no pueden existir variables dependientes sin las independientes.  Considerando el tiempo, las independientes son más antiguas que las dependientes. Se encuentran en las siguientes investigaciones: 1. Explicativa 2. Relacional 3. Experimental (La variable dependiente en una investigación experimental se le conoce como respuesta) Ejemplo 13: En el problema influencia del uso de mapas mentales en el rendimiento académico de los estudiantes de las I.E de la región de Cusco, 2011. Variable independiente: Rendimiento Académico Variable dependiente: Uso de mapas mentales Variable Intermedia  Es aquella que juega un rol de factor condicionante, pues su presencia entre la variable independiente y variable dependiente hace que sin tener el carácter de factor causal o determinante, modifique le resultado más complejas y de mayor profundidad.
  • 22.
    Ejemplo 14: En el estudio de formación académica y rol de la experiencia en el desempeño profesional, Quillabamba. 2011. Variable independiente: formación académica. Variable Dependiente: Desempeño profesional Variable Intermedia : Experiencia Variable interviniente  Es aquella que en ciertas medida juega un rol pasivo en el problema, pues permite medir las características, atributos, estructuras, incidencia, elementos o aspectos que se son inherentes.  La variable interviniente, la encontramos en investigaciones: 1. Descriptiva 2. Comparativa. Ejemplo 15: En el problema: Niveles de desnutrición de los estudiantes de las instituciones educativas de la ciudad de Sicuani, 2011. Variable interviniente : Nivel de desnutrición. Variables Asociadas  Son aquellas que no guardan mayor nivel de dependencia, no hay relación causal entre ellas y considerando el criterio tiempo vienen a ser más o menos contemporáneas, pues para que aparezca el problema surgen de manera simultánea.  Este tipo de variables, se encuentra en la investigación descriptiva multivariable, se trata de dos o más variables intervinientes, por lo que nunca van acompañadas de algún otro tipo de variables. Ejemplo 16: En el problema: Rasgos sociales y culturales de los profesores de la ciudad de Cusco , 2011.
  • 23.
     Las variablesasociadas son rasgos sociales y rasgos culturales Variables Interdependientes  Son aquellas que indistintamente pueden ser consideradas como causa o como consecuencia una de otra. Corresponden a la investigación correlacional. Ejemplo 17: En el problema: Correlación entre tipo de alimentación y obesidad de los estudiantes de la ciudad de Cusco, 2010. Las variables interdependientes, son tipo de alimentación y obesidad Resumen del tipo de variables según tipo de investigación. Descriptiva Comparativa Explicativa Interviniente Interviniente Independiente(s) Asociada Dependiente(s) Relacional Correlacional Experimental Independiente Interdependiente Estimulo (Factor) Dependiente Interdependiente Respuesta Observaciones: 1. Las variables según su naturaleza se clasifican en cuantitativas y cualitativas. 2. Las variables según su relación casual se clasifican en: independiente, dependiente, interviniente. En el área de las ciencias de la salud, se tiene los siguientes tipos de investigación biomédica. 1.13 RECOPILACIÓN DE DATOS. Dentro de un proceso de investigación una de las actividades que se realizan es la recopilación de datos, la cual es el acopio de información y se incluye
  • 24.
    desde elaborar fichasbibliográficas hasta la aplicación de cuestionarios con el empleo de técnicas de muestreo. Para Hernández et.al. (2006) un instrumento de medición es un recurso que utiliza el investigador para registrar información o datos sobre las variables que tiene en mente. La construcción de instrumento consiste en generar un número suficiente de ítems para medir todas las variables con todas sus dimensiones. La recopilación de datos, se puede realizar mediante: Investigación documental Investigación de campo La investigación documental. Consiste en el estudio de documentos escritos sobre un objeto determinado, es decir son todos aquellos documentos registrados en diferentes dispositivos físicos a los que podemos tener acceso en forma directa o indirecta para su consulta y se puede clasificar en: 1.- Documental bibliográfica 4.- Documental audiográfica 2.- Documental hemerográfica 5.- Documental videográfica 3.- Documental escrita 6.- Documental iconográfica La investigación de campo. Consiste en obtener información directa mediante diferentes actividades por contacto directo con el hecho que se quiere investigar así como las personas relacionadas y se puede realizar: a) Por observación directa b) Por interrogación La observación. Es el procedimiento empírico básico, el cual consiste en realizar la percepción intencionada de una actividad determinada mediante la experimentación la cual consiste en la obtención de datos cuantitativos por medio de la medición del fenómeno que se este observando. Para realizar la observación se utilizan diversos instrumentos auxiliares los cuales son:
  • 25.
    1.- La fichade campo 3.- La entrevista 2.- Estudio de Actividades 4.- La encuesta La Entrevista. Es una de las técnicas más comunes y es considerada como la relación directa entre el investigador y el objeto de estudio a través de individuos o grupos con el fin de obtener testimonios reales. a) Entrevistas formales b) Entrevistas informales La Encuesta. Consiste en recopilar información sobre una parte de la población. La información recopilada puede emplearse para un análisis cuantitativo con el fin de identificar las magnitudes del problema. El Cuestionario. Es un eficaz auxiliar en la observación científica que contiene aspectos del fenómeno esenciales, las cuales son preguntas formuladas por escrito y no es necesaria la presencia del investigador. - Cuestionarios por correo - Cuestionario administrado por el entrevistado - Cuestionario administrado por el entrevistador La Cedula. Tiene carácter de anónimo, donde el encuestador es quien llena la cedula de entrevista, además de que es posible aclara la información sobre las preguntas y es utilizada cuando una persona tiene un bajo nivel cultural. 1.14 VALIDACIÓN DEL INSTRUMENTO La validación de los instrumentos se realiza con el fin de conseguir una mayor objetividad al seleccionar los ítems en los respectivos cuestionarios.
  • 26.
    VALIDEZ DE CONTENIDO Elproceso de validación de contenido es eminentemente lógico, si bien pueden utilizarse jueces expertos en el tema para valorar la congruencia entre los diversos items y los diversos objetivos. Existen procedimientos cuantitativos diversos para que cada experto valore el grado en que un ítem sirve para evaluar el objetivo al que corresponde. El procedimiento cuantitativo más sencillo sería el siguiente:  Especificar los diversos objetivos (v.gr. áreas diferentes de contenidos) que se Pretenden evaluar.  Elaborar varios ítems para cada objetivo.  Seleccionar una muestra de expertos en el contenido del test.  Pedirles que, según su opinión, asignen cada ítem al objetivo que pretende medir.  Seleccionar los ítems en los que los expertos manifiestan mayor acuerdo en sus clasificaciones.
  • 27.
    CRITERIO DE EXPERTOS Método 1: HOJA DE PREGUNTAS PARA LA VALIDACIÓN PREGUNTAS ESCALA DE VALORACION 1. ¿Considera usted que los ítems del instrumento 1 2 3 4 5 miden lo que se pretende medir? 2. ¿Considera usted que la cantidad de ítems registrados en esta versión son suficientes para tener una comprensión de la materia de estudio? 1 2 3 4 5 3, ¿Considera usted que los ítems contenidos en este instrumento, son una muestra representativa del universo materia del estudio? 1 2 3 4 5 4. ¿Considera usted que si aplicamos en reiteradas oportunidades este instrumento a muestras similares, obtendríamos también datos similares? 1 2 3 4 5 5. ¿Considera usted que los conceptos utilizados en este instrumento, son todos y cada uno de ellos, propios de las variables del estudio? 1 2 3 4 5 6. ¿Considera usted que todos y cada uno de los ítems contenidos en este instrumento tienen los mismos objetivos? 1 2 3 4 5 7. ¿Considera usted que el lenguaje utilizado en el presente instrumento es claro, sencillo y no da lugar a diversas interpretaciones? 1 2 3 4 5 8. ¿Considera usted que la estructura del presente instrumento es adecuada al tipo de usuario a quien se 1 2 3 4 5 dirige el instrumento? 9. ¿Estima usted que las escalas de medición utilizadas son pertinentes a los objetos materia de 1 2 3 4 5 estudio? 10. ¿Que aspectos habría que modificar, que aspectos tendrían que incrementarse o que aspectos habría que suprimirse? …………………………………………………………………………………………………………………… …………………………………………………………………………………………………………………… ……………………………………………………………………………………………………
  • 28.
    PROCEDIMIENTO El método DPPmide la adecuación de los instrumentos, para medir la variable de interés, en función a la valoración de los expertos. Ejemplo 18. En el presente estudio la valoración de los expertos es: EXPERTOS Item 1 2 3 4 Promedio 1 5 4 5 5 4.75 2 5 5 5 5 5 3 5 4 5 4 4.5 4 5 5 4 4 4.5 5 5 5 5 5 5 6 5 5 5 5 5 7 4 5 3 4 4 8 4 4 5 4 4.25 9 4 4 5 5 4.5 2. Con los promedios hallados, se determina la distancia de punto múltiple (DPP), mediante la siguiente ecuación: DPP = (X 1 Y1 )2 +(X 2 Y2 )2 + ................(X 9 Y9 )2 Donde: Xi = Valor máximo en la escala para el ítem i. Yi = El promedio del ítem i. DPP = ( 5 4.75 )2 +( 5 5 )2 + ................( 5 4.5 )2 1.541 Determinar la distancia máxima (Dmax) del valor obtenido respecto al punto de referencia Cero (0), con la ecuación: 2 D M x a (1 x 1 (1... n 2 2 2 )x .... ) ) ... x ...(1 ... ... Donde: Xi = Valor máximo en la escala concedido para el ítem i. 1 = Valor mínimo de la escala para cada ítem.
  • 29.
    DMax (5 1) 2 (5 1) 2 ...................(5 1) 2 12 La Dmax hallada fue de 12 La Dmax se divide entre el valor máximo de la escala, lo que nos da un valor de 12/5=2.4 5. Con el valor hallado anteriormente (apartado 4) se construye una nueva escala valorativa a partir de cero, hasta llegar a Dmax. Dividiéndose en intervalos Iguales entre si, llamándose con las letras A, B, C, D, y E. Siendo: Valoración Valoración de Escala Expertos 0- A = Adecuación Total DPP=1.541 2.4 2.4- B = Adecuación en gran 4.8 medida 4.8- C = Adecuación 7.2 Promedio 7.2- D = Escasa Adecuación 9.6 9.6- E = inadecuación 12 6. El punto DPP debe caer en las zonas A o B; en caso contrario, la encuesta requiere reestructuración y/o modificación, luego de las cuales se somete nuevamente a juicio de expertos. El valor hallado del DPP fue de 1.541 cayendo en la zona A, lo que indica la Adecuación del instrumento y que puede ser aplicado.
  • 30.
    Método 2 Cuadro 1.Formato para validar instrumentos a incluir en el instrumento de validación. ÍTEM Criterios a evaluar observaciones Claridad Coherencia Inducción Lenguaje Mide lo ( si debe que eliminarse o En la interna a la Adecuado pretend modificarse un redacció respuesta Con el nivel e medir favor indique) n (sesgo) Del informante Si No Si No Si No Si No Si No 1 .. n Aspectos generales Si No ************* El instrumento contiene instrucciones claras y precisas para responder el cuestionario Los ítems permiten el logro del objetivo de la investigación Los ítems están distribuidos en forma lógica y secuencial El número de ítems es suficiente para recoger la información. En caso de ser negativa su respuesta, sugiera los ítems a añadir Validez Aplicable ( ) No aplicable ( ) Validado por: Firma:
  • 31.
    1.5.10 CONFIABILIDAD delINSTRUMENTO Antes de iniciar el trabajo de campo, es imprescindible probar el cuestionario sobre un pequeño grupo de población. Esta prueba piloto ha de garantizar las mismas condiciones de realización que el trabajo de campo real. Se recomienda un pequeño grupo de sujetos que no pertenezcan a la muestra seleccionada pero sí a la población o un grupo con características similares a la de la muestra del estudio, aproximadamente entre 14 y 30 personas. De esta manera se estimará la confiabilidad del cuestionario. La confiabilidad responde a la pregunta ¿con cuánta exactitud los ítems, reactivos o tareas representan al universo de donde fueron seleccionados?. El término confiabilidad “…designa la exactitud con que un conjunto de puntajes de pruebas miden lo que tendrían que medir” (Ebel, 1977, citado por Fuentes, op. cit., p. 103). Entre los métodos para estimar la confiabilidad, se tienen: Método Test-Retest: una forma de estimar la confiabilidad de un test o cuestionario es administrarlo dos veces al mismo grupo y correlacionar las puntuaciones obtenidas. El coeficiente que se obtiene recibe el nombre de coeficiente de estabilidad porque denota la coherencia de las puntuaciones en el tiempo Para un desarrollo adecuado y sean confiables deben variar entre 0,80 y 0,95 (Popham, 1980, citado por Fuentes, op. cit.). Se usa la correlación por el método de los puntajes directos (Correlación r de Pearson): n xi yi xi yi rxy 2 2 n xi2 xi * n yi2 yi Donde: rxy : es el coeficiente de correlación n: número de sujetos X: valores de X (1ª aplicación)
  • 32.
    Y: valores deY (2ª aplicación) Método común de división por mitades o Hemitest: este método computa el coeficiente de correlación entre los puntajes de las dos mitades del test o cuestionario aplicado. Esto supone que las dos test mitades son paralelos, tienen igual longitud y varianza entre sí. Se estima a través del coeficiente de confiabilidad de Spearman-Brown: Se establece la correlación entre los dos puntajes de las dos mitades del test a través del método de los puntajes directos, Correlación r de Pearson: n x1 x2 x1 x2 r12 2 2 n x12 x1 * n 2 x2 x2 Estimación del test completo (Spearman-Brown) con la fórmula: 2r12 rtt 1 r12 Se interpreta la prueba de hemitest como coeficiente de consistencia interna, ya que una sola prueba contiene las dos formas equivalentes y su énfasis lo pone en las puntuaciones de los sujetos, no en los ítemes. El método de división por mitades de Rulon: utiliza la división del test en mitades, pero su método no supone necesariamente varianzas iguales en los sub-tests. coeficiente de consistencia interna. 2 sd rtt 1 2 st Donde: rtt : coeficiente de confiabilidad 2 sd : varianza de la diferencia entre las puntuaciones de las mitades st2 : varianza de las puntuaciones del test total El método de división por mitades de Guttman: también se denomina coeficiente de consistencia interna. Su fórmula es:
  • 33.
    sa sb2 2 rtt 2 1 st2 Donde: rtt : coeficiente de confiabilidad 2 sa : varianza de las puntuaciones de los ítemes pares 2 sb : varianza de las puntuaciones de los ítemes impares st2 :varianza de las puntuaciones del test total ALFA DE CRONBACH Para evaluar la confiabilidad o la homogeneidad de las preguntas o ítems es común emplear el coeficiente alfa de Cronbach cuando se trata de alternativas de respuestas policotómicas, como las escalas tipo Likert; la cual puede tomar valores entre 0 y 1, donde: 0 significa confiabilidad nula y 1 representa confiabilidad total. El coeficiente α de Cronbach puede ser calculado por medio de la varianza de los ítems y la varianza del puntaje total (Hernández Sampieri et al, 2003). Para calcular el coeficiente de confiabilidad se usó el ”COEFICIENTE ALFA DE CROMBACH ( )” Córdova (2009), cuya ecuación es: donde: : coeficiente de confiabilidad de la prueba o cuestionario número de ítems del instrumento : Varianza total del instrumento. : Sumatoria de las varianzas de los ítems. Método de Kuder-Richarson 21: permite obtener la confiabilidad a partir de los datos obtenidos en una sola aplicación del test. La suposición básica es considerar que todos los ítemes presentan igual varianza. Coeficiente de consistencia interna.
  • 34.
    n M n M KR21 1 n 1 nst2 Donde: n: número total de ítems M: media aritmética de las puntuaciones obtenidas por los individuos st2 : varianza de las puntuaciones totales Para la interpretación de la confiabilidad se utiliza el siguiente cuadro: TABLA DE CATEGORÍAS ESCALA CATEGORÍA Confiabilidad muy alta Confiabilidad alta Confiabilidad aceptable Confiabilidad moderada Confiabilidad baja Confiabilidad muy baja Confiabilidad despreciable
  • 35.
    Ejemplo 19. Determine laconfiabilidad, utilizando alfa de cronbach, para la siguiente información Encuestados Preguntas (Ítems) Puntos 1 2 3 4 5 6 7 8 9 10 1 0 0 0 1 1 1 0 0 0 0 3 2 0 1 1 1 2 1 1 1 2 2 12 3 0 1 0 2 1 1 0 0 0 0 5 4 0 0 0 1 1 0 0 1 0 0 3 5 0 0 1 1 1 1 2 1 0 0 7 6 0 0 0 1 1 1 0 1 0 0 4 7 0 0 0 2 1 2 2 1 0 2 10 8 0 0 0 0 0 1 0 0 0 0 1 9 1 0 0 1 1 0 0 0 0 0 3 10 0 1 0 2 2 2 0 2 2 2 13 11 0 0 1 1 1 1 0 1 2 2 9 12 0 1 0 1 2 2 0 2 0 1 9 13 0 0 0 1 2 2 0 0 0 0 5 14 1 0 0 2 2 0 0 1 0 0 6 15 1 1 0 0 0 0 1 0 0 3 Total 3 5 3 17 18 15 5 12 6 9 93 0.17 0.24 0.17 0.42 0.45 0.57 0.53 0.46 0.69 0.83 varianza del instrumento
  • 36.
    Varianza de cadapregunta El índice de confiabilidad es alto de conformidad con la tabla de categorías. BAREMACIÓN DEL INSTRUMENTO, UTILIZANDO ESCALA DE LIKERT. Para medir la variable de estudio se aplico una encuesta utilizando la escala de likert, la misma que presenta en cada ítems cinco alternativas, a partir de las cuales los entrevistados pueden elegir, con la finalidad de señalar su nivel de acuerdo. - Alternativa a (5) - Alternativa b (4) - Alternativa c (3) - alternativa d (2) -alternativa e (1) Para obtener las puntuaciones de la variable de estudio, se suman los valores obtenidos respecto de cada ítem. El puntaje mínimo (PM) resulta de la multiplicación del número de ítems (x) por 1. Una puntuación alta (PA) está dada por el número de ítems o afirmaciones multiplicado por 5. PM--------------------I----------------------I----------------------I------------------PA
  • 37.
    Para facilitar lainterpretar las puntuaciones de la variable de estudio se transforman a una escala cualitativa, según el siguiente criterio. Puntaje Obtenido Categoría Puntaje 1.5x Deficiente 1.5x Puntaje 2.5x Malo 2.5x Puntaje 3.5x Regular 3.5x Puntaje 4.5x Bueno Puntaje 4.5x Muy bueno
  • 38.
    5.11 MATRIZ DECONSISTENCIA. Esta referido a la estructura del proyecto de Investigación desarrollado y que para fines didácticos se presenta en el siguiente esquema: TITULO:……… PROBLEMA OBJETIVO HIPOTESIS VARIABLES General General General Variable ¿…………………….? independiente Formulación de problemas …………… …………. …………… específicos. Formulación de hipótesis 1. ¿………………….? Objetivo específico operativas. Variable Dependiente 2. ¿……………… .. … 3. ¿…………………? .. ….. ……………. … ….. …………..
  • 39.
    TIPO DE ESTUDIO POBLACIÓN Y RECOLECCIÓN DE DATOS PRUEBAS ESTADISTICAS MUESTRA Nivel de investigación…. Población…. Guía de observación Tipo de investigación…………. Cuestionario encuestas Diseño de investigación……… Muestra………… Entrevistas VARIABLES DIMENSIONES INDICADORES Ubicación de ítems 1 1 ……. ……….. …………. 2 2
  • 40.
    MODELO DE TESIS TÍTULODE LA TESIS: CAPITULO I: PROBLEMA DE INVESTIGACIÓN PLANTEAMIENTO DEL PROBLEMA FORMULACIÓN DEL PROBLEMA DE INVESTIGACIÓN OBJETIVOS JUSTIFICACIÓN  ORIGINALIDAD:  PERTINENCIA:  RELEVANCIA:  OPORTUNIDAD:  FACTIBILIDAD: IMPORTANCIA LIMITACIÓN ÁREA DE ESTUDIO DELIMITACIÓN DELIMITACIÓN ESPACIAL DELIMITACIÓN TEMPORAL CAPITULO II: MARCO TEÓRICO ANTECEDENTES DE ESTUDIO MARCO CONCEPTUAL MARCO NORMATIVO MARCO TEÓRICO CONCEPTUALIZACIÓN EN TÉRMINOS HIPÓTESIS DE INVESTIGACION. CAPITULO III: DISEÑO METODOLÓGICO NIVEL DE INVESTIGACIÓN TIPO DE NVESTIGACION. DISEÑO DE INVESTIGACIÓN POBLACIÓN Y MUESTRA VARIABLES OPERACIONALIZACIÓN DE VARIABLES TÉCNICAS E INSTRUMENTOS DE RECOLECCIÓN DE DATOS
  • 41.
    CLETO DE LATORRE DUEÑAS 41 TÉCNICAS DE ANÁLISIS DE DATOS. CAPITULO IV: PRESENTACION DE RESULTADOS CONCLUSIONES RECOMENDACIONES BIBLIOGRAFIA ANEXOS EJERCICIOS PROPUESTOS. 1. Influencia del uso de materiales didácticos en el rendimiento académico de los estudiantes de la ciudad de Cusco. Especifique. a. La(s) variable(s) de estudio y el tipo de variable. b. La escala de medición a emplear. c. Nivel de investigación. d. Tipo de investigación e. Diseño de investigación 2. Se realizo el estudio de la calidad de vida y servicio educativo de los profesores de las I.E de la UGEL Cusco. Especifique a. Proponer un titulo para esta investigación. b. La(s) variable(s) de estudio y el tipo de variable. c. La escala de medición a emplear. d. Nivel, tipo y diseño de investigación. 3. Se hizo una encuesta a una muestra representativa de profesores de la UGEL La Convención sobre el nivel de acuerdo con la carrera pública magisterial propuesta por el gobierno. Carrera publica magisterial. Frecuencia Totalmente de acuerdo 15 De acuerdo 40 Indeciso 25 En desacuerdo 10 Totalmente en desacuerdo 6 En base a la información, realice el análisis correspondiente.
  • 42.
    42 ESTADISTICA 4. Clasificar cada una de las siguientes variables : a. Rendimiento Académico (Bajo, Medio, Alto). b. Sexo. c. Edad. d. Nivel educativo (primario secundario, superior). e. Años de estudios completados. f. Tipo de enseñanza (privada o pública). g. Estrato social (bajo, medio o alto). h. Numero Telefónico i. Numero de DNI de un profesor. j. Método de enseñanza. k. Nivel de congruencia entre la sumilla y el silabo. 5. Se aplico un test para medir la competitividad del magisterio a una muestra piloto de 5 profesores, obteniendo los siguientes resultados. Profesor Ítems 1 2 3 4 5 6 1 1 0 1 0 0 0 2 0 0 1 1 0 1 3 1 0 0 1 1 1 4 1 0 1 1 0 0 5 0 0 1 0 1 1 Determine la confiabilidad y validez del instrumento.
  • 43.
    CLETO DE LATORRE DUEÑAS 43 CAPITULO II ORGANIZACIÓN Y PRESENTACIÓN DE DATOS 2.1 ESTADISTICA. La Estadística es la ciencia que se ocupa de los métodos y procedimientos de colección, clasificación, organización, análisis, síntesis e interpretación de datos; siendo su característica que la distingue, la de hacer generalizaciones o inferencias en base a una muestra. Se define la estadística como: Una ciencia que se ocupa de la recolección, organización, procesamiento y análisis de la información. Una ciencia que permite tomar de decisiones Herramienta de la investigación científica. En términos generales la estadística aborda dos tipos de problemas: ♦ Resumir, describir y explorar datos. ♦ Utilizar datos de una muestra para inferir la naturaleza del conjunto del cual se selecciono la muestra. DIVISION DE LA ESTADISTICA La estadística se divide en dos partes íntimamente relacionadas: Estadística Descriptiva: Esta es la parte de la estadística que se dedica a la organización, síntesis y descripción de conjuntos de datos. Esta es importante, ya que antes de que la mente humana pueda interpretar (hacer inferencias) un conjunto de datos, especialmente cuando estos son demasiados, es necesario resumirlos o representarlos de manera clara, simplificada o reducida.
  • 44.
    44 ESTADISTICA Estadística Inferencial: Esta rama de la estadística trata el problema de inferir la naturaleza de un conjunto de datos a partir de una muestra de dichos datos. El problema general de la Estadística Muestra Inferencias Población Que tan reales es. Figura 2.1: Relación entre población y muestra. CONCEPTOS BASICOS Población. Es cualquier conjunto de datos, objetivo de nuestro interés, sobre los cuales interesa observar una o más características. Esta puede ser finita o infinita. El tamaño de la población es el número de individuos que esta tiene. Muestra. Una muestra es un conjunto de individuos de la población que refleja las características de ésta lo mejor posible. Si las características quedan bien reflejadas, se dice que la muestra es representativa. El tamaño de una muestra es el número de individuos que tiene, lo denotamos por n. Unidad de estudio. Es cada elemento que va a ser estudiado, normalmente se trate de individuos, pero no tiene por qué ser así. Data. Es cualquier medida resultado de haber observado una variable en una unidad de alguna población. Parámetro. Es una propiedad descriptiva de una población. Ejemplo media y varianza poblacional Estadístico. Es una propiedad descriptiva de una muestra. Ejemplo media y varianza muestral. Variable. Cualquier característica de Interés en el estudio. Variable cualitativa: Ordinal y Nominal Variable cuantitativa: Discreta y continua. Por otra parte, el reporte de las variables medidas requiere de los siguientes conceptos:
  • 45.
    CLETO DE LATORRE DUEÑAS 45 2.2 ORGANIZACIÓN DE DATOS La presentación de datos a través de tablas estadísticas es una actividad importante dentro de los sistemas de información, estas se fortalecen significativamente cuando se la acompañan con gráficos descriptivos ilustrativos. En el contexto de los sistemas de información, en más de una oportunidad se encontrara que un buen grafico resume y expresa mucho más que párrafos completos de comentarios e interpretaciones literales. Resumir los datos es un procedimiento útil para conseguirlo y puede hacerse mediante tablas, gráficos o valores numéricos. A lo largo de este tema veremos las principales técnicas numéricas y gráficas que nos permiten describir una característica de interés observada en una población, poniendo en relieve sus rasgos más importantes. 2.3 TABLA DE FRECUENCIAS. Un primer resumen de la información contenida en un conjunto de datos observado se obtiene al organiza los datos, en una tabla de frecuencias. En ésta se recogen los distintos valores (números o categorías) que toma la variable junto con sus correspondientes frecuencias de aparición. TABLA DE FRECUENCIAS PARA VARIABLES CUALITATIVAS Si en una muestra de n elementos, se observa k categorías diferentes C1, C2,…, Ck de una variable cualitativa X. Para resumir la información, previamente definimos algunos conceptos: La frecuencia absoluta de un valor Ci es el número de veces que dicho valor aparece en la muestra. Se representa por fi y cumple k fi f1 f 2 ...... fk n i 1 La frecuencia relativa de un valor Ci es el cociente de la frecuencia absoluta (fi) entre el tamaño de la muestra (n), se representa por hi k fi hi , se cumple hi 1 n i 1
  • 46.
    46 ESTADISTICA La frecuencia absoluta acumulada del valor i-ésimo es la suma de las frecuencias absolutas hasta dicho valor, se denota por Fi Fi f1 f 2 ...... fi La frecuencia relativa acumulada del valor i-ésimo es la suma de las frecuencias relativas hasta dicho valor, se denota por Fi Hi h1 h2 ...... hi , Fi Hi n La tabla de frecuencias tiene la siguiente estructura: Categoría de X fi hi pi Fi Hi C1 f1 h1 p1 F1 H1 C2 f2 h2 pi F2 H2 …. … … … … … Ck fk hk pk Fk=n Hk=1 Total n 1.00 100 GRAFICAS PARA VARIABLES CUALITATIVAS. Las representaciones gráficas prácticamente están orientadas de acuerdo con las necesidades del investigador o estadístico, de todas formas se tienen algunas normas de trabajo y representación, que tienen por objeto facilitar la lectura de los datos e información que se maneja estadísticamente. La calidad de un gráfico estadístico consiste en comunicar ideas complejas con precisión, claridad y eficiencia, de tal manera que: • Induzca a pensar en el contenido más que en la apariencia • No distorsione la información proporcionada por los datos • Presente mucha información (números) en poco espacio
  • 47.
    CLETO DE LATORRE DUEÑAS 47 • Favorezca la comparación de diferentes grupos de datos o de relaciones entre los mismos (por ejemplo una secuencia temporal) La finalidad de los gráficos estadísticos es: – Organizar los datos. – Observar patrones. – Observar agrupamientos. – Observar relaciones. – Comparar distribuciones. – Visualizar rápidamente la distribución de los datos. – Visualizar, obtener y comparar medidas estadísticas. La tabla de frecuencias para variables cualitativas, se puede representar utilizando los siguientes gráficos.  Diagrama de barras o rectangulos Es la representación gráfica usual para variables cualitativas. Para el caso de variables cualitativas se construye dibujando sobre la categoría correspondiente un rectángulo con altura igual a la frecuencia (absoluta o relativa). También es válido para variables cuantitativas discretas, considerando en el eje de abscisas los valores de la variable en orden creciente en lugar de las categorías, sobre cada valor levantamos una barra de altura igual a la frecuencia (absoluta o relativa). Este grafico es recomendable, cuando la variable de estudio tiene muchas categorías.  Diagrama de Pareto. Se ordenan las categorías de mayor a menor importancia y se dibujan los rectángulos correspondientes. Este grafico se recomienda para jerarquizar los factores considerados en el estudio.
  • 48.
    48 ESTADISTICA  Diagrama de sectores. Es el más usual en variables cualitativas. Se representan mediante círculos. A cada valor de la variable se le asocia el sector circular proporcional a su frecuencia. Para hallar el ángulo usamos la siguiente proporción: al tener una circunferencia 360º, el cociente entre la frecuencia absoluta (o relativa) total y la frecuencia absoluta (o relativa) que queramos representar será igual al cociente entre los 360º de la circunferencia y el ángulo a determinar, así: n 360º 1 360º fi hi Donde es el ángulo a determinar. Este grafico es recomendable, cuando la variable tiene pocas categorías.  Pictogramas. Expresan con dibujos alusivos al tema de estudio las frecuencias de las modalidades de la variable. La escala de los dibujos debe ser tal que el área de cada uno de ellos sea proporcional a la frecuencia de la modalidad que representa. TABLA DE FRECUENCIAS PARA VARIABLES CUANTITATIVAS DISCRETAS Una vez obtenida una muestra de cualquier población y observados los valores que toma la variable en los individuos de la muestra, estos valores se suelen ordenar. Si la variable es cuantitativa la ordenación será de menor a mayor.
  • 49.
    CLETO DE LATORRE DUEÑAS 49 Dada una variable X, consideramos una muestra de tamaño n que toma k valores distintos, x1, . . . , xk (x1 < x2 < . . . < xk). La organización es en forma similar al caso cualitativo. Valores de X fi hi pi Fi Hi x1 f1 h1 p1 F1 H1 x2 f2 h2 pi F2 H2 …. … … … … … xk fk hk pk Fk=n Hk=1 Total n 1.00 100 La grafica para representar esta información es Bastones. Existe otros gráficos, tales como:  Diagrama de cajas(box-plot) Presentación visual que describe al mismo tiempo varias características importantes de un conjunto de datos, tales como el centro, la dispersión, el alejamiento de la simetría, y la identificación de valores extremos (puntos atípicos), es decir, de valores que se alejan de una manera poco usual del resto de los datos. Presenta los tres cuartiles, (y los valores mínimos y máximos) alineados sobre una caja vertical u horizontalmente. El procedimiento Para el diagrama de cajas y bigotes es: 1. Dibujar un segmento con extremos en los valores menor y mayor que aparecen en la muestra paralelo a uno de los ejes. 2. Dibujamos una caja con extremos en el primer y tercer cuartil y marcamos en ella la mediana. 3. Se hallan los límites interiores (Q1 – 1.5 IQR y Q3 + 1.5 IQR) y los límites exteriores (Q1 – 3 IQR y Q3 + 3 IQR). Donde Qi : Cuartiles que seran desarrollados más adelante. 4. Se unen, con unos segmentos (bigotes), Q1 y Q3 con los valores adyacentes de la muestra.
  • 50.
    50 ESTADISTICA 5. Por último se indican los valores atípicos  Tallos y Hojas (stem & leaf) Procedimiento semigráfico para el que se preparan los datos resumiéndolos en dos o tres cifras (expresándolos en las unidades adecuadas). A continuación se disponen en una tabla de dos columnas del siguiente modo: 1. Si los datos son de dos dígitos, a la izquierda (en el tallo) aparece la cifra de las decenas, a la derecha separada por una línea aparecen las hojas y se escriben ordenadas y todas seguidas. 2. Si hay tres dígitos el tallo está formado por los dos primeros. Las hojas son las unidades. TABLA DE FRECUENCIAS PARA VARIABLES CUANTITATIVAS CONTINUAS A veces se hace necesario trabajar con datos agrupados. Definimos entonces como clase a cada uno de los intervalos en que se agrupan los datos. Las frecuencias harán ahora referencia al número de datos que hay en cada intervalo. Para construir distribución de frecuencias por intervalos, se tiene los siguientes pasos:  Elegir un número de intervalos de clase (K) Puede utilizar la regla de Sturges, k 1 3.3log(n) Donde k: Número de intervalos. n: Número de datos.  Determinar el rango. R xmax xmin  Determinar la amplitud de las clases. A R/k
  • 51.
    CLETO DE LATORRE DUEÑAS 51  Determinación de los intervalos i : I I1 xmin , xmin A LI1, LS1 I2 xmin A, xmin 2 A LI2 , LS2  Ik xmin (k 1) A, xmin kA LI k , LSk  Determinación de las marcas de clase. LI i LSi mi 2 Donde LI : Limite inferior LS : Limite superior.  Realizar la clasificación y el conteo de datos en cada clase construida. Ii mi fi hi hi pi Fi Hi I1 m1 f1 h1 h1 p1 F1 H1 I2 m2 f2 h2 h2 pi F2 H2 …. … … … … … … … Ik mk fk hk hk pk Fk=n Hk=1 Total n 1.00 1.00 100 Cuando las variables son continuas, utilizamos como diagramas diferenciales los histogramas y los polígonos de frecuencias.
  • 52.
    52 ESTADISTICA  Histograma de frecuencias Un histograma es la representación más frecuente con datos agrupados, se construye a partir de la tabla estadística, representando sobre cada intervalo, un rectángulo que tiene a este segmento como base. El criterio para calcular la altura de cada rectángulo es el de mantener la proporcionalidad entre las frecuencias absolutas (o relativas) de cada intervalo y el área de los mismos.  Polígono de frecuencias El polígono se construye fácilmente si tenemos representado previamente el histograma, ya que consiste en unir mediante líneas rectas los puntos del histograma que corresponden a las marcas de clase. Para representar el polígono de frecuencias en el primer y último intervalo, suponemos que adyacentes a ellos existen otros intervalos de la misma amplitud y frecuencia nula, y se unen por una línea recta los puntos del histograma que corresponden a sus marcas de clase.  Curva de frecuencias. Resulta de suavizar el polígono de frecuencias, en sus puntos angulosos.  Ojivas Es una poligonal construida uniendo los puntos cuyas abscisas son los límites superiores de clases y las ordenadas son las frecuencias absolutas acumuladas
  • 53.
    CLETO DE LATORRE DUEÑAS 53 Resumen de gráficos. Variable Tipo Gráfico Cualitativa Nominal Sectores circulares, Ordinal barras, pictogramas, pareto. Cuantitativa Discreta Bastones, barras, box plots, tallos y hojas Continua Histogramas, polígonos de frecuencia, Ojivas, Grafico de cajas, Box- plots, tallos y hojas.
  • 54.
    54 ESTADISTICA EJERCICIOS DESARROLLADOS 1. En una encuesta de opinión, respecto a las preferencias del método de enseñanza: Clásico(A), Nuevo enfoque (B), Ambos métodos(C), 30 docentes dieron las siguientes respuestas: A, B, B, B, C, B, B, B, A, A, B, B, C, A, B, C, B, A, A, B, B, B, C, C, B, B, C, C, C, B Construir la distribución de frecuencias y represente la información mediante un grafico. Solución. Método fi hi pi Clásico 20 6 0.2 Nuevo Enfoque 53.33 16 0.5333 Ambos métodos 26.67 8 0.2667 Total n=30 1.00 100.00 Barchart for Metodo 16 12 frequency 8 4 0 Ambos metodos Clasico Nuevo enfoque
  • 55.
    CLETO DE LATORRE DUEÑAS 55 Pie Chart of C1 Category Ambos metodos Clasico Nuevo enfoque 2. En un estudio realizado de los hábitos estudio de los estudiantes de I.E de la ciudad de Cusco, se obtuvo los siguientes resultados que se muestra en el cuadro siguiente. Hábito de estudio Frecuencia Porcentaje Bajo 96 38,4 Intermedio 83 33,2 Alto 71 28,4 Total 250 100,0 Representa la información mediante dos gráficos adecuados. 40 30 Porcentaje 20 10 0 Bajo Intermedio Alto Hábito de estudio
  • 56.
    56 ESTADISTICA 3. El Director de una institución educativa desea analizar el número de tardanzas presentadas por los estudiantes. Para ello, se toma una muestra aleatoria de 50 estudiantes obtenido los siguientes datos de tardanzas: 2 4 2 3 1 2 4 2 3 0 2 2 2 3 2 6 2 3 2 2 3 2 3 3 4 3 3 4 5 2 0 3 2 1 2 3 2 2 3 1 4 2 3 2 4 3 3 2 2 1 En base a la información: a) ¿Cuál es la población objeto de estudio? b) ¿Qué variable estamos estudiando? c) ¿Qué tipo de variable es? d) Construir la tabla de frecuencias? Solución: a) La población objeto de estudio es el total de estudiantes de la I.E. b) La variable (x) que estamos estudiando es el número de tardanzas c) El tipo de variable es discreta ya que el número de tardanzas solo puede tomar determinados valores enteros d) Para construir la tabla de frecuencias tenemos que analizar el número de tardanzas de los estudiantes. Podemos ver que el número de tardanzas, toma los valores existentes entre 0 y 6 hijos: Xi fi Fi hi Hi 0 2 2 0.04 0.04 1 4 6 0.08 0.12 2 21 27 0.42 0.54 3 15 42 0.30 0.84 4 6 48 0.12 0.96 5 1 49 0.02 0.98 6 1 50 0.024 1 n = 50 1 4. En la UGEL de la región Cusco, se realizo un estudio sobre el conocimiento de estrategias cognitivas. Los resultados se muestran a continuación.
  • 57.
    CLETO DE LATORRE DUEÑAS 57 Conocimiento Frecuencia Porcentaje Deficiente 26 63.4 Regular 8 19.5 Bueno 7 17.1 Total 41 100.0 Represente la información mediante un grafico. Solución: 60,0% Porcentaje 40,0% 20,0% 0,0% Deficiente Regular Bueno Conocimiento 5. Por encargo del nutricionista, se debe dar la siguiente cantidad de calorías a un grupo de 50 estudiantes de una institución educativa. 3255 2123 3525 2123 3453 1895 2740 4525 3215 2593 2155 3255 2460 1985 3530 2456 3772 4220 2971 4685 1525 3847 3005 2224 2646 4450 2793 1965 2327 4525 4243 4124 4595 2643 3797 3024 3214 4509 3727 4134 4244 4955 3925 2220 2335 1255 4675 4580 3437 2702
  • 58.
    58 ESTADISTICA a) Organice la información en una tabla de frecuencias. b) Represente la información utilizando: Histograma de frecuencias porcentuales acumuladas y Ojiva. c) Trace el histograma y polígono de frecuencias porcentuales. Solución. a) Construiremos la tabla de frecuencias.  Número de clases. Usando la relación de sturges se tiene: k 1 3.3log(n) 1 3.3log(50) 6,6 7  Determinar la amplitud de los intervalos R xmax xmin 4955 1255 3700  Determinar el tamaño del intervalo de clases (A), R 3700 A 528,57 k 7 Clase Intervalo mi fi hi pi Pi 1 [1255,0 - 1783,57 ) 1519,29 1 0,0400 4% 4% 2 [1783,57 - 2312,14 ) 2047,86 8 0,1600 16% 20% 3 [2312,14 - 2840,71 ) 2576,43 10 0,2000 20% 40% 4 [2840,71 - 3369,29 ) 3105,0 7 0,1400 14% 54% 5 [3369,29 - 3897,86) 3633,57 8 0,1600 16% 70% 6 [3897,86 - 4426,43) 4162,14 6 0,1200 12% 82% 7 [4426,43 - 4955 ) 4690,71 9 0,1800 18% 1OO% Total 50 1 100%
  • 59.
    CLETO DE LATORRE DUEÑAS 59 b) La grafica muestra el histograma de frecuencias porcentuales acumuladas y la Histograma ojiva Frecuencia Porcentual Acumulada 100 80 Ojiva 60 Histograma 40 20 0 0 1 2 3 4 5 (X 1000,0) Calorias Histograma 20 Polígono de Frecuencia Porcentual 16 c) En el grafico se muestra, el polígono de frecuencias. frecuencias 12 8 4 0 0 1 2 3 4 5 (X 1000,0) Calorias
  • 60.
    60 ESTADISTICA 6. Un investigador recopila información del peso de 50 profesores. Los datos obtenidos fueron los siguientes. 65 63 65 63 69 67 53 58 60 61 64 65 64 72 68 66 55 57 60 62 64 65 64 71 68 66 56 59 61 62 63 65 63 70 67 66 57 59 61 62 64 64 63 69 67 66 58 60 61 62 a. Construya la tabla de distribución de frecuencias b. Represente la información obtenida, mediante un grafico. Solución. a. Para construir una tabla de frecuencia se tiene los siguientes pasos.  Elegir el número de clases. Usando la relación de sturges se tiene: k 1 3.3log(n) 1 3.3log(50) 7  Determinar la amplitud de los intervalos R xmax xmin 72 53 19  Determinar el tamaño del intervalo de clases (A), R 19 A 2, 7 k 7 Consideramos A=3  Establecimiento de los límites y construcción de la tabla: LI - LS fi mi Fi hi= fi/n pi Hi [52 – 55) 2 53.5 2 0.04 4 0,04 [55 – 58) 5 56.5 7 0.1 10 0,14 [58 – 61) 9 59.5 16 0.18 18 0,32 [61 – 64) 15 62.5 31 0.3 30 0,62 [64 – 67) 12 65.5 43 0.24 24 0,86 [67 – 70) 5 68.5 48 0.1 10 0,96 [70 – 73) 2 71.5 50 0.04 4 1,0000 TOTAL n=50 1 100
  • 61.
    CLETO DE LATORRE DUEÑAS 61 b. Histograma de frecuencias relativas. Histogram 30 25 20 percentage 15 10 5 0 52 56 60 64 68 72 76 Peso
  • 62.
    62 ESTADISTICA EJERCICIOS PROPUESTOS. 1. Un investigador realiza una investigación con la finalidad de comparar la eficiencia de los siguientes métodos de comprensión lectora: A: Enseñanza directa. B: Enseñanza recíproca. C: Combinación de los métodos de enseñanza directa y enseñanza recíproca. Si se aplico cada método en forma independiente en tres secciones diferentes de 50 alumnos cada uno, obteniéndose, que 30 alumnos con el método de enseñanza directa, 20 con método de enseñanza reciproca y 35 con la combinación de estos métodos presenta una buena comprensión lectora. En base a estos resultados cual es su conclusión del estudio. 2. Se aplico una encuesta a directores de I.E con la finalidad de evaluar la influencia de los programas de capacitación de docentes fomentados por el Estado en la calidad de servicio educativo. Los resultados son los siguientes: I.E X Y I.E X Y I.E X Y 1 R R 8 MB MB 15 R R 2 M M 9 R R 16 R M 3 M R 10 R M 17 M R 4 R M 11 M M 18 M M 5 B B 12 M R 19 M M 6 M M 13 R R 20 B B 7 R R 14 MB B 21 B R Donde X: Programas de capacitación. Y: Calidad del servicio educativo. M: Mala, R: Regular, B: Buena, MB: Muy buena. Cuál es su conclusión del estudio 3. Se ha medido la comprensión lectora de una muestra de 50 profesores de la UGEL A, Los resultados son los siguientes: 30, 35, 34, 38, 40, 42, 43, 43,
  • 63.
    CLETO DE LATORRE DUEÑAS 63 44,44,45,45,46,46,46, 47, 48, 50, 55, 56, 58, 59, 60, 63, 65, 66, 67, 67, 68, 70, 72, 74, 75, 77,78,78,78,78, 78, 79, 79, 79, 80,82, 82, 83, 88, 90, 96,99 a) Organiza y representa adecuadamente la información. b) Redacte sus conclusiones del estudio. 4. Los siguientes datos corresponden a una muestra de 30 estudiantes de un centro educativo de la ciudad de Cusco, en los cuales se midieron tres características: Peso en libras (X), Número de tardanzas en el año escolar (Y) y Estrato socioeconómico (Z) X Y Z 138 3 MEDIO 164 5 MEDIO 150 1 ALTO 132 4 BAJO 144 3 MEDIO 125 2 MEDIO 149 0 BAJO 157 1 BAJO 146 5 MEDIO 158 3 ALTO 140 4 BAJO 147 2 MEDIO 136 2 MEDIO 148 4 ALTO 152 5 BAJO 149 4 MEDIO 168 4 MEDIO 126 0 MEDIO 138 1 ALTO 176 2 BAJO 163 2 MEDIO 119 3 MEDIO 154 5 BAJO 165 2 BAJO
  • 64.
    64 ESTADISTICA 146 3 BAJO 173 4 MEDIO 142 1 BAJO 147 1 ALTO 135 2 MEDIO 153 2 MEDIO I. Identifique los siguientes conceptos: a) Población. b) Muestra. c) Unidad de análisis. d) Variables o características de interés e) Clasifique las variables definidas anteriormente II. Construya una tabla de frecuencias para presentar el estrato socioeconómico de los estudiantes con su correspondiente título y anéxele un gráfico adecuado. III. Construya una tabla de frecuencias para presentar el número de tardanzas al año de los estudiantes con su correspondiente título y anéxele un gráfico adecuado. IV. Construya una tabla de frecuencias de 5 intervalos para presentar el peso de los estudiantes con su correspondiente título y anéxele un gráfico adecuado. V. De las tablas construidas anteriormente responda las siguientes consultas: a) ¿Qué porcentaje de estudiantes corresponde al estrato socioeconómico bajo? b) ¿Cuantos estudiantes realizan, presentaron a lo más dos tardanzas al año? c) ¿Qué porcentaje de estudiantes no presento tardanzas en el año? d) ¿Cuántos estudiantes tienen un peso a lo más de 167? e) ¿Qué porcentaje de estudiantes tiene un peso mayor a 127 y menor o igual a 159? f) ¿Cuántos estudiantes tienen un peso mayor a 159? 5. Una encuesta realizada en un grupo de profesores sobre el uso de los distintos tipos de estrategias metodológicas, dio los siguientes resultados A D B A D D A C D B A B A C A A D D D A D C A C C D A
  • 65.
    CLETO DE LATORRE DUEÑAS 65 B A D B A B C C A D C A D A B A B A Confeccionar una tabla de frecuencias que recoja esta información y elabora dos tipos de gráficos distintos a partir de ella. ¿Qué porcentaje de profesores utiliza cada estrategia? 6. Los datos siguientes representan el número de gestiones realizadas en instituciones públicas o privadas de 52 Directores de igual número de centros educativos en el año 2009: 0 2 0 1 3 4 0 2 1 3 0 2 2 1 0 5 2 6 1 2 1 4 1 1 0 1 1 2 0 5 2 0 4 3 2 4 3 2 1 6 2 3 3 5 1 3 6 1 3 4 5 0 2 3 a) Identifique los siguientes conceptos: i) Población analizada. ii) Elementos de la población. iii) Característica en estudio. iv) Tipo de dato analizado. b) Construya una tabla de frecuencias completa para estos datos y escríbale un título. c) Trazar una grafica adecuada. d) Con la tabla construida en c) entregue la siguiente información al Director de la UGEL: i) ¿ Cuántos Directores , realizaron a lo más 3 gestiones?. ii) ¿Qué porcentaje de Directores, realizo exactamente 5 gestiones?. 7. Se ha realizado una encuesta a 30 familias en la que se les pregunta el nº de integrantes. Las respuestas obtenidas han sido las siguientes: 1, 4, 4, 1, 3, 5, 3, 2, 4, 1, 6, 2, 3, 4, 5, 5, 6, 2, 3, 3, 2, 2, 1, 8, 3, 5, 3, 4, 7, 2, 3. 1. Calcule la distribución de frecuencias de la variable obteniendo las frecuencias absolutas, relativas y sus correspondientes acumuladas. 2. ¿Qué proporción de familias está compuesta por tres o menos personas? 3. Dibuje el diagrama de barras de frecuencias. 8. Se le aplico una prueba de inteligencia a los estudiantes de un centro educativo, obteniendo los siguientes datos.
  • 66.
    66 ESTADISTICA 87 105 88 103 114 125 108 107 118 114 129 100 106 113 105 111 94 115 89 82 141 92 132 112 97 135 101 104 130 99 114 91 145 95 101 115 104 87 108 115 103 132 110 113 102 109 124 98 140 107 93 108 122 117 114 141 116 108 102 101 118 138 99 105 112 94 96 132 118 123 108 131 127 100 91 a) Agrupe los datos en y confeccione una tabla de frecuencias b) Trace las graficas adecuadas. 9. Represente gráficamente la siguiente información Comprensión Literal Frecuencia Porcentaje Malo 2 4.0 Regular 18 36.0 Bueno 30 60.0 Total 50 100.0
  • 67.
    CLETO DE LATORRE DUEÑAS 67 CAPITULO III MEDIDAS DESCRIPTIVAS DE UNA DISTRIBUCIÓN DE DATOS. 3.1 INTRODUCCION. Las técnicas estudiadas anteriormente permiten una descripción visual de la distribución de una variable. En muchos casos, el resumen puede hacerse eficazmente de una forma más sencilla y precisa, utilizando valores numéricos que den idea de la ubicación o del centro de los datos (medidas de posición). Usando cantidades que informen de la concentración de las observaciones alrededor de dicho centro (medidas de dispersión) y mediante números que reflejen la forma (asimetría y apuntamiento) de la distribución (medidas de forma). La conjunción de técnicas numéricas y gráficas permite una buena descripción de la variable. Los estadísticos resúmenes tratan de reflejar numéricamente distintos aspectos de la variable en estudio. Podemos distinguir 4 aspectos o características principales que pueden resumirse en una distribución. (Ver cuadro siguiente)
  • 68.
    68 ESTADISTICA Media Nos dan un centro de Centralización Mediana la distribución de Moda frecuencias Percentiles Son valores de la Cuartiles distribución que Posición dividen en partes Deciles iguales Varianza Las medidas de Medidas Desviación típica dispersión cuantifican descriptivas Coeficiente de variación la separación, la Rango dispersión, la Dispersión variabilidad de los valores de la distribución respecto al Recorrido Intercuartilico valor central Coeficiente de Asimetría Comparan la forma Forma Coeficiente de Apuntamiento que tiene la o Curtosis representación gráfica 3.2 MEDIDAS DE TENDENCIA CENTRAL Los promedios o medidas de tendencia central son valores representativos de un conjunto de datos. Pretenden resumir todos los datos en un único valor. Las medidas de tendencia central son fundamentales ya que permiten localizar cuantitativamente la zona central o de mayor acumulación de información de un conjunto de datos correspondientes a una variable, obtenidos de una muestra seleccionada de una población específica o de un conjunto de resultados del espacio muestral de un experimento aleatorio. Definimos tres medidas de tendencia central más importantes: media, mediana y moda.
  • 69.
    CLETO DE LATORRE DUEÑAS 69 Media ( x ) Media para datos sin agrupar: Dado un conjunto de observaciones x1, . . . , xn, la media se representa mediante x, se obtiene mediante: n xi x1 x2 ..... xn i 1 x n n Media para datos agrupados Consideremos el caso en que tenemos una distribución de frecuencia para variables cuantitativas discretas, en este caso la media es: k f1 x1 f 2 x2 ..... f k xk x xi hi n i 1 Si los datos están agrupados por intervalos, para hallar la media tomamos la marca de las clases, k f1m1 f 2 m2 ..... f k mk x hi mi n i 1 La media se mide en las mismas unidades que la variable, y tiene el inconveniente de verse muy afectada por la presencia de datos que sean extremadamente grandes o pequeños (datos atípicos). Mediana (Me) Se calcula para variables cuantitativas; es el valor de la serie de datos que se sitúa justamente en el centro de la muestra una vez se ha ordenado ésta, corresponde a un 50% de valores son inferiores y otro 50% son superiores.
  • 70.
    70 ESTADISTICA Mediana para datos sin agrupar La mediana es el valor del dato central y depende del tamaño de la muestra. Me xn 1 , para n impar 2 x n x n 1 2 2 Me , Si n es par. 2 Mediana para datos agrupados Cuando trabajamos con variables agrupadas por intervalos es imposible determinar con precisión los valores que toman los datos, ya que esa información se ha perdido en privilegio del agrupamiento intervalo. Por lo tanto, en este caso, debemos buscar otro método para determinar el valor de la mediana. n Fi 1 0.5 H i 1 Me LI 2 A LI A fi hi La mediana sólo tiene en cuenta la posición de los valores en la muestra y por lo tanto tiene mejor comportamiento que la media cuando hay observaciones anómalas. Moda (Mo) Es el valor con mayor frecuencia. Si hay más de una moda, la variable se dice multimodal y puede calcularse para cualquier tipo de variable (Cuantitativas o cualitativas). Si los datos están agrupados hablamos de clase modal y será aquella para la que la frecuencia absoluta sea mayor. 1 fi fi 1 Mo LI A LI A 1 2 fi fi 1 fi fi 1
  • 71.
    CLETO DE LATORRE DUEÑAS 71 Donde: 1 fi fi 1 2 fi fi 1 Unimodal Bimodal Multimodal ¿Cómo elegir entre las medidas de tendencia central?- En general, la media es la medida de tendencia central más útil y más empleada. El uso de la media es el más apropiado cuando y la distribución de los datos es unimodal y aproximadamente simétrica. Cuando valores extremos distorsionan la distribución de los datos, el uso de la mediana es más apropiado pues se ve menos afectada, pero en la práctica esta medida de tendencia central no se utiliza demasiado. Si se trata de una variable ordinal, o sólo necesitas una descripción rápida y aproximada de la tendencia central, puedes utilizar la moda, que también es útil cuando la distribución está distorsionada por valores extremos o la distribución es bimodal. 3.3 CLASES DE DISTRIBUCIONES Distribución Simétrica: Se presenta si todas las observaciones están concentradas en un solo valor de la variable, en este caso la media, mediana y moda coincidirían en el mismo. x Me Mo Distribución asimétrica sesgada a la izquierda
  • 72.
    72 ESTADISTICA Supongamos ahora que las observaciones de la parte izquierda se alejan del valor central más que las observaciones de la parte derecha, generando una distribución asimétrica hacia la izquierda; en este caso como la media es la suma de los valores de las observaciones dividido por la cantidad total de observaciones, su valor se correrá a la izquierda también y por el mismo motivo, la media será menor que la mediana y ambas menor que la moda, es decir: x Me Mo Distribución asimétrica sesgada a la derecha. En este caso la media, es mayor que la mediana y que la moda. Mo Me x . 3.4 MEDIDAS DE POSICIÓN. Cuartiles Dividen la muestra, ordenada de menor a mayor, en 4 partes iguales, y se denotan por Qi , i=1,2,3 i.n Fk 1 Qi LI i 4 A fk
  • 73.
    CLETO DE LATORRE DUEÑAS 73 - Q1, primer cuartil, al menos el 25% de los datos son menores o iguales que él y al menos el 75% de los datos son mayores o iguales que él. - Q2, segundo cuartil, es la mediana, Q2 = Me. - Q3, tercer cuartil, al menos el 75% de los datos son menores o iguales que él y al menos el 25% de los datos son mayores o iguales que él. Percentiles Dividen la muestra ordenada en 100 partes iguales. i.n Fk 1 Pi LI i 100 A fk El i-ésimo percentil, Pi ( 1 i 99 ) es un valor tal que al menos el i% de los datos son menores o iguales que él y al menos el (100-i) % de los datos son mayores o iguales que él. A partir de las definiciones de los cuartiles y percentiles, es claro que Q1 = P25, Q2 = P50 =Me y que Q3 = P75. Deciles Dividen el conjunto de datos en 10 partes iguales y se denota con Di , i=1,…9 i.n Fk 1 Di LI i 10 A fk 3.5 MEDIDAS DE DISPERSIÓN Mientras los estadísticos de tendencia central nos indican los valores alrededor de los cuales se sitúan un grupo de observaciones, los estadísticos de variabilidad o dispersión muestran si los valores de las observaciones están próximos entre sí o
  • 74.
    74 ESTADISTICA están muy separados. Dos conjuntos de datos pueden tener la misma localización central y no obstante, ser muy distintos si uno se halla más disperso que el otro. La dispersión es el grado en que los datos numéricos tienden a extenderse alrededor de un valor medio. La dispersión de la distribución suministra información complementaria que permite juzgar la confiabilidad de nuestra medida de tendencia central. Si los datos están ampliamente dispersos, la localización central será menos representativa de los datos en su conjunto de lo que sería en el caso de datos que se acumulasen más alrededor de la media. Además, si no conviene tener una amplia dispersión de valores respecto al centro o si esa dispersión implica un riesgo inaceptable, deberemos ser capaces de reconocerlo y no escoger las distribuciones que presentan la máxima dispersión. Las medidas más importantes son: Varianza, desviación típica, coeficiente de variación muestral, rango y rango semiintercuartilico. Las mismas que se desarrolla a continuación: Varianza. Sólo tienen sentido para variables cuantitativas y se define: n n 2 xi x xi2 S2 i 1 i 1 x2 , Para datos no tabulados. n n n n 2 xi x fi fi xi2 S2 i 1 i 1 x 2 , Para datos tabulados de variable n n discreta n n 2 mi x fi f i mi2 S2 i 1 i 1 x2, Para datos tabulados por intervalos, n n para variables continuas. Observaciones sobre la varianza:
  • 75.
    CLETO DE LATORRE DUEÑAS 75  Las unidades de la varianza son los cuadrados de las unidades de los datos y en muchas ocasiones no son fáciles de interpretar.  Puede sufrir un cambio desproporcionado por la existencia de valores extremos en el conjunto.  Si la muestra es pequeño, se recomienda utilizar en el denominador de la ecuación de la varianza n-1 en reemplazo de n. Desviación típica (S) Es la raíz cuadrada positiva de la varianza s s2 La desviación típica poblacional suele denotarse por . Observaciones sobre la desviación típica:  Nos permite determinar con mayor grado de precisión dónde se sitúan los valores de una distribución de frecuencia en relación con la media.  Las unidades de la desviación típica se expresan en las mismas unidades de los datos.  Puede sufrir un cambio desproporcionado por la existencia de valores extremos en el conjunto. Variables tipificadas Los distintos conjuntos de datos están asociados por lo general a diferentes medias, ya sea porque son de naturaleza diferente (escalas de medidas diferentes). Con el propósito de reducir los datos a un mismo punto de referencia y a una escala común, se realiza entre ellos una transformación llamada tipificación. Se conoce por tipificación de una variable “x” a efectuar el cambio de origen y de escala de la variable: x x z para muestras s x- z para población
  • 76.
    76 ESTADISTICA Esta nueva variable (z), carece de unidades de medida y permite comparar dos o más cantidades que en un principio no son comparables porque aluden a conceptos diferentes. También es aplicable a casos en que se quieran comparar individuos semejantes de poblaciones diferentes. Ejemplo 1: Un estudiante obtuvo 84 puntos en el examen final de matemáticas, en el que la nota media fue 76, y la desviación típica 10. En el examen final de física obtuvo 90 puntos, siendo la media 82 y la desviación típica 16. ¿En qué examen sobresalió más?. Examen de matemática Examen de física x = 76 x = 82 s = 10 s = 16 x = 84 x = 90 84 76 90 82 z= 0,8 z= 0,5 10 16 Sobresalió más en matemáticas. Coeficiente de variación Muestral de Pearson Las medidas de dispersión anteriores dependen de las unidades de medida, el coeficiente de variación es, en cambio, una medida de dispersión relativa y adimensional. S CV *100% |X| CV es apropiado en poblaciones donde los datos son positivos. Si 0<CV<15%, los datos provienen de una población homogénea Si CV>15%, los datos provienen de una población heterogénea. El coeficiente de variación es útil, en razón de su carácter adimensional, para comparar muestras con medias desiguales, donde las unidades de medida de las
  • 77.
    CLETO DE LATORRE DUEÑAS 77 observaciones son diferentes. También para decidir cual muestra es más homogénea o menos variable Recorrido o rango Es la diferencia entre el mayor y menor valor de una muestra. R x max x min Rango semiintercuartílico y amplitud intercuartil El rango semiintercuartílico es la mitad de la diferencia entre el tercer y primer cuartil, Q = (Q3 – Q1)/2. La amplitud intercuartil es el doble del valor anterior, 2Q = IQR = (Q3 – Q1). ¿Cómo elegir entre las medidas de dispersión?- La medida de dispersión más útil es la desviación típica. Sólo debes usar el rango cuando dispones de pocas medidas o cuando todo lo que necesitas conocer es la dispersión general de las medidas. Utiliza el coeficiente de variación cuando quieras tener una idea de la variabilidad relativa de dos o más variables cuyas medias son muy diferentes en magnitud. Esto se ve facilitado por su carácter adimensional, es decir, no depende de las unidades en que se mida la media 3.6 MEDIDAS DE FORMA Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda y Hacen referencia a la forma de la distribución, simétrica, asimetría a la derecha o a la izquierda. En general la mejor manera de verlo es por la representación gráfica, pero si no la tenemos existen coeficientes que nos indican la forma de la distribución. Los más utilizados son: Coeficiente de asimetría de Pearson, El coeficiente de asimetría de una variable mide el grado de asimetría de la distribución de sus datos en torno a su media, es adimensional y se define como sigue:
  • 78.
    78 ESTADISTICA x Mo Ap S Este coeficiente puede ser:  Ap 0 , entonces la media igual que la moda, distribución simétrica  Ap 0 , entonces la media mayor que la moda, asimetría a la derecha positiva  Ap 0 , entonces la media menor que la moda, asimetría a la izquierda negativa. Curtosis El Coeficiente de Curtosis mide el grado de concentración que presentan los valores alrededor de la zona central de la distribución. La curtosis hace referencia al mayor o menor apuntamiento que tiene una distribución de frecuencias respecto a una distribución Normal, por lo tanto sólo se estudia en comparación con la campana de Gauss, se determina mediante: P75 P25 K 0.5 P90 P10 Se definen 3 tipos de distribuciones según su grado de curtosis:  K 0 , la curva es igual que la normal, se llama Mesocúrtica  K 0 , la curva es más puntiaguda que la normal se llama Leptocúrtica  K 0 , la curva es más aplastada que la normal, se llama Platicúrtica
  • 79.
    CLETO DE LATORRE DUEÑAS 79
  • 80.
    80 ESTADISTICA EJERCICIOS DESARROLLADOS 1. La siguiente tabla muestra los coeficientes de inteligencia de 480 niños. C.I 70 74 78 82 86 90 94 98 102 106 110 114 118 122 126 fi 4 9 16 28 45 66 85 72 54 38 27 18 11 5 2 Calcule: a) El C.I. medio de los niños. b) Su desviación típica. c) Si una madre afirma que exactamente la mitad de los niños del colegio tienen un C.I. superior al de su hijo, ¿qué C.I. tiene el niño? d) Supongamos que se quieren hacer estudios sobre el proceso de aprendizaje de los niños con mayor C.I., pero que el psicólogo solo puede atender al 15% de los niños del centro. ¿Qué C.I. deberá tener un niño como mínimo para ser considerado dentro de ese grupo de elegidos? e) Se van a preparar unas clases de apoyo, para un 25% de los niños del centro, precisamente para aquellos que tengan menor C.I. ¿Hasta que niños de qué C.I. deberemos considerar en estas clases? Solución: La variable de estudio es el cociente intelectual (X) xi fi fixi fixi2 Fi Hi 70 4 280 19600 4 0.0083 74 9 666 49284 13 0.0271 78 16 1248 97344 29 0.0604 82 28 2296 188272 57 0.1188 86 45 3870 332820 102 0.2125 90 66 5940 534600 168 0.35 94 85 7990 751060 253 0.5271 98 72 7056 691488 325 0.6771 102 54 5508 561816 379 0.7896 106 38 4028 426968 417 0.8688 110 27 2970 326700 444 0.925 114 18 2052 233928 462 0.9625
  • 81.
    CLETO DE LATORRE DUEÑAS 81 118 11 1298 153164 473 0.9854 122 5 610 74420 478 0.9958 126 2 252 31752 480 1 1470 n=480 46064 4473216 a) Media f 1x1 f 2 x2 ..... fkxk 46064 x 95.96 n 480 b) Varianza y desviación. n n 2 xi x fi fi xi2 4473216 2 S2 i 1 i 1 x2 95.96 110.88 n n 480 s 110.88 10.52 c) Mediana. n=480 ( Par) xn xn x 480 x 480 2 2 1 2 2 1 x 240 x 241 94 94 Me 94 2 2 2 2 d) Percentil 85 P 106 85 e) Percentil 25 P25 90 2. Un centro educativo particular requiere los servicios de un Profesor. De los expedientes presentados, se han seleccionado 2 candidatos: A y B, los cuales reúnen los requisitos mínimos requeridos. Para decidir cual de los 2 se va a contratar, los miembros del Jurado deciden tomar 7 pruebas a cada uno de ellos. Los resultados se dan a continuación:
  • 82.
    82 ESTADISTICA Candidato Prueba 1 2 3 4 5 6 7 A 57 55 54 52 62 55 59 B 80 40 62 72 46 80 40 a) Halle e interprete la media, mediana y moda de los dos candidatos. b) Estadísticamente ¿Cuál de los candidatos debe ser contratado? Fundamente su respuesta. Solución: XA XB XA2 xB2 57 80 3249 6400 55 40 3025 1600 54 62 2916 3844 52 72 2704 5184 62 46 3844 2116 55 80 3025 6400 59 40 3481 1600 394 420 22244 27144 a) Estadísticos de A. n xi x1 x 2 ..... xn i 1 394 xA 56.28 n n 7 MeA xn 1 , para n impar n=7 2 MeA xn 1 x7 1 x4 55 2 2 MoA 55
  • 83.
    CLETO DE LATORRE DUEÑAS 83 Estadísticos de B. n xi x1 x 2 ..... xn i 1 420 xB 60 n n 7 MeB xn 1 , para n impar n=7 2 MeB xn 1 x7 1 x4 62 2 2 MoB1 40 MoB 2 80 b) Calcular la varianza n n 2 xi x xi2 2 2 22244 SA i 1 i 1 xA (56.28) 2 10.27 n n 7 S 10.27 CVA 0.057 | XA | 56.28 n n 2 xi x xi2 2 2 27144 SB i 1 i 1 xB 602 277.7 n n 7 S 277.7 CVB 0.277 | XB | 60 La información se ilustra en el grafico siguiente.
  • 84.
    84 ESTADISTICA Boxplot of Puntaje vs Postulante 80 70 Puntaje 60 50 40 A B Postulante 3. En un examen de matemáticas los 30 alumnos de una clase han obtenido las puntuaciones recogidas en la siguiente tabla: Calificaciones Alumnos [0, 1> 2 [1, 2> 2 [2, 3> 3 [3, 4> 6 [4, 5> 7 [5, 6> 1 [6, 7> 1 [7, 8> 1 [8, 9> 1 a) Halla la media, varianza, la desviación típica y coeficiente de variación. b) Mediana c) Moda.
  • 85.
    CLETO DE LATORRE DUEÑAS 85 Solución: I fi mi mifi mi2fi Fi [0, 1> 2 0.5 1 0.5 2 [1, 2> 2 1.5 3 4.5 4 [2, 3> 3 2.5 7.5 18.75 7 [3, 4> 6 3.5 21 73.5 13 [4, 5> 7 4.5 31.5 141.75 20 [5, 6> 1 5.5 5.5 30.25 21 [6, 7> 1 6.5 6.5 42.25 22 [7, 8> 1 7.5 7.5 56.25 23 8, 9 1 8.5 8.5 72.25 24 Total 24 40.5 92 440 a) Media, varianza, desviación y coeficiente de variación. Media. fi mi 92 x 3.83 n 24 Varianza. mi2 fi 440 S2 x2 3.83 3.66 n 24 Desviación. s 3.66 1.91 Coeficiente de Variación. S 1.91 CV 0.498 |X| 3.83
  • 86.
    86 ESTADISTICA Mediana 12 7 Me 3 *1 3.833 6 Moda 1 Mo Li A 1 2 1 7 6 1 2 7 1 6 1 Mo 4 *1 4.14 1 6 4. En una institución educativa, se ha medido el nivel de depresión que presentan los adolescentes en una escala de 0- 20, obteniendo los siguientes resultado. Nivel de Nro de depresión adolescentes. [ 0-5 > 10 [ 5-10 > 15 [ 10-13 > 25 [13-18 > 8 [ 18-20 2 a) Calcule la media, varianza y la desviación. b) Determine la mediana y la moda c) Determine e interprete Q1, Q3, P10 y P90 d) Coeficiente de curtosis y de asimetría.
  • 87.
    CLETO DE LATORRE DUEÑAS 87 Solución: I fi. Fi mi mifi mi2fi [ 0-5 > 10 10 2.5 25 62.5 [ 5-10 > 15 25 7.5 112.5 843.75 [ 10-13 > 25 50 11.5 287.5 3306.25 [13-18 > 8 58 15.5 124 1922 [ 18-20 2 60 19 38 722 60 56 587 6856.5 a) Media y varianza Media. fi mi 587 x 9.78 n 60 Varianza. mi2 fi 6856.5 S2 x2 9.782 18.63 n 60 Desviación. s 18.63 4.31 b) Mediana y moda Mediana n Fk 1 Me Li 2 A fK n 60 Determinamos 30 2 2
  • 88.
    88 ESTADISTICA n Fk 2 1 30 25 Me Li A 10 3 10.6 fK 25 Moda 1 Mo Li A 1 2 1 25 15 10 2 25 8 17 1 10 Mo Li A 10 3 11.11 1 2 10 17 c) Determine e interprete Q1, Q3, P10 y P90  Para obtener los cuarteles se tiene la relación. i.n Fk 1 Qi Li 4 A fK Cuartil 1 1.n Fk 4 1 15 10 Q1 Li A 5 5 6.67 fK 15 El 25% de los adolescentes presentan niveles de depresión menores a 6.67
  • 89.
    CLETO DE LATORRE DUEÑAS 89 Cuartil 3 3.n Fk 4 1 45 25 Q3 Li A 10 3 12.4 fK 25 El nivel de depresión máximo del 75% de los adolescentes es de 12.4.  Para obtener los percentiles se tiene la relación. i.n Fk 1 Pi Li 100 A fK Percentil 10 10.n Fk 100 1 6 0 P10 Li A 0 5 3 fK 10 El 10% de los adolescentes tienen niveles de depresión entre 0 a 3 Percentil 90 90.n Fk 100 1 54 50 P90 Li A 13 5 15.5 fK 8 d) Coeficiente de Asimetría. x Mo 9.78 11.11 Ap -0.308 s 4.31
  • 90.
    90 ESTADISTICA Puesto que Ap < 0  la distribución es asimétrica negativa o a izquierdas (desplazada hacia la izquierda). Coeficiente de curtosis de fisher. Q3 Q1 12.4 6.67 K 0.5 0.5 -0.0416 P90 P10 15.5 3 Si k 0 , entonces la distribución es platicúrtica.
  • 91.
    CLETO DE LATORRE DUEÑAS 91 EJERCICIOS PROPUESTOS. 1. Se desea evaluar el efecto de un programa de intervención educativa en el nivel de conservación del medio ambiente, para este fin se aplico un instrumento antes y después de la aplicación del programa, obteniéndose los siguientes resultados: Estudiante 1 2 3 4 5 6 7 8 9 Antes 10 13 11 09 13 12 11 14 08 Después 13 18 14 15 13 17 13 16 12 Cuál es su conclusión del estudio. 2. Se realiza un experimento en una I.E, con la finalidad de determinar el efecto de dos métodos de enseñanza (Tradicional y ABP) en el rendimiento académico. Tradicional 12 14 04 09 13 16 13 05 15 ABP 14 13 12 15 15 14 16 14 16 Cuál de los métodos presenta mayor confianza. Fundamente su respesta 3. En 20 Unidades de gestión escolar, seleccionados aleatoriamente se contabilizó el número de libreta de notas, incorrectamente llenadas durante un año escolar, obteniéndose los siguientes resultados: 3 4 2 3 6 1 4 3 2 6 4 2 4 1 4 3 4 4 4 3 a) Calcule e interprete la media, mediana y moda b) ¿Que tipo de distribución es? 4. Las puntuaciones de un test de inteligencia de 198 Profesores dieron los siguientes resultados: Puntuación [30,40] (40,50] (50,60] (60,70] (70,80] (80,90] Nº de 6 17 76 68 22 9 personas a) Calcula la media, la mediana y la moda. b) Calcule la varianza, desviación y el coeficiente de variación c) Calcule el coeficiente de curtosis y de asimetría.
  • 92.
    92 ESTADISTICA 5. El Director de un centro educativo esta interesado en firmar un contrato de larga duración para el aprovisionamiento de suministros. El encargado de realizar la operación desea llevarla a cabo con la empresa que menos se retrase en proporcionar dichos suministros por termino medio. Tras un periodo de prueba con dos compañías, se han obtenido los siguientes datos referidos a retrasos en suministros, medidos en hora Empresa 1 Empresa 2 110 15 147 93 104 95 108 80 41 3 325 19 93 115 23 Asumiendo que el periodo de prueba es representativo del futuro desempeño de la actividad ¿por que empresa debería decidirse? 6. Se mide la altura en metros de 110 estudiantes, obteniendo la siguiente tabla: Altura Nº de jóvenes [1,55-1,60) 18 [1,60-1,70) 31 [1,70-1,80) 24 [1,80-1,90) 20 [1,90-2,00) 17 a) Construye la tabla de frecuencias. b) Calcule Q1, D7 y P40 , e interprete dichos valores. c) Se consideran “bajos” aquellos alumnos cuya estatura está sobre el percentil 30. ¿Cuál es la altura máxima que pueden alcanzar? d) Se consideran “altos” aquellos alumnos cuya altura está sobre el percentil 82. ¿Cuál será su altura mínima? e) ¿En qué percentil está un joven cuya altura es 1,78 m.? 7. Se registra el tiempo en minutos que utilizan 30 alumnos para ejecutar una tarea, resultando los siguientes:
  • 93.
    CLETO DE LATORRE DUEÑAS 93 19,15,26,17,11,23,26,22,18,20,11,18,23,25,20,16,9,22,12,23,13,18,12,13,15,20, 21,15,18,22 a) Construir una distribución de frecuencias de 5 intervalos, de amplitud constante. b) Calcule el tiempo debajo del cual se encuentran el 25% de las tareas. 8. En un examen final de estadística, la puntuación media de un grupo de 150 estudiantes fue de 78 y la desviación típica fue de 8 puntos. En álgebra, sin embargo, la media final del grupo fue de 73 y la desviación típica 7,6. ¿En qué asignatura hubo mayor dispersión absoluta y en cuál mayor dispersión relativa? 9. En un estudio se anotó el número de palabras leídas en 15 segundos por un grupo de 120 sujetos que habían recibido previamente un adiestramiento y 120 individuos que no habían recibido dicha instrucción. Los resultados fueron los siguientes: Número de palabras leídas No instruidos Instruidos 25 56 1 26 24 9 27 16 21 28 12 29 29 10 28 30 2 32 Compare la variabilidad en ambos grupos. 10. En un examen final de microeconomía, la puntuación media de 150 estudiantes fue 12,8 puntos y la desviación típica 2,3 puntos. En estadística el promedio fue 10,2 puntos y la desviación típica 1,6 puntos. a) En qué materia hay mayor dispersión relativa? b) ¿En qué materia destaca más un alumno que obtuvo 14 puntos en ambas? 11. La siguiente tabla representa los resultados en la prueba de aptitud académica de un grupo de 1000 jóvenes que aspiran ingresar a cierta universidad:
  • 94.
    94 ESTADISTICA Calificación 300-350) 350-400) 400-450) 450-500) 500-550) 550-600) %Hi 6 28 45 63 95 100 Hallar: a) Porcentaje de aspirantes cuya calificación es superior a 420 puntos pero inferior a 510 b) N° de estudiantes que obtuvieron 500 puntos o más c) La mayor nota del 30% que obtuvo la nota más baja d) Porcentaje que obtuvo más de 480 puntos e) Coeficiente de asimetría de Pearson e interprete f) La curtosis e interprete. 12. Un Especialista de educación desea comparar el rendimiento académico generado por dos métodos de enseñanza, A y B. El especialista piensa que el método de enseñanza A presenta mayor eficiencia que el método B. Para comprobar esta sospecha se toma una muestra aleatorias de 10 alumnos que utilizaron el método de enseñanza A y de 10 con el método B, obteniéndose los siguientes rendimientos en una escala vigesimal : Método A 14 15 13 11 10 17 18 16 15 05 Método B 12 13 13 14 13 14 14 12 15 14 a) Estadísticamente. Cuál de los métodos es más recomendable para el especialista que está interesado en: Mayor rendimiento Académico. Mayor nivel de confianza. Fundamente su respuesta. b) Cuál es su conclusión respecto de la afirmación del especialista. 13. Se han tabulado el nivel de gestión de los directores de las instituciones educativas, obteniendo los siguientes resultados. Nivel de gestión 0-20 20-40 40-60 60-80 80-100 Frecuencia 6 12 14 9 3 Con la finalidad de una capacitación de los directores, el ministerio de educación agrupara los directores según sus niveles de gestión en tres categorías: El 25% de los directores con menores niveles de gestión en la
  • 95.
    CLETO DE LATORRE DUEÑAS 95 categoría A, el 30% de los que presentan mayores niveles de gestión en la categoría C y el resto en la categoría B. Cuáles son los limites para cada categoría. 14. En cierta evaluación para optar por una beca, Juan Perez obtuvo una calificación de 310 puntos en habilidad verbal y 218 puntos en habilidad numérica. Los parámetros de c/u son: Habilidad verbal: x 245 s2 900 Habilidad numérica: x 150 s 24 a. ¿En cuál de las dos pruebas obtuvo mejor calificación? b. ¿En cuál de las dos pruebas el grupo es más homogéneo? 15. Una gran compañía llevó a cabo un estudio para ubicar las variables que pudieran determinar el sueldo de un egresado universitario dos años después de haberse graduado en un área Administrativa. Los datos recogidos se presentan en la siguiente tabla: (La columna del sueldo es en cientos de miles de soles.) Edad Sexo E. Civil Sueldo 1 24 F C 6,75 2 25 M C 6,90 3 26 M S 6,90 4 27 F C 6,80 5 27 M D 7,10 6 27 F C 6,50 7 27 M S 7,25 8 25 F C 6,80 9 23 M S 6,75 10 24 M S 6,80 11 26 F C 6,75 12 29 F D 7,00 13 25 M C 7,15 14 31 F D 7,50
  • 96.
    96 ESTADISTICA 15 26 M S 6,20 16 24 F D 7,40 17 26 F C 6,70 18 28 F S 6,95 19 25 M C 6,95 20 29 M C 7,10 a) Utilice la técnica de estadística descriptiva más apropiada para analizar cada variable individualmente. Interprete lo obtenido. b) Realice diagramas de cajas que le ayuden a visualizar como influye cada una de las variables en el sueldo que gana el individuo.
  • 97.
    CLETO DE LATORRE DUEÑAS 97 CAPITULO IV DISTRIBUCIONES BIDIMENSIONALES Si resumir la información de una variable es de por si interesante, en investigación lo es mucho más el poner de manifiesto la posible relación entre dos de ellas. El análisis de la relación de dos variables, X e Y, depende del tipo de variables y Según sean los tipos de cada una de ellas se usa técnicas estadísticas diferentes. 4.1 CUALITATIVA-CUALITATIVA. Cuando las variables de estudio son cualitativas (categóricas) o cuantitativas discretas con poca modalidades, se suele presentar las observaciones de las variables X e Y, mediante pares ordenados (xi, yi), esta forma de presentaciones se denomina tablas de contingencia. Las tablas de contingencia son de doble entrada organizada por filas y columnas y donde se presenta la distribución de frecuencias conjuntas de las dos variables. Dada una variable bidimensional ( X, Y ), consideramos una muestra de tamaño n en la que X toma k valores distintos, x1, . . . , xk, e Y toma l valores distintos, y1, . . , yl, obtenemos, por tanto, observaciones del tipo (xi, yj). La frecuencia absoluta de un valor (xi, yj) es el número de veces que dicho valor aparece en la muestra. Se representa por fij , se cumple k l fij n i 1 j 1
  • 98.
    98 ESTADISTICA La frecuencia relativa de un valor (xi , yj) es el cociente de la frecuencia absoluta fij entre el tamaño de la muestra n, se representa por hij k l fij hij hij 1 n , se cumple: i 1 j 1 Distribuciones marginales Nos indican el comportamiento aislado de cada una de las variables X e Y que dan lugar a una variable bidimensional. Frecuencia absoluta marginal de xi, l fi. f i1 f i 2  f il fij j 1 Frecuencia relativa marginal de xi, fi . hi . n Frecuencia absoluta marginal de yj, k f. j f1 j f 2 j  f kj fij i 1 Frecuencia relativa marginal de yj, f. j h. j n Una tabla de doble entrada de una variable bidimensional sigue la estructura que se presenta a continuación, en la que tienen cabida las frecuencias marginales (representadas en la última fila y última columna). Puede ser de frecuencias absolutas o relativas.
  • 99.
    CLETO DE LATORRE DUEÑAS 99 Y X y1 y2 ..... yl ni. x1 f11 f12 ..... f1l f1. x2 F21 f22 ..... f2l f2. .. .. .. ..... .. .. xk fk1 fk2 ..... fkl fk. n.j f.1 f.2 ..... f.l n Ejemplo 1: En una encuesta aplicada a los profesores egresados de una Universidad respecto a la comprensión lectora y hábitos de estudio se obtuvo los siguientes resultados. Comprensión lectora Habito de estudio Deficitario Dependiente Independiente Bajo 12 3 0 Intermedio. 1 13 0 Alto. 3 3 5 Interprete la información. Solución. Compresión Lectora Habitos de Estudio Deficitario Dependiente Independiente Total Bajo Frecuencia 12 3 0 15 Porcentaje 80.0% 20.0% .0% 100% Intermedio Frecuencia 1 13 0 14 Porcentaje 7.1% 92.9% .0% 100% Alto Frecuencia 3 3 5 11 Porcentaje 27.3% 27.3% 45.5% 100% Total Frecuencia 16 19 5 40 Porcentaje 40.0% 47.5% 12.5% 100% Chi-cuadrado=32,805 P-valor=0,000
  • 100.
    100 ESTADISTICA Del 100% de estudiantes con el hábito de estudio bajo, 80% de estos presentan un deficitario nivel de comprensión lectora, en cambio del 100% de estudiantes con un hábito de estudio intermedio, 92.9% de ellos presenta una comprensión lectora dependiente y del 100% de estudiantes con un habito de estudio alto, el 45.5% presenta una comprensión lectora independiente. La información se muestra en el siguiente grafico: Com prension lectora 100 Deficitario 90 Dependiente 80 Independiente 70 Porcentaje 60 50 40 30 20 10 0 Bajo Intermedio Alto Habitos de estudio 4.2 CUALITATIVA-CUANTITATIVA. Supongamos que tenemos datos cuantitativos (numéricos) para varias cualitativas (categorías), por ejemplo en un experimento donde hacemos mediciones numéricas en dos o más grupos. En estos casos, lo que se realiza es un estudio descriptivo de la variable numérica en cada una de las muestras y se comparamos los resultados. Ejemplo 2: Un investigador esta analizando el efecto que tiene en el rendimiento académico el uso de tres métodos de enseñanza, para tal efecto solicito a 30 docentes para que participen en el estudio. En el cuadro siguiente se muestra el rendimiento promedio de los alumnos de cada Docente.
  • 101.
    CLETO DE LATORRE DUEÑAS 101 Método de enseñanza Nuevo Clásico Enfoque Ambos 8 15 13 9 16 12 10 13 17 13 16 9 14 17 10 5 16 11 12 14 13 11 13 8 9 16 9 7 17 10 a) Calcule el rendimiento promedio para cada método de enseñanza. b) Cual de los métodos, genera rendimientos más homogéneos. c) Represente la información mediante un grafico. SOLUCION: Método Mean S Variance CV Median Kurtosis Ambos 11.200 2.658 7.067 23.74 10.500 1.38 Clásico 9.800 2.781 7.733 28.38 9.500 -0.53 Nuevo enfoque 15.300 1.494 2.233 9.77 16.000 -0.99
  • 102.
    102 ESTADISTICA Boxplot of Rendimiento vs Metodo 17.5 15.0 Rendimiento 12.5 10.0 7.5 5.0 Ambos Clasico Nuevo enfoque Metodo 4.3 CUANTITATIVA-CUANTITATIVA. Análisis de dos variables cuantitativas y establecimiento de una relación entre ellas. La forma más sencilla de estudiar la posible asociación entre estas variables es el diagrama de dispersión (Nube de puntos). Si reconocemos una tendencia, entonces el interés ahora será el análisis de regresión. Media y varianza La información de las dos variables X e Y se puede resumir usando la media y la varianza como se muestra a continuación: Media de la variable X: fi xi x n Media de la variable Y: fi yi y n Varianza de la variable X:
  • 103.
    CLETO DE LATORRE DUEÑAS 103 2 fi xi2 2 s x x n Varianza de la variable Y: 2 fi yi2 2 sy y n La covarianza Es una medida de la asociación lineal existente entre dos variables. Resume la información contenida en el diagrama de dispersión. Presenta la siguiente expresión: fi xi yi cov( x, y) sxy x. y n Si la covarianza está muy próxima a cero, no existe relación entre las variables o si existe es marcadamente no lineal, si es positiva, hay asociación lineal positiva, y si es negativa, hay asociación lineal negativa. Sin embargo, como la covarianza depende de las unidades de medida de las variables, no nos permite cuantificar el grado de asociación lineal ni comparar la asociación existente entre distintos pares de variables. Para dar solución a este problema se obtiene el coeficiente de correlación. Correlación. Estudia la relación o dependencia que existe entre dos variables que intervienen en una distribución bidimensional. Coeficiente de correlación lineal. Es un número que mide el grado de dependencia entre las variables X e Y. Se mide mediante la siguiente fórmula:
  • 104.
    104 ESTADISTICA s xy r s x .s y Su valor está comprendido entre – 1 y 1. Si r = -1 ó r = 1 todos los valores de la variable bidimensional se encuentran situados sobre una recta. Si – 1< r < 0 se dice que las variables X e Y están también en dependencia aleatoria. La correlación es negativa. Si 0 < r < 1 la correlación es positiva. Las variables X e Y están también en dependencia aleatoria. La correlación es tanto más fuerte a medida que r se aproxima a –1 ó 1 y es tanto más débil a medida que se aproxima a 0. 4.3.1 Análisis de Regresión. Regresión: conjunto de técnicas que son usadas para establecer una relación entre una variable cuantitativa llamada variable dependiente y una o más variables independientes, llamadas predictoras. Estas también deberían ser cuantitativas, sin embargo algunas de ellas podrían ser cualitativas. Modelo de regresión. Ecuación que representa la relación entre las variables Y X Estimación de la línea de regresión usando Mínimos Cuadrados Minimizando el error cuadrático medio: n n 2 Q , e i ( yi xi )2 , se tiene: i 1 i 1 n n n n xi yi xi yi ˆ i 1 i 1 i 1 S xy n n S xx n xi2 ( xi ) 2 i 1 i 1
  • 105.
    CLETO DE LATORRE DUEÑAS 105 ˆ y ˆx La pendiente ˆ , indica el cambio promedio en la variable de respuesta cuando la variable predictora aumenta en una unidad adicional. El intercepto ˆ , indica el valor promedio de la variable de respuesta cuando la variable predictora vale 0. Sin embargo carece de interpretación práctica si es irrazonable pensar que el rango de valores de x incluye a cero. A partir de la recta ˆ Y ˆ ˆX podemos calcular los valores de y conocidos los de x. La fiabilidad que podemos conceder a los cálculos obtenidos viene dada por el coeficiente de correlación: si r es muy pequeño no tiene sentido realizar ningún tipo de estimaciones. Si r es próximo a – 1 ó 1, las estimaciones realizadas estarán cerca de los valores reales. Si r = 1 o r = -1, las estimaciones realizadas coincidirán con los valores reales. Ejemplo 3: Se aplicó un test para medir el conocimiento (X) y la aplicación (Y) de estratégicas cognitivas en el proceso de enseñanza en una escala de 0- 120. Los datos que se obtuvo fueron los siguientes:
  • 106.
    106 ESTADISTICA X Y 51.3 102.5 49.9 104.5 50 100.4 49.2 95.9 48.5 87 47.8 95 47.3 88.6 45.1 89.2 46.3 78.9 42.1 84.6 44.2 81.7 43.5 72.2 42.3 65.1 40.2 68.1 31.8 67.3 34 52.5 a) Trace un diagrama de dispersión. b) Ajuste una recta de regresión. c) Calcule la correlación lineal e interprete dicho valor. Solución: 110 100 90 80 Y 70 60 50 30 35 40 45 50 X
  • 107.
    CLETO DE LATORRE DUEÑAS 107 X Y X.Y X2 Y2 51.3 102.5 5258.25 2631.69 10506.25 49.9 104.5 5214.55 2490.01 10920.25 50 100.4 5020 2500 10080.16 49.2 95.9 4718.28 2420.64 9196.81 48.5 87 4219.5 2352.25 7569 47.8 95 4541 2284.84 9025 47.3 88.6 4190.78 2237.29 7849.96 45.1 89.2 4022.92 2034.01 7956.64 46.3 78.9 3653.07 2143.69 6225.21 42.1 84.6 3561.66 1772.41 7157.16 44.2 81.7 3611.14 1953.64 6674.89 43.5 72.2 3140.7 1892.25 5212.84 42.3 65.1 2753.73 1789.29 4238.01 40.2 68.1 2737.62 1616.04 4637.61 31.8 67.3 2140.14 1011.24 4529.29 34 52.5 1785 1156 2756.25 713.5 1333.5 60568.34 32285.29 114535.33 xi 713.5 x 44.59375 ; n 16 yi 1333.5 y 83.34375 ; n 16 2 xi2 2 32285.29 s x x 44.593752 29.228 n 16 2 yi2 2 114535.33 s y y 83.343752 212.277 ; n 16 xi yi 60568.34 sxy x. y (44.59375).(83.34375) 68.9 n 16
  • 108.
    108 ESTADISTICA Recta de regresión n n n n xi yi xi yi ˆ i 1 i 1 i 1 S xy 68.9 n n 2.357 S x2 29.228 n xi2 ( xi )2 i 1 i 1 ˆ y ˆx 83.34375 2.357(44.59375) 21.76 ˆ Y ˆ ˆX 21.76 2.357 X sxy 68.9 r 0.8747 sx .s y 29.228. 212.277 Ejemplo 4: Las calificaciones de 40 alumnos en psicología evolutiva y en estadística han sido las siguientes: X Y Número calif. en psicol. calif. en estad. de alumnos. 3 2 4 4 5 6 5 5 12 6 6 4 6 7 5 7 6 4 7 7 2 8 9 1 10 10 2 a) Determina la media y varianza de X e Y. b) Calcule la covarianza de X e Y c) Calcule e interprete el coeficiente de correlaciones.
  • 109.
    CLETO DE LATORRE DUEÑAS 109 Solución: Disponemos los datos de la siguiente forma: xi yi ni nixi niyi nixi2 niyi2 nixiyi 3 2 4 12 8 36 16 24 4 5 6 24 30 96 150 120 5 5 12 60 60 300 300 300 6 6 4 24 24 144 144 144 6 7 5 30 35 180 245 210 7 6 4 28 24 196 144 168 7 7 2 14 14 98 98 98 8 9 1 8 9 64 81 72 10 10 2 20 20 200 200 200 40 220 224 1314 1378 1336 ni xi 220 ni yi 224 x 5,5 ; y 5,6 N 40 N 40 2 ni xi2 2 1314 s x x (5,6) 2 32,85 30,25 2,6 N 40 2 sx sx 2,6 1,61 2 ni yi2 2 1378 s y y (5,6) 2 3,09 ; N 40 sy 3,09 1,75 ni xi yi 1336 s xy x.y (5,3).(5,6) 33,4 30,8 2,6 N 40 s xy El coeficiente de correlación: r s x .s y 2,6 r 0,92 (1,61).(1,75) La correlación es positiva, es decir, a medida que aumenta la nota de estadística aumenta también la nota en psicología. Su valor está próximo a 1 lo que indica que se trata de una correlación fuerte, las estimaciones realizadas están cerca de los valores reales.
  • 110.
    110 ESTADISTICA EJERCICIOS PROPUESTOS. 1. De la evaluación censal, desarrollado a los docentes de la ciudad de Cusco, se registro la información del conocimiento y aplicación de metodologías de enseñanzas de 10 Docentes. Docentes Conocimiento Aplicación. 1 16 16,5 2 14 14,5 3 18 17 4 15 15 5 13,5 14 6 17 18 7 15 17 8 10 10 9 15 16 10 14 15 a) Calcula la covarianza, las varianzas y el coeficiente de correlación. b) ¿Existe correlación entre las dos variables? c) Calcula la recta de regresión. ¿Interprete adecuadamente los resultados? 2. En una encuesta realizada a los alumnos de los centros educativos de la ciudad de Cusco, respecto al conocimiento de los docentes de las materias que regenta, proporciona la siguiente información: Recuento El profesor de la asignatura conoce el curso Regular Bien Muy Bien Total Area Comunicacion 5 12 7 24 Matematica 84 16 1 101 Biologia 30 10 10 50 Educacion fisica 17 19 32 68 Total 70 138 35 243
  • 111.
    CLETO DE LATORRE DUEÑAS 111 a) Analice la información de forma adecuada b) Interprete los resultados obtenidos y redacte algunas conclusiones. 3. Un especialista en Educación, desea analizar si la metodología de los Docentes esta relacionado con su preparación académica, para tal efecto aplica un test, los resultados se muestran a continuación. Preparación Académica Metodología 50 50 75 66 50 75 75 25 50 66 58 58 66 66 83 41 83 83 66 41 50 75 75 75 75 41 75 66 75 66 a) Trace el diagrama de dispersión ¿Que tipo de relación se observa? b) Ajuste una recta de regresión c) Calcula el coeficiente de correlación. ¿Interprete adecuadamente dicho resultado? 4. La siguiente tabla muestra las distribuciones de frecuencias de las puntuaciones finales de 100 estudiantes en matemáticas y física:
  • 112.
    112 ESTADISTICA Física Matemáticas 40-49 50-59 60-69 70-79 80-89 90-99 90-99 2 4 4 80-89 1 4 6 5 70-79 5 10 8 1 60-69 1 4 9 5 2 50-59 3 6 6 2 40-49 3 5 4 a) Número de alumnos que recibieron puntuación entre 70 y 79 en matemáticas y entre 80 y 89 en física. b) Porcentaje de estudiantes con puntuación en matemáticas inferior a 70. c) Porcentaje de que un estudiante obtenga 70 ó más puntos en física y menos de 80 en matemáticas. d) Porcentaje de estudiantes que aprobó al menos una de las dos asignaturas, suponiendo 60 la puntuación mínima para aprobar. e) Porcentaje de que un estudiante tenga aprobadas las dos asignaturas. f) Porcentaje de que un estudiante, que sabemos que tiene aprobada las matemáticas, tenga aprobada también física. g) Porcentaje de estudiantes que tienen aprobada matemáticas de entre los que tienen aprobada física. h) Sobre qué puntuación en física tendrá un estudiante del que sabemos que ha obtenido 86 puntos en matemáticas. i) Da una medida de la exactitud del resultado obtenido en h). 5. Se ha recogidos datos sobre la puntuaciones que en una encuesta dieron los alumnos de cuatro grupos a un profesor. La información se muestra en el cuadro siguiente:
  • 113.
    CLETO DE LATORRE DUEÑAS 113 NOTA GRUPO A B C D 2 20 0 10 30 4 30 30 20 30 6 30 40 40 20 8 10 20 10 20 10 10 10 20 0 a) En que grupo tuvo el profesor mejor calificación media. b) En cual de los grupos hubo menos divergencia de opiniones. c) Interprete adecuadamente la tabla. 6. La tabla siguiente muestra el CI (coeficiente intelectual) de un grupo de personas y su capacidad lectora (HL). CI HL 109 31,8 138 24,5 86 11,8 153 18,8 156 17,3 40 11,0 70 12,2 126 20,6 68 10,8 99 5,3 112 29,3 138 8,0 103 35,8 127 19,6 63 21,4 a) Trace una diagrama de dispersión b) Ajuste los datos a una recta de regresión. c) Predecir la capacidad lectora de una persona con cociente intelectual de 120 d) Calcule la correlación entre ambas variables. interprete dicho valor.
  • 114.
    114 ESTADISTICA CAPITULO V PROBABILIDADES El Cálculo de Probabilidades se ocupa de estudiar ciertos experimentos que se denominan aleatorios, cuya característica fundamental es la incertidumbre del resultado, esto significa que es imposible predecir los resultados porque hay más de uno posible. En nuestra vida cotidiana asociamos usualmente el concepto de probabilidad a su calificativo probable, considerando probable a aquellos eventos en los que tenemos alto grado de creencia en su ocurrencia. En esta línea probabilidad es un concepto asociado a una medida del azar. El objetivo de la probabilidad es cuantificar las posibilidades que tengan ciertos eventos inciertos. 5.1 EXPERIMENTO ALEATORIO. Es una acción que da lugar a resultados identificables y se caracteriza por:  Todos los posibles resultados son conocidos previamente.  Repeticiones en situaciones análogas pueden dar resultados diferentes.  No se puede predecir el resultado del mismo antes de realizarlo, es decir, no se sabe cuál de los posibles resultados aparecerá al final. Los experimentos pueden ser aleatorios o deterministas. Aleatorio significa relativo a todo acontecimiento incierto, por depender de la suerte o del azar, mientras que los deterministas son aquellos que se caracterizan por el hecho de que las mismas causas producen los mismos efectos.
  • 115.
    CLETO DE LATORRE DUEÑAS 115 Espacio muestral. Es el conjunto de todos los resultados posibles del experimento y se denota por . A cada elemento de se denomina punto muestral w , es decir: w / w es un punto muestral . Evento o Suceso Aleatorio. Un evento aleatorio es un subconjunto del espacio muestral y se denota con letras mayúsculas.  El evento seguro , es aquel que ocurre siempre al realizar el experimento.  El evento imposible , es aquel que no ocurre nunca.  Los eventos elementales solo tienen un punto muestral.  El evento complementario Ac , esta dado por todo los puntos muestrales que no están en A 5.2 OPERACIONES DE EVENTOS. Unión de eventos: Dados dos eventos A y B de un mismo espacio muestral su unión se representa por A B y es el evento que contiene los elementos que están en A o en B o en ambos. El evento A B ocurre si al menos uno de los dos eventos ocurre. Intersección de eventos: Dados dos eventos A y B de un mismo espacio muestral su intersección se representa por A B y es el evento que contiene los elementos que están en A y B al mismo tiempo. El evento A B ocurre cuando ambos eventos ocurren simultáneamente. Evento Complemento: El complemento de un evento A se representa por Ac y es el evento que contiene todos los elementos que no están en A. El evento Ac ocurre si A no ocurre.
  • 116.
    116 ESTADISTICA 5.3 DEFINICIÓN CLÁSICA DE PROBABILIDAD: La probabilidad de un suceso A se calcula como el número de casos favorables al suceso A, dividido por el número de casos posibles del experimento aleatorio. casos favorables P( A) casos posibles 5.4 DEFINICIÓN AXIOMÁTICA DE PROBABILIDAD. La probabilidad es una función que asigna a cada suceso A un número real que varia entre 0 a 1. P: y que verifica: A P(A) i) 0 P( A) 1 A ii) P 1 iii) Si A y B son sucesos incompatibles, P A B P A P B Como consecuencia de estos tres axiomas, se verifican además las siguientes propiedades: iv) P( Ac ) 1 P A v) P( ) 0 vi) Si A B, P( A) P( B) vii) P( A B) P( A) P( A B) , A,B viii) Si A1, A2, ...... , An son incompatibles dos a dos, entonces P A1 A2 ... An P A1 P A2 ... P An ix) Si A, B son dos sucesos cualesquiera, entonces P A B P A P B P A B x) Si A, B son dos sucesos cualesquiera, entonces
  • 117.
    CLETO DE LATORRE DUEÑAS 117 P( A) P A Bc P A B 5.5 PROBABILIDAD CONDICIONADA. Queremos estudiar como cambia la probabilidad de ocurrencia de A cuando se conoce que otro evento B ha ocurrido. En este caso habrá que redefinir el espacio muestral considerando solamente los elementos de B como posibles resultados. La probabilidad de A condicionada a B, esta definido como la probabilidad de que ocurra A sabiendo que ha ocurrido B, y se define mediante: P( A B) P( A | B) , P(B) 0. P( B) En consecuencia, P(A B) =P( A) P( B ) A Independencia. Dos sucesos A, B se dicen independientes si: P( A) P( A | B) , o bien P( B) P( B | A) Es decir, se cumplirá que: P( A B) P( B).P( A) Si A y B son independientes, entonces A y BC son independientes, AC y B son independientes, y AC y BC son independientes. Observación. Decimos que n sucesos A1, A2, An son independientes si para cada par (Ai, Aj), P( Ai Aj ) P( Ai ) P( Aj ) si i j , si para cada trío (Ai, Aj, Ak) P( Ai Aj Ak ) P( Ai ) P( Aj ) P( Ak ) Si i j k y así sucesivamente. En general,
  • 118.
    118 ESTADISTICA P( A1 A2  An) P( A1) P( A2) P( An) Teorema de la probabilidad compuesta. Dados n sucesos A1, A2, ......., An se verifica: P( A1 A2  An) P( A1)P( A2 | A1)P( A3 | A1 A2)P( An | A1 A2  An 1) 5.6 TEOREMA DE LA PROBABILIDAD TOTAL Si suponemos que los eventos A1, A2, A3, ...., An, forman una partición de un espacio muestral ; esto es, que los eventos Ai son mutuamente excluyentes y su unión es . E A1 A2 A3 …… An La partición A1, A2, ......, An , cumple con las siguientes propiedades: i) A1  A2 i j ( disjuntos dos a dos) n ii)  Ai i 1 iii) P( Ai ) 0 , i 1,....n . La probabilidad de un suceso B cualquiera es: P( B) P( A1 ) P( B ) P( A2 ) P( B ) ....... P( An ) P( B ) A1 A2 An
  • 119.
    CLETO DE LATORRE DUEÑAS 119 n P( B) P( Ai) P( B | Ai) i 1 5.7 TEOREMA DE BAYES El procedimiento que se utiliza para encontrar probabilidades posteriores, a partir de probabilidades previas, se llama regla Bayesiana. Las probabilidades a priori o previas se conocen antes de obtener información alguna del experimento en cuestión. Las probabilidades a posteriori se determinan después de conocer los resultados del experimento. El teorema de Bayes consiste en un método para encontrar la probabilidad de una causa específica cuando se observa un efecto particular. Esto es, si el evento B ha ocurrido, ¿Cuál es la probabilidad de que fue generado por el evento A1 (que es una causa posible ) o por el A2 (otra causa posible)?. Si A1, A2, ......., An es una partición del espacio muestral tal que p( Ai ) 0 , i 1,....n , entonces para un suceso B cualquiera se verifica: P( Ai B) P( Ai ) P( B | Ai ) P( Ai | B) n , i = 1, ...., n. P( B) P( Ai ) P( B | Ai) i 1 P( Ai ) P( B | Ai) P( Ai | B) P( A1 ) P( B ) P( A2 ) P( B ) ....... P( An ) P( B ) A1 A2 An
  • 120.
    120 ESTADISTICA EJERCICIOS DESARROLLADOS. 1) Un director de una institución educativa mixta, tiene 3 vacantes para el quinto año de secundaria. a) Cual es el espacio muestral. b) Si el interés del director es matricular, exactamente dos estudiantes de sexo masculino ¿Cual es la probabilidad asociado a este evento? c) Cual es la probabilidad de que el primer estudiante aceptado sea de sexo masculino y el último de sexo femenino. d) Cual es la probabilidad de admitir por lo menos un estudiante de sexo masculino e) Cual es la probabilidad de admitir a lo más 1 estudiantes de sexo femenino. Solución. a) M1M2 F3 , M1M2 M3 , M1F2 F3 , M1F2 M3 , F1M2M3 , F1M2 F3 , F1F2M3 , F1F2 F3 b) Sea el evento A: Estudiantes de sexo masculino A M1M 2 F3 , M1F2 M3 , F1M 2 M3 n( A) 3 p( A) n( ) 8 c) Sea el evento B: Primer estudiante aceptado de sexo masculino y el último de sexo femenino. C M1M2 F3 , M1F2 F3 n(C ) 2 p(C ) n( ) 8 d) Sea el evento D: Se admite por lo menos un estudiante de sexo masculino. D M1M2 F3 , M1M2 M3 , M1F2 F3 , M1F2 M3 , F1M2 M3 , F1M2 F3 , F1F2 M3 n( D ) 7 p( D) n( ) 8 e) Sea el evento E: Se admite a lo más un estudiante de sexo femenino. E M1M2 F3 , M1M2 M3 , M1F2 M3 , F1M2 M3 n( E ) 4 1 p( E ) n( ) 8 2
  • 121.
    CLETO DE LATORRE DUEÑAS 121 2) La biblioteca municipal de una provincia compra libros de 3 editoriales: el 45% de los libros son compradas del editorial A resultando defectuoso el 1%, la editorial B suministra el 30% de los libros y de ellas es defectuoso el 2%. Las restantes son adquiridas de la editorial C, siendo defectuoso el 3% de las mismas. En un control de recepción de libros se selecciona un libro al azar cual es la probabilidad: a) De que sea defectuosa. b) De que sea defectuosa y haya sido adquirido de la editorial B c) Calcular la probabilidad de que el libro haya sido adquirido de la editorial C, dado que es defectuoso. Solución Defectuoso 1% 99% Bueno A 40% 2% Defectuoso 98% Libro 30% B Bueno 3% Defectuoso 30% C 97% Bueno Sean los eventos. A: Libro adquirido de la editorial A, B: Libro adquirido de la editorial B. C: Libro adquirido de la editorial C, D: Libro defectuoso, E: libro Bueno. a) p( D) p( A) p( D ) p( B) p( D ) p(C ) p( D ) A B C p( D) 0.4*(0.01) 0.3*(0.02) 0.3*(0.03) b) p(B D) =p( B) p( D ) B p(B D) =0.3*(0.02)
  • 122.
    122 ESTADISTICA p(C D) p(C ) p( D | C ) c) p(C | D) p( B) p( A) p( D | A) p( B) p( D | B) p(C ) p( D | C ) 0.3*(0.03) p(C | D) 0.4*(0.01) 0.3*(0.02) 0.3*(0.03) 3) En un estante hay 7 libros de historia y 3 de matemáticas. De los libros de historia, tres están empastados de amarillo y el resto de rojo; mientras que de los libros de matemáticas, uno está empastado en amarillo y dos en rojo. Suponiendo que del estante se elige un libro al azar, ¿cuál es la probabilidad de que sea de : a) Historia b) Color amarillo. c) matemáticas y de color rojo d) matemáticas o de color rojo d) Historia, dado que es de color amarillo. Solución. Historia Matemática Total Amarillo 3 1 4 Rojo 4 2 6 Total 7 3 10 Sean los eventos: A: Libro de matemáticas. B: Libro de historia. C: Color amarillo, D: Color rojo. n( B ) 7 a) p( B) 0.7 n( ) 10 n(C ) 6 b) p(C ) 0.6 n( ) 10 n( A D ) 2 c) p( A D) 0.4 n( ) 10
  • 123.
    CLETO DE LATORRE DUEÑAS 123 n( A) n( D ) n( A D ) d) p( A D) p( A) p ( D) p( A D) n( ) n( ) n( ) 3 6 2 7 p( A D) 0.7 10 10 10 10 n( B C ) P( B C ) n( ) n( B C ) 4 e) P ( B | C ) P (C ) n(C ) n(C ) 7 n( ) 4) En una ciudad se publican los periódicos A, B y C. Una encuesta reciente de lectores indica lo siguiente: 20% lee A, 16% lee B, 14% lee C, 8% lee A y B, 5% lee A y C, 2% lee A, B y C, y 4% lee B y C. Para un adulto escogido al azar, calcular la probabilidad de que: a) No lea ninguno de los periódicos. b) Lea exactamente uno de los periódicos. c) Lea A y B. Solución. Sean los eventos A: Lee el periódico A. B: Lee el periódico B. C: Lee el periódico C. A 9% 6% B 3% 2% 6% 2% 7% C c a) p A B C p(U ) p A B C c p A B C 100% (9 6 6 3 2 2 7)% 75%
  • 124.
    124 ESTADISTICA b) p(Lea exactamente un periódico)=9%+6%+7%=22% c) p A B 6% 5) En una Universidad, se conoce a través de una muestra, que en los estudiantes varones: 50 son de aspiraciones elevadas y 20 de aspiraciones modestas. Asimismo, en los estudiantes 60 son de aspiraciones elevadas y 30 de aspiraciones modestas. Si se selecciona dos estudiantes¿ Cual es la probabilidad de seleccionar:  Dos estudiantes de aspiraciones elevadas?  Un estudiante con aspiraciones elevadas y uno de aspiraciones modestas.  El primer seleccionado sea de sexo masculino y el segundo de sexo femenino. Solución. Masculino Femenino Total Aspiraciones elevadas 50 60 110 Aspiraciones modestas 20 30 50 Total 70 90 160 Sean los eventos A: Estudiante se sexo masculino. B: Estudiante se sexo femenino. C: Estudiante de aspiraciones elevadas. D: Estudiante de aspiraciones modestas. 110 C2 a) p(C1 C2 ) 160 C2 b) p(Uno aspiraciones elevadas y uno modestas) p(C1 D2 ) p(D1 C2 ) C1 * C150 110 C150 * C1110 160 160 C2 C2 C170 * C190 c) p( A1 B2 ) 160 C2
  • 125.
    CLETO DE LATORRE DUEÑAS 125
  • 126.
    126 ESTADISTICA Problemas Propuestos. 1) Calcular la probabilidad de que al lanzar un dado se obtenga un número que sea múltiplo de dos o tres. 2) Si se lanzan dos dados, encontrar la probabilidad de obtener un 5 en el primero y 3 en el segundo. 3) En una encuesta entre alumnos de maestría en administración se obtuvieron los datos siguientes acerca de “el principal motivo del alumno para solicitar su ingreso a la escuela donde está matriculado”. Motivo Calidad de la Costo o Otros Tipo est. escuela comodidad Totales Tiempo completo 421 393 76 890 Tiempo parcial 400 593 46 1039 Totales 821 986 122 1929 a. Si un alumno es de tiempo completo. ¿Cuál es la probabilidad de que la calidad de la institución sea el principal motivo para elegir su escuela?. b. Si un alumno es de tiempo parcial. ¿Cuál es la probabilidad de que la calidad de la escuela sea el motivo para elegirla? c. Sea A el evento en que el alumno es de tiempo completo y sea B el evento que el alumno menciona que la calidad de la escuela es el 1 er motivo de su solicitud. ¿Son independientes los eventos A y B?. Justifique su respuesta. 4) Antes de que un libro sea lanzado al mercado se recogen las reacciones de un grupo de personas a las que se les permite leer el libro previamente. Posteriormente a las ventas del libro se les asigna el calificativo de altas, moderadas o bajas de acuerdo a las noemas del mercado. Los resultados se muestran en la siguiente tabla:
  • 127.
    CLETO DE LATORRE DUEÑAS 127 Reacciones Favorables Neutral Desfavorables Ventas Altas 173 101 61 Moderadas 88 211 70 Bajas 42 113 141 a) ¿Cuál es la probabilidad de que las ventas sean altas? b) ¿Cuál es la probabilidad de que las reacciones sean favorables? c) Si la reacción del grupo es favorable?. ¿Cuál es la probabilidad de que las ventas sean altas? d) Si las ventas son bajas ¿Cual es la probabilidad de que las opiniones hayan sido desfavorables? e) ¿Cuál es la probabilidad de que las opiniones sean favorables y las ventas sean altas? f) ¿Cuál es la probabilidad de que las ventas sean favorables o desfavorables?. ¿Son esos sucesos mutuamente excluyentes? Justifique g) ¿Son los sucesos “Opiniones desfavorables” y “Ventas Bajas” independientes? Justifique. 5) Una prueba de selección consta de dos preguntas tipo test. Se consideran aptos aquellos individuos que contesten correctamente a la segunda pregunta, independientemente de cómo hayan contestado a la primera. La primera pregunta tiene cuatro posibles respuestas. A los individuos que contestan correctamente a la primera pregunta, se les plantea una segunda pregunta con dos posibles respuestas, mientras que a quienes fallan la primera pregunta les proponen una segunda cuestión con ocho posibles respuestas. Si un individuo que se presenta a la prueba y contesta a las preguntas al azar, a) ¿cuál es la probabilidad de que sea considerado apto? b) ¿cuál es la probabilidad de que conteste correctamente a la primera pregunta y mal a la segunda? 6) En un instituto hay 320 alumnos de primer curso, 280 de segundo y 200 de tercero. Al final de curso han suspendido 60 alumnos de primero, 48 de segundo y 72 de
  • 128.
    128 ESTADISTICA tercero. Hallar la probabilidad de que al elegir un alumno al azar y resultando que está suspendido, sea de 1º, de 2º o de 3º. 7) En una clase de 30 alumnos hay 18 que han aprobado matemáticas, 16 que han aprobado inglés y 6 que no han aprobado ninguna de las dos. Elegimos al azar un alumno de esa clase: a) ¿Cuál es la probabilidad de que haya aprobado inglés y matemáticas? b) Sabiendo que ha aprobado matemáticas, ¿cuál es la probabilidad de que haya aprobado inglés? c) ¿Son independientes los sucesos "Aprobar matemáticas" y "Aprobar inglés"? 8) La probabilidad de que un alumno estudie para su examen es 0.75. Si estudia, la probabilidad de que apruebe el examen es 0.80. Si el alumno no estudia la probabilidad de que no apruebe el examen es 0.90. a. ¿Cual es la probabilidad de que el alumno apruebe el examen? b. Si el alumno aprueba el examen ¿Cual es la probabilidad de que haya estudiado? 9) Una dirección departamental de educación recibe 25 solicitudes para una vacante de director de una UGEL. Entre los solicitantes 10 son hombres. Diecisiete de ellos acreditan titulo de maestría y ocho son licenciados. Además se sabe que 7 aspirantes son mujeres que tienen grado de magíster.  ¿Cual es la probabilidad de que sea seleccionado una mujer o una persona con titulo de licenciado?  Si el postulante seleccionado es magíster ¿Cual es la probabilidad de que sea varón? 10) 200 alumnos de la Facultad de Educación están distribuidos de acuerdo a su sexo y lugar de procedencia de la siguiente forma: 70 son mujeres, 110 son de Cusco y 30 son mujeres y de provincias. Si se elige dos alumnos al azar calcular la probabilidad de que:  Ambos sean mujeres y de Cusco.  Al menos uno de los dos escogidos sea hombre.
  • 129.
    CLETO DE LATORRE DUEÑAS 129 11) En la entrada de una facultad hay tres fotocopiadoras, A, B y C cuyos porcentajes de fallo son 3%, 5% y 4% respectivamente. Un alumno entra en la facultad y, como las tres fotocopiadoras están libres, elige una al azar, para realizar su fotocopia. Al llegar a clase observa que la fotocopia es defectuosa. ¿Cuál es la probabilidad de que fuera hecha en la máquina B?. 12) En una clase, el 20% de los chicos y el 5% de las chicas juega al tenis. El 60% de la clase son chicos. Se eligió al azar un estudiante de la clase y resultó ser de los que jugaban al tenis. ¿ Cuál es la probabilidad de que el estudiante elegido sea chico?. 13) En una asignatura de una carrera el 10% de los alumnos reciben una nota final de sobresaliente. El 70% de los estudiantes que la reciben ya la habían obtenido en un examen realizado a mitad de curso. Además, el 10% de los alumnos que no reciben sobresaliente al final de curso lo habían obtenido en el examen parcial. ¿Qué porcentaje de alumnos obtiene sobresaliente en el examen parcial?. ¿Cuál es la probabilidad de que un alumno que recibe un sobresaliente en el parcial obtenga esa calificación en el examen final?
  • 130.
    130 ESTADISTICA CAPITULO VI VARIABLE ALEATORIA Y DISTRIBUCIONES DE PROBABILIDAD 6.1 VARIABLE ALEATORIA. Definición.- Una variable aleatoria (v.a) X es cualquier función, que transforma cada elemento del espacio muestral , en un número real. X: R X Al conjunto de posibles valores de X se le llama rango de X (Rx)  Si Rx es finito o enumerable (rango discreto), entonces X es una v.a Discreta.  Si Rx no es enumerable (rango continuo), entonces X es una v.a Continua. Función de Probabilidad.- Si X es una v.a discreta, la función de probabilidad de X viene dada por: PX x P X x P /X x , tal que PX ( x) 1 x Rx
  • 131.
    CLETO DE LATORRE DUEÑAS 131 Función de densidad.- Si X es una v.a continua, la función de densidad de X es b una aplicación fX : X 0, tal que P a X b f X ( x)dx ,tal a que f X ( x)dx 1 Función de distribución.- La función de distribución de una v.a X esta dada por: FX ( x) P( X x) P( / X( ) x) Propiedades.  F es continua por la derecha y es creciente  Si X es una v.a discreta , entonces P a X b F b F a P X a  Si X es una v.a continua , entonces P a X b F b F a dF ( x)  Si X es una v.a continua , entonces F ' ( x) f ( x) dx  limx FX ( x) 0 y lim x FX ( x) 1 6.2 ESPERANZA Y VARIANZA. Esperanza La esperanza o media de una variable aleatoria X, denotada por E( X ) o X se define según sea la variable discreta o continua, mediante: x.P X x , si X es discreta x Rx E X x. f ( x)dx, si X es continua x Rx Propiedades.  El valor esperado de una constante es dicha constante
  • 132.
    132 ESTADISTICA  E a bX a bE X Varianza La varianza de una variable aleatoria X cuya media o esperanza es X , se define como 2 2 2 2 V X X E X X E X E X E X E2 X Propiedades.  La raíz cuadrada de la varianza se llama desviación estándar. 2 2 2  X E X X  V aX b a2V ( X ) Desigualdad de Chebyshev. Si X es una variable aleatoria, entonces para cualquier k se cumple 1 P X X k X 1 k2 Ejemplo 1: Sea X la variable aleatoria definida como la suma de los valores que aparecen al lanzar dos dados. a) Determine la distribución de probabilidad. b) Calcule la probabilidad P(5<X<8) c) La media y su varianza.
  • 133.
    CLETO DE LATORRE DUEÑAS 133 Solución. a) Resultados en Resultados en el segundo dado el primer dado 1 2 3 4 5 6 1 2 3 4 5 6 7 2 3 4 5 6 7 8 3 4 5 6 7 8 9 4 5 6 7 8 9 10 5 6 7 8 9 10 11 6 7 8 9 10 11 12 X: Suma de los valores de los dos dados Rx 2 3 4 5 6 7 8 9 10 11 12 P(X) 1/36 2/36 3/16 4/16 5/36 6/36 5/36 4/36 3/36 2/36 1/36 b) p(5 X 8) p(6) p(7) 5/ 36 6 / 36 11/ 36 c) Media E X x.P X x , si X es discreta x Rx 1 2 3 4 5 6 5 4 3 2 1 E X 2 3 4 5 6 7 8 9 10 11 12 36 36 36 36 36 36 36 36 36 36 36 252 E X 36 Varianza. 2 2 X E X E2 X 1 2 3 4 5 6 5 4 3 2 1 E X2 22 32 42 52 62 72 82 92 102 112 122 36 36 36 36 36 36 36 36 36 36 36 1974 E X2 36 2 2 2 2 1974 252 X E X E X 36 36
  • 134.
    134 ESTADISTICA 6.3 DISTRIBUCIONES DE PROBABILIDAD. Existen otras variables cuyas funciones de probabilidad o densidad resultan ser modelos de mucha utilidad para una serie de aplicaciones. Se cita brevemente algunos de los modelos de mayor importancia. 6.3.1 Distribuciones discretas. Un experimento de Bernoulli, es un experimento aleatorio con solo dos posibles resultados: Éxito y Fracaso. Sea p = P (Éxito). Distribución Binomial. La distribución binomial aparece cuando se dan las condiciones siguientes: -Tenemos un experimento aleatorio simple, con una situación dicotómica, es decir Éxito y Fracaso. - Repetimos este experimento simple n veces de manera independiente. X = Número de Éxitos en n experimentos independientes de Bernoulli. Función de Probabilidad: n x Cx p x 1 p n , si x 0,1,2,..., n PX x 0 , en otro caso. 2 Valor esperado: X np. Varianza: X np 1 p . Notación: X B(n, p). Distribución de Pascal o Binomial Negativa. Notación: X BN(r, p). X = Número de ensayos (experimentos independientes de Bernoulli) hasta conseguir el r-ésimo Éxito. Función de Probabilidad: x r Crx 11 1 p pr , si x r , r 1, r 2,... PX x 0 , en otro caso.
  • 135.
    CLETO DE LATORRE DUEÑAS 135 r 2 r1 p Valor esperado: X . Varianza: X 2 . p p Nota: Si r = 1, X se dice que es una variable aleatoria con distribución geométrica de parámetro p, y se le denota por X G(p). Distribución Hipergeométrica. Notación: X H(N, M, n). Considérese una población de N elementos, M de los cuales son de un tipo A, y supongamos se extraen sin reemplazo una muestra de n elementos de esta población. Entonces: X = Número de elementos de tipo A en la muestra. Función de Probabilidad: C x Cn xM M N N , si x 0,1,2,..., n PX x Cn 0 , en otro caso. M 2 M M N n Valor esperado: X n . Varianza: X n 1 . N N N N 1 Notas: b 1. En PX se esta usando la convención que Ca 0, si a > b. 2. Si la elección de la muestra fuera con reemplazo, entonces M X  B n, p . N Distribución de Poisson. La distribución de Poisson aparece en situaciones en las que se cuenta el número de apariciones de un determinado suceso o bien en un intervalo de tiempo dado (como el número de partículas emitidas en un segundo por un material radioactivo, o el número de pacientes que llegan a un servicio en un intervalo de tiempo dado) o bien en un recinto físico (como el número de fallos en un metro de alambre de hierro producido.
  • 136.
    136 ESTADISTICA X = Número de eventos en 0, t . Función de Probabilidad: x e , si x 0,1,2,... PX x x! 0 , en otro caso. 2 Valor esperado: X . Varianza: X . 6.3.2 Distribuciones continuas. Distribución Uniforme. Notación: X U a,b . Esta distribución se da cuando la variable aleatoria X puede tomar indistintamente cualquier valor en el intervalo a, b . Función de densidad: 1 , si x a, b fX x b a 0 , en otro caso. a b 2 b a2 Valor esperado: X . Varianza: X . 2 12 2 Distribución Normal. Notación: X N( , ). Función de densidad: 1 2 1 2 x fX x e 2 2 2 2 Valor esperado: X . Varianza: X . 2 Nota: Cuando =0y = 1, a X se le denota por Z y se le llama una variable aleatoria con distribución normal estándar; vale decir, Z N (0, 1). Toda v.a. normal X N( , 2) puede convertirse con una v.a. normal estándar (estandarizarse) a través de la transformación:
  • 137.
    CLETO DE LATORRE DUEÑAS 137 X Z 1. Teorema del limite central (TLC). Si X1 , X 2 ,..., X n son n v.a.s independientes, donde cada Xi tiene la misma distribución de valor esperado y 2 varianza , entonces para n suficientemente grande (en la práctica n 30) se cumple que aproximadamente n Xi n X Z i 1  N (0, 1) n / n 2. Aproximación de la Binomial por la Normal. Si X B (n, p) y n es suficientemente grande, entonces aproximadamente: X np Z N (0, 1). np 1 p Aquí, para el cálculo de probabilidades, se recomienda utilizar la llamada corrección por continuidad: Si a b son dos números naturales, entonces aproximadamente: b 1 np a 1 np 1 1 2 2 Pa X b P a X b Fz Fz . 2 2 np 1 p np 1 p 6.4 OTRAS DISTRIBUCIONES CONTINUAS IMPORTANTES DISTRIBUCION CHI-CUADRADO. Una v.a. X tiene distribución chi-cuadrado con n grados de libertad, y se le denota por X  2 (n) . PROPOSICION. 1. Si Z N (0, 1), entonces Z2  2 (1)
  • 138.
    138 ESTADISTICA 2 2 2 2. Propiedad reproductiva. Si 1 2 ... k son k variables aleatorias independientes con distribuciones chi-cuadrado de respectivamente n1 , n2 ,..., nk grados de libertad, entonces k 2 2 i i 1 k Es también una v.a. con distribución chi-cuadrado de n n i 1 i grados de libertad. 3. Si X1 , X 2 ,..., X n es una m.a de X N ( , 2), entonces n 1 S2 W 2  2 (n-1) DISTRIBUCION T DE STUDENT. Una v.a. X tiene distribución t de Student con n grados de libertad, y se le denota por X  t(n) . PROPOSICION. 1. Sea X  t(n) . Si n es grande, entonces aproximadamente X N (0, 1). 2. Si Z N (0, 1) y 2  2 (n) son v.a independientes, entonces Z T 2 t(n). En particular, dada una m.a. X1 , X 2 ,..., X n de X, n extraída de una población N ( , 2), se cumple que: X T  t (n -1) . S/ n
  • 139.
    CLETO DE LATORRE DUEÑAS 139 DISTRIBUCION F DE FISHER. Una v.a. X tiene distribución F de Fisher con n grados de libertad en el numerador y m grados de libertad en el denominador, y se le denota por X  F (n, m) . PROPOSICION. 1. Si X  F (n, m) entonces: 1 X F (m, n). 2 2 2 2 2. Si 1 (n) y 2 (m) son v.a’s independientes, entonces 2 /n F 1 2  F (m, n) . 2 /m En particular, si X1 , X 2 ,..., X n es una v.a. de X N ( 1, 2 1 ), e Y1 , Y2 ,...,Ym una m.a de una v.a. Y N ( 2, 2 2 ), donde X e Y son independientes, entonces S12 2 F 2 2 2  F (n -1, m - 1) S2 1 2 2 Siendo S1 y S 2 las varianzas muestrales asociadas a las poblaciones estadísticas determinadas por X e Y, respectivamente. Nota: La distribución normal estándar, t de Student, chi-cuadrado y F de Fisher poseen todas tablas en la que se tabulan algunos valores de su función de distribución.
  • 140.
    140 ESTADISTICA EJERCICIOS DESARROLLADOS 1. Una prueba de inteligencia está compuesta por 10 preguntas, cada una de las cuales tiene 4 respuestas y solo una de ellas correcta. Un alumno tiene prisa por acabar la prueba y decide contestar aleatoriamente. Se pide a) Probabilidad de acertar exactamente 4 preguntas b) Probabilidad de no acertar ninguna c) Probabilidad de acertar todas d) Probabilidad de acertar al menos 8 e) Probabilidad de acertar a los sumo 6 f) Media y varianza Solución Consideremos los sucesos A = Contestar bien P (A) = 0.25 A = No contestar bien P ( A ) = 0.75 Se trata de una distribución Binomial de parámetros B (10, 0.25 ) Sea X la variable aleatoria que representa el número de preguntas contestadas correctamente 10 a) P(acertar 4) = P X 4 (0.25)4 (0.75)6 0.1460 4 10 b) P (no acertar ninguna) = P X 0 (0.25)0 (0.75)10 0.0563 0 10 c) P(acertar todas) = P X 10 (0.25)10 (0.75)0 0 10 d) P(acertar al menos 8) = P X 8 PX 8 PX 9 PX 10 10 10 (0.25)8 (0.75)2 (0.25)9 (0.75) 0 0.005 8 9 e) P( acertar a lo sumo 3) = P X 3 PX 0 PX 1 PX 2 PX 3
  • 141.
    CLETO DE LATORRE DUEÑAS 141 10 10 10 10 (0.25)0 (0.75)10 (0.25)1 (0.75)9 (0.25)2 (0.75)8 (0.25)3 (0.75)7 0.7759 0 1 2 3 f) Media y Varianza np 10 (0.25) 2.5 2 np(1 p) 10(0.25)(0.75) 1.875 2. La probabilidad de que un estudiante obtenga el título de licenciado en Geografía e Historia es de 0.3. Halla la probabilidad de que de un grupo de siete estudiantes matriculados en primer curso. a) Ninguno de los 7 finalice la carrera b) Finalicen todos la carrera c) Al menos 2 acaben la carrera d) Halla la media y la desviación típica Solución Consideremos los sucesos: A = Finalizar la carrera P(A) = 0.3 A = No finalizar la carrera P ( A ) = 0.7 Por tanto se trata de una distribución Binomial de parámetros B (7, 0.3) Sea X la variable aleatoria que representa el número de estudiantes que obtienen el título de licenciado en Geografía e Historia 7 a) PX 0 (0.3)0 (0.7)7 0.0824 0 7 b) PX 7 (0.3)7 (0.7)0 0.0002 7 7 7 c) P X 2 1 PX 1 1 PX 0 PX 1 1 (0.3)0 (0.7)7 (0.3)1 (0.7)6 0.6705 0 1 Media y desviación típica np 7(0.3) 2.1 np(1 p) 7(0.3)(0.7) 1.21
  • 142.
    142 ESTADISTICA 3) El peso medio de los estudiantes de un colegio es 60 kg y la desviación típica es 6 kg. Suponiendo que los pesos están distribuidos normalmente. a) Cual es la probabilidad de que un estudiante pese menos de 64k g? b) Cual es la probabilidad de que un estudiante pese 57 kg o más? c) Cual es la probabilidad de que un estudiante pese más de 63 Kg? d) Cual es la probabilidad de que un estudiante pese entre 57 a 65 kg? e) Cual es la probabilidad de que un estudiante pese menos de 50 Kg? f) Cual es la probabilidad de que un estudiante pese entre 64 a 70 kg? g) Si los estudiantes son 200, .Cuantos cabe esperar que pesen más de 57 kg y menos de 64k g?. Solución. X: Peso de los trabajadores. 60 (Media poblacional) 6 (Desviación) X 64 64 60 a) P( X 64) P( ) P( Z ) P( Z 0.67) 6 (0.67) 0 z=0.67 0.5 (0.67) 0.5 0.24857=0.74857=74.857% X 57 57 60 b) P( X 57) P( ) P( Z ) P( Z 0.5) (0.5) 0.5 6 (0.5) z= 0.5 0 0.19146+0.5=0.69146=69.146%
  • 143.
    CLETO DE LATORRE DUEÑAS 143 X 63 63 60 c) P( X 63) P( ) P( Z ) P( Z 0.5) 0.5 (0.5) 6 (0.5) 0 z=0.5 0.5 0.19146=0.30854=30.854% 57 X 65 57 60 65 60 d) P(57 X 65) P( ) P( Z ) 6 6 X P( 0.50 0.83) (0.50) (0.83) 0.19146+0.29373=0.48519=48.519% (0.5) (0.83) z= 0.50 0 z=0.83 X 50 50 60 e) P( X 50) P( ) P( Z ) P( Z 0.167) 6 (0.167) z= 0.167 0 0.5 (0.167) 0.5 0.0675=0.4325=43.25% 64 X 70 64 60 70 60 f) P(64 X 70) P( ) P( Z ) 6 6 X P(0.67 1.67) (1.67) (0.67) 0.45254-0.24857=0.20397=20.397%
  • 144.
    144 ESTADISTICA 0 z=0.67 z=1.67 (0.67) (1.67) 57 X 64 57 60 64 60 g) P(57 X 64) P( ) P( Z ) 6 6 X P( 0.5 0.67) (0.5) (0.67) 0.19146+0.24857=0.44003=44.003% Cabe esperar el 44.003% de estudiantes, es decir 0.44003* 200 88
  • 145.
    CLETO DE LATORRE DUEÑAS 145 EJERCICIOS PROPUESTOS. 1) En un grupo de 10 alumnos de un centro educativo se ha comprobado que cada uno de ellos falta a clase el 5% de los días. Calcula la probabilidad de que en un día determinado. . a) no se registre ninguna ausencia. b) falten a clase más de 5 alumnos. c) no asista a clase ningún alumno. d) falte a clase un único alumno. e) falten a clase menos de 3 alumnos. 2) La probabilidad de que un estudiante obtenga el grado de magíster es de 0.3. Calcular la probabilidad de que de un grupo de siete estudiantes matriculados. . . a) los siete obtenga el grado de magíster. b) al menos dos obtengan el grado. 3) La probabilidad de que un estudiante de ingeniería fracase en sus estudios es de 0.7. a) De un grupo de 7 estudiantes de ingeniería, calcula la probabilidad de que los 7 fracasen en sus estudios. b) En el mismo caso que en el apartado anterior, calcula la probabilidad de que al menos 2 acaben la carrera. c) Se el grupo se aumenta a 40 estudiantes, calcular la probabilidad de que fracasen entre 20 y 30 de ellos 4) Un examen tipo test tiene 100 preguntas y cada pregunta 4 respuestas diferentes, de las que sólo una es correcta. a) Calcular la probabilidad de que un estudiante que responde al azar acierte más de 20 preguntas. b) Calcular la probabilidad de que de las 20 primeras preguntas acierte a lo sumo 5) Las puntuaciones de un test se distribuye normalmente con media 80 y varianza 49 ¿Cuál es la probabilidad de obtener en el test una puntuación entre 79 y 88 puntos ?.
  • 146.
    146 ESTADISTICA 6) Se llama cociente intelectual (C.I.) al cociente entre la edad mental y la edad real. Se sabe que la distribución del C.I. se distribuye normalmente con media 0.95 y desviación típica 0.22. En una población con 2600 personas se desea saber: a) Cuantas tendrían un C.I. superior a 1.3? b) Cuantas tendrían un C.I. inferior a 0.07? c) Cuantas tendrían un C.I. entre 0.8 y 1.15? 7) Tras realizar un test de cultura general entre los habitantes de cierta población, se observa que las puntuaciones siguen una distribución normal, de media 68 y desviación típica 18. Se desea clasificar a los habitantes en tres grupos (de baja cultura general, de cultura general aceptable y de cultura general excelente), de manera que el primer grupo abarque un 20% de la población, el segundo un 65% y el tercero el 15% restante. .Cuales son las puntuaciones que marcan el paso de un grupo a otro? 8) Se ha aplicado un test de fluidez verbal a 500 alumnos de la UNSAAC. Se supone que las puntuaciones obtenidas se distribuyen según una normal de media 80 y desviación típica 12. Se pide: a) .Que puntuación separa el 25% de los alumnos con menos fluidez verbal? b) .A partir de que puntuación se encuentra el 25% de los alumnos con mayor fluidez verbal? 9) El peso medio de 500 estudiantes de cierta universidad es 72 Kg y la desviación típica es 7. Si los pesos se distribuyen según una normal, halla: a) El número de estudiantes que pesan entre 68 y 75 Kg. b) El número de estudiantes que pesan más de 72 Kg. c) El número de estudiantes que pesan menos de 62 Kg. 10) En una clase de Ingeniería Técnica se sabe que las calificaciones de Estadística se distribuyen según una N(4, 2). Si el profesor desea aprobar al 70% de la clase, ¿a partir de qué nota se debe considerar aprobado el examen? 11) La nota media de un examen es 5,25 y la desviación típica 2. El 10% de la clase recibirá la calificación de sobresaliente. ¿Cuál es la nota mínima para optar a él? Se eligen cinco alumnos al azar, ¿cuál es la probabilidad de que dos de ellos hayan Obtenido un sobresaliente?
  • 147.
    CLETO DE LATORRE DUEÑAS 147 APENDICE TABLA NORMAL ESTÁNDAR 8,5Z 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0 0 0.00399 0.00798 0.01197 0.01595 0.01994 0.02392 0.0279 0.03188 0.03586 0.1 0.03983 0.04395 0.04776 0.05172 0.05567 0.05962 0.06356 0.0675 0.07124 0.07534 0.2 0.07926 0.08617 0.08706 0.09095 0.09483 0.09871 0.10257 0.10642 0.11026 0.11409 0.3 0.11781 0.12172 0.12552 0.1293 0.13307 0.13683 0.14058 0.14431 0.14803 0.15173 0.4 0.15542 0.1591 0.16276 0.1664 0.17003 0.17364 0.17724 0.18082 0.18439 0.18793 0.5 0.19146 0.19497 0.19847 0.20194 0.2054 0.20884 0.21226 0.21566 0.21904 0.2224 0.6 0.22575 0.22907 0.23237 0.23565 0.23891 0.24215 0.24537 0.24857 0.25175 0.2549 0.7 0.25804 0.26115 0.26424 0.2673 0.27035 0.27337 0.27637 0.27935 0.2823 0.28524 0.8 0.28814 0.29103 0.29389 0.29373 0.29955 0.30234 0.3051 0.30785 0.31057 0.31327 0.9 0.31594 0.31859 0.32124 0.32381 0.32639 0.32894 0.33147 0.33398 0.33646 0.33891 1 0.34134 0.34375 0.34614 0.34849 0.35083 0.35314 0.35543 0.35769 0.35993 0.36214 1.1 0.36433 0.3665 0.36864 0.37076 0.37286 0.37923 0.37698 0.379 0.381 0.38298 1.2 0.38493 0.38686 0.38877 0.39065 0.39251 0.39435 0.39616 0.39796 0.39973 0.40147 1.3 0.4032 0.4049 0.40658 0.40824 0.40988 0.41149 0.41308 0.41466 0.41621 0.41774 1.4 0.41924 0.42073 0.4222 0.42364 0.42507 0.42647 0.42785 0.42922 0.43056 0.43189 1.5 0.43319 0.43448 0.43574 0.43699 0.43822 0.43943 0.44062 0.44179 0.44295 0.44408 1.6 0.4452 0.4463 0.44738 0.44845 0.4495 0.45053 0.45154 0.45254 0.45352 0.45449 1.7 0.45543 0.45637 0.45728 0.45818 0.45907 0.45994 0.46079 0.46164 0.46246 0.46327 1.8 0.46407 0.46485 0.46562 0.46637 0.46712 0.46784 0.46856 0.46926 0.46995 0.47062 1.9 0.47128 0.47193 0.47257 0.4732 0.47381 0.47441 0.475 0.47558 0.47615 0.4767 2 0.47725 0.47778 0.47831 0.47882 0.47932 0.47982 0.4803 0.48077 0.48124 0.48169 2.1 0.48214 0.48257 0.48299 0.48341 0.48382 0.48422 0.48461 0.485 0.48537 0.48574 2.2 0.4861 0.48645 0.48679 0.48713 0.48745 0.48778 0.48809 0.4884 0.4887 0.48899 2.3 0.48928 0.48956 0.48983 0.49001 0.49036 0.49061 0.49086 0.4911 0.49134 0.49158 2.4 0.4918 0.49202 0.49224 0.49245 0.49266 0.49286 0.49305 0.49324 0.49343 0.49361 2.5 0.49379 0.49396 0.49413 0.4943 0.49446 0.49461 0.49477 0.49491 0.49506 0.4952 2.6 0.49534 0.49547 0.4956 0.49573 0.49585 0.49597 0.49609 0.49621 0.49632 0.49643 2.7 0.49653 0.49664 0.49674 0.49683 0.49693 0.49702 0.49711 0.4972 0.49728 0.49736 2.8 0.49744 0.49752 0.4976 0.49767 0.49774 0.49781 0.49788 0.49795 0.49801 0.49807 2.9 0.49813 0.49819 0.49825 0.4983 0.49836 0.49841 0.49846 0.49851 0.49856 0.4986 3 0.49865 0.49869 0.49874 0.49878 0.49882 0.49886 0.49889 0.49893 0.49897 0.499 3.1 0.49903 0.49906 0.4991 0.49913 0.49916 0.49918 0.49921 0.49924 0.49926 0.49929 3.2 0.49931 0.49934 0.49936 0.49938 0.4994 0.49942 0.49944 0.49946 0.49948 0.4995 3.3 0.49952 0.49953 0.49955 0.49957 0.49958 0.4996 0.49961 0.49962 0.49964 0.49965 3.4 0.49956 0.49968 0.49969 0.4997 0.49971 0.49972 0.49973 0.49974 0.49975 0.49976 3.5 0.49977 0.49978 0.49978 0.49979 0.4998 0.49981 0.49981 0.49982 0.49983 0.49983 3.6 0.49984 0.49985 0.49985 0.49986 0.49986 0.49987 0.49987 0.49988 0.49988 0.49989 3.7 0.49989 0.4999 0.4999 0.4999 0.49991 0.49991 0.49992 0.49992 0.49992 0.49992 3.8 0.49993 0.49993 0.49993 0.49994 0.49994 0.49994 0.49994 0.49995 0.49995 0.49995 3.9 0.49995 0.49995 0.49996 0.49996 0.49996 0.49996 0.49996 0.49996 0.49997 0.49997
  • 148.
    148 ESTADISTICA BIBLIOGRAFIA. 1. Briones, G. (1998). Métodos y técnicas de investigación para las Ciencias Sociales. México: Trillas. 2. Blalock, H. (1994). Estadística Social. México: Fondo de Cultura Económica. 3. Carrasco, J. B. y Calderero, J. F: (2000). Aprendo a investigar en educación. Madrid: Ediciones Rialp, S.A. 4. Cordova, Manuel (2003). Estadística descriptiva e inferencial. Editorial Mosqueira Lima. 5. Guilford J. P. Y Fruchter B. 1984. “Estadística aplicada a la Psicología y a la Educación”. Editorial Mc Graw Hill. 6. JESUS AMON, Estadística para Psicólogos 1, estadística descriptiva. 7. JESUS AMON, Estadística para Psicólogos 2, estadística inferencial. 8. 5PAGANO, Robert, ESTADÍSTICA PARA LAS CIENCIAS DEL COMPORTAMIENTO, Edit. Thomson, 7ma edición, 2006, México D.F. 9. Peña D. Y Romo J. 1997. Introducción a la estadística para las Ciencias sociales. Editorial Mc Graw Hill. Interamericana de España. 10. Siegel, S. (1956). Non Parametric Statistics for the Behaviral Sciences. New Cork: McGraw Hill Book Company. 11. Valdivieso Serrano Luis (2004) Estadística aplicada, editorial PUCP.