SlideShare una empresa de Scribd logo
1 de 23
ESTADÍSTICA APLICADA A LA EVALUACIÓN

      GUÍA TÉCNICA DE ESTUDIO




      DANIEL ACOSTA ESPARZA




            MAYO DE 2010
GUÍA TÉCNICA DE ESTUDIO DE ESTADÍSTICA APLICADA A LA EVALUACIÓN

La Estadística es una rama de las matemáticas que ordena, describe, explica y proyecta datos y
está asociada a la probabilidad y la inducción.

PROBABILIDAD

La probabilidad se emplea en procesos físicos, biológicos y sociales que no pueden predecirse con
exactitud. Los eventos aleatorios ocurren con una frecuencia relativa constante. Este tipo de
comportamiento se denomina aleatorio o estocástico, y su frecuencia proporciona una medida
intuitiva pero significativa de su posibilidad de ocurrencia. El uso de esta frecuencia como medida de
la posibilidad de ocurrencia de una condición tiene como objetivo determinar con cierta precisión el
acierto en el resultado del evento.
                                                                                                         S B
Como punto de partida, la teoría de la probabilidad considera la teoría de conjuntos: Si S es el
conjunto de todos los elementos considerados, S es el conjunto universo. Para cualquiera de los                A
conjuntos A y B se dice que A es subconjunto de B (A B) si cada elemento de A está también en B.

El conjunto vacío ( ) es un subconjunto que carece de elementos, por lo que es un subconjunto de
cualquier conjunto. Los conjuntos y sus relaciones se representan en diagramas de Venn.

Si consideramos dos conjuntos arbitrarios A y B, la unión de A con B se denota como A B y
contiene los elementos de A y de B.        S
                                             A         B


La intersección de A y B (A B) son los elementos que se encuentran en A y que también se
encuentran en B.
                                         S
                                           A        B



Si A es un subconjunto de S, el complemento de A ( A ) son los elementos de S que no se
encuentran en A.                                          S
                                                                  A
                                                           A

A y B son mutuamente excluyentes si A B= , o sea que no tienen elementos comunes.



             A            B
S B                     S                         S                      S
                            A            B            A            B               A            A            B
       A                                                                     A


       A B                        A B                     A B                    S=A   A              A B=

En una población, una muestra participa con una proporción determinada, a lo que se denomina
frecuencia relativa, y hace referencia a la probabilidad de ocurrencia del evento en estabilizada en
un punto por la regularidad de su aparición. Por lo tanto, la probabilidad de suceso del evento se
representa como su frecuencia relativa.


P(A)=Frecuencia Relativa de A

INDUCCIÓN:

La lógica es la disciplina que trata la relación de implicación de las proposiciones

             relación
                                Premisa------------------->Conclusión            DEDUCCIÓN
                                          inclusión

             relación
                                 Premisa<-----------------------Conclusión       INDUCCIÓN
                                        probabilística

La posible verdad o falsedad de un conjunto limita la posible verdad o falsedad del otro:
        Si la premisa es verdadera, entonces la conclusión es verdadera
        Si la premisa es falsa, entonces la conclusión es falsa
        Si la conclusión es verdadera, la premisa puede ser verdadera
        Si la conclusión es falsa, la premisa es falsa

(2) Cantidad-calidad

La proposición es un enunciado del que es posible afirmar que es verdadero o falso. Las
proposiciones pueden analizarse en cuanto a calidad como afirmativas o negativas; mientras que en
cuanto a calidad en generales o particulares:

              Calidad                                 Afirmativo                           Negativo
Cantidad
Universal                                          Todos S es P                         Ningún S es P
                                                        A                                     E
Particular                                         Algún S es P                        Algún S no es P
                                                         I                                    O
MEDICIÓN

El análisis de la medición se aborda a partir de dos temáticas: los niveles y las escalas de medición
que son utilizados en las diversas disciplinas científicas y su aplicación en la estadística. 1

NIVELES DE MEDICIÓN.

Para todas las ciencias, existen diversos niveles de medición, mismos que pueden clasificarse en
cuatro, dependiendo de su precisión y exactitud.

a) Nivel nominal: Diferenciación de una uniformidad empírica:

CLASE
               telekinesis
               telepatía
               hiponosis

b) Nivel ordinal = Nivel Nominal + ordenamiento cualitativo de mayor a menor o viceversa:
        CLASE PESO
           Excelente calidad              5
           Buena calidad                  4
           Regular Calidad                3
           Mala Calidad                   2
           Nula calidad                   1

c) Nivel proporcional = Nivel Ordinal + Intervalo:
        CLASE               INTERVALO              FRECUENCIA
           analfabeta             0                    30
           primaria               6                    90
           secundaria             9                    99
           preparatoria          12                    70
           licenciatura          16                    50
           maestría              18                    19
           doctorado             20                    10

d) Nivel de razón = Nivel Proporcional + 0 absoluto: Salarios mínimos
        CLASE         MC      FRECUENCIA
        0              0            20
        1 a 5          3            50
        5 a 10         8            40
        11 a 15       13            20
        16 a 20       18            10


1   Acosta, E. D. Teoría Metodología y Técnicas de Investigación. UIA. México. 1980
Hasta aquí primera clase
Clasificación de la estadistica
TIPOS DE ESTADÍSTICA

ESTADÍSTICA DESCREPTIVA            MEDIDAS       DE       TENDENCIA a) MEDIA
                                   CENTRAL                          b) MEDIANA
                                                                    c) MODA

                                   ANÁLISIS DE ESTRATIFICACIÓN a) DESVIACIÓN CUARTIL
                                                               b) DESVIACIÓN DECIL
                                                               c) DESVIACIÓN PERCENTIL

                                   MEDIDAS DE DISPERSIÓN              a)       RANGO
                                                                      b)       DESVIACIÓN MEDIA
                                                                      c)       VARIANZA
                                                                      d)       DISEPRSIÓN ESTÁNDAR

SÍNTESIS DESCRIPTIVA:                                                 a)       DESVIACIÓN ESTANDAR/MEDIA
COEFICIENTE DE VARIACIÓN
ESTADÍSTICA EXPLICATIVA            PRUEBAS PARAMÉTRICAS               a) PRUEBA ―t‖
                                                                      b) ―f‖ DE FISHER
                                                                      b) CORRELACIÓN ―r”

                                   PRUEBAS NO PARAMÉTRICAS     2 (Ji CUADRADA)

ESTADÍSTICA PROYECTIVA             ESCENARIOS:       VARIABLE a) ESCENARIOS SIMPLES
                                   ESTAD. INDEPENDIENTE: X    b) ESCENARIOS CON RANGOS

                                   ESCENARIOS VARIABLE ESTAD. a) LINEAL
                                   CORRELACIONADA: Y          b) EXPONENCIAL
                                                              c) LOGARÍTMICA


DISTRIBUCIÓN NORMAL
                   Premisa: Existen regularidades en la naturaleza:

                                             *
                                    *                 *
                              *                                *
                     *                                                     *

                     3s       2s    s        X        S       2s       3s

                                           66%

                                           95%

                                           99%
CARACTERÍSTICAS:
  En una distribución de frecuencia paramétrica, las tres mediciones de tendencia central coinciden
  en un mismo punto; en este sentido,
  La diferencia del valor de estas tres medidas nos da una idea del carácter normalizado o no de
  los datos analizados.

CONSTRUCCIÓN DE FRECUENCIAS
En el análisis estadístico tenemos dos conceptos básicos: el de población y el de muestra:2
            Se denomina población al conjunto formado por la totalidad de los eventos de una clase o
            categoría a ser analizados.
            Un subconjunto o parte de la población. Se le llama muestra. Esta puede ser
            representativa o no de aquella; para que una muestra sea representativa de una
            población, sus elementos deben ser seleccionados por algún método aleatorio.

En la investigación, obtenemos datos de muestras, mismo que clasifican y tabulan para construir
frecuencias y realizar el análisis cuantitativo.

CLASIFICACIÓN
En la investigación se maneja una gran cantidad de datos, por lo que es conveniente agruparlos en
clases o categorías. En este sentido, la clasificación implica ordenar o agrupar los datos;
clasificación que, de antemano, está determinada por el nivel de medición de los datos analizados.

El punto de referencia para construir los datos es:
           Para el nivel de medición nominal, el dato mismo, como uniformidad empírica
           Para el nivel de medición ordinal: el conocimiento acumulado o teoría que describe o
           explica las uniformidades empíricas
           Para los niveles de medición de proporción o razón, el intervalo.

Con relación al intervalo, recordamos que este consiste en la diferencia cuantitativa entre las clases,
por lo que dados ciertos datos, es posible obtener la longitud del intervalo, calculando la diferencia
entre la máxima y la mínima observación y dividiendo la diferencia resultante entre el número
deseado de intervalos, la longitud de los intervalos debe ser igual a este cociente.

Ejemplo: Se tienen 50 casos, cuya cuantificación menor es de 10 y la mayor de 60 y se quiere
manejar 5 intervalos, entonces la longitud del intervalo se calcularía de la siguiente forma: 60 - 10 =
50/5 = 10, por lo que las clases que tendríamos serían:

             CLASE:
           De   1 a 10
           De 11 a 20
           De 21 a 30
           De 31 a 40
           De 41 a 50
           De 51 a 60
2
    Moreno, B. A. Probabilidad y Estadística. R y S I. México. 1980.
TABULACIÓN: La ubicación de cada dato en la clase que le corresponde es lo que se denomina
tabulación. Ejemplo, tenemos los siguientes datos:
   10         11        21        43        15     18     17       16        35       14
   26         60        26        45        10     58     24       14        38       26
   24         56        28        40        19     60     26       15        47       37
   12         42        16        38        47     26     28       22        50       26
   18         35        19        35        59     43     33       44        57       43

La tabulación implicara ubicar cada caso en la clase que se construyo:
        CLASE                   FRECUENCIA
        De     1 a 10                   2
        De 11 a 20                      13
        De 21 a 30                      12
        De 31 a 40                      7
        De 41 a 50                      9
        De 51 a 60                      7
        TOTAL                           50

FRECUENCIA: El total de casos por cada una de las categorías se le denomina Frecuencia. Al
arreglo tabular de los datos por clase junto con sus correspondientes frecuencias de clase, se les
denomina tabla de frecuencias. El resultado del ejemplo anterior, en donde tenemos clase y
frecuencia, constituye una tabla de frecuencias.
            Frecuencia simple o absoluta. Esta se compone de la clase y frecuencia, como es el
            caso del ejemplo anterior.
            Frecuencia relativa. En este tipo de frecuencias, se les añade el peso porcentual de
            cada clase. Por ejemplo, si utilizamos los datos anteriores, tenemos la siguiente
            frecuencia relativa:

           CLASE:                       FRECUENCIA          FRECUENCIA RELATIVA
                                         ABSOLUTA
           De   1 a 10                      2                              4
           De 11 a 20                       13                            26
           De 21 a 30                       12                            24
           De 31 a 40                       7                             14
           De 41 a 50                       9                             18
           De 51 hasta 60                   7                             14
           TOTAL                            50                           100%

           Frecuencia -Acumulativa. En este caso, por cada clase se suman las frecuencias
           anteriores, dándonos como resultado el 100% en la última clase
CLASE               FRECUENCIA           FRECUENCIA                  FRECUENCIA
                                  ABSOLUTA           ACUMULATIVA                 RELATIVA ACUM.
  De   1 a 10                         2                    2                            4
  De 11 a 20                         13                   15                           30
  De 21 a 30                         12                   27                           54
  De 31 a 40                          7                   34                           68
  De 41 a 50                          9                   43                           86
  De 51 hasta 60                      7                   50                         100%
  TOTAL                              50

GRAFICACIÓN DE DATOS

Los datos podemos graficarlos en histogramas y polígonos de frecuencia:
                HISTOGRAMA                                    POLÍGONO DE FRECUENCIA

 15                                                   15


 10                                                   10


  5
                                                       5


  0
                                                       0
        10     20    30     40     50     60
                                                             10        20   30      40   50    60



RANGOS
Las clases intervalares, nivel de medición de proporción y de razón, se integran por un límite menor
y un límite mayor, como es el caso del ejemplo expuesto con anterioridad:

                                    CLASE                  FRECUENCIA
                            Limite        Limite
                           Inferior      Superior
                          Hasta       10                           2
                          De 11 a     20                          13
                          De 21 a     30                          12
                          De 31 a     40                           7
                          De 41 a     50                           9
                          De 51 a     Hasta 60                     7
                          TOTAL                                   50

EL punto medio entre el límite mayor y el límite menor, se denomina marca de clase y constituye el
valor representativo de cada clase. La marca de clase se calcula sumando el límite mayor más el
límite menor entre dos. Para el ejemplo anterior tenemos:
CLASE               MARCA DE           FRECUENCIA
                                             CLASE
              Limite         Limite
             Inferior       Superior
            Hasta         10                      10                  2
            De 11 a       20                     15.5                13
            De 21 a       30                     25.5                12
            De 31 a       40                     35.5                 7
            De 41 a       50                     45.5                 9
            De 51 a       Hasta 60               55.5                 7
            TOTAL                                                    50

SUMATORIA: La sumatoria, que simplemente es la suma de una serie de datos, se simboliza con
la sigma mayúscula: es utilizada en diferentes mediciones estadísticas como la Media o la
Desviación Estándar. Un ejemplo sería el siguiente:

    MES             ACCIDENTES             MES          ACCIDENTES
     01                 34                  07              45
     02                 26                  08              48            La sumatoria será el número
     03                 18                  09              34
                                                                          de los accidentes ocurridos
     04                 42                  10              21
     05                 30                  11              19            durante los 12 meses:
     06                 21                  12              39
                                                                            = 377

Es importante observar que en el caso de los niveles de medición ordinal, que tienen un peso y
frecuencia, así como el caso intervalar en que se da marca de clase y frecuencia, primeramente
tiene que ponderarse, multiplicando, en el caso ordinal, peso x frecuencia; mientras que en el
intervalar, marca de clase x frecuencia.

         CLASE                   PESO          FRECUENCIA              PESO X FRECUENCIA
Excelente calidad                  5                50                         250
Buena calidad                      4                70                         280
Regular Calidad                    3                90                         270
Mala Calidad                       2                80                         160
Nula calidad                       1                70                          70
TOTAL                                             n=360                       = 1,030


ESTADÍSTICA DESCRIPTIVA

MEDIDAS DE TENDENCIA CENTRAL

 (1) Media simple o nominal: Cada clase es independiente entre sí, o sea clase es igual a la
frecuencia
                                                  xi
                                          X
                                                  n
Promedio de accidentes en 10 tramos carreteros

                   CLASE          FRECUENCIA            CLASE        FRECUENCIA
                     01               24                  06             34
                     02               26                  07             39
                     03               21                  08             15
                     04               19                  09             22
                     05               22                  10             22

    xi = 244 y n = 10     Matematización:        X = 244/10 = 24.1

(2) Media ordinal o ponderada:

Esta se utiliza con escalas de medición ordinal: agregativa de clase, acumulativa de peso o
diferencial:
                                X = ·pf/n
p = peso de la clase
f = frecuencia
n = sumatoria de las frecuencias de clase

Medición de calidad en diferentes muestras de un producto:

p              clase                    frecuencia              ponderación
  5          calidad alta                      200                    1,000
  4          calidad media                     300                    1,200
  3         calidad regular                    350                    1,050
  2         calidad baja                       100                      200
  1         calidad nula                        50                       50
Total                                         1,000                    3,500

    pf = 3,500,   n     = 1,000

X = 3,500/1000 = 3.5. La opinión se encuentra entre la clase ―calidad media‖ y ―calidad regular‖.

En las escalas ordinales cuya base es el peso lógico de las clases pueden ser convertidas en X%,
media porcentual con la finalidad de utilizar la estadística paramétrica, tal conversión se realiza
dividiendo la posición media entre el valor del peso óptimo o valor máximo (VM) multiplicado por
100:

          X % = ( X /VM)x100

Para el caso anterior, tenemos: X % (3.5/5)100 = 70%.

Para el análisis de posicionamiento (Benchmarking) la media porcentual de una institución se
compara con la Media Porcentual del Contexto, o con el concepto ―excelencia‖, mismo que hace
referencia al valor máximo de las clases, en este sentido, siempre será el 100%
(3) Intervalar:

La media aplicada a datos intervalares se clasifican en los niveles de medición proporcional y de
razón.
                                           X = xi·f/n
Promedio de escolaridad:
       Clase           Frecuencia     M.C Ponderación
       0               100              0                 0
   1 a 4               150              2.5             375
   5 a 8               700              6.5            4550
   9 a 12              300            10.5             3150
  13 a 16              150            14.5             2175
  17 a 20              150            18.5             2775
               n = 1550                           = 13025

                    X = 13025/1550 =8.4 años de escolaridad
ANÁLISIS DE ESTRATIFICACIÓN.
Las medidas de dispersión aplicadas al análisis de estratificación son: desviación cuartil, decil y
percentil, las cuales expresan la forma como entre el límite menor y el mayor, se distribuyen los
datos: en cuatro partes para el cuartil, 10 para el decil y 100 para el percentil. Estas medidas son
muy útiles en el análisis de estratificación social, política o administrativa y determinar los niveles de
ingresos, consumo, inversión, etc.

(1) Cuartil: Qn = n( F/4)
                                                       mediana

      Dato mínimo:         25%              25%     25%           25%:     Dato máximo
                            q1                q2     q3           q4
                  Q1 = Li + (( f/4 - fa)/f·)i
                  Q2 =MD
                  Q3 = Li + (( 3 f/4 - fa)/f·)i

Ej:      Si calculamos el qi y q3 para los datos de escolaridad tenemos:
         Clase           Frecuencia       M.C             Ponderación
         0               100                0                 0
   1    a 4              150              2.5               375
   5    a 8              700              6.5             4550
   9    a 12             300              10.5            3150
  13    a 16             150              14.5            2175
  17    a 20             150              18.5            2775
                   n = 1550                            = 13025

                             X = 13025/1550 =8.4 años de escolaridad
Datos para q1:                  Datos para q3·:
                   f/4 = 387                            3 f/4 = 1162
                 Li = 5                          Li     =9
                 fa = 250                               fa      = 950
                 f = 700                                f       = 300
                 i =4                            i      =4

Q1 = 5 + ((387-250)/700)4 = 5.8           Q3 = 9 + ((1162 -950) 300) 4 = 11.8

(2) Decil: Dn = n( F/10)    Percentil: Pn = n( F/100)

Para calcular cualquier decil o percentil, se aplica la misma formula cambiando en n( f/n), los
valores respectivos, por ejemplo: Para el 7 decil o para el percentil 40:

                Datos para el 7o decil:          Datos para el 40 percentil:
                7( f/10) = 1085                         40( f/100) = 620
                Li          =9                          Li              =5
                fa          = 950                       fa              =200
                f           = 300                       f               =700
                i           =4                          i               =4
D7 = 9 + ((1085 - 950)/300)4 = 10.8              P40 = 5 + ((620-200)/700)4 0 7.4

MEDIDAS DE DISPERSIÓN

3.1 Rango:
El Rango es la diferencia entre la magnitud Mayor y la magnitud Menor de una serie de datos; por
ejemplo en las clases del ejemplo anterior: 20 – 0 = 20

3.2.- Desviación Media:
Es el promedio de la sumatoria de las diferencias absolutas de xi menos x :

DM =     │xi - x │/n

3.3.- Desviación estándar (s) y varianza (S ) para nivel de medición nominal en una serie
simple:

Fórmulas:

                  2
     2
            xi   x /n

                  2
S2          xi   x /n
Datos:
Clase % votación  x (xi - x )            (xi - x )2
01        24     24.4 - 0.4                0.16
02        26            1.6               2.56       S2 = 45.3
03        21          - 3.4              11.56
04        19             - 5.4              29.16
05        22          - 2.4               5.76       s = 2 45 .3    6.73
06        34               9.6              92.16
07        39          14.6              211.96
08        15          - 9.4              88.16
09        22          - 2.4               5.76
10        22          - 2.4               5.76
                                                = 453.00

2) Desviación estándar (s) y varianza (S2) para nivel de medición ordinal

                   2
     2
             p - x f/n

                   2
S2           p - x f/n

 P           CLASE          FREC.     PxF            x           P- x        (P - x )2 F
 5       Calidad alta        200      1,000         3.5           1.5          450.0
 4       Calidad media       300      1,200                       0.5           75.0
 3       Calidad regular     350      1,050                       0.5           87.5
 2       Calidad baja        100       200                        -1.5         225.0
 1       Calidad nula        50         50                        -2.5         312.5
         TOTAL              1,000     3,500                                   1,150.0

 xi·p = 1,150, n = 1,000              S2 = 1,150/1000 = 1.5
     2
          1.5   1.07

3) Desviación estándar intervalar
Fórmulas:
                                 2
                           xi   x f                                      2
                       2
                                                     S2        xi   x f/n
                      n
Clase Marca de Clase. frecuencia x (xi - x ) (xi - x )2 f
0         0              100    8.4 - 8.4     7056.0
1 a 4     2.5            150         - 5.9    5221.5
5 a 8     6.5            700         - 1.9    2527.0
9 a 12 10.5                300            2.1    1323.0
13 a 16 14.5             150           6.1     5581.5
17 a 20 18.5             150          10.1 15301.5
n= 1550                 S = 37110.5

x = 13025/1550 =8.4

S2 = 23.04

     2
         23 .4   4.8

4) Coeficiente de Variación
Esta medición muestra la relación entre la media y la desviación estándar; en este sentido, nos
plantea el índice entre la tendencia de dispersión sobre la tendencia central, teniendo como punto de
referencia que, en una distribución normal -paramétrica o normalizada

x = 1; mientras que s = 0:

CV = s / x . Para una distribución normal: CV. = 0/1 = 0

Para los ejemplos anteriores tenemos:
            Escala nominal: % accidentes:               CV. = 6.73 /24.4        =        0.28
            Escala ordinal: medición de la calidad:     CV. = 1.88/3.5          =        0.54
            Escala intervalar: nivel de escolaridad:    CV. = 4.8/8.4           =        0.57

MUESTREO:
En toda investigación se tiene un universo, una muestra y un elemento de estudio que es la fuente
de la información.
La muestra viene a ser en la investigación el enunciado particular ―algún S es P‖; mientras que el
universo, el enunciado general: ―Todo S es P‖.
Existen dos tipos de muestras: las paramétricas y las no paramétricas, las primeras con
probabilidades altas de que la muestra represente al universo, y las segundas con poca
probabilidad.
5.4.2.1.- Muestras Probabilísticas y no Probabilísticas:
(1) Muestras Probabilísticas:
Estas se caracterizan porque todos los elementos del universo tienen las mismas probabilidades de
ser seleccionados en la muestra, lo que es posible sólo se cada elemento de la muestra se
selecciona al azar.
Existen tres tipos de muestra paramétrica:
   Muestra aleatoria simple. En ésta no es importante conocer las diferencias del universo, por lo
   que cada elemento se selecciona al azar por medio de métodos como la lotería, números
   aleatorios, etcétera.
   Muestra estratificada. Para este tipo de muestra es importante conocer las diferencias
   existentes en el universo, por lo que cada diferencia o característica heterogénea del mismo es
   representado proporcionalmente en la muestra y cada elemento se selecciona al azar.
Muestra por conglomerados. En esta además es importante incluir, además de la
       representatividad de los estratos, la correspondiente a la representatividad proporcional de los
       elementos del universo en su distribución geográfica, seleccionándose cada elemento de la
       muestra al azar.
(2) Muestras no Probabilísticas:
En este tipo de muestras, no todos los elementos del universo tienen las mismas probabilidades de
ser contenidos en la muestra, por lo tanto no son representativas y se utilizan para investigaciones
exploratorias o diagnósticos particulares, cuyos resultados no se pretende generalizar.
Tres son las diversas muestras no paramétricas: intencionales, accidentales y por cuotas.
       Muestras intencionales. Estas se conforman por elementos que han sido seleccionados
       propositiva o intencionalmente. Existe un tipo de muestra, denominado de ―informantes
       confiables‖ que se caracteriza por ser intencional, pero que es muy útil, al utilizarse expertos, o
       personas con disposición a proporcionar información.
       Muestra accidental. Esta se compone por elementos que fueron seleccionados por medios
       casuales; en este sentido conforman accidentalmente la muestra en cuestión.
       Muestra por cuotas. Este tipo de muestra toma en cuenta las diferencias existentes en el
       universo, por lo que se conforma por grupos de muestras que representan dichas diferencias,
       pero éstas no son proporcionales y los elementos de la muestra se seleccionan intencional o
       accidentalmente.

5.4.2.2.- Tamaño de la Muestra:
Para determinar el tamaño de la muestra, se aplican diversos métodos:
        (a) Método Probabilístico
                                              n = Z2 x (pq), en dónde:
                                                          E2
                  n    = Tamaño de la muestra
                  Z    = Nivel de confianza para generalizar los resultados a todo el universo
                  pq = Variabilidad del fenómeno estudiado: probabilidad de acierto, probabilidad de error
                  E     = El error global o precisión con que se generalizarán los resultados.


        (b)   Método de la NOM: Z-12-87: Equivalente al ISO-9000: 20003




3   SECOFI. NOM:Z-12-87. TII. México
Aplicación del Método:
1) Ubicar el tamaño del universo en el Rango correspondiente al cuadro 1.
         2) Seleccionar el Nivel de Inspección del recuadro de Niveles de Inspección Generales
         3) Determinar la Letra Clave
         4) Ubicar la Letra Clave en el cuadro 2 para determinar el tamaño de la muestra
Seleccionar el Nivel de Calidad Aceptable que se va a aceptar y a rechazar



SERIES DE TIEMPO

CONCEPTO Y CARACTERÍSTICAS

Una serie de tiempo es un conjunto de datos ordenado temporalmente, tomando como punto de
referencia una unidad de tiempo: día semana, mes, bimestre, trimestre, semestre, año, etcétera. Si
hacemos referencia al aforo vehicular en un tramo carretero un ejemplo sería el siguiente:

                  AÑO                VEHICULOS                             AÑO        VEHICULOS
                  1990               2,300                                 1995            3,450
                  1991               2,450                                 1996            3,900
                  1992               2,700                                 1997            4,250
                  1993               2,800                                 1998e           4,500
                  1994               3,100

  = 29,450, el número de años, n = 9, entonces la media anual de aforo es de 3,272

CÁLCULO DE TENDENCIAS

Las series estadísticas nos sirven para calcular tendencias de incremento o decremento de las
variables, mismas que son la base de los escenarios. Por ejemplo, utilizando los datos anteriores:

AÑO               VEHICULOS                    TENDENCIA
                  (MILES)                      (MILES)
2001              2,300
2002              2,450                        150
2003              2,700                        250
2004              2,800                        100
2005              3,100                        300
2006              3,450                        350
2007              3,900                        450
2008              4,250                        350
2009              4,500                        250

            = 2,200, el número de casos, n = 8, entonces la tendencia media anual de incremento del
                       aforo es de 275
TÉCNICAS DE AJUSTE A SERIES DE TIEMPO ASIMÉTRICAS
Algunos datos en una serie de tiempo se comportan de una manera irregular, esto es, tienen saltos –
altas y bajas—que no se explican teóricamente, por lo que existen técnicas para ajustar la serie de
tiempo sin deformar los datos. La técnica más utilizada es la media movil, que implica sustituir los
datos reales por la media de cada tres datos en la serie.
AÑO          VEHICULOS (MILES)          MEDIA MOVIL (DE CADA 3)
1998           2,300
1999           2,200
2000           2,500 2,333              (1987, 88, 89)
2001           2,300 2,333              (1988, 89, 90)
2002           2,450 2417               (1989, 90, 91)
2003           2,250 2,333              (1990, 91, 92)
2004           2,800 2,500              (1991, 92, 93)
2005           3,200 2,750              (1992, 93, 94)
2006           3,050 3,017              (1993, 94, 95)
2007           3,900 3,383              (1994, 95, 96)
2008           4,250 3,733              (1995, 96, 97)
2009           4,100 4,083              (1996, 97, 98)

Como puede apreciarse, en la serie corregida se perfila una tendencia más simétrica, tendiente a la
alza.

CORRELACIÓN, REGRESIÓN Y MÍNIMOS CUADRADOS

COEFICIENTE "r" DE PEARSON.
Para medir la magnitud de la correlación entre dos variables a nivel de intervalo, la prueba "r" es
adecuada, ya que sus valores oscilan entre -1 a +1, si la relación entre las variables es inversamente
proporcional la correlación sera de 1; mientras si ésta es directamente proporcional, la correlación
sera +1.
Se mide, con esta prueba, la determinación media de cada elemento de la variable independiente
―x‖ con relación a cada elemento de la variable dependiente, ―y‖ , dando como resultado un índice de
correlación.4

Formula:

                               n(   XY) - (   X)(        Y)
                r
                                         2                       2
                     2   [n   X2      X ][n         Y2          Y ]

Supongamos que nos interesa correlacionar las fallas de mantenimiento en carreteras, captadas a
través de los reportes de supervisión y el número de accidentes reportados en ocho meses, la
unidad de medida es cientos.

X: Fallas de mantenimiento              8.2    9.6        6.5        7.8   9.0   6.7    8.4     7.4
Y: Accidentes                           8.0    9.3        6.6        7.5   8.6   7.0    8.2     7.2

4
    Moreno. Op. Cit. p 136 y 81.
Aplicación de la formula:
          X    Y      X·Y                            X2       Y2
        8.2 8.0      65.6                         67.2       64.0
        9.6 9.3      89.3                         92.2       86.5
        6.5 6.6      42.9                         42.3       43.6
        7.8 7.5      58.5                         60.8       56.3
        9.0 8.6      77.4                         81.0       74.0
        6.7 7.0      46.9                         44.9       49.0
        8.4 8.2      68.9                         70.6       67.2
        7.4 7.2      53.3                         54.8       51.8

            63.6 62.4                   502.8 513.8          492.4

                                                          8(502.8) (63.6)(62.4)
                                        r                                                     0.98
                                            2
                                                [8(513.8) (63.6) 2 ][8(492.4) (62.4) 2 ]

10. ESCENARIOS

Conceptualización:
La estadística proyectiva es una herramienta para construir escenarios de prospectiva, el método
parte de un punto de referencia en el pasado(To), cuantifica las tendencias de incremento o
decremento de las variables al presente (T1) y las proyecta a un futuro dado (T2):

T0           T1                                     T2         T3
     TENDENCIA                                      ESCENARIOS

A continuación se expone esta conceptualización en la siguiente gráfica.
  y ^                                               x=        variable independiente
                                        *                     tiempo
                                    *
                                *                             y=       variable dependiente
                            *                                 proyección cuantitativa
                        *
                    *                               To =      pasado
                *
            *                                                 T1 =       presente
        *
     *                                              T2 =       futuro
     ------------------------> x
                                                    T's% =     tendencias
     To---->T1----->T2
      T's%        E's                               E's =      escenarios

                                                              *      = dato histórico
     Diagnóstico
                                                              *      = dato proyectado
                                    Pronóstico
Tipos de proyección:

Dependiendo de las características de las variables a proyectar, existen dos tipos de técnicas
proyectivas: proyección de variables estadísticamente independientes y proyección de variables
estadísticamente correlacionadas

a) Proyección de variables estadísticamente independientes

   Conceptualización:
En la proyección de este tipo de variables se parte del hecho o la suposición fundamentada de que:
su comportamiento no está determinado por ninguna otra variable o no se cuenta con información
confiable sobre el comportamiento de la posible variable antecedente.

   Clasificación: Las técnicas proyectivas de las variables estadísticamente independientes son
dos:

1) Proyección simple:

Escenario = ud + x

        ud = Ultimo dato de una serie
        x = Tendencia media de incremento-decremento de la variable

Esta técnica es unilineal, pues el escenario se construye añadiendo la tendencia media de la
variable.

                Proyección de la Variable ―X·‖
        Año            Comportamiento                   Tendencia
        2002                    1200
        2003                    1350                   150
        2004                    1300                   - 50
        2005                    1400                   100     TENDENCIA MEDIA ANUAL
        2006                    1450                   150
        2007                    1550                   100           x = 71
        2008                    1500                   - 50
        2009                    1600                   100
                                                      500/7 = 71

Construcción de escenarios:
              Año                       Comportamiento Posible
                                             Escenario
                2010                         1671
                2011                         1742
                2012                         1813
                2013                         1884
                2014                         1955
2) Proyección con rango: Escenario = ud + ( x ±       / v)

Este escenario se conforma por tres componentes:
   Límite superior del escenario:             ud +( x + / v) Límite Superior
   Punto medio del escenario:                 ud + x Proyección media
   Límite inferior del escenario:             ud +( x - / v) Límite inferior

En donde:                       ud =    ultimo dato de la serie
                                x =     tendencia media de incremento o decremento
                                   =    desviación estándar de la serie
                                 v =    variemus

La función del variemus es definir la extensión del rango de ocurrencia del escenario, en relación al
valor del coeficiente de variación (CV) de la serie de la variable proyectada:

Si el CV. DE 1 A 0, v = 1
Si el CV. DE 2 A 1, v = 2
Si el CV. DE 3 A 2, v = 3

En este sentido, el escenario enuncia que la variable proyectada a futuro (T2), probabilísticamente
se ubicara entre un valor mínimo Lm y un valor máximo LM: El rango de probabilidad donde se ubica
el escenario de la variable permite contar con un margen de maniobra en la toma de decisiones;
esto es, en situaciones de certidumbre, la decisión puede tomarse en relación a su valor máximo;
mientras que en caso de riesgo por incertidumbre, la decisión hace referencia al valor mínimo.

Proyección de la inversión bruta de capital para los próximos tres años:
año       i.b.c
       (millones)        xi        x       (xi - x )    ( xi – x )2
2003 1450
2004 1600               150      92          58          3364
2005 1880               130                  38          1444
2006 2000               120                  28           784
2007 2150               150                  58          3364
2008 2170                 20               - 72          5184
2009 2150               - 20              -112         12544
                n=       550                         = 26684

x = 550/6 = 91.6 ≈ 92

     2
         26684 / 6 = 67

CV= 67/92 = 0.73,         v=1
Escenarios:
Año LM                              PM                              LM
      ud + ( x - /v)                  ud + x                     ud + ( x + /v)
10 2150 + 92 - 67= 2175         2150+92 =2242         2150 + 92 + 67 = 2309
11 2242 + 92 - 67= 2267         2242+92 =2334         2242 + 92 + 67 = 2401
12 2334 + 92 - 67= 2359         2334+92 =2426         2234 + 92 + 67 = 2493

Para las variables estadísticamente correlacionadas se utiliza la técnica de mínimos cuadrados,
expuesta en el punto anterior. En este caso se parte del supuesto que una variable independiente X
determina a una variable dependiente Y, por lo que todo cambio en X, produce un cambio en Y. El
método implica:

Cálculo del escenario de X, a través de las técnicas de variable estadísticamente independiente.

Calculo del escenario de Y, utilizando las técnicas de variables estadísticamente correlacionadas:

Si utilizamos los datos de los escenarios de ―X‖ expuestos más arriba y los datos de ―Y‖ presentados
en el punto anterior, el cálculo de los escenarios de ―y‖ son:

y = a + bx. Tanto ―a‖ como ―b‖ son constantes y lo que cambia es el escenario de x.

Habrá de tener en cuenta que los escenarios siempre constituyen hipótesis respecto al
comportamiento futuro de una variable, por lo que deberán tratarse de una manera probabilística.

1) Cálculo de "b"
b = [6(2185050) - 13007500] / 6(24550800)-146410000 =0.11

2) Cálculo de "a"
a = [1075 - (0.11)(12100)] / 6 = -42.6

3) Cálculo de "y"
   Escenario 1996:    y= -42.6 + (0.11)(2242) = 204
   Escenario 1997:    y= -42.6 + (0.11)(2334) = 214
   Escenario 1998:    y= -42.6 + (0.11)(2426) = 224
BIBLIOGRAFÍA:

                                       Estadística
        Autor                 Título          Edición      Editorial    Ciudad   Año
Hubert, M y Blalok J.   Estadística Social   10a        Ariel          Barcelona 2001
                                             33         Plaza y
Rojas, Soriano                               Reimp      Valdés         México   2002
                                                        UNAM
                                                        Plaza y
Rojas Soriano           Guía para realizar     11a      Valdés         México   2006
                         investigaciones
                             sociales

Más contenido relacionado

La actualidad más candente

EL ROL DOCENTE EN LOS PROCESOS DE EVALUACIÓN DE LOS APRENDIZAJES
EL ROL DOCENTE EN LOS PROCESOS DE EVALUACIÓN DE LOS APRENDIZAJESEL ROL DOCENTE EN LOS PROCESOS DE EVALUACIÓN DE LOS APRENDIZAJES
EL ROL DOCENTE EN LOS PROCESOS DE EVALUACIÓN DE LOS APRENDIZAJESEmanuel Manuel Camacho Arce
 
Mapa conceptual ambientes de aprendizaje-melisa
Mapa conceptual ambientes de aprendizaje-melisaMapa conceptual ambientes de aprendizaje-melisa
Mapa conceptual ambientes de aprendizaje-melisaMeeLii RodriiGuezz
 
Propuesta Curricular 15-16
Propuesta Curricular 15-16Propuesta Curricular 15-16
Propuesta Curricular 15-16E- ORIENTA
 
Definición y clasificación de recursos didacticos
Definición y clasificación de recursos didacticosDefinición y clasificación de recursos didacticos
Definición y clasificación de recursos didacticosDiego Troentle
 
Prueba objetiva y examen
Prueba objetiva y examenPrueba objetiva y examen
Prueba objetiva y examenAlva R. Lomelí
 
PLANIFICACION CURRICULAR
PLANIFICACION CURRICULARPLANIFICACION CURRICULAR
PLANIFICACION CURRICULARflorfalcones1
 
resumen acuerdo 444
resumen acuerdo 444resumen acuerdo 444
resumen acuerdo 444velezp700
 
Objetivos de la evaluacion
Objetivos de la evaluacionObjetivos de la evaluacion
Objetivos de la evaluacionMayra_Gualotuna
 
Cuadro de autores de la teoría curricular
Cuadro de autores de la teoría curricularCuadro de autores de la teoría curricular
Cuadro de autores de la teoría curricularAlain Rodmer
 
Mapa conceptual del sistema educativo
Mapa conceptual del sistema educativoMapa conceptual del sistema educativo
Mapa conceptual del sistema educativoMaryori Mendoza
 
Cuestionario gestion curricular
Cuestionario gestion curricularCuestionario gestion curricular
Cuestionario gestion curricularedgar17diciembre
 

La actualidad más candente (20)

Currículo Nulo
Currículo NuloCurrículo Nulo
Currículo Nulo
 
Cuadro comparativo teorias del currículo
Cuadro comparativo   teorias del currículoCuadro comparativo   teorias del currículo
Cuadro comparativo teorias del currículo
 
EL ROL DOCENTE EN LOS PROCESOS DE EVALUACIÓN DE LOS APRENDIZAJES
EL ROL DOCENTE EN LOS PROCESOS DE EVALUACIÓN DE LOS APRENDIZAJESEL ROL DOCENTE EN LOS PROCESOS DE EVALUACIÓN DE LOS APRENDIZAJES
EL ROL DOCENTE EN LOS PROCESOS DE EVALUACIÓN DE LOS APRENDIZAJES
 
Diseño curricular
Diseño curricularDiseño curricular
Diseño curricular
 
Mapa conceptual ambientes de aprendizaje-melisa
Mapa conceptual ambientes de aprendizaje-melisaMapa conceptual ambientes de aprendizaje-melisa
Mapa conceptual ambientes de aprendizaje-melisa
 
Propuesta Curricular 15-16
Propuesta Curricular 15-16Propuesta Curricular 15-16
Propuesta Curricular 15-16
 
Definición y clasificación de recursos didacticos
Definición y clasificación de recursos didacticosDefinición y clasificación de recursos didacticos
Definición y clasificación de recursos didacticos
 
Árbol de Problemas
Árbol de ProblemasÁrbol de Problemas
Árbol de Problemas
 
Prueba objetiva y examen
Prueba objetiva y examenPrueba objetiva y examen
Prueba objetiva y examen
 
Encuesta sobre perfil docente
Encuesta sobre perfil docenteEncuesta sobre perfil docente
Encuesta sobre perfil docente
 
PLANIFICACION CURRICULAR
PLANIFICACION CURRICULARPLANIFICACION CURRICULAR
PLANIFICACION CURRICULAR
 
Ensayo organización escolar
Ensayo   organización escolarEnsayo   organización escolar
Ensayo organización escolar
 
resumen acuerdo 444
resumen acuerdo 444resumen acuerdo 444
resumen acuerdo 444
 
Objetivos de la evaluacion
Objetivos de la evaluacionObjetivos de la evaluacion
Objetivos de la evaluacion
 
Cuadro de autores de la teoría curricular
Cuadro de autores de la teoría curricularCuadro de autores de la teoría curricular
Cuadro de autores de la teoría curricular
 
Tendencias de la didactica (1)
Tendencias de la didactica (1)Tendencias de la didactica (1)
Tendencias de la didactica (1)
 
Mapa conceptual del sistema educativo
Mapa conceptual del sistema educativoMapa conceptual del sistema educativo
Mapa conceptual del sistema educativo
 
Características del curriculo
Características del curriculoCaracterísticas del curriculo
Características del curriculo
 
Evaluación inclusiva
Evaluación inclusivaEvaluación inclusiva
Evaluación inclusiva
 
Cuestionario gestion curricular
Cuestionario gestion curricularCuestionario gestion curricular
Cuestionario gestion curricular
 

Último

Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Alejandrino Halire Ccahuana
 
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdfGUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdfPaolaRopero2
 
Ejercicios de PROBLEMAS PAEV 6 GRADO 2024.pdf
Ejercicios de PROBLEMAS PAEV 6 GRADO 2024.pdfEjercicios de PROBLEMAS PAEV 6 GRADO 2024.pdf
Ejercicios de PROBLEMAS PAEV 6 GRADO 2024.pdfMaritzaRetamozoVera
 
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdfSELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdfAngélica Soledad Vega Ramírez
 
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...JAVIER SOLIS NOYOLA
 
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...Carlos Muñoz
 
2024 - Expo Visibles - Visibilidad Lesbica.pdf
2024 - Expo Visibles - Visibilidad Lesbica.pdf2024 - Expo Visibles - Visibilidad Lesbica.pdf
2024 - Expo Visibles - Visibilidad Lesbica.pdfBaker Publishing Company
 
TECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptx
TECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptxTECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptx
TECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptxKarlaMassielMartinez
 
Registro Auxiliar - Primaria 2024 (1).pptx
Registro Auxiliar - Primaria  2024 (1).pptxRegistro Auxiliar - Primaria  2024 (1).pptx
Registro Auxiliar - Primaria 2024 (1).pptxFelicitasAsuncionDia
 
proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niñoproyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niñotapirjackluis
 
Neurociencias para Educadores NE24 Ccesa007.pdf
Neurociencias para Educadores  NE24  Ccesa007.pdfNeurociencias para Educadores  NE24  Ccesa007.pdf
Neurociencias para Educadores NE24 Ccesa007.pdfDemetrio Ccesa Rayme
 
Planificacion Anual 4to Grado Educacion Primaria 2024 Ccesa007.pdf
Planificacion Anual 4to Grado Educacion Primaria   2024   Ccesa007.pdfPlanificacion Anual 4to Grado Educacion Primaria   2024   Ccesa007.pdf
Planificacion Anual 4to Grado Educacion Primaria 2024 Ccesa007.pdfDemetrio Ccesa Rayme
 
plan de capacitacion docente AIP 2024 clllll.pdf
plan de capacitacion docente  AIP 2024          clllll.pdfplan de capacitacion docente  AIP 2024          clllll.pdf
plan de capacitacion docente AIP 2024 clllll.pdfenelcielosiempre
 
Qué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaQué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaDecaunlz
 
CLASE - La visión y misión organizacionales.pdf
CLASE - La visión y misión organizacionales.pdfCLASE - La visión y misión organizacionales.pdf
CLASE - La visión y misión organizacionales.pdfJonathanCovena1
 
Éteres. Química Orgánica. Propiedades y reacciones
Éteres. Química Orgánica. Propiedades y reaccionesÉteres. Química Orgánica. Propiedades y reacciones
Éteres. Química Orgánica. Propiedades y reaccionesLauraColom3
 
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOSTEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOSjlorentemartos
 
Cuaderno de trabajo Matemática 3 tercer grado.pdf
Cuaderno de trabajo Matemática 3 tercer grado.pdfCuaderno de trabajo Matemática 3 tercer grado.pdf
Cuaderno de trabajo Matemática 3 tercer grado.pdfNancyLoaa
 
Ley 21.545 - Circular Nº 586.pdf circular
Ley 21.545 - Circular Nº 586.pdf circularLey 21.545 - Circular Nº 586.pdf circular
Ley 21.545 - Circular Nº 586.pdf circularMooPandrea
 

Último (20)

Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
 
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdfGUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
 
Ejercicios de PROBLEMAS PAEV 6 GRADO 2024.pdf
Ejercicios de PROBLEMAS PAEV 6 GRADO 2024.pdfEjercicios de PROBLEMAS PAEV 6 GRADO 2024.pdf
Ejercicios de PROBLEMAS PAEV 6 GRADO 2024.pdf
 
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdfSELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
 
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
 
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
 
2024 - Expo Visibles - Visibilidad Lesbica.pdf
2024 - Expo Visibles - Visibilidad Lesbica.pdf2024 - Expo Visibles - Visibilidad Lesbica.pdf
2024 - Expo Visibles - Visibilidad Lesbica.pdf
 
TECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptx
TECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptxTECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptx
TECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptx
 
Registro Auxiliar - Primaria 2024 (1).pptx
Registro Auxiliar - Primaria  2024 (1).pptxRegistro Auxiliar - Primaria  2024 (1).pptx
Registro Auxiliar - Primaria 2024 (1).pptx
 
proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niñoproyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
 
Neurociencias para Educadores NE24 Ccesa007.pdf
Neurociencias para Educadores  NE24  Ccesa007.pdfNeurociencias para Educadores  NE24  Ccesa007.pdf
Neurociencias para Educadores NE24 Ccesa007.pdf
 
Planificacion Anual 4to Grado Educacion Primaria 2024 Ccesa007.pdf
Planificacion Anual 4to Grado Educacion Primaria   2024   Ccesa007.pdfPlanificacion Anual 4to Grado Educacion Primaria   2024   Ccesa007.pdf
Planificacion Anual 4to Grado Educacion Primaria 2024 Ccesa007.pdf
 
plan de capacitacion docente AIP 2024 clllll.pdf
plan de capacitacion docente  AIP 2024          clllll.pdfplan de capacitacion docente  AIP 2024          clllll.pdf
plan de capacitacion docente AIP 2024 clllll.pdf
 
Qué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaQué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativa
 
CLASE - La visión y misión organizacionales.pdf
CLASE - La visión y misión organizacionales.pdfCLASE - La visión y misión organizacionales.pdf
CLASE - La visión y misión organizacionales.pdf
 
Éteres. Química Orgánica. Propiedades y reacciones
Éteres. Química Orgánica. Propiedades y reaccionesÉteres. Química Orgánica. Propiedades y reacciones
Éteres. Química Orgánica. Propiedades y reacciones
 
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOSTEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
 
Unidad 3 | Metodología de la Investigación
Unidad 3 | Metodología de la InvestigaciónUnidad 3 | Metodología de la Investigación
Unidad 3 | Metodología de la Investigación
 
Cuaderno de trabajo Matemática 3 tercer grado.pdf
Cuaderno de trabajo Matemática 3 tercer grado.pdfCuaderno de trabajo Matemática 3 tercer grado.pdf
Cuaderno de trabajo Matemática 3 tercer grado.pdf
 
Ley 21.545 - Circular Nº 586.pdf circular
Ley 21.545 - Circular Nº 586.pdf circularLey 21.545 - Circular Nº 586.pdf circular
Ley 21.545 - Circular Nº 586.pdf circular
 

Guía técnica de estudio de estadística aplicada a la evaluación

  • 1. ESTADÍSTICA APLICADA A LA EVALUACIÓN GUÍA TÉCNICA DE ESTUDIO DANIEL ACOSTA ESPARZA MAYO DE 2010
  • 2. GUÍA TÉCNICA DE ESTUDIO DE ESTADÍSTICA APLICADA A LA EVALUACIÓN La Estadística es una rama de las matemáticas que ordena, describe, explica y proyecta datos y está asociada a la probabilidad y la inducción. PROBABILIDAD La probabilidad se emplea en procesos físicos, biológicos y sociales que no pueden predecirse con exactitud. Los eventos aleatorios ocurren con una frecuencia relativa constante. Este tipo de comportamiento se denomina aleatorio o estocástico, y su frecuencia proporciona una medida intuitiva pero significativa de su posibilidad de ocurrencia. El uso de esta frecuencia como medida de la posibilidad de ocurrencia de una condición tiene como objetivo determinar con cierta precisión el acierto en el resultado del evento. S B Como punto de partida, la teoría de la probabilidad considera la teoría de conjuntos: Si S es el conjunto de todos los elementos considerados, S es el conjunto universo. Para cualquiera de los A conjuntos A y B se dice que A es subconjunto de B (A B) si cada elemento de A está también en B. El conjunto vacío ( ) es un subconjunto que carece de elementos, por lo que es un subconjunto de cualquier conjunto. Los conjuntos y sus relaciones se representan en diagramas de Venn. Si consideramos dos conjuntos arbitrarios A y B, la unión de A con B se denota como A B y contiene los elementos de A y de B. S A B La intersección de A y B (A B) son los elementos que se encuentran en A y que también se encuentran en B. S A B Si A es un subconjunto de S, el complemento de A ( A ) son los elementos de S que no se encuentran en A. S A A A y B son mutuamente excluyentes si A B= , o sea que no tienen elementos comunes. A B
  • 3. S B S S S A B A B A A B A A A B A B A B S=A A A B= En una población, una muestra participa con una proporción determinada, a lo que se denomina frecuencia relativa, y hace referencia a la probabilidad de ocurrencia del evento en estabilizada en un punto por la regularidad de su aparición. Por lo tanto, la probabilidad de suceso del evento se representa como su frecuencia relativa. P(A)=Frecuencia Relativa de A INDUCCIÓN: La lógica es la disciplina que trata la relación de implicación de las proposiciones relación Premisa------------------->Conclusión DEDUCCIÓN inclusión relación Premisa<-----------------------Conclusión INDUCCIÓN probabilística La posible verdad o falsedad de un conjunto limita la posible verdad o falsedad del otro: Si la premisa es verdadera, entonces la conclusión es verdadera Si la premisa es falsa, entonces la conclusión es falsa Si la conclusión es verdadera, la premisa puede ser verdadera Si la conclusión es falsa, la premisa es falsa (2) Cantidad-calidad La proposición es un enunciado del que es posible afirmar que es verdadero o falso. Las proposiciones pueden analizarse en cuanto a calidad como afirmativas o negativas; mientras que en cuanto a calidad en generales o particulares: Calidad Afirmativo Negativo Cantidad Universal Todos S es P Ningún S es P A E Particular Algún S es P Algún S no es P I O
  • 4. MEDICIÓN El análisis de la medición se aborda a partir de dos temáticas: los niveles y las escalas de medición que son utilizados en las diversas disciplinas científicas y su aplicación en la estadística. 1 NIVELES DE MEDICIÓN. Para todas las ciencias, existen diversos niveles de medición, mismos que pueden clasificarse en cuatro, dependiendo de su precisión y exactitud. a) Nivel nominal: Diferenciación de una uniformidad empírica: CLASE telekinesis telepatía hiponosis b) Nivel ordinal = Nivel Nominal + ordenamiento cualitativo de mayor a menor o viceversa: CLASE PESO Excelente calidad 5 Buena calidad 4 Regular Calidad 3 Mala Calidad 2 Nula calidad 1 c) Nivel proporcional = Nivel Ordinal + Intervalo: CLASE INTERVALO FRECUENCIA analfabeta 0 30 primaria 6 90 secundaria 9 99 preparatoria 12 70 licenciatura 16 50 maestría 18 19 doctorado 20 10 d) Nivel de razón = Nivel Proporcional + 0 absoluto: Salarios mínimos CLASE MC FRECUENCIA 0 0 20 1 a 5 3 50 5 a 10 8 40 11 a 15 13 20 16 a 20 18 10 1 Acosta, E. D. Teoría Metodología y Técnicas de Investigación. UIA. México. 1980
  • 5. Hasta aquí primera clase Clasificación de la estadistica TIPOS DE ESTADÍSTICA ESTADÍSTICA DESCREPTIVA MEDIDAS DE TENDENCIA a) MEDIA CENTRAL b) MEDIANA c) MODA ANÁLISIS DE ESTRATIFICACIÓN a) DESVIACIÓN CUARTIL b) DESVIACIÓN DECIL c) DESVIACIÓN PERCENTIL MEDIDAS DE DISPERSIÓN a) RANGO b) DESVIACIÓN MEDIA c) VARIANZA d) DISEPRSIÓN ESTÁNDAR SÍNTESIS DESCRIPTIVA: a) DESVIACIÓN ESTANDAR/MEDIA COEFICIENTE DE VARIACIÓN ESTADÍSTICA EXPLICATIVA PRUEBAS PARAMÉTRICAS a) PRUEBA ―t‖ b) ―f‖ DE FISHER b) CORRELACIÓN ―r” PRUEBAS NO PARAMÉTRICAS 2 (Ji CUADRADA) ESTADÍSTICA PROYECTIVA ESCENARIOS: VARIABLE a) ESCENARIOS SIMPLES ESTAD. INDEPENDIENTE: X b) ESCENARIOS CON RANGOS ESCENARIOS VARIABLE ESTAD. a) LINEAL CORRELACIONADA: Y b) EXPONENCIAL c) LOGARÍTMICA DISTRIBUCIÓN NORMAL Premisa: Existen regularidades en la naturaleza: * * * * * * * 3s 2s s X S 2s 3s 66% 95% 99%
  • 6. CARACTERÍSTICAS: En una distribución de frecuencia paramétrica, las tres mediciones de tendencia central coinciden en un mismo punto; en este sentido, La diferencia del valor de estas tres medidas nos da una idea del carácter normalizado o no de los datos analizados. CONSTRUCCIÓN DE FRECUENCIAS En el análisis estadístico tenemos dos conceptos básicos: el de población y el de muestra:2 Se denomina población al conjunto formado por la totalidad de los eventos de una clase o categoría a ser analizados. Un subconjunto o parte de la población. Se le llama muestra. Esta puede ser representativa o no de aquella; para que una muestra sea representativa de una población, sus elementos deben ser seleccionados por algún método aleatorio. En la investigación, obtenemos datos de muestras, mismo que clasifican y tabulan para construir frecuencias y realizar el análisis cuantitativo. CLASIFICACIÓN En la investigación se maneja una gran cantidad de datos, por lo que es conveniente agruparlos en clases o categorías. En este sentido, la clasificación implica ordenar o agrupar los datos; clasificación que, de antemano, está determinada por el nivel de medición de los datos analizados. El punto de referencia para construir los datos es: Para el nivel de medición nominal, el dato mismo, como uniformidad empírica Para el nivel de medición ordinal: el conocimiento acumulado o teoría que describe o explica las uniformidades empíricas Para los niveles de medición de proporción o razón, el intervalo. Con relación al intervalo, recordamos que este consiste en la diferencia cuantitativa entre las clases, por lo que dados ciertos datos, es posible obtener la longitud del intervalo, calculando la diferencia entre la máxima y la mínima observación y dividiendo la diferencia resultante entre el número deseado de intervalos, la longitud de los intervalos debe ser igual a este cociente. Ejemplo: Se tienen 50 casos, cuya cuantificación menor es de 10 y la mayor de 60 y se quiere manejar 5 intervalos, entonces la longitud del intervalo se calcularía de la siguiente forma: 60 - 10 = 50/5 = 10, por lo que las clases que tendríamos serían: CLASE: De 1 a 10 De 11 a 20 De 21 a 30 De 31 a 40 De 41 a 50 De 51 a 60 2 Moreno, B. A. Probabilidad y Estadística. R y S I. México. 1980.
  • 7. TABULACIÓN: La ubicación de cada dato en la clase que le corresponde es lo que se denomina tabulación. Ejemplo, tenemos los siguientes datos: 10 11 21 43 15 18 17 16 35 14 26 60 26 45 10 58 24 14 38 26 24 56 28 40 19 60 26 15 47 37 12 42 16 38 47 26 28 22 50 26 18 35 19 35 59 43 33 44 57 43 La tabulación implicara ubicar cada caso en la clase que se construyo: CLASE FRECUENCIA De 1 a 10 2 De 11 a 20 13 De 21 a 30 12 De 31 a 40 7 De 41 a 50 9 De 51 a 60 7 TOTAL 50 FRECUENCIA: El total de casos por cada una de las categorías se le denomina Frecuencia. Al arreglo tabular de los datos por clase junto con sus correspondientes frecuencias de clase, se les denomina tabla de frecuencias. El resultado del ejemplo anterior, en donde tenemos clase y frecuencia, constituye una tabla de frecuencias. Frecuencia simple o absoluta. Esta se compone de la clase y frecuencia, como es el caso del ejemplo anterior. Frecuencia relativa. En este tipo de frecuencias, se les añade el peso porcentual de cada clase. Por ejemplo, si utilizamos los datos anteriores, tenemos la siguiente frecuencia relativa: CLASE: FRECUENCIA FRECUENCIA RELATIVA ABSOLUTA De 1 a 10 2 4 De 11 a 20 13 26 De 21 a 30 12 24 De 31 a 40 7 14 De 41 a 50 9 18 De 51 hasta 60 7 14 TOTAL 50 100% Frecuencia -Acumulativa. En este caso, por cada clase se suman las frecuencias anteriores, dándonos como resultado el 100% en la última clase
  • 8. CLASE FRECUENCIA FRECUENCIA FRECUENCIA ABSOLUTA ACUMULATIVA RELATIVA ACUM. De 1 a 10 2 2 4 De 11 a 20 13 15 30 De 21 a 30 12 27 54 De 31 a 40 7 34 68 De 41 a 50 9 43 86 De 51 hasta 60 7 50 100% TOTAL 50 GRAFICACIÓN DE DATOS Los datos podemos graficarlos en histogramas y polígonos de frecuencia: HISTOGRAMA POLÍGONO DE FRECUENCIA 15 15 10 10 5 5 0 0 10 20 30 40 50 60 10 20 30 40 50 60 RANGOS Las clases intervalares, nivel de medición de proporción y de razón, se integran por un límite menor y un límite mayor, como es el caso del ejemplo expuesto con anterioridad: CLASE FRECUENCIA Limite Limite Inferior Superior Hasta 10 2 De 11 a 20 13 De 21 a 30 12 De 31 a 40 7 De 41 a 50 9 De 51 a Hasta 60 7 TOTAL 50 EL punto medio entre el límite mayor y el límite menor, se denomina marca de clase y constituye el valor representativo de cada clase. La marca de clase se calcula sumando el límite mayor más el límite menor entre dos. Para el ejemplo anterior tenemos:
  • 9. CLASE MARCA DE FRECUENCIA CLASE Limite Limite Inferior Superior Hasta 10 10 2 De 11 a 20 15.5 13 De 21 a 30 25.5 12 De 31 a 40 35.5 7 De 41 a 50 45.5 9 De 51 a Hasta 60 55.5 7 TOTAL 50 SUMATORIA: La sumatoria, que simplemente es la suma de una serie de datos, se simboliza con la sigma mayúscula: es utilizada en diferentes mediciones estadísticas como la Media o la Desviación Estándar. Un ejemplo sería el siguiente: MES ACCIDENTES MES ACCIDENTES 01 34 07 45 02 26 08 48 La sumatoria será el número 03 18 09 34 de los accidentes ocurridos 04 42 10 21 05 30 11 19 durante los 12 meses: 06 21 12 39 = 377 Es importante observar que en el caso de los niveles de medición ordinal, que tienen un peso y frecuencia, así como el caso intervalar en que se da marca de clase y frecuencia, primeramente tiene que ponderarse, multiplicando, en el caso ordinal, peso x frecuencia; mientras que en el intervalar, marca de clase x frecuencia. CLASE PESO FRECUENCIA PESO X FRECUENCIA Excelente calidad 5 50 250 Buena calidad 4 70 280 Regular Calidad 3 90 270 Mala Calidad 2 80 160 Nula calidad 1 70 70 TOTAL n=360 = 1,030 ESTADÍSTICA DESCRIPTIVA MEDIDAS DE TENDENCIA CENTRAL (1) Media simple o nominal: Cada clase es independiente entre sí, o sea clase es igual a la frecuencia xi X n
  • 10. Promedio de accidentes en 10 tramos carreteros CLASE FRECUENCIA CLASE FRECUENCIA 01 24 06 34 02 26 07 39 03 21 08 15 04 19 09 22 05 22 10 22 xi = 244 y n = 10 Matematización: X = 244/10 = 24.1 (2) Media ordinal o ponderada: Esta se utiliza con escalas de medición ordinal: agregativa de clase, acumulativa de peso o diferencial: X = ·pf/n p = peso de la clase f = frecuencia n = sumatoria de las frecuencias de clase Medición de calidad en diferentes muestras de un producto: p clase frecuencia ponderación 5 calidad alta 200 1,000 4 calidad media 300 1,200 3 calidad regular 350 1,050 2 calidad baja 100 200 1 calidad nula 50 50 Total 1,000 3,500 pf = 3,500, n = 1,000 X = 3,500/1000 = 3.5. La opinión se encuentra entre la clase ―calidad media‖ y ―calidad regular‖. En las escalas ordinales cuya base es el peso lógico de las clases pueden ser convertidas en X%, media porcentual con la finalidad de utilizar la estadística paramétrica, tal conversión se realiza dividiendo la posición media entre el valor del peso óptimo o valor máximo (VM) multiplicado por 100: X % = ( X /VM)x100 Para el caso anterior, tenemos: X % (3.5/5)100 = 70%. Para el análisis de posicionamiento (Benchmarking) la media porcentual de una institución se compara con la Media Porcentual del Contexto, o con el concepto ―excelencia‖, mismo que hace referencia al valor máximo de las clases, en este sentido, siempre será el 100%
  • 11. (3) Intervalar: La media aplicada a datos intervalares se clasifican en los niveles de medición proporcional y de razón. X = xi·f/n Promedio de escolaridad: Clase Frecuencia M.C Ponderación 0 100 0 0 1 a 4 150 2.5 375 5 a 8 700 6.5 4550 9 a 12 300 10.5 3150 13 a 16 150 14.5 2175 17 a 20 150 18.5 2775 n = 1550 = 13025 X = 13025/1550 =8.4 años de escolaridad ANÁLISIS DE ESTRATIFICACIÓN. Las medidas de dispersión aplicadas al análisis de estratificación son: desviación cuartil, decil y percentil, las cuales expresan la forma como entre el límite menor y el mayor, se distribuyen los datos: en cuatro partes para el cuartil, 10 para el decil y 100 para el percentil. Estas medidas son muy útiles en el análisis de estratificación social, política o administrativa y determinar los niveles de ingresos, consumo, inversión, etc. (1) Cuartil: Qn = n( F/4) mediana Dato mínimo: 25% 25% 25% 25%: Dato máximo q1 q2 q3 q4 Q1 = Li + (( f/4 - fa)/f·)i Q2 =MD Q3 = Li + (( 3 f/4 - fa)/f·)i Ej: Si calculamos el qi y q3 para los datos de escolaridad tenemos: Clase Frecuencia M.C Ponderación 0 100 0 0 1 a 4 150 2.5 375 5 a 8 700 6.5 4550 9 a 12 300 10.5 3150 13 a 16 150 14.5 2175 17 a 20 150 18.5 2775 n = 1550 = 13025 X = 13025/1550 =8.4 años de escolaridad
  • 12. Datos para q1: Datos para q3·: f/4 = 387 3 f/4 = 1162 Li = 5 Li =9 fa = 250 fa = 950 f = 700 f = 300 i =4 i =4 Q1 = 5 + ((387-250)/700)4 = 5.8 Q3 = 9 + ((1162 -950) 300) 4 = 11.8 (2) Decil: Dn = n( F/10) Percentil: Pn = n( F/100) Para calcular cualquier decil o percentil, se aplica la misma formula cambiando en n( f/n), los valores respectivos, por ejemplo: Para el 7 decil o para el percentil 40: Datos para el 7o decil: Datos para el 40 percentil: 7( f/10) = 1085 40( f/100) = 620 Li =9 Li =5 fa = 950 fa =200 f = 300 f =700 i =4 i =4 D7 = 9 + ((1085 - 950)/300)4 = 10.8 P40 = 5 + ((620-200)/700)4 0 7.4 MEDIDAS DE DISPERSIÓN 3.1 Rango: El Rango es la diferencia entre la magnitud Mayor y la magnitud Menor de una serie de datos; por ejemplo en las clases del ejemplo anterior: 20 – 0 = 20 3.2.- Desviación Media: Es el promedio de la sumatoria de las diferencias absolutas de xi menos x : DM = │xi - x │/n 3.3.- Desviación estándar (s) y varianza (S ) para nivel de medición nominal en una serie simple: Fórmulas: 2 2 xi x /n 2 S2 xi x /n
  • 13. Datos: Clase % votación x (xi - x ) (xi - x )2 01 24 24.4 - 0.4 0.16 02 26 1.6 2.56 S2 = 45.3 03 21 - 3.4 11.56 04 19 - 5.4 29.16 05 22 - 2.4 5.76 s = 2 45 .3 6.73 06 34 9.6 92.16 07 39 14.6 211.96 08 15 - 9.4 88.16 09 22 - 2.4 5.76 10 22 - 2.4 5.76 = 453.00 2) Desviación estándar (s) y varianza (S2) para nivel de medición ordinal 2 2 p - x f/n 2 S2 p - x f/n P CLASE FREC. PxF x P- x (P - x )2 F 5 Calidad alta 200 1,000 3.5 1.5 450.0 4 Calidad media 300 1,200 0.5 75.0 3 Calidad regular 350 1,050 0.5 87.5 2 Calidad baja 100 200 -1.5 225.0 1 Calidad nula 50 50 -2.5 312.5 TOTAL 1,000 3,500 1,150.0 xi·p = 1,150, n = 1,000 S2 = 1,150/1000 = 1.5 2 1.5 1.07 3) Desviación estándar intervalar Fórmulas: 2 xi x f 2 2 S2 xi x f/n n Clase Marca de Clase. frecuencia x (xi - x ) (xi - x )2 f 0 0 100 8.4 - 8.4 7056.0 1 a 4 2.5 150 - 5.9 5221.5 5 a 8 6.5 700 - 1.9 2527.0 9 a 12 10.5 300 2.1 1323.0 13 a 16 14.5 150 6.1 5581.5 17 a 20 18.5 150 10.1 15301.5
  • 14. n= 1550 S = 37110.5 x = 13025/1550 =8.4 S2 = 23.04 2 23 .4 4.8 4) Coeficiente de Variación Esta medición muestra la relación entre la media y la desviación estándar; en este sentido, nos plantea el índice entre la tendencia de dispersión sobre la tendencia central, teniendo como punto de referencia que, en una distribución normal -paramétrica o normalizada x = 1; mientras que s = 0: CV = s / x . Para una distribución normal: CV. = 0/1 = 0 Para los ejemplos anteriores tenemos: Escala nominal: % accidentes: CV. = 6.73 /24.4 = 0.28 Escala ordinal: medición de la calidad: CV. = 1.88/3.5 = 0.54 Escala intervalar: nivel de escolaridad: CV. = 4.8/8.4 = 0.57 MUESTREO: En toda investigación se tiene un universo, una muestra y un elemento de estudio que es la fuente de la información. La muestra viene a ser en la investigación el enunciado particular ―algún S es P‖; mientras que el universo, el enunciado general: ―Todo S es P‖. Existen dos tipos de muestras: las paramétricas y las no paramétricas, las primeras con probabilidades altas de que la muestra represente al universo, y las segundas con poca probabilidad. 5.4.2.1.- Muestras Probabilísticas y no Probabilísticas: (1) Muestras Probabilísticas: Estas se caracterizan porque todos los elementos del universo tienen las mismas probabilidades de ser seleccionados en la muestra, lo que es posible sólo se cada elemento de la muestra se selecciona al azar. Existen tres tipos de muestra paramétrica: Muestra aleatoria simple. En ésta no es importante conocer las diferencias del universo, por lo que cada elemento se selecciona al azar por medio de métodos como la lotería, números aleatorios, etcétera. Muestra estratificada. Para este tipo de muestra es importante conocer las diferencias existentes en el universo, por lo que cada diferencia o característica heterogénea del mismo es representado proporcionalmente en la muestra y cada elemento se selecciona al azar.
  • 15. Muestra por conglomerados. En esta además es importante incluir, además de la representatividad de los estratos, la correspondiente a la representatividad proporcional de los elementos del universo en su distribución geográfica, seleccionándose cada elemento de la muestra al azar. (2) Muestras no Probabilísticas: En este tipo de muestras, no todos los elementos del universo tienen las mismas probabilidades de ser contenidos en la muestra, por lo tanto no son representativas y se utilizan para investigaciones exploratorias o diagnósticos particulares, cuyos resultados no se pretende generalizar. Tres son las diversas muestras no paramétricas: intencionales, accidentales y por cuotas. Muestras intencionales. Estas se conforman por elementos que han sido seleccionados propositiva o intencionalmente. Existe un tipo de muestra, denominado de ―informantes confiables‖ que se caracteriza por ser intencional, pero que es muy útil, al utilizarse expertos, o personas con disposición a proporcionar información. Muestra accidental. Esta se compone por elementos que fueron seleccionados por medios casuales; en este sentido conforman accidentalmente la muestra en cuestión. Muestra por cuotas. Este tipo de muestra toma en cuenta las diferencias existentes en el universo, por lo que se conforma por grupos de muestras que representan dichas diferencias, pero éstas no son proporcionales y los elementos de la muestra se seleccionan intencional o accidentalmente. 5.4.2.2.- Tamaño de la Muestra: Para determinar el tamaño de la muestra, se aplican diversos métodos: (a) Método Probabilístico n = Z2 x (pq), en dónde: E2 n = Tamaño de la muestra Z = Nivel de confianza para generalizar los resultados a todo el universo pq = Variabilidad del fenómeno estudiado: probabilidad de acierto, probabilidad de error E = El error global o precisión con que se generalizarán los resultados. (b) Método de la NOM: Z-12-87: Equivalente al ISO-9000: 20003 3 SECOFI. NOM:Z-12-87. TII. México
  • 17. 1) Ubicar el tamaño del universo en el Rango correspondiente al cuadro 1. 2) Seleccionar el Nivel de Inspección del recuadro de Niveles de Inspección Generales 3) Determinar la Letra Clave 4) Ubicar la Letra Clave en el cuadro 2 para determinar el tamaño de la muestra Seleccionar el Nivel de Calidad Aceptable que se va a aceptar y a rechazar SERIES DE TIEMPO CONCEPTO Y CARACTERÍSTICAS Una serie de tiempo es un conjunto de datos ordenado temporalmente, tomando como punto de referencia una unidad de tiempo: día semana, mes, bimestre, trimestre, semestre, año, etcétera. Si hacemos referencia al aforo vehicular en un tramo carretero un ejemplo sería el siguiente: AÑO VEHICULOS AÑO VEHICULOS 1990 2,300 1995 3,450 1991 2,450 1996 3,900 1992 2,700 1997 4,250 1993 2,800 1998e 4,500 1994 3,100 = 29,450, el número de años, n = 9, entonces la media anual de aforo es de 3,272 CÁLCULO DE TENDENCIAS Las series estadísticas nos sirven para calcular tendencias de incremento o decremento de las variables, mismas que son la base de los escenarios. Por ejemplo, utilizando los datos anteriores: AÑO VEHICULOS TENDENCIA (MILES) (MILES) 2001 2,300 2002 2,450 150 2003 2,700 250 2004 2,800 100 2005 3,100 300 2006 3,450 350 2007 3,900 450 2008 4,250 350 2009 4,500 250 = 2,200, el número de casos, n = 8, entonces la tendencia media anual de incremento del aforo es de 275
  • 18. TÉCNICAS DE AJUSTE A SERIES DE TIEMPO ASIMÉTRICAS Algunos datos en una serie de tiempo se comportan de una manera irregular, esto es, tienen saltos – altas y bajas—que no se explican teóricamente, por lo que existen técnicas para ajustar la serie de tiempo sin deformar los datos. La técnica más utilizada es la media movil, que implica sustituir los datos reales por la media de cada tres datos en la serie. AÑO VEHICULOS (MILES) MEDIA MOVIL (DE CADA 3) 1998 2,300 1999 2,200 2000 2,500 2,333 (1987, 88, 89) 2001 2,300 2,333 (1988, 89, 90) 2002 2,450 2417 (1989, 90, 91) 2003 2,250 2,333 (1990, 91, 92) 2004 2,800 2,500 (1991, 92, 93) 2005 3,200 2,750 (1992, 93, 94) 2006 3,050 3,017 (1993, 94, 95) 2007 3,900 3,383 (1994, 95, 96) 2008 4,250 3,733 (1995, 96, 97) 2009 4,100 4,083 (1996, 97, 98) Como puede apreciarse, en la serie corregida se perfila una tendencia más simétrica, tendiente a la alza. CORRELACIÓN, REGRESIÓN Y MÍNIMOS CUADRADOS COEFICIENTE "r" DE PEARSON. Para medir la magnitud de la correlación entre dos variables a nivel de intervalo, la prueba "r" es adecuada, ya que sus valores oscilan entre -1 a +1, si la relación entre las variables es inversamente proporcional la correlación sera de 1; mientras si ésta es directamente proporcional, la correlación sera +1. Se mide, con esta prueba, la determinación media de cada elemento de la variable independiente ―x‖ con relación a cada elemento de la variable dependiente, ―y‖ , dando como resultado un índice de correlación.4 Formula: n( XY) - ( X)( Y) r 2 2 2 [n X2 X ][n Y2 Y ] Supongamos que nos interesa correlacionar las fallas de mantenimiento en carreteras, captadas a través de los reportes de supervisión y el número de accidentes reportados en ocho meses, la unidad de medida es cientos. X: Fallas de mantenimiento 8.2 9.6 6.5 7.8 9.0 6.7 8.4 7.4 Y: Accidentes 8.0 9.3 6.6 7.5 8.6 7.0 8.2 7.2 4 Moreno. Op. Cit. p 136 y 81.
  • 19. Aplicación de la formula: X Y X·Y X2 Y2 8.2 8.0 65.6 67.2 64.0 9.6 9.3 89.3 92.2 86.5 6.5 6.6 42.9 42.3 43.6 7.8 7.5 58.5 60.8 56.3 9.0 8.6 77.4 81.0 74.0 6.7 7.0 46.9 44.9 49.0 8.4 8.2 68.9 70.6 67.2 7.4 7.2 53.3 54.8 51.8 63.6 62.4 502.8 513.8 492.4 8(502.8) (63.6)(62.4) r 0.98 2 [8(513.8) (63.6) 2 ][8(492.4) (62.4) 2 ] 10. ESCENARIOS Conceptualización: La estadística proyectiva es una herramienta para construir escenarios de prospectiva, el método parte de un punto de referencia en el pasado(To), cuantifica las tendencias de incremento o decremento de las variables al presente (T1) y las proyecta a un futuro dado (T2): T0 T1 T2 T3 TENDENCIA ESCENARIOS A continuación se expone esta conceptualización en la siguiente gráfica. y ^ x= variable independiente * tiempo * * y= variable dependiente * proyección cuantitativa * * To = pasado * * T1 = presente * * T2 = futuro ------------------------> x T's% = tendencias To---->T1----->T2 T's% E's E's = escenarios * = dato histórico Diagnóstico * = dato proyectado Pronóstico
  • 20. Tipos de proyección: Dependiendo de las características de las variables a proyectar, existen dos tipos de técnicas proyectivas: proyección de variables estadísticamente independientes y proyección de variables estadísticamente correlacionadas a) Proyección de variables estadísticamente independientes Conceptualización: En la proyección de este tipo de variables se parte del hecho o la suposición fundamentada de que: su comportamiento no está determinado por ninguna otra variable o no se cuenta con información confiable sobre el comportamiento de la posible variable antecedente. Clasificación: Las técnicas proyectivas de las variables estadísticamente independientes son dos: 1) Proyección simple: Escenario = ud + x ud = Ultimo dato de una serie x = Tendencia media de incremento-decremento de la variable Esta técnica es unilineal, pues el escenario se construye añadiendo la tendencia media de la variable. Proyección de la Variable ―X·‖ Año Comportamiento Tendencia 2002 1200 2003 1350 150 2004 1300 - 50 2005 1400 100 TENDENCIA MEDIA ANUAL 2006 1450 150 2007 1550 100 x = 71 2008 1500 - 50 2009 1600 100 500/7 = 71 Construcción de escenarios: Año Comportamiento Posible Escenario 2010 1671 2011 1742 2012 1813 2013 1884 2014 1955
  • 21. 2) Proyección con rango: Escenario = ud + ( x ± / v) Este escenario se conforma por tres componentes: Límite superior del escenario: ud +( x + / v) Límite Superior Punto medio del escenario: ud + x Proyección media Límite inferior del escenario: ud +( x - / v) Límite inferior En donde: ud = ultimo dato de la serie x = tendencia media de incremento o decremento = desviación estándar de la serie v = variemus La función del variemus es definir la extensión del rango de ocurrencia del escenario, en relación al valor del coeficiente de variación (CV) de la serie de la variable proyectada: Si el CV. DE 1 A 0, v = 1 Si el CV. DE 2 A 1, v = 2 Si el CV. DE 3 A 2, v = 3 En este sentido, el escenario enuncia que la variable proyectada a futuro (T2), probabilísticamente se ubicara entre un valor mínimo Lm y un valor máximo LM: El rango de probabilidad donde se ubica el escenario de la variable permite contar con un margen de maniobra en la toma de decisiones; esto es, en situaciones de certidumbre, la decisión puede tomarse en relación a su valor máximo; mientras que en caso de riesgo por incertidumbre, la decisión hace referencia al valor mínimo. Proyección de la inversión bruta de capital para los próximos tres años: año i.b.c (millones) xi x (xi - x ) ( xi – x )2 2003 1450 2004 1600 150 92 58 3364 2005 1880 130 38 1444 2006 2000 120 28 784 2007 2150 150 58 3364 2008 2170 20 - 72 5184 2009 2150 - 20 -112 12544 n= 550 = 26684 x = 550/6 = 91.6 ≈ 92 2 26684 / 6 = 67 CV= 67/92 = 0.73, v=1
  • 22. Escenarios: Año LM PM LM ud + ( x - /v) ud + x ud + ( x + /v) 10 2150 + 92 - 67= 2175 2150+92 =2242 2150 + 92 + 67 = 2309 11 2242 + 92 - 67= 2267 2242+92 =2334 2242 + 92 + 67 = 2401 12 2334 + 92 - 67= 2359 2334+92 =2426 2234 + 92 + 67 = 2493 Para las variables estadísticamente correlacionadas se utiliza la técnica de mínimos cuadrados, expuesta en el punto anterior. En este caso se parte del supuesto que una variable independiente X determina a una variable dependiente Y, por lo que todo cambio en X, produce un cambio en Y. El método implica: Cálculo del escenario de X, a través de las técnicas de variable estadísticamente independiente. Calculo del escenario de Y, utilizando las técnicas de variables estadísticamente correlacionadas: Si utilizamos los datos de los escenarios de ―X‖ expuestos más arriba y los datos de ―Y‖ presentados en el punto anterior, el cálculo de los escenarios de ―y‖ son: y = a + bx. Tanto ―a‖ como ―b‖ son constantes y lo que cambia es el escenario de x. Habrá de tener en cuenta que los escenarios siempre constituyen hipótesis respecto al comportamiento futuro de una variable, por lo que deberán tratarse de una manera probabilística. 1) Cálculo de "b" b = [6(2185050) - 13007500] / 6(24550800)-146410000 =0.11 2) Cálculo de "a" a = [1075 - (0.11)(12100)] / 6 = -42.6 3) Cálculo de "y" Escenario 1996: y= -42.6 + (0.11)(2242) = 204 Escenario 1997: y= -42.6 + (0.11)(2334) = 214 Escenario 1998: y= -42.6 + (0.11)(2426) = 224
  • 23. BIBLIOGRAFÍA: Estadística Autor Título Edición Editorial Ciudad Año Hubert, M y Blalok J. Estadística Social 10a Ariel Barcelona 2001 33 Plaza y Rojas, Soriano Reimp Valdés México 2002 UNAM Plaza y Rojas Soriano Guía para realizar 11a Valdés México 2006 investigaciones sociales