SlideShare una empresa de Scribd logo
1 de 79
Bioestadistica 1




Ac. Fabrizio Marcillo Morla MBA


               barcillo@gmail.com
               http://www.facebook.com/barcillo
               094-194239
Capitulo 1

Conceptos Generales
Que es Estadistica?
  La ciencia pura y aplicada (no exacta), que
crea, desarrolla y aplica técnicas de modo que
        pueda evaluarse la incertidumbre.
   Ciencia: "un conjunto de conocimientos
    comprobados y sistematizados".
   Pura: Por que estudia ciertos procesos teóricos.

   Aplicada: En cuanto se encarga de resolver

    problemas específicos.
   No exacta: No podemos obtener un resultado
    único, si no probabilidades de resultados
    esperados.
Otros Conceptos
   Estadísticas: statísticum collegium
      Consejo de estado:

   Estadístico: Persona que al tener la cabeza en
    un horno y los pies en hielo dice “en promedio
    me siento muy bien”?
       Bestias Salvajes?
       No se puede generalizar?
Historia
   Origenes en juegos de azar y censos.
   Siglo XVIII desarrolló teoría de Probabilidades
    (Gauss, Laplace, Bayes, etc). Discusión
    filosófica sigue hasta ahora.
   Muchas teorías, principalmente de carácter
    biológico como las de Mendel o Darwin tuvieron
    bases estadísticas
   Mayoría de métodos modernos se desarrollaron
    desde mediados del siglo XIX y principios del XX
    (Pearson, Student, Fisher…), principalmente
    para uso en biología, agricultura y genética
Porque BIOestadistica?
   “Muchos” biologistas desconfian de las
    matematicas: “los seres vivos son
    impredecibles”; “Camarones no se comportan
    como deberían”.
       FIMA – QUIBIO????
   Métodos estadísticos desarrollados justo para
    ser usados en ciencias biológicas: Toman en
    cuenta variabilidad propia de poblaciones
    naturales en sus cálculos y tablas.
Método Científico

   Todas las ramas de la ciencia
    estudian la naturaleza y lo
    hacen de la misma manera.
   Los científicos usan el método
    científico al intentar explicar la
    naturaleza.
   El método científico es una
    manera          de       recopilar
    información       y    comprobar
    ideas. Consta de:
        Hacer observaciones
        Formular hipótesis
        Someter     a    prueba   las
         hipótesis
        Llegar a conclusiones
Tipos de Estadistica
   Descriptiva: Trata resumir e interpretar datos
    para poder describir una población.
       Enumeración, organización y representación
        gráfica de los datos.
   Inferencial: Usa la teoría de la probabilidad
    para extraer conclusiones acerca de una
    población, a partir de la información
    incompleta de los datos obtenidos en una
    muestra:
     Estimación
     Comparativa

     Predictiva
Aplicaciones de la Estadística

 Obtener una muestra.
 Resumir datos.
 Hacer inferencias de una población,
  basado en los resultados de la muestra.
 Tener modelo más simple para un
  grupo de datos.
 Comparar poblaciones.
 Predecir eventos.
Variables
    Una propiedad con respecto a la cual los
    individuos de una muestra o una población
         se diferencian en algo verificable.

   Ciertas "características" que presentan
    variación.

   Ejemplos?
Tipos de Variables (1)
                     Clasificación por su escala de medición
   Cualitativas
      Dicotómicas-binarias

             Sexo: masculino o femenino.
             Status de empleo: empleado o desempleado.
        Ordinales
             Nivel socioeconómico: alto, medio o bajo.
             Índice de lípidos: 1, 2 ,3 ,4 , 5, 6
        Nominales
             Sitio de residencia: centro, sur, norte, este, oeste
             Estado civil: soltero, casado, viudo, divorciado, unión libre, T.L.A.
        Variables de Intervalo:
             Fiebre: Si (>37º C), No (<37º C)
   Cuantitativas
      Discretas

             Número de hijos: 1,2,3,4.
        Continuas
             Nivel de glucosa en sangre: 110 mg/dl, 145 mg/dl.
             Peso: 10 g, 11 g, 10.5 g, 10.1 g, 10.05 g, 10.001 g…
Tipos de Variables Cuantitativas
   Discretas: su conjunto de posibles valores
    son fijos, y no pueden tomar valores
    intermedios:
       Número de peces en un acuario.
   Continuas: su conjunto de posibles valores
    puede alcanzar un número infinito entre
    dos valores cuales quiera:
       Longitud, Peso
Tipos de Variables (2)
        Clasificación por su relación
 Independientes: Aquellas cuyo valor no
  depende de otra variable.
 Dependientes: Aquellas cuyo valor va a
  depender de otra variable.

           Dependiente de que?

      V. Intermedias y V. confusoras?
Ejemplos de Variables
      De un ejemplo de cada una en su campo
   Cualitativas
     Dicotómicas-binarias

     Ordinales

     Nominales

     Variables de Intervalo:

   Cuantitativas
     Discretas

     Continuas



   Independientes y Dependientes
Valores, Datos, etc.
Llamamos Valores, Datos u Observaciones
   a cualquier valor numérico o cualitativo
           que mida una variable.

Los valores experimentales que va a tomar
         una variable determinada.

              Variable: Peso
     Valores: 125 lbs, 145 lbs, 180 lbs
Variables y Datos
   Siendo las siguientes variables:
           Sexo
           Altura
           Peso
           Carrera
           Nivel
           Edad
           Color de pelo
           Color de piel
           Color de ojos
           Longitud de antebrazo
           Longitud de pie
           Diametro de cadera,
           Diametro de cintura
           Diametro de pecho

   Obtenga los datos de los alumnos de la clase y
    presentelos de forma tabulada
Población
   El grupo de individuos bajo estudio sobre
    el que deseamos hacer alguna inferencia.
       Conjunto de objetos, mediciones u
        observaciones del que tomamos muestra.
 Puede ser finita o infinita, dependiendo de
  su tamaño.
 Tamaño de población (número total de los
  individuos que la conforman) se lo denota
  con la letra N.
Ejemplos de poblaciones
   20 camarones en una pecera.
   Todos los camarones de una piscina.

   Todos los camarones posibles a ser

    cultivados bajo cierto tratamiento.
   Todos los camarones del mundo.




    Límites de población dependen de como la
      definamos nosotros acorde con nuestras
                    necesidades.
Antes de empezar cualquier proceso estadístico es
     necesario Definir claramente la población o
              poblaciones bajo estudio.
Población y Muestra
 Conociendo la distribución de frecuencias
  de alguna característica (variable) de la
  población, es posible describirla por medio
  de una función de densidad, la cual a su
  vez vendrá caracterizada por ciertos
  parámetros.
 Problema es que al ser población muy
  grande, resulta más conveniente estudiar
  un subconjunto de ella (muestra) y decir
  que representa mas o menos fielmente
  (representativo) a la población total.
Muestra
   Sea una variable aleatoria dada (X); los valores
    de esta variable aleatoria (X1, X2,...Xn) forman
    una muestra de la variable X, si ellas son
    independientes entre sí y siguen la misma
    distribución de X:
      Representa fielmente a X.

   Partimos suposición: muestra es porción de
    población que la representa fielmente.
   No tomamos en cuenta muestreos mal
    realizados.
   Tamaño de la muestra se lo denota como n.
Muestra
   Igual que población, debe definirse
    correctamente antes de empezar estudio.
     20 camarones en una pecera.
     Todos los camarones de una piscina.

     Todos los camarones posibles a ser

      cultivados bajo cierto tratamiento.
     Todos los camarones del mundo.

   Pueden representar una muestra de una
    población mayor.
Objetivos de Muestreo
   Obtener información sobre distribuciones
    de frecuencia de la población (distribución
    de probabilidad) o más preciso: de los
    parámetros poblacionales que describen
    dicha distribución de probabilidad.
Población y Muestra
   Defina una población y una muestra en su
    campo de interés.
Distribucion de Frecuencias
            (introduccion)
 Operación en que dividimos un conjunto
  de datos, en varios grupos, mostrando el
  número de elementos en cada grupo.
 Más tarde veremos los detalles.
 Ahora importante entender el concepto y
  su relación con la distribución de
  probabilidad.
 Archivo: Ejercicio01 - Distribucion de
  Frecuencias.xlsx
Datos longitud cefálica O. niloticus (mm)
    25.3   26.3   27.0   27.7   28.2   29.0   29.5
    25.5   26.4   27.0   28.0   28.2   29.3   29.5
    26.0   26.4   27.0   28.0   28.4   29.3   29.7
    26.0   26.6   27.0   28.0   28.5   29.3   29.8
    26.0   26.8   27.3   28.0   28.9   29.4   30.2
    26.0   27.0   27.6   28.0   28.9   29.4   31.0
    26.0   27.0   27.6   28.0   29.0   29.5   31.0
    26.1   27.0   27.6   28.1   29.0   29.5   33.4
Tabla de Frecuencias
                Int Real              Frec Relat    Frec             Marca
                                                   Acum              Clae
                                                           F. Acum
Int Repres   lim inf lim sup   Frec                          Relat

22    23      21.5    23.5      0      0.00%        0       0.00%    22.5

24    25      23.5    25.5      2      3.57%        2       3.57%    24.5

26    27      25.5    27.5     19      33.93%       21     37.50% 26.5

28    29      27.5    29.5     29      51.79%       50     89.29% 28.5

30    31      29.5    31.5      5      8.93%        55     98.21% 30.5

32    33      31.5    33.5      1      1.79%        56     100.00% 32.5

                               56     100.00%
Histograma
                              Histograma
60%

                                  51.79%
50%



40%
                      33.93%

30%
                                                           Frec Relat


20%



10%                                        8.93%

              3.57%
                                                   1.79%
      0.00%
0%
      22.5    24.5     26.5        28.5    30.5    32.5
Poligono de frecuencias
              Poligono de Frecuencias Acumuladas Relativas
120%



100%                                                 98.21%      100.00%
                                         89.29%
80%



60%
                                                                     F. Acum Relat



40%
                             37.50%

20%


                  3.57%
 0%   0.00%
   23.5        25.5       27.5        29.5        31.5        33.5
Deber en Grupo
   Grupos de 3 personas
   2 Dados por grupo
   1 hoja de Excel con 3 columnas :
      1 / cada dado

      1 suma de dados

   2 personas lanzan al mismo tiempo pero por
    separado los dados. 60 veces
   Para cada dado y suma hacer:
      Tabla de frecuencia

      Histograma de frecuencia relativa

      Poligono de frecuencia acumulada

      Analizar
Teoria de Probabilidades
 Originó en juegos de azar
 O talvez antes?
 Todos jugamos al riesgo dia a dia.
 Varios enfoques filosóficos a probabilidad:
     Teoria Clasica
     Frecuentismo

     Bayesiana

     etc
Probabilidad
   Eventos que son comunes o improbables son
    aquellos cuya probabilidad de ocurrencia son
    grandes o pequeñas, respectivamente.
   Dia a dia calculamos "al ojo" la probabilidad de
    todas los sucesos que nos rodean
   Determinamos que tan "común" o "raras" son.
       En Esmeraldas no es "común" encontrar un nativo
        rubio y ojos azules, en Suecia si.
       Basado en "muestras" de Suecos y Esmeraldeños, sin
        necesidad de ver todos los esmeraldeños y suecos.
   Problema de este método al "ojímetro“:
    carecemos de un término preciso para describir
    la probabilidad.
Gringo?
Gringos
Probabilidad
   Nombre
     Algo común, probable y casi seguro
     Algo poco común, difícil o casi improbable
Probabilidad
   Estadísticos reemplazan como "con dificultad",
    "pudo" o "casi con seguridad" por número de 0 a
    1, que indica de forma precisa que tan probable
    o improbable es el evento.
   Haciendo inferencias sobre una población a
    partir de muestras no podemos esperar llegar
    siempre a resultados correctos.
   Estadística ofrece procedimientos para saber
    cuántas veces acertamos "en promedio".
    (enunciados probabilísticos).
Espacio Muestreal
 El conjunto universal de una población
 Todos los valores posibles que nuestra
  variable aleatoria puede tomar
     Todas las formas en que podemos sacar 4
      bolas de una funda que contenga 8 bolas
      rojas y 2 blancas
     De cuantas formas puede caer un dado

     Todas las posibles supervivencias que
      podamos obtener en un cultivo
     Todos los posibles climas que puedan haber

      en un día determinado
Deber
 En grupos.
 Ley de la multiplicación, permutaciones y
  combinaciones para determinar el espacio
  muestreal y la probabilidad.
 Determinar la probabilidad de ganar el
  pozo millonario, el lotto, sacar bolas de
  una bolsa, dados, cartas etc.
 Exponer en clases.
 Demostrar empiricamente si es posible.
Probabilidad Clasica
   Si un evento puede ocurrir de N maneras
    mutuamente exclusivas e igualmente posibles, y
    si n de ellas tienen una característica E,
    entonces, la posibilidad de ocurrencia de E es la
    fracción n/N y se indica por:
                            n
                      (E) =
                            N
   Funciona bien con espacio muestreal pequeño y
    conocido, y en donde todas las N maneras sean
    igualmente posibles.
Probabilidad Frecuentista
   Probabilidad de un evento es su frecuencia
    relativa a lo largo del tiempo.



   Probabilidad de obtener “cara” al lanzar una
    moneda es 0.5: No porque se la calcula
    matemáticamente, sino porque esto ocurre al
    lanzarla muchas veces.
   No se puede repetir experimento infinitas veces.
   Al repetirlo pocas veces da distinta probabilidad.
   Error de probabilidad es una probabilidad… bis…
Probabilidad
   La probabilidad que un carro sea robado en
    Guayaquil puede ser calculada en función al
    número de carros robados y al número de carros
    en Guayaquil.
       Aseguradoras usan esto, para calcular el valor
        esperado a pagar. +costos +utilidad = prima.
   Probabilidad que en cierta camaronera una
    corrida a 130.000 Pl/Ha alcance 15 gr. en 120
    días puede ser calculada con base en veces que
    se ha logrado en condiciones similares
Ejercicio Individual
   Calcular la posibilidad de que el sol salga
    mañana.
Teoremas Basicos (1)
   La probabilidad de un evento cualquiera va
    a estar en el rango de cero a uno. Esto
    quiere decir que no existen probabilidades
    negativas ni mayores de 100%
                    0 ≤ P(E) ≤ 1
Teoremas Basicos (2)
 La suma de la probabilidad de ocurrencia
  de un evento mas la probabilidad de no
  ocurrencia del mismo es igual a uno.
              P(E) + P(¬E) = 1
 Probabilidad de que salga 1 en
  lanzamiento de dados es 1/6
 Ocurrencia de que no salga 1 es:
            P(¬1) = 1 – 1/6 = 5/6
Teoremas Basicos (3)
 La probabilidad de ocurrencia de dos
  eventos independientes es igual al
  producto de la ocurrencia de cada uno.
             P(A B) = P(A) x P(B)
 Probabilidad de que al lanzar dos dados
  salga 1 y 2:
 P(1) = 1/6 ; P(2) = 1/6
          P(1 y 2) = 1/6 x 1/6 = 1/36
Teoremas Basicos (4)
   Para dos eventos cualesquiera A y B, la
    probabilidad de que ocurra A o B viene dado, por
    la probabilidad de que ocurra A, mas la
    probabilidad de que ocurra B, menos la
    probabilidad de que ocurran ambos.
             P(A o B) = P(A) + P(B) - P(AB)
   Probabilidad que al lanzar dos dados obtenga
    solo un 1 o un 2:
   P(1) = 1/6 ; P(2) = 1/6
        P( 1 o 2) = 1/6 + 1/6 – (1/6 x 1/6) = 11/36
Teoremas Basicos
 Si dos eventos son mutuamente
  excluyentes, P(AB) será 0 y la probabilidad
  de ocurrencia de ambos será :
           P(A o B) = P(A) + P(B)
 Probabilidad de que al lanzar un dado
  obtenga 1 o 2:
 P(1) = 1/6 ; P(2) = 1/6
          P( 1 o 2) = 1/6 + 1/6 = 2/6
Valor Esperado
   Llamamos valor esperado al valor probable que
    podemos obtener al repetir cierto evento.
   Va a estar asociado a la probabilidad de
    ocurrencia de cada opción del mismo, y al valor
    que tomará la variable cada caso.
   Ejemplo:
       Probabilidad de que ganemos al apostar a un número
        en la ruleta es 1/37 = 0.27.
       Premio obtenido es 35 veces la apuesta
       Calcule la esperanza de ganar en la ruleta apostando
        US$1,000.
Valor Esperado
       P(Ganar) = 1/37
       P(Perder)= 1- 1/37 = 36/37
       Valor a Ganar = $35,000
       Valor a Perder = $1,000
   Esperanza de Ganancia:
E(G) = P(ganar)xValor Ganar + P(perder)*xValor Perder
E(G) = 1/37 x $35,000 + 36/37 x - $1,000
E(ganancia) = $946 - $973 = - $27
   Si jugamos a la ruleta, apostando toda la noche a
    un número $1,000; la esperanza que tenemos es
    de perder “en promedio” $27 cada vez.
Ejercicio
   Usted se Encuentra en el programa “Haga
    negocios conmigo”.
   Polito le presenta 3 puertas:
   Detrás de una hay un flamante ferrari rojo
    descapotable ultimo modelo.
   Detrás de las otras dos un
    pectol
Haga Negocio Conmigo
   Usted debe de escoger una puerta.
   Luego de que la ha escogido, El Eterno
    Perdedor abrirá de las otras dos, la que
    contenga un pectol.
   En este momento usted podrá escoger:
    mantenerse con la misma puerta inicial, o
    cambiar por la otra puerta.
              Que escogería y porque?
Parámetros
   Mayoría de investigaciones estadísticas quieren hacer
    inferencias a partir de la información contenida en
    muestras aleatorias sobre la población de donde fueron
    obtenidas.
   Gralmente inferencias sobre los parámetros
    poblacionales (ej: media y varianza 2). Que
    describen a la población.
       Se usa letras griegas.(       , etc.).
   Definimos parámetros como ciertas medidas que
    describen a la población.
   A los parámetros en general los podemos definir como .
Estadísticos
   Para hacer tales inferencias utilizaremos los
    estadísticos muestreales o estimadores de los
    parámetros (ej: promedio o media aritmetica x y
    varianza muestreal s2)
       Valores calculadas con base en observaciones de la
        muestra.
   Definimos estadístico como una medida que
    describe a la muestra, y que sirve para estimar
    los parámetros.
   A los estadísticos en general los podemos definir como
     n.
Estadísticos vs. Parámetros
 Importante diferencia entre estadístico y
  parámetro: una las bases de estadística.
 A pesar que estadísticos se usan para
  representar o estimar parámetros,
  probabilidad de que sean exactamente
  iguales es 0.
Ej: Promedio x
   Variable aleatoria. Distribución de probabilidad
    (muestreo) depende mecanismo muestreo.
   Algunos valores x estarán cerca de , y otros
    alejados (para arriba o abajo).
   Al tomar varias muestras, queremos tener los x
    concentrados cerca a , y que el promedio de x
    esté muy cercano a .
                                                               Distribucion de Medias
                                             14%


                                             12%


                                             10%




                               PROBABILITY
                                             8%


                                             6%


                                             4%


                                             2%


                                             0%
                                                   4.0   6.0   8.0            10.0                 12.0   14.0   16.0
                                                                           Values

                                                                     Dist. Deriv     Dist. Pobl.
Estimadores Insesgados Eficientes
    Queremos seleccionar un estimador y un plan de
     muestreo que:
1.    Nos asegure que la esperanza de el estimador
      sea el parámetro (E( 0) = ) Insesgado

2.    La varianza del estimador tenga la menor
      varianza posible ( 2( 0) → sea baja) Eficiente

    De dos estadísticos 1 y 2, el que tenga menor
     varianza será el mas eficiente.
Error de Estimación
   Conociendo el estadístico 0 usado, y su
    distribución de probabilidad, podemos evaluar su
    error de estimación.
   “El valor absoluto de la diferencia entre el
    estadístico y el parámetro” (E=           ).
   No sabemos exactamente cuanto es
    (desconocemos parámetro ),
   Podemos encontrar límites entre los cuales
    existe una probabilidad de que se encuentre el
    parámetro :
       P(           .
Estadísticos de Centralización
Ejercicio02a - Estadisticos.xlsx
   Media poblacional
       La media aritmética de datos de toda la población
       Representa esperanza matemática de variable
        aleatoria:                   N
                                   1
                                           xi
                                   N   1

   Este parámetro no lo conocemos, y no lo
    conoceremos nunca a no ser que
    muestreáramos la población completa.
   Para estimarlo usamos el estadístico promedio o
    media muestreal x.
Estadísticos de Centralización
   Promedio o media poblacional x :
       La media aritmética de los datos de la muestra

                    1               n
                 x=                 i 1
                                          xi
                    n
   Al ser la esperanza matemática de los x, esta
    puede calcularse también de la siguiente forma:
                         nj     k
                                    xj
                          N     1
       j es j-esimo grupo de un total de k grupos
       nj es el número de individuos en el j-esimo grupo
         xj es la media del j-esimo grupo
Estadísticos de Centralización
                      ˆ
    Promedio ponderado x


                 nj        k
        
        x                      xj
                  n        1
Promedio Ponderado
   Los siguientes son las libras netas obtenidas en una
    liquidación de pesca de una piscina comercial de
    camarón y el precio para cada clasificación
       Cual es el precio promedio obtenido por libra?
       Calcule % y uselos para calcular el precio promedio ponderado

     Clasificacion                  libras           Precio $/lb
     26 - 30                        -                $ 3.60
     31 - 35                        1,554            $ 3.15
     36 - 40                        15,542           $ 2.90
     41 - 50                        80,818           $ 2.40
     51 - 60                        43,517           $ 1.80
     61 - 70                        10,879           $ 1.70
     71 - 90                        3,108            $ 1.35
     Total                          155,419
Estadísticos de Centralización
   Moda: Marca de clase del intervalo con mayor
    frecuencia
       Aproximadamente: Valor que mas encontramos en
        nuestro muestreo.
   Mediana: valor más cercano a la mitad si los
    ordenamos, o valor con igual número de datos
    mayores que menores a él.
       Valor del dato número (n+1)/2 cuando n es impar
       Media del dato # (n/2) y el dato # (n/2 +1) cuando n es
        par.
Estadísticos de Dispersión
   Medidas de centralización dan una idea de hacia
    dónde están distribuidos nuestros datos, pero no
    de cómo están distribuidos.
   Probabilidad de dato igual a la media tiende a 0
   Media de posibles valores un dado 3.5
   Cruce de Rio; Pies en horno, cabeza refrigerador
   Dos poblaciones con igual media pero dispersión
    de datos distinta: Poblaciones distintas
Estadísticos de Dispersión
   Parámetro varianza poblacional        2   :
       Promedio de cuadrados de las desviaciones
        de los valores de una variable en población
        con respecto a media poblacional
                                 2
                  2     ( xi - )
                      =
                           N
     xi- es distancia de cada punto a la media
     Se eleva al cuadrado porque si no distancias

      positivas y negativas se anularían dando 0
Varianza
   Fisher (1918) “The Correlation Between Relatives on the
    Supposition of Mendelian Inheritance”
       El gran cuerpo de las estadísticas disponibles nos muestran que
        las desviaciones de una medida humana de su media siguen
        muy de cerca la ley normal de los errores, y, por tanto, que la
        variabilidad puede ser medida de manera uniforme por la
        desviación estándar correspondiente a la raíz cuadrada de la
        media del cuadrado del error.
       Cuando hay dos causas de variabilidad independientes, capaces
        de producir en una distribución poblacional de otra manera
        uniforme, con desviaciones estándar θ1 y θ2, se encuentra que
        la distribución, cuando ambas causas actúan juntas, tiene una
        desviación estándar
       Por tanto, es conveniente en el análisis de las causas de la
        variabilidad, trabajar con el cuadrado de la desviación estándar
        como la medida de la variabilidad. Vamos a llamar esta cantidad,
        la varianza
Propiedades de la Varianza (1)
1.   Es positiva (2)
2.   Es en distintas unidades que la variable (2)
3.   No varía por localización. Sumar constante a todos los
     datos: misma varianza. Var(x + a) = Var(x)
4.   Si se multiplica todos los datos por una constante,
     varianza se multiplica por constante2 Var(ax) = a2Var(x)
5.   La varianza de la suma de variables aleatorias es igual
     a la suma de sus varianzas + 2 veces su covarianza.

6.   Generalizando para N Variables
Propiedades de la Varianza (2)
7. Varianza = Promedio de cuadrados – el cuadrado del
   promedio
                    Var (X)= 1/N xi2 - x2
8. La varianza de la suma de variables aleatorias
   independientes es igual a la suma de sus varianzas:
                Var(X + Y) = Var(X) + Var (Y)
generalizando:

9.   Si las variables independientes tienen la misma
     varianza, la varianza de su promedio puede
     transformarse multiplicando por (1/n)2 (4).



*Recordar este    2/n   para teorema central del limite
Estadísticos de Dispersión
   Varianza empírica s2 es el estadístico mediante
    el cual hacemos estimaciones de nuestro
    parámetro varianza poblacional.
   Ya que s2 sería estimador sesgado de 2 si la
    dividimos para n, se la divide por n-1:
                            2
                2  ( xi - x )
               s =
                     n -1

   A medida que tamaño de la muestra (n)
    aumenta, sesgo entre 2 y s2 disminuye
Estadísticos de Dispersión
   La desviación típica o desviación estándar ( o s),
    es la raíz cuadrada positiva de la varianza. s es
    estimador sesgado de . Tiene misma unidad.
   El rango es la diferencia entre el valor del mayor
    dato y el valor del menor dato.
   Desviación media: promedio de las desviaciones
    absolutas respecto al promedio: DM= |xi- x|/n
   Error típico de la media: estima s para la
    distribución de x: S x = s / √n
   Coeficiente de variación: expresión porcentual de
    variación (sin unidades): CV= s x 100 / x
           Est. Disp. Usan 1 decimal más que la muestra
Introduccion al Excel Como
          Herramienta Estadistica
   Versatilidad:
       Hoja de calculo
       Base de datos          Otros Objetos:
       Diagramador                Row
       Lenguaje de                Column
        programación               Cell
       Análisis de datos          Area
   Modelo de objeto:              Rangos con Nombre
       Aplication
       Workbook
       Worksheet
       Range
       Otros objetos:
Interfaz de Usuario?
   Ventanas
   Menu de Excel 2003 y anteriores
   Cinta de opciones Excel 2007
   Barra(s) de Herramientas
   Barra de formulas
   Cuadro de nombres
   Barra de estado
   Macros
   Complementos
   Archivos personales
   Entrada de datos e interfaz con el usuario
Tipos de Datos/Objetos?
   Texto
   Números
   Formatos
   Fórmulas
      Referencias absolutas y relativas

   Funciones
   Matrices
   Referencias Remotas
   Comentarios
   Gráficos
   Tablas y gráficos dinámicos
   Otros objetos
Operaciones Básicas?
 Desplazamiento
 Teclas de acceso rápido
 Funciones Mouse
 Selección
 Direcciones relativas y absolutas
 Nombres de rango
 Copiar, Cortar. Pegar , Pegado Especial.
 Asistentes
 Personalización
Funciones Estadisticas
 Muchas
 Muy Utiles
 Algunas no se para que son o no las he
  usado
 Aplasten F1 y lean de que se tratan
 Pruebenlas y comparenlas con calculos
  “manuales”.
 Revisaremos las mas frecuentes.
 Existen rutas alternas en Excel
Herramientas de Analisis de
              Datos
 Complemento de Excel
 Existen otros complementos estadisticos
  de terceros
 Tienen sus ventajas y sus limitaciones
 Existen rutas alternas en Excel
Herramientas No Estadisticas
      Utiles Para la Estadistica
 Modelo de Hoja de Calculo
 Formulas
 Funciones no Estadisticas
 Ordenar, filtrar.
 Graficos
 Tablas Dinamicas y Graficos
 ODBC, conecciones y otros datos externos
 Macros
Ejercicio Practico
   Calcular en Ejercicio02b - Estadisticos.xlsx:
       Suma
       n
        x
       Moda
       Mediana
       s2 y s
       Maximo, mínimo y rango
       Error típico, coeficiente de variación
       Analisis de Datos / Estadistica Descriptiva
                Usar Formula y Función

Más contenido relacionado

La actualidad más candente (20)

La medicion
La medicionLa medicion
La medicion
 
Estad uma 01
Estad uma 01Estad uma 01
Estad uma 01
 
terminos Basicos Estadistica I
terminos Basicos Estadistica Iterminos Basicos Estadistica I
terminos Basicos Estadistica I
 
Presentacion 1 ricardo
Presentacion 1 ricardoPresentacion 1 ricardo
Presentacion 1 ricardo
 
Cuestionario
CuestionarioCuestionario
Cuestionario
 
Taller 1 estadistica
Taller   1 estadisticaTaller   1 estadistica
Taller 1 estadistica
 
Estadistica parte-teorica
Estadistica parte-teoricaEstadistica parte-teorica
Estadistica parte-teorica
 
Terminos Básicos de Estadística
Terminos Básicos de EstadísticaTerminos Básicos de Estadística
Terminos Básicos de Estadística
 
Estadistica
Estadistica  Estadistica
Estadistica
 
Estadistica descriptiva
Estadistica descriptivaEstadistica descriptiva
Estadistica descriptiva
 
Estadística Elemental.
Estadística Elemental.Estadística Elemental.
Estadística Elemental.
 
Estadisticos 1
Estadisticos 1Estadisticos 1
Estadisticos 1
 
La distribucion
La distribucionLa distribucion
La distribucion
 
Apuntes estadisco
Apuntes estadiscoApuntes estadisco
Apuntes estadisco
 
Seminario 5
Seminario 5Seminario 5
Seminario 5
 
terminos basicos en la Estadistica
terminos basicos en la Estadisticaterminos basicos en la Estadistica
terminos basicos en la Estadistica
 
Estadisticos 29 3-2020
Estadisticos 29 3-2020Estadisticos 29 3-2020
Estadisticos 29 3-2020
 
ESTADISTICA BASICA
ESTADISTICA BASICA ESTADISTICA BASICA
ESTADISTICA BASICA
 
Tabla 1
Tabla 1Tabla 1
Tabla 1
 
Bioestadística
BioestadísticaBioestadística
Bioestadística
 

Similar a Clase01 conceptos generales (20)

Clase01 - Conceptos Generales.pptx
Clase01 - Conceptos Generales.pptxClase01 - Conceptos Generales.pptx
Clase01 - Conceptos Generales.pptx
 
Guia 1-estadistica
Guia 1-estadisticaGuia 1-estadistica
Guia 1-estadistica
 
Curso completo proba 1.pptx
Curso completo proba 1.pptxCurso completo proba 1.pptx
Curso completo proba 1.pptx
 
Biometría i
Biometría iBiometría i
Biometría i
 
Clase1 - Estadística Preceptores
Clase1 - Estadística PreceptoresClase1 - Estadística Preceptores
Clase1 - Estadística Preceptores
 
Guia 1-estadistica
Guia 1-estadisticaGuia 1-estadistica
Guia 1-estadistica
 
Guia 1-estadistica
Guia 1-estadisticaGuia 1-estadistica
Guia 1-estadistica
 
Estadistica 2
Estadistica 2Estadistica 2
Estadistica 2
 
Clase01 conceptos generales
Clase01   conceptos generalesClase01   conceptos generales
Clase01 conceptos generales
 
PROBABILIDAD Y ESTADISTICA contenido tematico 4 parciales
PROBABILIDAD Y ESTADISTICA contenido tematico 4 parcialesPROBABILIDAD Y ESTADISTICA contenido tematico 4 parciales
PROBABILIDAD Y ESTADISTICA contenido tematico 4 parciales
 
ANALISIS DE RESULTADOS
ANALISIS DE RESULTADOSANALISIS DE RESULTADOS
ANALISIS DE RESULTADOS
 
Bioestadistica 2.2
Bioestadistica 2.2Bioestadistica 2.2
Bioestadistica 2.2
 
diapositivas de estadistica.ppt
diapositivas de estadistica.pptdiapositivas de estadistica.ppt
diapositivas de estadistica.ppt
 
Terminos basicos estadistica
Terminos basicos estadisticaTerminos basicos estadistica
Terminos basicos estadistica
 
Estadstica 1223899160588231-9
Estadstica 1223899160588231-9Estadstica 1223899160588231-9
Estadstica 1223899160588231-9
 
Estadística I: Conceptos básicos y Ejemplos.
Estadística I: Conceptos básicos y Ejemplos.Estadística I: Conceptos básicos y Ejemplos.
Estadística I: Conceptos básicos y Ejemplos.
 
Estadistica Jose Antonio Leon
Estadistica Jose Antonio LeonEstadistica Jose Antonio Leon
Estadistica Jose Antonio Leon
 
Estadística
Estadística Estadística
Estadística
 
Presentación1
Presentación1Presentación1
Presentación1
 
Presentación estadistica l
Presentación estadistica lPresentación estadistica l
Presentación estadistica l
 

Más de Fabrizio Marcillo Morla

Alcohol101 - Lo que siempre quizo saber sobre las bebidas alcoholicas y nadie...
Alcohol101 - Lo que siempre quizo saber sobre las bebidas alcoholicas y nadie...Alcohol101 - Lo que siempre quizo saber sobre las bebidas alcoholicas y nadie...
Alcohol101 - Lo que siempre quizo saber sobre las bebidas alcoholicas y nadie...Fabrizio Marcillo Morla
 
Perfil profesional y de Egreso Ingenieria Acuicola ESPOL
Perfil profesional y de Egreso Ingenieria Acuicola ESPOLPerfil profesional y de Egreso Ingenieria Acuicola ESPOL
Perfil profesional y de Egreso Ingenieria Acuicola ESPOLFabrizio Marcillo Morla
 
Barcillo 2014 papa noel pruebas hipotesis y otros mitos absurdos
Barcillo 2014   papa noel pruebas hipotesis y otros mitos absurdosBarcillo 2014   papa noel pruebas hipotesis y otros mitos absurdos
Barcillo 2014 papa noel pruebas hipotesis y otros mitos absurdosFabrizio Marcillo Morla
 
Libro tomo 1 organizacion del pensamiento digital (4)
Libro tomo 1 organizacion del pensamiento digital (4)Libro tomo 1 organizacion del pensamiento digital (4)
Libro tomo 1 organizacion del pensamiento digital (4)Fabrizio Marcillo Morla
 
Uso de herramientas de citas y referencias bibliograficas en ms word
Uso de herramientas de citas y referencias bibliograficas en ms wordUso de herramientas de citas y referencias bibliograficas en ms word
Uso de herramientas de citas y referencias bibliograficas en ms wordFabrizio Marcillo Morla
 
1 syllabus manipuleo y conservacion 2013-i
1  syllabus manipuleo y conservacion 2013-i1  syllabus manipuleo y conservacion 2013-i
1 syllabus manipuleo y conservacion 2013-iFabrizio Marcillo Morla
 

Más de Fabrizio Marcillo Morla (20)

Alcohol101 - Lo que siempre quizo saber sobre las bebidas alcoholicas y nadie...
Alcohol101 - Lo que siempre quizo saber sobre las bebidas alcoholicas y nadie...Alcohol101 - Lo que siempre quizo saber sobre las bebidas alcoholicas y nadie...
Alcohol101 - Lo que siempre quizo saber sobre las bebidas alcoholicas y nadie...
 
Perfil profesional y de Egreso Ingenieria Acuicola ESPOL
Perfil profesional y de Egreso Ingenieria Acuicola ESPOLPerfil profesional y de Egreso Ingenieria Acuicola ESPOL
Perfil profesional y de Egreso Ingenieria Acuicola ESPOL
 
Informe graduadosacuicultura141207
Informe graduadosacuicultura141207Informe graduadosacuicultura141207
Informe graduadosacuicultura141207
 
Barcillo 2014 papa noel pruebas hipotesis y otros mitos absurdos
Barcillo 2014   papa noel pruebas hipotesis y otros mitos absurdosBarcillo 2014   papa noel pruebas hipotesis y otros mitos absurdos
Barcillo 2014 papa noel pruebas hipotesis y otros mitos absurdos
 
Aireacion de camaron en Ecuador
Aireacion de camaron en EcuadorAireacion de camaron en Ecuador
Aireacion de camaron en Ecuador
 
Libro tomo 1 organizacion del pensamiento digital (4)
Libro tomo 1 organizacion del pensamiento digital (4)Libro tomo 1 organizacion del pensamiento digital (4)
Libro tomo 1 organizacion del pensamiento digital (4)
 
Uso de herramientas de citas y referencias bibliograficas en ms word
Uso de herramientas de citas y referencias bibliograficas en ms wordUso de herramientas de citas y referencias bibliograficas en ms word
Uso de herramientas de citas y referencias bibliograficas en ms word
 
Cna 2001 analisis del sector camaronero
Cna 2001   analisis del sector camaroneroCna 2001   analisis del sector camaronero
Cna 2001 analisis del sector camaronero
 
Clase01 composicion mariscos
Clase01   composicion mariscosClase01   composicion mariscos
Clase01 composicion mariscos
 
1 syllabus manipuleo y conservacion 2013-i
1  syllabus manipuleo y conservacion 2013-i1  syllabus manipuleo y conservacion 2013-i
1 syllabus manipuleo y conservacion 2013-i
 
Clase03 entendiendo las relaciones
Clase03   entendiendo las relacionesClase03   entendiendo las relaciones
Clase03 entendiendo las relaciones
 
Clase02 distribuciones de probabilidad
Clase02   distribuciones de probabilidadClase02   distribuciones de probabilidad
Clase02 distribuciones de probabilidad
 
Clase04 estadistica descriptiva
Clase04   estadistica descriptivaClase04   estadistica descriptiva
Clase04 estadistica descriptiva
 
Clase08 alimentos vivos
Clase08   alimentos vivosClase08   alimentos vivos
Clase08 alimentos vivos
 
Clase07 minerales
Clase07   mineralesClase07   minerales
Clase07 minerales
 
Clase06 vitaminas
Clase06   vitaminasClase06   vitaminas
Clase06 vitaminas
 
Clase04 lipidos
Clase04   lipidosClase04   lipidos
Clase04 lipidos
 
Clase03 proteinas
Clase03   proteinasClase03   proteinas
Clase03 proteinas
 
Clase02 energia
Clase02   energiaClase02   energia
Clase02 energia
 
Clase01 introduccion
Clase01   introduccionClase01   introduccion
Clase01 introduccion
 

Clase01 conceptos generales

  • 1. Bioestadistica 1 Ac. Fabrizio Marcillo Morla MBA barcillo@gmail.com http://www.facebook.com/barcillo 094-194239
  • 3. Que es Estadistica? La ciencia pura y aplicada (no exacta), que crea, desarrolla y aplica técnicas de modo que pueda evaluarse la incertidumbre.  Ciencia: "un conjunto de conocimientos comprobados y sistematizados".  Pura: Por que estudia ciertos procesos teóricos.  Aplicada: En cuanto se encarga de resolver problemas específicos.  No exacta: No podemos obtener un resultado único, si no probabilidades de resultados esperados.
  • 4. Otros Conceptos  Estadísticas: statísticum collegium  Consejo de estado:  Estadístico: Persona que al tener la cabeza en un horno y los pies en hielo dice “en promedio me siento muy bien”?  Bestias Salvajes?  No se puede generalizar?
  • 5. Historia  Origenes en juegos de azar y censos.  Siglo XVIII desarrolló teoría de Probabilidades (Gauss, Laplace, Bayes, etc). Discusión filosófica sigue hasta ahora.  Muchas teorías, principalmente de carácter biológico como las de Mendel o Darwin tuvieron bases estadísticas  Mayoría de métodos modernos se desarrollaron desde mediados del siglo XIX y principios del XX (Pearson, Student, Fisher…), principalmente para uso en biología, agricultura y genética
  • 6. Porque BIOestadistica?  “Muchos” biologistas desconfian de las matematicas: “los seres vivos son impredecibles”; “Camarones no se comportan como deberían”.  FIMA – QUIBIO????  Métodos estadísticos desarrollados justo para ser usados en ciencias biológicas: Toman en cuenta variabilidad propia de poblaciones naturales en sus cálculos y tablas.
  • 7. Método Científico  Todas las ramas de la ciencia estudian la naturaleza y lo hacen de la misma manera.  Los científicos usan el método científico al intentar explicar la naturaleza.  El método científico es una manera de recopilar información y comprobar ideas. Consta de:  Hacer observaciones  Formular hipótesis  Someter a prueba las hipótesis  Llegar a conclusiones
  • 8. Tipos de Estadistica  Descriptiva: Trata resumir e interpretar datos para poder describir una población.  Enumeración, organización y representación gráfica de los datos.  Inferencial: Usa la teoría de la probabilidad para extraer conclusiones acerca de una población, a partir de la información incompleta de los datos obtenidos en una muestra:  Estimación  Comparativa  Predictiva
  • 9.
  • 10. Aplicaciones de la Estadística  Obtener una muestra.  Resumir datos.  Hacer inferencias de una población, basado en los resultados de la muestra.  Tener modelo más simple para un grupo de datos.  Comparar poblaciones.  Predecir eventos.
  • 11. Variables Una propiedad con respecto a la cual los individuos de una muestra o una población se diferencian en algo verificable.  Ciertas "características" que presentan variación.  Ejemplos?
  • 12. Tipos de Variables (1) Clasificación por su escala de medición  Cualitativas  Dicotómicas-binarias  Sexo: masculino o femenino.  Status de empleo: empleado o desempleado.  Ordinales  Nivel socioeconómico: alto, medio o bajo.  Índice de lípidos: 1, 2 ,3 ,4 , 5, 6  Nominales  Sitio de residencia: centro, sur, norte, este, oeste  Estado civil: soltero, casado, viudo, divorciado, unión libre, T.L.A.  Variables de Intervalo:  Fiebre: Si (>37º C), No (<37º C)  Cuantitativas  Discretas  Número de hijos: 1,2,3,4.  Continuas  Nivel de glucosa en sangre: 110 mg/dl, 145 mg/dl.  Peso: 10 g, 11 g, 10.5 g, 10.1 g, 10.05 g, 10.001 g…
  • 13. Tipos de Variables Cuantitativas  Discretas: su conjunto de posibles valores son fijos, y no pueden tomar valores intermedios:  Número de peces en un acuario.  Continuas: su conjunto de posibles valores puede alcanzar un número infinito entre dos valores cuales quiera:  Longitud, Peso
  • 14. Tipos de Variables (2) Clasificación por su relación  Independientes: Aquellas cuyo valor no depende de otra variable.  Dependientes: Aquellas cuyo valor va a depender de otra variable. Dependiente de que? V. Intermedias y V. confusoras?
  • 15. Ejemplos de Variables De un ejemplo de cada una en su campo  Cualitativas  Dicotómicas-binarias  Ordinales  Nominales  Variables de Intervalo:  Cuantitativas  Discretas  Continuas  Independientes y Dependientes
  • 16. Valores, Datos, etc. Llamamos Valores, Datos u Observaciones a cualquier valor numérico o cualitativo que mida una variable. Los valores experimentales que va a tomar una variable determinada. Variable: Peso Valores: 125 lbs, 145 lbs, 180 lbs
  • 17. Variables y Datos  Siendo las siguientes variables:  Sexo  Altura  Peso  Carrera  Nivel  Edad  Color de pelo  Color de piel  Color de ojos  Longitud de antebrazo  Longitud de pie  Diametro de cadera,  Diametro de cintura  Diametro de pecho  Obtenga los datos de los alumnos de la clase y presentelos de forma tabulada
  • 18. Población  El grupo de individuos bajo estudio sobre el que deseamos hacer alguna inferencia.  Conjunto de objetos, mediciones u observaciones del que tomamos muestra.  Puede ser finita o infinita, dependiendo de su tamaño.  Tamaño de población (número total de los individuos que la conforman) se lo denota con la letra N.
  • 19. Ejemplos de poblaciones  20 camarones en una pecera.  Todos los camarones de una piscina.  Todos los camarones posibles a ser cultivados bajo cierto tratamiento.  Todos los camarones del mundo. Límites de población dependen de como la definamos nosotros acorde con nuestras necesidades. Antes de empezar cualquier proceso estadístico es necesario Definir claramente la población o poblaciones bajo estudio.
  • 20. Población y Muestra  Conociendo la distribución de frecuencias de alguna característica (variable) de la población, es posible describirla por medio de una función de densidad, la cual a su vez vendrá caracterizada por ciertos parámetros.  Problema es que al ser población muy grande, resulta más conveniente estudiar un subconjunto de ella (muestra) y decir que representa mas o menos fielmente (representativo) a la población total.
  • 21. Muestra  Sea una variable aleatoria dada (X); los valores de esta variable aleatoria (X1, X2,...Xn) forman una muestra de la variable X, si ellas son independientes entre sí y siguen la misma distribución de X:  Representa fielmente a X.  Partimos suposición: muestra es porción de población que la representa fielmente.  No tomamos en cuenta muestreos mal realizados.  Tamaño de la muestra se lo denota como n.
  • 22. Muestra  Igual que población, debe definirse correctamente antes de empezar estudio.  20 camarones en una pecera.  Todos los camarones de una piscina.  Todos los camarones posibles a ser cultivados bajo cierto tratamiento.  Todos los camarones del mundo.  Pueden representar una muestra de una población mayor.
  • 23. Objetivos de Muestreo  Obtener información sobre distribuciones de frecuencia de la población (distribución de probabilidad) o más preciso: de los parámetros poblacionales que describen dicha distribución de probabilidad.
  • 24. Población y Muestra  Defina una población y una muestra en su campo de interés.
  • 25. Distribucion de Frecuencias (introduccion)  Operación en que dividimos un conjunto de datos, en varios grupos, mostrando el número de elementos en cada grupo.  Más tarde veremos los detalles.  Ahora importante entender el concepto y su relación con la distribución de probabilidad.  Archivo: Ejercicio01 - Distribucion de Frecuencias.xlsx
  • 26. Datos longitud cefálica O. niloticus (mm) 25.3 26.3 27.0 27.7 28.2 29.0 29.5 25.5 26.4 27.0 28.0 28.2 29.3 29.5 26.0 26.4 27.0 28.0 28.4 29.3 29.7 26.0 26.6 27.0 28.0 28.5 29.3 29.8 26.0 26.8 27.3 28.0 28.9 29.4 30.2 26.0 27.0 27.6 28.0 28.9 29.4 31.0 26.0 27.0 27.6 28.0 29.0 29.5 31.0 26.1 27.0 27.6 28.1 29.0 29.5 33.4
  • 27. Tabla de Frecuencias Int Real Frec Relat Frec Marca Acum Clae F. Acum Int Repres lim inf lim sup Frec Relat 22 23 21.5 23.5 0 0.00% 0 0.00% 22.5 24 25 23.5 25.5 2 3.57% 2 3.57% 24.5 26 27 25.5 27.5 19 33.93% 21 37.50% 26.5 28 29 27.5 29.5 29 51.79% 50 89.29% 28.5 30 31 29.5 31.5 5 8.93% 55 98.21% 30.5 32 33 31.5 33.5 1 1.79% 56 100.00% 32.5 56 100.00%
  • 28. Histograma Histograma 60% 51.79% 50% 40% 33.93% 30% Frec Relat 20% 10% 8.93% 3.57% 1.79% 0.00% 0% 22.5 24.5 26.5 28.5 30.5 32.5
  • 29. Poligono de frecuencias Poligono de Frecuencias Acumuladas Relativas 120% 100% 98.21% 100.00% 89.29% 80% 60% F. Acum Relat 40% 37.50% 20% 3.57% 0% 0.00% 23.5 25.5 27.5 29.5 31.5 33.5
  • 30. Deber en Grupo  Grupos de 3 personas  2 Dados por grupo  1 hoja de Excel con 3 columnas :  1 / cada dado  1 suma de dados  2 personas lanzan al mismo tiempo pero por separado los dados. 60 veces  Para cada dado y suma hacer:  Tabla de frecuencia  Histograma de frecuencia relativa  Poligono de frecuencia acumulada  Analizar
  • 31. Teoria de Probabilidades  Originó en juegos de azar  O talvez antes?  Todos jugamos al riesgo dia a dia.  Varios enfoques filosóficos a probabilidad:  Teoria Clasica  Frecuentismo  Bayesiana  etc
  • 32. Probabilidad  Eventos que son comunes o improbables son aquellos cuya probabilidad de ocurrencia son grandes o pequeñas, respectivamente.  Dia a dia calculamos "al ojo" la probabilidad de todas los sucesos que nos rodean  Determinamos que tan "común" o "raras" son.  En Esmeraldas no es "común" encontrar un nativo rubio y ojos azules, en Suecia si.  Basado en "muestras" de Suecos y Esmeraldeños, sin necesidad de ver todos los esmeraldeños y suecos.  Problema de este método al "ojímetro“: carecemos de un término preciso para describir la probabilidad.
  • 35. Probabilidad  Nombre  Algo común, probable y casi seguro  Algo poco común, difícil o casi improbable
  • 36. Probabilidad  Estadísticos reemplazan como "con dificultad", "pudo" o "casi con seguridad" por número de 0 a 1, que indica de forma precisa que tan probable o improbable es el evento.  Haciendo inferencias sobre una población a partir de muestras no podemos esperar llegar siempre a resultados correctos.  Estadística ofrece procedimientos para saber cuántas veces acertamos "en promedio". (enunciados probabilísticos).
  • 37. Espacio Muestreal  El conjunto universal de una población  Todos los valores posibles que nuestra variable aleatoria puede tomar  Todas las formas en que podemos sacar 4 bolas de una funda que contenga 8 bolas rojas y 2 blancas  De cuantas formas puede caer un dado  Todas las posibles supervivencias que podamos obtener en un cultivo  Todos los posibles climas que puedan haber en un día determinado
  • 38. Deber  En grupos.  Ley de la multiplicación, permutaciones y combinaciones para determinar el espacio muestreal y la probabilidad.  Determinar la probabilidad de ganar el pozo millonario, el lotto, sacar bolas de una bolsa, dados, cartas etc.  Exponer en clases.  Demostrar empiricamente si es posible.
  • 39. Probabilidad Clasica  Si un evento puede ocurrir de N maneras mutuamente exclusivas e igualmente posibles, y si n de ellas tienen una característica E, entonces, la posibilidad de ocurrencia de E es la fracción n/N y se indica por: n (E) = N  Funciona bien con espacio muestreal pequeño y conocido, y en donde todas las N maneras sean igualmente posibles.
  • 40. Probabilidad Frecuentista  Probabilidad de un evento es su frecuencia relativa a lo largo del tiempo.  Probabilidad de obtener “cara” al lanzar una moneda es 0.5: No porque se la calcula matemáticamente, sino porque esto ocurre al lanzarla muchas veces.  No se puede repetir experimento infinitas veces.  Al repetirlo pocas veces da distinta probabilidad.  Error de probabilidad es una probabilidad… bis…
  • 41. Probabilidad  La probabilidad que un carro sea robado en Guayaquil puede ser calculada en función al número de carros robados y al número de carros en Guayaquil.  Aseguradoras usan esto, para calcular el valor esperado a pagar. +costos +utilidad = prima.  Probabilidad que en cierta camaronera una corrida a 130.000 Pl/Ha alcance 15 gr. en 120 días puede ser calculada con base en veces que se ha logrado en condiciones similares
  • 42. Ejercicio Individual  Calcular la posibilidad de que el sol salga mañana.
  • 43. Teoremas Basicos (1)  La probabilidad de un evento cualquiera va a estar en el rango de cero a uno. Esto quiere decir que no existen probabilidades negativas ni mayores de 100% 0 ≤ P(E) ≤ 1
  • 44. Teoremas Basicos (2)  La suma de la probabilidad de ocurrencia de un evento mas la probabilidad de no ocurrencia del mismo es igual a uno. P(E) + P(¬E) = 1  Probabilidad de que salga 1 en lanzamiento de dados es 1/6  Ocurrencia de que no salga 1 es: P(¬1) = 1 – 1/6 = 5/6
  • 45. Teoremas Basicos (3)  La probabilidad de ocurrencia de dos eventos independientes es igual al producto de la ocurrencia de cada uno. P(A B) = P(A) x P(B)  Probabilidad de que al lanzar dos dados salga 1 y 2:  P(1) = 1/6 ; P(2) = 1/6 P(1 y 2) = 1/6 x 1/6 = 1/36
  • 46. Teoremas Basicos (4)  Para dos eventos cualesquiera A y B, la probabilidad de que ocurra A o B viene dado, por la probabilidad de que ocurra A, mas la probabilidad de que ocurra B, menos la probabilidad de que ocurran ambos. P(A o B) = P(A) + P(B) - P(AB)  Probabilidad que al lanzar dos dados obtenga solo un 1 o un 2:  P(1) = 1/6 ; P(2) = 1/6 P( 1 o 2) = 1/6 + 1/6 – (1/6 x 1/6) = 11/36
  • 47. Teoremas Basicos  Si dos eventos son mutuamente excluyentes, P(AB) será 0 y la probabilidad de ocurrencia de ambos será : P(A o B) = P(A) + P(B)  Probabilidad de que al lanzar un dado obtenga 1 o 2:  P(1) = 1/6 ; P(2) = 1/6 P( 1 o 2) = 1/6 + 1/6 = 2/6
  • 48. Valor Esperado  Llamamos valor esperado al valor probable que podemos obtener al repetir cierto evento.  Va a estar asociado a la probabilidad de ocurrencia de cada opción del mismo, y al valor que tomará la variable cada caso.  Ejemplo:  Probabilidad de que ganemos al apostar a un número en la ruleta es 1/37 = 0.27.  Premio obtenido es 35 veces la apuesta  Calcule la esperanza de ganar en la ruleta apostando US$1,000.
  • 49. Valor Esperado  P(Ganar) = 1/37  P(Perder)= 1- 1/37 = 36/37  Valor a Ganar = $35,000  Valor a Perder = $1,000  Esperanza de Ganancia: E(G) = P(ganar)xValor Ganar + P(perder)*xValor Perder E(G) = 1/37 x $35,000 + 36/37 x - $1,000 E(ganancia) = $946 - $973 = - $27  Si jugamos a la ruleta, apostando toda la noche a un número $1,000; la esperanza que tenemos es de perder “en promedio” $27 cada vez.
  • 50. Ejercicio  Usted se Encuentra en el programa “Haga negocios conmigo”.  Polito le presenta 3 puertas:  Detrás de una hay un flamante ferrari rojo descapotable ultimo modelo.  Detrás de las otras dos un pectol
  • 51. Haga Negocio Conmigo  Usted debe de escoger una puerta.  Luego de que la ha escogido, El Eterno Perdedor abrirá de las otras dos, la que contenga un pectol.  En este momento usted podrá escoger: mantenerse con la misma puerta inicial, o cambiar por la otra puerta. Que escogería y porque?
  • 52. Parámetros  Mayoría de investigaciones estadísticas quieren hacer inferencias a partir de la información contenida en muestras aleatorias sobre la población de donde fueron obtenidas.  Gralmente inferencias sobre los parámetros poblacionales (ej: media y varianza 2). Que describen a la población.  Se usa letras griegas.( , etc.).  Definimos parámetros como ciertas medidas que describen a la población.  A los parámetros en general los podemos definir como .
  • 53. Estadísticos  Para hacer tales inferencias utilizaremos los estadísticos muestreales o estimadores de los parámetros (ej: promedio o media aritmetica x y varianza muestreal s2)  Valores calculadas con base en observaciones de la muestra.  Definimos estadístico como una medida que describe a la muestra, y que sirve para estimar los parámetros.  A los estadísticos en general los podemos definir como n.
  • 54.
  • 55. Estadísticos vs. Parámetros  Importante diferencia entre estadístico y parámetro: una las bases de estadística.  A pesar que estadísticos se usan para representar o estimar parámetros, probabilidad de que sean exactamente iguales es 0.
  • 56. Ej: Promedio x  Variable aleatoria. Distribución de probabilidad (muestreo) depende mecanismo muestreo.  Algunos valores x estarán cerca de , y otros alejados (para arriba o abajo).  Al tomar varias muestras, queremos tener los x concentrados cerca a , y que el promedio de x esté muy cercano a . Distribucion de Medias 14% 12% 10% PROBABILITY 8% 6% 4% 2% 0% 4.0 6.0 8.0 10.0 12.0 14.0 16.0 Values Dist. Deriv Dist. Pobl.
  • 57. Estimadores Insesgados Eficientes  Queremos seleccionar un estimador y un plan de muestreo que: 1. Nos asegure que la esperanza de el estimador sea el parámetro (E( 0) = ) Insesgado 2. La varianza del estimador tenga la menor varianza posible ( 2( 0) → sea baja) Eficiente  De dos estadísticos 1 y 2, el que tenga menor varianza será el mas eficiente.
  • 58. Error de Estimación  Conociendo el estadístico 0 usado, y su distribución de probabilidad, podemos evaluar su error de estimación.  “El valor absoluto de la diferencia entre el estadístico y el parámetro” (E= ).  No sabemos exactamente cuanto es (desconocemos parámetro ),  Podemos encontrar límites entre los cuales existe una probabilidad de que se encuentre el parámetro :  P( .
  • 59. Estadísticos de Centralización Ejercicio02a - Estadisticos.xlsx  Media poblacional  La media aritmética de datos de toda la población  Representa esperanza matemática de variable aleatoria: N 1 xi N 1  Este parámetro no lo conocemos, y no lo conoceremos nunca a no ser que muestreáramos la población completa.  Para estimarlo usamos el estadístico promedio o media muestreal x.
  • 60. Estadísticos de Centralización  Promedio o media poblacional x :  La media aritmética de los datos de la muestra 1 n x= i 1 xi n  Al ser la esperanza matemática de los x, esta puede calcularse también de la siguiente forma: nj k xj N 1  j es j-esimo grupo de un total de k grupos  nj es el número de individuos en el j-esimo grupo  xj es la media del j-esimo grupo
  • 61. Estadísticos de Centralización  ˆ Promedio ponderado x nj k  x xj n 1
  • 62. Promedio Ponderado  Los siguientes son las libras netas obtenidas en una liquidación de pesca de una piscina comercial de camarón y el precio para cada clasificación  Cual es el precio promedio obtenido por libra?  Calcule % y uselos para calcular el precio promedio ponderado Clasificacion libras Precio $/lb 26 - 30 - $ 3.60 31 - 35 1,554 $ 3.15 36 - 40 15,542 $ 2.90 41 - 50 80,818 $ 2.40 51 - 60 43,517 $ 1.80 61 - 70 10,879 $ 1.70 71 - 90 3,108 $ 1.35 Total 155,419
  • 63. Estadísticos de Centralización  Moda: Marca de clase del intervalo con mayor frecuencia  Aproximadamente: Valor que mas encontramos en nuestro muestreo.  Mediana: valor más cercano a la mitad si los ordenamos, o valor con igual número de datos mayores que menores a él.  Valor del dato número (n+1)/2 cuando n es impar  Media del dato # (n/2) y el dato # (n/2 +1) cuando n es par.
  • 64. Estadísticos de Dispersión  Medidas de centralización dan una idea de hacia dónde están distribuidos nuestros datos, pero no de cómo están distribuidos.  Probabilidad de dato igual a la media tiende a 0  Media de posibles valores un dado 3.5  Cruce de Rio; Pies en horno, cabeza refrigerador  Dos poblaciones con igual media pero dispersión de datos distinta: Poblaciones distintas
  • 65. Estadísticos de Dispersión  Parámetro varianza poblacional 2 :  Promedio de cuadrados de las desviaciones de los valores de una variable en población con respecto a media poblacional 2 2 ( xi - ) = N  xi- es distancia de cada punto a la media  Se eleva al cuadrado porque si no distancias positivas y negativas se anularían dando 0
  • 66. Varianza  Fisher (1918) “The Correlation Between Relatives on the Supposition of Mendelian Inheritance”  El gran cuerpo de las estadísticas disponibles nos muestran que las desviaciones de una medida humana de su media siguen muy de cerca la ley normal de los errores, y, por tanto, que la variabilidad puede ser medida de manera uniforme por la desviación estándar correspondiente a la raíz cuadrada de la media del cuadrado del error.  Cuando hay dos causas de variabilidad independientes, capaces de producir en una distribución poblacional de otra manera uniforme, con desviaciones estándar θ1 y θ2, se encuentra que la distribución, cuando ambas causas actúan juntas, tiene una desviación estándar  Por tanto, es conveniente en el análisis de las causas de la variabilidad, trabajar con el cuadrado de la desviación estándar como la medida de la variabilidad. Vamos a llamar esta cantidad, la varianza
  • 67. Propiedades de la Varianza (1) 1. Es positiva (2) 2. Es en distintas unidades que la variable (2) 3. No varía por localización. Sumar constante a todos los datos: misma varianza. Var(x + a) = Var(x) 4. Si se multiplica todos los datos por una constante, varianza se multiplica por constante2 Var(ax) = a2Var(x) 5. La varianza de la suma de variables aleatorias es igual a la suma de sus varianzas + 2 veces su covarianza. 6. Generalizando para N Variables
  • 68. Propiedades de la Varianza (2) 7. Varianza = Promedio de cuadrados – el cuadrado del promedio Var (X)= 1/N xi2 - x2 8. La varianza de la suma de variables aleatorias independientes es igual a la suma de sus varianzas: Var(X + Y) = Var(X) + Var (Y) generalizando: 9. Si las variables independientes tienen la misma varianza, la varianza de su promedio puede transformarse multiplicando por (1/n)2 (4). *Recordar este 2/n para teorema central del limite
  • 69. Estadísticos de Dispersión  Varianza empírica s2 es el estadístico mediante el cual hacemos estimaciones de nuestro parámetro varianza poblacional.  Ya que s2 sería estimador sesgado de 2 si la dividimos para n, se la divide por n-1: 2 2 ( xi - x ) s = n -1  A medida que tamaño de la muestra (n) aumenta, sesgo entre 2 y s2 disminuye
  • 70.
  • 71. Estadísticos de Dispersión  La desviación típica o desviación estándar ( o s), es la raíz cuadrada positiva de la varianza. s es estimador sesgado de . Tiene misma unidad.  El rango es la diferencia entre el valor del mayor dato y el valor del menor dato.  Desviación media: promedio de las desviaciones absolutas respecto al promedio: DM= |xi- x|/n  Error típico de la media: estima s para la distribución de x: S x = s / √n  Coeficiente de variación: expresión porcentual de variación (sin unidades): CV= s x 100 / x Est. Disp. Usan 1 decimal más que la muestra
  • 72. Introduccion al Excel Como Herramienta Estadistica  Versatilidad:  Hoja de calculo  Base de datos  Otros Objetos:  Diagramador  Row  Lenguaje de  Column programación  Cell  Análisis de datos  Area  Modelo de objeto:  Rangos con Nombre  Aplication  Workbook  Worksheet  Range  Otros objetos:
  • 73. Interfaz de Usuario?  Ventanas  Menu de Excel 2003 y anteriores  Cinta de opciones Excel 2007  Barra(s) de Herramientas  Barra de formulas  Cuadro de nombres  Barra de estado  Macros  Complementos  Archivos personales  Entrada de datos e interfaz con el usuario
  • 74. Tipos de Datos/Objetos?  Texto  Números  Formatos  Fórmulas  Referencias absolutas y relativas  Funciones  Matrices  Referencias Remotas  Comentarios  Gráficos  Tablas y gráficos dinámicos  Otros objetos
  • 75. Operaciones Básicas?  Desplazamiento  Teclas de acceso rápido  Funciones Mouse  Selección  Direcciones relativas y absolutas  Nombres de rango  Copiar, Cortar. Pegar , Pegado Especial.  Asistentes  Personalización
  • 76. Funciones Estadisticas  Muchas  Muy Utiles  Algunas no se para que son o no las he usado  Aplasten F1 y lean de que se tratan  Pruebenlas y comparenlas con calculos “manuales”.  Revisaremos las mas frecuentes.  Existen rutas alternas en Excel
  • 77. Herramientas de Analisis de Datos  Complemento de Excel  Existen otros complementos estadisticos de terceros  Tienen sus ventajas y sus limitaciones  Existen rutas alternas en Excel
  • 78. Herramientas No Estadisticas Utiles Para la Estadistica  Modelo de Hoja de Calculo  Formulas  Funciones no Estadisticas  Ordenar, filtrar.  Graficos  Tablas Dinamicas y Graficos  ODBC, conecciones y otros datos externos  Macros
  • 79. Ejercicio Practico  Calcular en Ejercicio02b - Estadisticos.xlsx:  Suma  n  x  Moda  Mediana  s2 y s  Maximo, mínimo y rango  Error típico, coeficiente de variación  Analisis de Datos / Estadistica Descriptiva Usar Formula y Función