SlideShare una empresa de Scribd logo
1 de 10
Descargar para leer sin conexión
Bioestadística

                             Tema 1: Introducción a la
                             estadística

Bioestadística. U. Málaga.       Tema 1: Introdución




¿Para qué sirve la estadística?
   La Ciencia se ocupa en general de fenómenos observables

   La Ciencia se desarrolla observando hechos, formulando leyes que los
   explican y realizando experimentos para validar o rechazar dichas leyes

   Los modelos que crea la ciencia son de tipo determinista o aleatorio
   (estocástico)

   La Estadística se utiliza como tecnología al servicio de las ciencias
   donde la variabilidad y la incertidumbre forman parte de su naturaleza

   “La Bioestadística [...] enseña y ayuda a investigar en todas las áreas de
   las Ciencias de la Vida donde la variablidad no es la excepción sino la
   regla”
   Carrasco de la Peña (1982)


Bioestadística. U. Málaga.                                 Tema 1: Introdución




                                                                                 1
Definición
       La Estadística es la Ciencia de la

       • Sistematización, recogida, ordenación y
         presentación de los datos referentes a un fenómeno
         que presenta variabilidad o incertidumbre para su
         estudio metódico, con objeto de

       • deducir las leyes que rigen esos fenómenos,


       • y poder de esa forma hacer previsiones sobre los
         mismos, tomar decisiones u obtener conclusiones.


 Bioestadística. U. Málaga.                                                                 Tema 1: Introdución




 Pasos en un estudio estadístico
Plantear hipótesis sobre una población
           Los fumadores tienen “más bajas” laborales que los no fumadores
           ¿En qué sentido? ¿Mayor número? ¿Tiempo medio?

Decidir qué datos recoger (diseño de experimentos)
     Qué individuos pertenecerán al estudio (muestras)
           Fumadores y no fumadores en edad laboral.
           Criterios de exclusión ¿Cómo se eligen? ¿Descartamos los que padecen enfermedades
           crónicas?
     Qué datos recoger de los mismos (variables)
           Número de bajas
           Tiempo de duración de cada baja
           ¿Sexo? ¿Sector laboral? ¿Otros factores?
                                                                                                       No tenéis que
Recoger los datos (muestreo)
     ¿Estratificado? ¿Sistemáticamente?                                                               entenderlo (aún)

Describir (resumir) los datos obtenidos
           tiempo medio de baja en fumadores y no (estadísticos)
           % de bajas por fumadores y sexo (frecuencias), gráficos,...

Realizar una inferencia sobre la población
           Los fumadores están de baja al menos 10 días/año más de media que los no fumadores.

Cuantificar la confianza en la inferencia
     Nivel de confianza del 95%
     Significación del contraste: p=2%
 Bioestadística. U. Málaga.                                                                 Tema 1: Introdución




                                                                                                                         2
Método científico y estadística

                              Plantear         Diseñar
                              hipótesis      experimento




                               Obtener      Recoger datos
                             conclusiones    y analizarlos




Bioestadística. U. Málaga.                                        Tema 1: Introdución




Población y muestra
   Población (‘population’) es el conjunto sobre el que estamos
   interesados en obtener conclusiones (hacer inferencia).
        Normalmente es demasiado grande para poder abarcarlo.



   Muestra (‘sample’) es un subconjunto suyo al que tenemos
   acceso y sobre el que realmente hacemos las observaciones
   (mediciones)
       Debería ser “representativo”
       Esta formado por miembros “seleccionados” de la población
       (individuos, unidades experimentales).




Bioestadística. U. Málaga.                                        Tema 1: Introdución




                                                                                        3
Variables
 Una variable es una característica observable que varía entre los
 diferentes individuos de una población. La información que disponemos
 de cada individuo es resumida en variables.

 En los individuos de la población española, de uno
 a otro es variable:

      El grupo sanguíneo
            {A, B, AB, O}        Var. Cualitativa
      Su nivel de felicidad “declarado”
            {Deprimido, Ni fu ni fa, Muy Feliz}     Var. Ordinal
      El número de hijos
            {0,1,2,3,...}    Var. Numérica discreta
      La altura
            {1’62 ; 1’74; ...}     Var. Numérica continua




Bioestadística. U. Málaga.                                                      Tema 1: Introdución




Tipos de variables
     Cualitativas
     Si sus valores (modalidades) no se pueden asociar naturalmente a un
     número (no se pueden hacer operaciones algebraicas con ellos)

          Nominales: Si sus valores no se pueden ordenar
                Sexo, Grupo Sanguíneo, Religión, Nacionalidad, Fumar (Sí/No)

          Ordinales: Si sus valores se pueden ordenar
                Mejoría a un tratamiento, Grado de satisfacción, Intensidad del dolor

     Cuantitativas o Numéricas
     Si sus valores son numéricos (tiene sentido hacer operaciones
     algebraicas con ellos)

          Discretas: Si toma valores enteros
                Número de hijos, Número de cigarrillos, Num. de “cumpleaños”

          Continuas: Si entre dos valores, son posibles infinitos valores intermedios.
                Altura, Presión intraocular, Dosis de medicamento administrado, edad

Bioestadística. U. Málaga.                                                      Tema 1: Introdución




                                                                                                      4
Es buena idea codificar las variables
  como números para poder procesarlas
  con facilidad en un ordenador.
  Es conveniente asignar “etiquetas” a
  los valores de las variables para
  recordar qué significan los códigos
  numéricos.
        Sexo (Cualit: Códigos arbitrarios)
              1 = Hombre
              2 = Mujer
        Raza (Cualit: Códigos arbitrarios)
              1 = Blanca
              2 = Negra,...
        Felicidad Ordinal: Respetar un orden al
        codificar.
              1 = Muy feliz
              2 = Bastante feliz
              3 = No demasiado feliz
  Se pueden asignar códigos a
  respuestas especiales como
              0 = No sabe
              99 = No contesta...
  Estas situaciones deberán ser tenidas
  en cuentas en el análisis. Datos
  perdidos (‘missing data’)


Bioestadística. U. Málaga.                            Tema 1: Introdución




   Aunque se codifiquen como números, debemos recordar siempre el
   verdadero tipo de las variables y su significado cuando vayamos a
   usar programas de cálculo estadístico.
   No todo está permitido con cualquier tipo de variable.




Bioestadística. U. Málaga.                            Tema 1: Introdución




                                                                            5
Los posibles valores de una variable suelen denominarse modalidades.

    Las modalidades pueden agruparse en clases (intervalos)
          Edades:
                 Menos de 20 años, de 20 a 50 años, más de 50 años
          Hijos:
                Menos de 3 hijos, De 3 a 5, 6 o más hijos

    Las modalidades/clases deben forman un sistema exhaustivo y
    excluyente
          Exhaustivo: No podemos olvidar ningún posible valor de la variable
                        Mal: ¿Cuál es su color del pelo: (Rubio, Moreno)?
                        Bien: ¿Cuál es su grupo sanguíneo?
          Excluyente: Nadie puede presentar dos valores
          simultáneos de la variable
                Estudio sobre el ocio
                        Mal: De los siguientes, qué le gusta: (deporte, cine)
                        Bien: Le gusta el deporte: (Sí, No)
                        Bien: Le gusta el cine: (Sí, No)
                        Mal: Cuántos hijos tiene: (Ninguno, Menos de 5, Más de 2)


Bioestadística. U. Málaga.                                                  Tema 1: Introdución




Presentación ordenada de datos
                                                                  7

                                                                  6
Género              Frec.                                         5

Hombre              4                                             4

                                                                  3

                                                                  2
Mujer               6                                             1
                                                                  0
                                                                          Hombre             Mujer




    Las tablas de frecuencias y las representaciones
    gráficas son dos maneras equivalentes de presentar la
    información. Las dos exponen ordenadamente la
    información recogida en una muestra.

Bioestadística. U. Málaga.                                                  Tema 1: Introdución




                                                                                                     6
Tablas de frecuencia
  Exponen la información recogida en la muestra, de forma que no se pierda nada de
  información (o poca).

             Frecuencias absolutas: Contabilizan el número de individuos de cada modalidad

             Frecuencias relativas (porcentajes): Idem, pero dividido por el total

             Frecuencias acumuladas: Sólo tienen sentido para variables ordinales y numéricas
                    Muy útiles para calcular cuantiles (ver más adelante)
                                ¿Qué porcentaje de individuos tiene menos de 3 hijos? Sol: 83,8
                                ¿Entre 4 y 6 hijos? Soluc 1ª: 8,4%+3,6%+1,6%= 13,6%. Soluc 2ª: 97,3% - 83,8% = 13,5%

                        Sexo del encuestado
                                                                                                                    Número de hijos
                                                         Porcentaje
                                                                                                                                         Porcentaje     Porcentaje
                          Frecuencia       Porcentaje      válido
                                                                                                               Frecuencia   Porcentaje     válido       acumulado
   Válidos     Hombre           636             41,9            41,9
                                                                                      Válidos    0                   419         27,6           27,8           27,8
               Mujer            881             58,1            58,1
                                                                                                 1                   255         16,8           16,9           44,7
               Total           1517            100,0           100,0
                                                                                                 2                   375         24,7           24,9           69,5
                                                                                                 3                   215         14,2           14,2           83,8
                                 Nivel de felicidad
                                                                                                 4                   127           8,4            8,4          92,2
                                                        Porcentaje     Porcentaje                5                     54          3,6            3,6          95,8
                                Frecuencia Porcentaje     válido       acumulado                 6                     24          1,6            1,6          97,3
Válidos    Muy feliz                  467       30,8           31,1          31,1                7                     23          1,5            1,5          98,9
           Bastante feliz             872       57,5           58,0          89,0
                                                                                                 Ocho o más            17          1,1            1,1        100,0
           No demasiado feliz         165       10,9           11,0         100,0
                                                                                                 Total              1509         99,5          100,0
           Total                     1504       99,1          100,0
                                                                                      Perdidos   No contesta            8           ,5
Perdidos   No contesta                 13          ,9
Total                                1517      100,0
                                                                                      Total                         1517        100,0



Bioestadística. U. Málaga.                                                                                              Tema 1: Introdución




Datos desordenados y ordenados en tablas
      Variable: Género                                                              Género Frec.                            Frec. relat.
                                                                                                                            porcentaje
               Modalidades:
                        H = Hombre                                                  Hombre 4                                4/10=0,4=40%
                        M = Mujer                                                   Mujer         6                         6/10=0,6=60%

                                                                                                  10=tamaño
                                                                                                  muestral
      Muestra:

               MHHMMHMMMH

               equivale a
               HHHH MMMMMM

Bioestadística. U. Málaga.                                                                                              Tema 1: Introdución




                                                                                                                                                                      7
Ejemplo
 ¿Cuántos individuos tienen                               Número de hijos
 menos de 2 hijos?
      frec. indiv. sin hijos                                       Porcent.      Porcent.
      +                                                    Frec.   (válido)       acum.
      frec. indiv. con 1 hijo                 0              419        27,8         27,8
      = 419 + 255                             1              255        16,9         44,7
      = 674 individuos                        2              375        24,9         69,5   50%
                                              3              215        14,2         83,8
 ¿Qué porcentaje de individuos                4              127         8,4         92,2
 tiene 6 hijos o menos?                       5               54         3,6         95,8
      97,3%
                                              6               24         1,6         97,3
                                              7               23         1,5         98,9
 ¿Qué cantidad de hijos es tal
                                              Ocho+           17         1,1       100,0
 que al menos el 50% de la
 población tiene una cantidad                 Total         1509      100,0
 inferior o igual?
      2 hijos



Bioestadística. U. Málaga.                                          Tema 1: Introdución




Gráficos para v. cualitativas
 Diagramas de barras
      Alturas proporcionales a las frecuencias (abs. o
      rel.)
      Se pueden aplicar también a variables discretas

 Diagramas de sectores (tartas, polares)
      No usarlo con variables ordinales.
      El área de cada sector es proporcional a su
      frecuencia (abs. o rel.)

 Pictogramas
      Fáciles de entender.
      El área de cada modalidad debe ser proporcional a
      la frecuencia. ¿De los dos, cuál es incorrecto?.




Bioestadística. U. Málaga.                                          Tema 1: Introdución




                                                                                                  8
Gráficos diferenciales para variables numéricas                                    419
                                                                             400               375




    Son diferentes en función de que las
                                                                             300

                                                                                         255




                                                                  Recuento
                                                                                                     215


    variables sean discretas o continuas.                                    200



                                                                                                           127


    Valen con frec. absolutas o relativas.                                   100

                                                                                                                 54



          Diagramas barras para v. discretas
                                                                                                                           24   23    17


                                                                                   0     1     2      3    4     5         6    7 Ocho o más



                Se deja un hueco entre barras para indicar                                         Número de hijos


                los valores que no son posibles
                                                                             250




          Histogramas para v. continuas                                      200




                                                                  Recuento
                El área que hay bajo el histograma entre                     150




                dos puntos cualesquiera indica la cantidad                   100



                (porcentaje o frecuencia) de individuos en                    50


                el intervalo.
                                                                                   20                40               60                80

                                                                                                   Edad del encuestado


Bioestadística. U. Málaga.                                                     Tema 1: Introdución




Diagramas integrales
 Cada uno de los anteriores diagramas tiene su correspondiente diagrama integral. Se realizan
 a partir de las frecuencias acumuladas. Indican, para cada valor de la variable, la cantidad
 (frecuencia) de individuos que poseen un valor inferior o igual al mismo. No los construiremos
 en clase. Se pasan de los diferenciales a los integrales por integración y a la inversa por
 derivación (en un sentido más general del que visteis en bachillerato.)




Bioestadística. U. Málaga.                                                     Tema 1: Introdución




                                                                                                                                               9
¿Qué hemos visto?
    Definición de estadística
    Población
    Muestra
    Variables
          Cualitativas
          Numéricas
    Presentación ordenada de datos
          Tablas de frecuencias
                absolutas
                relativas
                acumuladas
          Representaciones gráficas
                Cualitativas
                Numéricas
                       Diferenciales
                       Integrales




Bioestadística. U. Málaga.             Tema 1: Introdución




                                                             10

Más contenido relacionado

Destacado

Presentacion de definiciones
Presentacion de definicionesPresentacion de definiciones
Presentacion de definicionesemma19881
 
Expediente electrónico
Expediente electrónicoExpediente electrónico
Expediente electrónicoMilu_uz
 
Triptico Educación Expandida y Aumentada
Triptico Educación Expandida y AumentadaTriptico Educación Expandida y Aumentada
Triptico Educación Expandida y AumentadaSIRIUS e-Learning
 
Pastillas para adelgazar mango africano
Pastillas para adelgazar mango africanoPastillas para adelgazar mango africano
Pastillas para adelgazar mango africanopastillasbajarpeso
 
Presentacion modelo tic
Presentacion modelo ticPresentacion modelo tic
Presentacion modelo ticBrayan Solarte
 
Reseña de suma y resta
Reseña de suma y restaReseña de suma y resta
Reseña de suma y restaZully_5
 
LearningMEX 2015 | Gamificación, el complemento natural del mobile y social l...
LearningMEX 2015 | Gamificación, el complemento natural del mobile y social l...LearningMEX 2015 | Gamificación, el complemento natural del mobile y social l...
LearningMEX 2015 | Gamificación, el complemento natural del mobile y social l...Netex Learning
 
Benedicto xvi en 7 palabras
Benedicto xvi en 7 palabrasBenedicto xvi en 7 palabras
Benedicto xvi en 7 palabrascursoiberis
 
Presentación oficial de la escuela de la felicidad
Presentación oficial de la escuela de la felicidadPresentación oficial de la escuela de la felicidad
Presentación oficial de la escuela de la felicidadEscuelaDeLaFelicidad
 

Destacado (20)

Tecnologia wed 2
Tecnologia wed 2Tecnologia wed 2
Tecnologia wed 2
 
Google drive
Google driveGoogle drive
Google drive
 
Presentacion de definiciones
Presentacion de definicionesPresentacion de definiciones
Presentacion de definiciones
 
Gbi (2)
Gbi (2)Gbi (2)
Gbi (2)
 
Presentacion 3 menu
Presentacion 3 menuPresentacion 3 menu
Presentacion 3 menu
 
Presentacion transporte1
Presentacion transporte1Presentacion transporte1
Presentacion transporte1
 
Expediente electrónico
Expediente electrónicoExpediente electrónico
Expediente electrónico
 
Informática
InformáticaInformática
Informática
 
Pyongyang (a)
Pyongyang (a)Pyongyang (a)
Pyongyang (a)
 
Perseverancia (1)
Perseverancia (1)Perseverancia (1)
Perseverancia (1)
 
DISEÑO DE ENVASES
DISEÑO DE ENVASESDISEÑO DE ENVASES
DISEÑO DE ENVASES
 
Triptico Educación Expandida y Aumentada
Triptico Educación Expandida y AumentadaTriptico Educación Expandida y Aumentada
Triptico Educación Expandida y Aumentada
 
Empaques
EmpaquesEmpaques
Empaques
 
Pastillas para adelgazar mango africano
Pastillas para adelgazar mango africanoPastillas para adelgazar mango africano
Pastillas para adelgazar mango africano
 
Presentacion modelo tic
Presentacion modelo ticPresentacion modelo tic
Presentacion modelo tic
 
Reseña de suma y resta
Reseña de suma y restaReseña de suma y resta
Reseña de suma y resta
 
LearningMEX 2015 | Gamificación, el complemento natural del mobile y social l...
LearningMEX 2015 | Gamificación, el complemento natural del mobile y social l...LearningMEX 2015 | Gamificación, el complemento natural del mobile y social l...
LearningMEX 2015 | Gamificación, el complemento natural del mobile y social l...
 
Benedicto xvi en 7 palabras
Benedicto xvi en 7 palabrasBenedicto xvi en 7 palabras
Benedicto xvi en 7 palabras
 
Ciones
CionesCiones
Ciones
 
Presentación oficial de la escuela de la felicidad
Presentación oficial de la escuela de la felicidadPresentación oficial de la escuela de la felicidad
Presentación oficial de la escuela de la felicidad
 

Similar a Apuntes de biesadistica 1 (20)

Bioestadísticas
BioestadísticasBioestadísticas
Bioestadísticas
 
SEMANA 01.pdf
SEMANA 01.pdfSEMANA 01.pdf
SEMANA 01.pdf
 
estad_uma_01.ppt
estad_uma_01.pptestad_uma_01.ppt
estad_uma_01.ppt
 
estad_uma_01.ppt
estad_uma_01.pptestad_uma_01.ppt
estad_uma_01.ppt
 
estad_uma_01.ppt
estad_uma_01.pptestad_uma_01.ppt
estad_uma_01.ppt
 
estad_uma_01.ppt
estad_uma_01.pptestad_uma_01.ppt
estad_uma_01.ppt
 
estadistica descriptiva y gráficos estadisticos
estadistica descriptiva y gráficos estadisticosestadistica descriptiva y gráficos estadisticos
estadistica descriptiva y gráficos estadisticos
 
estadistica datos agrupados e introduccion
estadistica datos agrupados e introduccionestadistica datos agrupados e introduccion
estadistica datos agrupados e introduccion
 
estad_uma_01.ppt
estad_uma_01.pptestad_uma_01.ppt
estad_uma_01.ppt
 
estadistica_probabilidad_curso_clase avanzada
estadistica_probabilidad_curso_clase avanzadaestadistica_probabilidad_curso_clase avanzada
estadistica_probabilidad_curso_clase avanzada
 
Estad uma 01
Estad uma 01Estad uma 01
Estad uma 01
 
elefant
elefantelefant
elefant
 
Clase 1 29 de marzo.ppt
Clase 1 29 de marzo.pptClase 1 29 de marzo.ppt
Clase 1 29 de marzo.ppt
 
Estadistica 1 para egb
Estadistica 1 para egbEstadistica 1 para egb
Estadistica 1 para egb
 
estad_uma_01.ppt
estad_uma_01.pptestad_uma_01.ppt
estad_uma_01.ppt
 
Estadistica ii
Estadistica iiEstadistica ii
Estadistica ii
 
diapositivas de estadistica.ppt
diapositivas de estadistica.pptdiapositivas de estadistica.ppt
diapositivas de estadistica.ppt
 
Introducción a la Estadísitica Descriptiva
Introducción a la Estadísitica DescriptivaIntroducción a la Estadísitica Descriptiva
Introducción a la Estadísitica Descriptiva
 
semana 01 Ok 2022 2.pptx
semana 01 Ok 2022 2.pptxsemana 01 Ok 2022 2.pptx
semana 01 Ok 2022 2.pptx
 
Biometría i
Biometría iBiometría i
Biometría i
 

Último

Curso = Metodos Tecnicas y Modelos de Enseñanza.pdf
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdfCurso = Metodos Tecnicas y Modelos de Enseñanza.pdf
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdfFrancisco158360
 
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxTIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxlclcarmen
 
cortes de luz abril 2024 en la provincia de tungurahua
cortes de luz abril 2024 en la provincia de tungurahuacortes de luz abril 2024 en la provincia de tungurahua
cortes de luz abril 2024 en la provincia de tungurahuaDANNYISAACCARVAJALGA
 
Planificacion Anual 2do Grado Educacion Primaria 2024 Ccesa007.pdf
Planificacion Anual 2do Grado Educacion Primaria   2024   Ccesa007.pdfPlanificacion Anual 2do Grado Educacion Primaria   2024   Ccesa007.pdf
Planificacion Anual 2do Grado Educacion Primaria 2024 Ccesa007.pdfDemetrio Ccesa Rayme
 
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAFORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAEl Fortí
 
La triple Naturaleza del Hombre estudio.
La triple Naturaleza del Hombre estudio.La triple Naturaleza del Hombre estudio.
La triple Naturaleza del Hombre estudio.amayarogel
 
EXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptx
EXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptxEXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptx
EXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptxPryhaSalam
 
La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...JonathanCovena1
 
la unidad de s sesion edussssssssssssssscacio fisca
la unidad de s sesion edussssssssssssssscacio fiscala unidad de s sesion edussssssssssssssscacio fisca
la unidad de s sesion edussssssssssssssscacio fiscaeliseo91
 
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptxACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptxzulyvero07
 
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyzel CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyzprofefilete
 
RETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docxRETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docxAna Fernandez
 
CALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADCALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADauxsoporte
 
Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Lourdes Feria
 
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptxSEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptxYadi Campos
 
Qué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaQué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaDecaunlz
 
Ejercicios de PROBLEMAS PAEV 6 GRADO 2024.pdf
Ejercicios de PROBLEMAS PAEV 6 GRADO 2024.pdfEjercicios de PROBLEMAS PAEV 6 GRADO 2024.pdf
Ejercicios de PROBLEMAS PAEV 6 GRADO 2024.pdfMaritzaRetamozoVera
 

Último (20)

Sesión de clase: Defendamos la verdad.pdf
Sesión de clase: Defendamos la verdad.pdfSesión de clase: Defendamos la verdad.pdf
Sesión de clase: Defendamos la verdad.pdf
 
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdf
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdfCurso = Metodos Tecnicas y Modelos de Enseñanza.pdf
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdf
 
Sesión de clase: Fe contra todo pronóstico
Sesión de clase: Fe contra todo pronósticoSesión de clase: Fe contra todo pronóstico
Sesión de clase: Fe contra todo pronóstico
 
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxTIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
 
Unidad 3 | Metodología de la Investigación
Unidad 3 | Metodología de la InvestigaciónUnidad 3 | Metodología de la Investigación
Unidad 3 | Metodología de la Investigación
 
cortes de luz abril 2024 en la provincia de tungurahua
cortes de luz abril 2024 en la provincia de tungurahuacortes de luz abril 2024 en la provincia de tungurahua
cortes de luz abril 2024 en la provincia de tungurahua
 
Planificacion Anual 2do Grado Educacion Primaria 2024 Ccesa007.pdf
Planificacion Anual 2do Grado Educacion Primaria   2024   Ccesa007.pdfPlanificacion Anual 2do Grado Educacion Primaria   2024   Ccesa007.pdf
Planificacion Anual 2do Grado Educacion Primaria 2024 Ccesa007.pdf
 
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAFORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
 
La triple Naturaleza del Hombre estudio.
La triple Naturaleza del Hombre estudio.La triple Naturaleza del Hombre estudio.
La triple Naturaleza del Hombre estudio.
 
EXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptx
EXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptxEXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptx
EXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptx
 
La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...
 
la unidad de s sesion edussssssssssssssscacio fisca
la unidad de s sesion edussssssssssssssscacio fiscala unidad de s sesion edussssssssssssssscacio fisca
la unidad de s sesion edussssssssssssssscacio fisca
 
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptxACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
 
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyzel CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
 
RETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docxRETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docx
 
CALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADCALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDAD
 
Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...
 
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptxSEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
 
Qué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaQué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativa
 
Ejercicios de PROBLEMAS PAEV 6 GRADO 2024.pdf
Ejercicios de PROBLEMAS PAEV 6 GRADO 2024.pdfEjercicios de PROBLEMAS PAEV 6 GRADO 2024.pdf
Ejercicios de PROBLEMAS PAEV 6 GRADO 2024.pdf
 

Apuntes de biesadistica 1

  • 1. Bioestadística Tema 1: Introducción a la estadística Bioestadística. U. Málaga. Tema 1: Introdución ¿Para qué sirve la estadística? La Ciencia se ocupa en general de fenómenos observables La Ciencia se desarrolla observando hechos, formulando leyes que los explican y realizando experimentos para validar o rechazar dichas leyes Los modelos que crea la ciencia son de tipo determinista o aleatorio (estocástico) La Estadística se utiliza como tecnología al servicio de las ciencias donde la variabilidad y la incertidumbre forman parte de su naturaleza “La Bioestadística [...] enseña y ayuda a investigar en todas las áreas de las Ciencias de la Vida donde la variablidad no es la excepción sino la regla” Carrasco de la Peña (1982) Bioestadística. U. Málaga. Tema 1: Introdución 1
  • 2. Definición La Estadística es la Ciencia de la • Sistematización, recogida, ordenación y presentación de los datos referentes a un fenómeno que presenta variabilidad o incertidumbre para su estudio metódico, con objeto de • deducir las leyes que rigen esos fenómenos, • y poder de esa forma hacer previsiones sobre los mismos, tomar decisiones u obtener conclusiones. Bioestadística. U. Málaga. Tema 1: Introdución Pasos en un estudio estadístico Plantear hipótesis sobre una población Los fumadores tienen “más bajas” laborales que los no fumadores ¿En qué sentido? ¿Mayor número? ¿Tiempo medio? Decidir qué datos recoger (diseño de experimentos) Qué individuos pertenecerán al estudio (muestras) Fumadores y no fumadores en edad laboral. Criterios de exclusión ¿Cómo se eligen? ¿Descartamos los que padecen enfermedades crónicas? Qué datos recoger de los mismos (variables) Número de bajas Tiempo de duración de cada baja ¿Sexo? ¿Sector laboral? ¿Otros factores? No tenéis que Recoger los datos (muestreo) ¿Estratificado? ¿Sistemáticamente? entenderlo (aún) Describir (resumir) los datos obtenidos tiempo medio de baja en fumadores y no (estadísticos) % de bajas por fumadores y sexo (frecuencias), gráficos,... Realizar una inferencia sobre la población Los fumadores están de baja al menos 10 días/año más de media que los no fumadores. Cuantificar la confianza en la inferencia Nivel de confianza del 95% Significación del contraste: p=2% Bioestadística. U. Málaga. Tema 1: Introdución 2
  • 3. Método científico y estadística Plantear Diseñar hipótesis experimento Obtener Recoger datos conclusiones y analizarlos Bioestadística. U. Málaga. Tema 1: Introdución Población y muestra Población (‘population’) es el conjunto sobre el que estamos interesados en obtener conclusiones (hacer inferencia). Normalmente es demasiado grande para poder abarcarlo. Muestra (‘sample’) es un subconjunto suyo al que tenemos acceso y sobre el que realmente hacemos las observaciones (mediciones) Debería ser “representativo” Esta formado por miembros “seleccionados” de la población (individuos, unidades experimentales). Bioestadística. U. Málaga. Tema 1: Introdución 3
  • 4. Variables Una variable es una característica observable que varía entre los diferentes individuos de una población. La información que disponemos de cada individuo es resumida en variables. En los individuos de la población española, de uno a otro es variable: El grupo sanguíneo {A, B, AB, O} Var. Cualitativa Su nivel de felicidad “declarado” {Deprimido, Ni fu ni fa, Muy Feliz} Var. Ordinal El número de hijos {0,1,2,3,...} Var. Numérica discreta La altura {1’62 ; 1’74; ...} Var. Numérica continua Bioestadística. U. Málaga. Tema 1: Introdución Tipos de variables Cualitativas Si sus valores (modalidades) no se pueden asociar naturalmente a un número (no se pueden hacer operaciones algebraicas con ellos) Nominales: Si sus valores no se pueden ordenar Sexo, Grupo Sanguíneo, Religión, Nacionalidad, Fumar (Sí/No) Ordinales: Si sus valores se pueden ordenar Mejoría a un tratamiento, Grado de satisfacción, Intensidad del dolor Cuantitativas o Numéricas Si sus valores son numéricos (tiene sentido hacer operaciones algebraicas con ellos) Discretas: Si toma valores enteros Número de hijos, Número de cigarrillos, Num. de “cumpleaños” Continuas: Si entre dos valores, son posibles infinitos valores intermedios. Altura, Presión intraocular, Dosis de medicamento administrado, edad Bioestadística. U. Málaga. Tema 1: Introdución 4
  • 5. Es buena idea codificar las variables como números para poder procesarlas con facilidad en un ordenador. Es conveniente asignar “etiquetas” a los valores de las variables para recordar qué significan los códigos numéricos. Sexo (Cualit: Códigos arbitrarios) 1 = Hombre 2 = Mujer Raza (Cualit: Códigos arbitrarios) 1 = Blanca 2 = Negra,... Felicidad Ordinal: Respetar un orden al codificar. 1 = Muy feliz 2 = Bastante feliz 3 = No demasiado feliz Se pueden asignar códigos a respuestas especiales como 0 = No sabe 99 = No contesta... Estas situaciones deberán ser tenidas en cuentas en el análisis. Datos perdidos (‘missing data’) Bioestadística. U. Málaga. Tema 1: Introdución Aunque se codifiquen como números, debemos recordar siempre el verdadero tipo de las variables y su significado cuando vayamos a usar programas de cálculo estadístico. No todo está permitido con cualquier tipo de variable. Bioestadística. U. Málaga. Tema 1: Introdución 5
  • 6. Los posibles valores de una variable suelen denominarse modalidades. Las modalidades pueden agruparse en clases (intervalos) Edades: Menos de 20 años, de 20 a 50 años, más de 50 años Hijos: Menos de 3 hijos, De 3 a 5, 6 o más hijos Las modalidades/clases deben forman un sistema exhaustivo y excluyente Exhaustivo: No podemos olvidar ningún posible valor de la variable Mal: ¿Cuál es su color del pelo: (Rubio, Moreno)? Bien: ¿Cuál es su grupo sanguíneo? Excluyente: Nadie puede presentar dos valores simultáneos de la variable Estudio sobre el ocio Mal: De los siguientes, qué le gusta: (deporte, cine) Bien: Le gusta el deporte: (Sí, No) Bien: Le gusta el cine: (Sí, No) Mal: Cuántos hijos tiene: (Ninguno, Menos de 5, Más de 2) Bioestadística. U. Málaga. Tema 1: Introdución Presentación ordenada de datos 7 6 Género Frec. 5 Hombre 4 4 3 2 Mujer 6 1 0 Hombre Mujer Las tablas de frecuencias y las representaciones gráficas son dos maneras equivalentes de presentar la información. Las dos exponen ordenadamente la información recogida en una muestra. Bioestadística. U. Málaga. Tema 1: Introdución 6
  • 7. Tablas de frecuencia Exponen la información recogida en la muestra, de forma que no se pierda nada de información (o poca). Frecuencias absolutas: Contabilizan el número de individuos de cada modalidad Frecuencias relativas (porcentajes): Idem, pero dividido por el total Frecuencias acumuladas: Sólo tienen sentido para variables ordinales y numéricas Muy útiles para calcular cuantiles (ver más adelante) ¿Qué porcentaje de individuos tiene menos de 3 hijos? Sol: 83,8 ¿Entre 4 y 6 hijos? Soluc 1ª: 8,4%+3,6%+1,6%= 13,6%. Soluc 2ª: 97,3% - 83,8% = 13,5% Sexo del encuestado Número de hijos Porcentaje Porcentaje Porcentaje Frecuencia Porcentaje válido Frecuencia Porcentaje válido acumulado Válidos Hombre 636 41,9 41,9 Válidos 0 419 27,6 27,8 27,8 Mujer 881 58,1 58,1 1 255 16,8 16,9 44,7 Total 1517 100,0 100,0 2 375 24,7 24,9 69,5 3 215 14,2 14,2 83,8 Nivel de felicidad 4 127 8,4 8,4 92,2 Porcentaje Porcentaje 5 54 3,6 3,6 95,8 Frecuencia Porcentaje válido acumulado 6 24 1,6 1,6 97,3 Válidos Muy feliz 467 30,8 31,1 31,1 7 23 1,5 1,5 98,9 Bastante feliz 872 57,5 58,0 89,0 Ocho o más 17 1,1 1,1 100,0 No demasiado feliz 165 10,9 11,0 100,0 Total 1509 99,5 100,0 Total 1504 99,1 100,0 Perdidos No contesta 8 ,5 Perdidos No contesta 13 ,9 Total 1517 100,0 Total 1517 100,0 Bioestadística. U. Málaga. Tema 1: Introdución Datos desordenados y ordenados en tablas Variable: Género Género Frec. Frec. relat. porcentaje Modalidades: H = Hombre Hombre 4 4/10=0,4=40% M = Mujer Mujer 6 6/10=0,6=60% 10=tamaño muestral Muestra: MHHMMHMMMH equivale a HHHH MMMMMM Bioestadística. U. Málaga. Tema 1: Introdución 7
  • 8. Ejemplo ¿Cuántos individuos tienen Número de hijos menos de 2 hijos? frec. indiv. sin hijos Porcent. Porcent. + Frec. (válido) acum. frec. indiv. con 1 hijo 0 419 27,8 27,8 = 419 + 255 1 255 16,9 44,7 = 674 individuos 2 375 24,9 69,5 50% 3 215 14,2 83,8 ¿Qué porcentaje de individuos 4 127 8,4 92,2 tiene 6 hijos o menos? 5 54 3,6 95,8 97,3% 6 24 1,6 97,3 7 23 1,5 98,9 ¿Qué cantidad de hijos es tal Ocho+ 17 1,1 100,0 que al menos el 50% de la población tiene una cantidad Total 1509 100,0 inferior o igual? 2 hijos Bioestadística. U. Málaga. Tema 1: Introdución Gráficos para v. cualitativas Diagramas de barras Alturas proporcionales a las frecuencias (abs. o rel.) Se pueden aplicar también a variables discretas Diagramas de sectores (tartas, polares) No usarlo con variables ordinales. El área de cada sector es proporcional a su frecuencia (abs. o rel.) Pictogramas Fáciles de entender. El área de cada modalidad debe ser proporcional a la frecuencia. ¿De los dos, cuál es incorrecto?. Bioestadística. U. Málaga. Tema 1: Introdución 8
  • 9. Gráficos diferenciales para variables numéricas 419 400 375 Son diferentes en función de que las 300 255 Recuento 215 variables sean discretas o continuas. 200 127 Valen con frec. absolutas o relativas. 100 54 Diagramas barras para v. discretas 24 23 17 0 1 2 3 4 5 6 7 Ocho o más Se deja un hueco entre barras para indicar Número de hijos los valores que no son posibles 250 Histogramas para v. continuas 200 Recuento El área que hay bajo el histograma entre 150 dos puntos cualesquiera indica la cantidad 100 (porcentaje o frecuencia) de individuos en 50 el intervalo. 20 40 60 80 Edad del encuestado Bioestadística. U. Málaga. Tema 1: Introdución Diagramas integrales Cada uno de los anteriores diagramas tiene su correspondiente diagrama integral. Se realizan a partir de las frecuencias acumuladas. Indican, para cada valor de la variable, la cantidad (frecuencia) de individuos que poseen un valor inferior o igual al mismo. No los construiremos en clase. Se pasan de los diferenciales a los integrales por integración y a la inversa por derivación (en un sentido más general del que visteis en bachillerato.) Bioestadística. U. Málaga. Tema 1: Introdución 9
  • 10. ¿Qué hemos visto? Definición de estadística Población Muestra Variables Cualitativas Numéricas Presentación ordenada de datos Tablas de frecuencias absolutas relativas acumuladas Representaciones gráficas Cualitativas Numéricas Diferenciales Integrales Bioestadística. U. Málaga. Tema 1: Introdución 10