GENERALIDADES DE BIOESTADÍSTICA -VARIABLES   Diana García Lozada Optómetra Docente Fundación Universitaria del Área Andina
Estadística  Rama de la matemática que utiliza grandes conjuntos de datos numéricos para obtener inferencias basadas en el cálculo de probabilidades. Pura o matemática: Conocimiento para generar conocimiento. Desarrolla métodos y procedimientos nuevos que luego podrán utilizarse para resolver problemas en los distintos campos del saber. Aplicada: Cómo y cuando utilizar cada procedimiento y cómo interpretar los resultados que se obtienen.
Estadística Recopila, organiza, procesa, interpreta y presenta datos numéricos. Utilidad: Toma de decisiones en otras ciencias como economía, psicometría, biología, salud pública, medicina….
BIOESTADÍSTICA Rama de la estadística aplicada que estudia la utilización de métodos estadísticos en problemas médicos y biológicos (Martín Andrés y Luna, 1994) Aplicación de las herramientas estadísticas a las ciencias biológicas y de la salud. Puede ser: Descriptiva  Analítica o inferencial
Bioestadística Descriptiva:  Sintetiza información contenida en unos datos; recoge, clasifica, representa y  resume  datos tomados a una muestra. Calcula índices estadísticos (números) y representa mediante tablas y gráficos (sectores, barras, histogramas, etc.) Analítica o inferencial: Pretende demostrar asociaciones o relaciones entre las características observadas. Intenta probar hipótesis y estima intervalos de confianza. Pretende  concluir  para la población.
POBLACIÓN Completa colección de objetos, entidades o sujetos de estudio. Conjunto de todos los individuos o elementos que cumplen ciertas características. Totalidad de individuos en los que pueden presentarse determinadas características susceptibles de estudiarse Ej: personas, instituciones, HC,…
MUESTRA Parte de la población, representativa de la misma. Subconjunto de una población de mayor tamaño. En general, la población es inaccesible desde el punto de vista práctico, por lo que se estudia solo una muestra. Muestreo: Proceso de extracción de la muestra a partir de la población.
Proceso de muestreo e inferencia Población Muestra Muestreo Inferencia
PARÁMETRO Medida calculada a partir de la población (puede ser descriptiva o haber sido inferida). Se expresa en letras griegas:  μ ,  δ ,  δ 2
ESTIMADOR Medida calculada a partir de la muestra. Se expresa en letras romanas:  x, s, s 2 , etc.
Medir Según el diccionario de la Real Academia Española: Comparar una cantidad con su respectiva unidad, con el fin de averiguar cuántas veces la segunda está contenida en la primera. Tener determinada dimensión, ser de determinada altura, longitud, superficie, volumen, etc.
Medir Componente esencial en la investigación científica (cuantitativa). Es la obtención de datos. Proceso por el cual asignamos una categoría o valor a una variable para determinada unidad de análisis. OptoMETRÍA
CONFIABILIDAD - PRECISIÓN Los datos de diferentes mediciones dan resultados similares aunque sean tomados por diferentes observadores y en diferentes lugares. Repetibilidad: la medición arroja resultados idénticos en el mismo sujeto o en las mismas condiciones.
VALIDEZ - EXACTITUD Es cuando lo que se mide corresponde al verdadero estado del fenómeno. Si la medición mide realmente lo que se quiere medir. Verdad
Ni es preciso ni es exacto X X X X Preciso pero no exacto (sesgo) X X X X Ni es preciso ni es exacto (error)
Error versus Sesgo Cuando las desviaciones acerca del valor real ocurren en forma desorganizada,  no sistemática  Error Si la desviación tiene una tendencia sistemática, es un  error sistemático   Sesgo Los sesgos pueden invalidar los resultados de un estudio y por eso se deben controlar con el diseño del mismo o con el análisis estadístico
VARIABLES Es lo que está siendo observado. Características que varían de un individuo, una población o de un objeto a otro. Aspectos o propiedades diferentes entre dos individuos del estudio.
VARIABLES Importancia de la clasificación: Mejor comprensión del problema Ayuda a definir el diseño del estudio Manejo estadístico adecuado
VARIABLES Formas de clasificación: Según su naturaleza Según la relación con otras variables Según la escala de medición Variables epidemiológicas
Clasificación de Variables Según su naturaleza: Cualitativas o categóricas: Miden atributos o propiedades no numéricas. Se describen como % y se representan como gráfico de barras o torta (pie). Cuantitativas o numéricas: Determinan cantidades.  Permiten hacer conteos, ordenamiento o agrupaciones.  Pueden ser:   Discretas (números enteros). Ej: Nº. de hijos Continuas (permite decimales). Ej: Peso
Clasificación de Variables 2. Según la relación entre las variables: Dependiente e independiente: La independiente produce un cambio en la dependiente. Causa     Efecto Reversibles e irreversibles A  ↔   B  A    B Relación secuencial (en el tiempo): precedente o subsecuente Determinante o probabilística
Clasificación de Variables 3. Según la escala de medición: Cualitativas: 1. Nominal: Fumar  Si o no 2. Ordinal: Estadíos de cáncer I a IV,   Apgar, IQ Cuantitativas 3. Interval: Grados centígrados. 4. De razón o proporcional: Glicemia 1 2 3 4
Escala de Medición 1. Nominal: Cualitativa Categorías a las que se les asigna un nombre sin que exista un orden Presencia o ausencia de un atributo o característica Eventos mutuamente excluyentes y colectivamente exhaustivos Pueden ser dicotómicas (sexo) o politómicas (religión).
Escala nominal Mutuamente excluyente: Un sujeto no puede pertenecer a varias categorías. Ej: grupo sanguíneo Colectivamente exhaustivo: Cada categoría debe incluir todos los valores posibles.
Escala de Medición 2.  Ordinal: Cualitativa Eventos mutuamente excluyentes y colectivamente exhaustivos Valores jerarquizados y con un orden (secuencia lógica que mide la intensidad del atributo): peor a mejor, menor a mayor
Escala ordinal A veces se les asigna valor numérico a las categorías. Ej: estrato socioeconómico, Apgar El tamaño entre los valores no puede ser especificado. Ej: estado leve, moderado y grave de una enfermedad, escala de dolor de 1 a 10.
Escala de Medición 3. Intervalo: Cuantitativa Categorías con límites inferior y superior arbitrarios Distancias iguales entre intervalos El punto cero es arbitrario y no indica ausencia del evento
Escala de Medición 4. De razón o proporcional Cuantitativa El límite superior se confunde con el inferior de la siguiente El punto cero es real y no arbitrario Números racionales (+) y (-) Permite sumar, restar, multiplicar o dividir.
Ejemplo Variable: Hábito de fumar Nivel de razón Nivel ordinal Nivel nominal
Nivel de medición de las variables Nominal Ordinal Interval Razón Cualitativas Cuantitativas
Variables Epidemiológicas Persona. Ej: Edad, sexo, raza, estado civil, estrato socioeconómico, religión, etc. Lugar: Z ona de residencia: urbana o rural, pais de residencia, departamento, municipio, lugar de trabajo, sector de la vivienda, etc. Tiempo: Hora, día, semana, mes o año de ocurrencia. Ej:  Año de inicio de la sintomatología, años en tratamiento, tiempo de consumo de un medicamento, duración del síntoma, meses desde la última recaída…
Investigación Epidemiológica En los estudios siempre debemos hacer un listado de variables que incluya: A todas Su clasificación Manejo estadístico con cada una
Manejo de variables Idealmente debemos manejar las variables en su escala más alta Una variable puede ser  reducida de escala Manejada en escala inferior no puede regresarse a una superior
Cifras o Frecuencias Absolutas: Recuento de los datos. No sirven para compararse entre sí. Relativas: Provienen de relacionar cifras absolutas entre si. Ej: razones, proporciones, tasas, etc.
RAZÓN Relación entre cantidades de naturaleza diferente Razón = a / b Inglés Ej: hombre/mujer = índice de masculinidad
PROPORCIÓN Frecuencia con la cual se presenta cierto evento con respecto al total de unidades observadas Proporción = a / a + b Permiten comparar dos grupos de tamaño diferente Ej: Porcentajes
TASA Frecuencia con que se presenta un determinado evento en el tiempo Tasa = a / a + b x base La base es un multiplicador para mejor comprensión. Ej: 1 x 1000 habitantes Concepto dinámico de comportamiento: deben indicar área geográfica y período de tiempo. Permite hacer comparaciones Inglés
Medidas de Tendencia Central Las más utilizadas son: Media o promedio (x o  μ ) Mediana Moda
Media Única para una serie Se usa para datos cuantitativos Fácil de calcular Se deja afectar por los extremos Se debe acompañar de la desviación estándar
Mediana Valor que deja la mitad de los datos por debajo de él y la otra mitad por encima Se calcula de variables ordinales para arriba Para calcularla se ordenan los datos: si la serie es impar la mediana es el dato de la mitad. Si la serie es par, es el promedio de los datos de la mitad
Mediana Única para una serie de datos Sencilla de obtener Los valores extremos no la afectan
Moda Dato o categoría que ocurre con mayor frecuencia Se puede calcular para cualquier tipo de variable La serie puede ser unimodal, bimodal o multimodal
Medidas de Dispersión Aunque son varias, las más importantes son: Rango Varianza Desviación estándar
Rango Amplitud o recorrido Diferencia entre el valor más grande y el más pequeño Fácil de calcular Muy susceptible con extremos Poco útil
Varianza - s 2  -  σ 2 Establece la dispersión de los datos alrededor de la media Suma de las diferencias de cada dato con la media elevadas al cuadrado y divididas entre n-1 Representa unidades al cuadrado
Desviación estándar - s -  σ Representa las unidades originales Raíz cuadrada de la varianza Se utiliza con el promedio
Curvas de distribución  normal

Generalidades de bioestadística variables

  • 1.
    GENERALIDADES DE BIOESTADÍSTICA-VARIABLES Diana García Lozada Optómetra Docente Fundación Universitaria del Área Andina
  • 2.
    Estadística Ramade la matemática que utiliza grandes conjuntos de datos numéricos para obtener inferencias basadas en el cálculo de probabilidades. Pura o matemática: Conocimiento para generar conocimiento. Desarrolla métodos y procedimientos nuevos que luego podrán utilizarse para resolver problemas en los distintos campos del saber. Aplicada: Cómo y cuando utilizar cada procedimiento y cómo interpretar los resultados que se obtienen.
  • 3.
    Estadística Recopila, organiza,procesa, interpreta y presenta datos numéricos. Utilidad: Toma de decisiones en otras ciencias como economía, psicometría, biología, salud pública, medicina….
  • 4.
    BIOESTADÍSTICA Rama dela estadística aplicada que estudia la utilización de métodos estadísticos en problemas médicos y biológicos (Martín Andrés y Luna, 1994) Aplicación de las herramientas estadísticas a las ciencias biológicas y de la salud. Puede ser: Descriptiva Analítica o inferencial
  • 5.
    Bioestadística Descriptiva: Sintetiza información contenida en unos datos; recoge, clasifica, representa y resume datos tomados a una muestra. Calcula índices estadísticos (números) y representa mediante tablas y gráficos (sectores, barras, histogramas, etc.) Analítica o inferencial: Pretende demostrar asociaciones o relaciones entre las características observadas. Intenta probar hipótesis y estima intervalos de confianza. Pretende concluir para la población.
  • 6.
    POBLACIÓN Completa colecciónde objetos, entidades o sujetos de estudio. Conjunto de todos los individuos o elementos que cumplen ciertas características. Totalidad de individuos en los que pueden presentarse determinadas características susceptibles de estudiarse Ej: personas, instituciones, HC,…
  • 7.
    MUESTRA Parte dela población, representativa de la misma. Subconjunto de una población de mayor tamaño. En general, la población es inaccesible desde el punto de vista práctico, por lo que se estudia solo una muestra. Muestreo: Proceso de extracción de la muestra a partir de la población.
  • 8.
    Proceso de muestreoe inferencia Población Muestra Muestreo Inferencia
  • 9.
    PARÁMETRO Medida calculadaa partir de la población (puede ser descriptiva o haber sido inferida). Se expresa en letras griegas: μ , δ , δ 2
  • 10.
    ESTIMADOR Medida calculadaa partir de la muestra. Se expresa en letras romanas: x, s, s 2 , etc.
  • 11.
    Medir Según eldiccionario de la Real Academia Española: Comparar una cantidad con su respectiva unidad, con el fin de averiguar cuántas veces la segunda está contenida en la primera. Tener determinada dimensión, ser de determinada altura, longitud, superficie, volumen, etc.
  • 12.
    Medir Componente esencialen la investigación científica (cuantitativa). Es la obtención de datos. Proceso por el cual asignamos una categoría o valor a una variable para determinada unidad de análisis. OptoMETRÍA
  • 13.
    CONFIABILIDAD - PRECISIÓNLos datos de diferentes mediciones dan resultados similares aunque sean tomados por diferentes observadores y en diferentes lugares. Repetibilidad: la medición arroja resultados idénticos en el mismo sujeto o en las mismas condiciones.
  • 14.
    VALIDEZ - EXACTITUDEs cuando lo que se mide corresponde al verdadero estado del fenómeno. Si la medición mide realmente lo que se quiere medir. Verdad
  • 15.
    Ni es precisoni es exacto X X X X Preciso pero no exacto (sesgo) X X X X Ni es preciso ni es exacto (error)
  • 16.
    Error versus SesgoCuando las desviaciones acerca del valor real ocurren en forma desorganizada, no sistemática Error Si la desviación tiene una tendencia sistemática, es un error sistemático Sesgo Los sesgos pueden invalidar los resultados de un estudio y por eso se deben controlar con el diseño del mismo o con el análisis estadístico
  • 17.
    VARIABLES Es loque está siendo observado. Características que varían de un individuo, una población o de un objeto a otro. Aspectos o propiedades diferentes entre dos individuos del estudio.
  • 18.
    VARIABLES Importancia dela clasificación: Mejor comprensión del problema Ayuda a definir el diseño del estudio Manejo estadístico adecuado
  • 19.
    VARIABLES Formas declasificación: Según su naturaleza Según la relación con otras variables Según la escala de medición Variables epidemiológicas
  • 20.
    Clasificación de VariablesSegún su naturaleza: Cualitativas o categóricas: Miden atributos o propiedades no numéricas. Se describen como % y se representan como gráfico de barras o torta (pie). Cuantitativas o numéricas: Determinan cantidades. Permiten hacer conteos, ordenamiento o agrupaciones. Pueden ser: Discretas (números enteros). Ej: Nº. de hijos Continuas (permite decimales). Ej: Peso
  • 21.
    Clasificación de Variables2. Según la relación entre las variables: Dependiente e independiente: La independiente produce un cambio en la dependiente. Causa  Efecto Reversibles e irreversibles A ↔ B A  B Relación secuencial (en el tiempo): precedente o subsecuente Determinante o probabilística
  • 22.
    Clasificación de Variables3. Según la escala de medición: Cualitativas: 1. Nominal: Fumar Si o no 2. Ordinal: Estadíos de cáncer I a IV, Apgar, IQ Cuantitativas 3. Interval: Grados centígrados. 4. De razón o proporcional: Glicemia 1 2 3 4
  • 23.
    Escala de Medición1. Nominal: Cualitativa Categorías a las que se les asigna un nombre sin que exista un orden Presencia o ausencia de un atributo o característica Eventos mutuamente excluyentes y colectivamente exhaustivos Pueden ser dicotómicas (sexo) o politómicas (religión).
  • 24.
    Escala nominal Mutuamenteexcluyente: Un sujeto no puede pertenecer a varias categorías. Ej: grupo sanguíneo Colectivamente exhaustivo: Cada categoría debe incluir todos los valores posibles.
  • 25.
    Escala de Medición2. Ordinal: Cualitativa Eventos mutuamente excluyentes y colectivamente exhaustivos Valores jerarquizados y con un orden (secuencia lógica que mide la intensidad del atributo): peor a mejor, menor a mayor
  • 26.
    Escala ordinal Aveces se les asigna valor numérico a las categorías. Ej: estrato socioeconómico, Apgar El tamaño entre los valores no puede ser especificado. Ej: estado leve, moderado y grave de una enfermedad, escala de dolor de 1 a 10.
  • 27.
    Escala de Medición3. Intervalo: Cuantitativa Categorías con límites inferior y superior arbitrarios Distancias iguales entre intervalos El punto cero es arbitrario y no indica ausencia del evento
  • 28.
    Escala de Medición4. De razón o proporcional Cuantitativa El límite superior se confunde con el inferior de la siguiente El punto cero es real y no arbitrario Números racionales (+) y (-) Permite sumar, restar, multiplicar o dividir.
  • 29.
    Ejemplo Variable: Hábitode fumar Nivel de razón Nivel ordinal Nivel nominal
  • 30.
    Nivel de mediciónde las variables Nominal Ordinal Interval Razón Cualitativas Cuantitativas
  • 31.
    Variables Epidemiológicas Persona.Ej: Edad, sexo, raza, estado civil, estrato socioeconómico, religión, etc. Lugar: Z ona de residencia: urbana o rural, pais de residencia, departamento, municipio, lugar de trabajo, sector de la vivienda, etc. Tiempo: Hora, día, semana, mes o año de ocurrencia. Ej: Año de inicio de la sintomatología, años en tratamiento, tiempo de consumo de un medicamento, duración del síntoma, meses desde la última recaída…
  • 32.
    Investigación Epidemiológica Enlos estudios siempre debemos hacer un listado de variables que incluya: A todas Su clasificación Manejo estadístico con cada una
  • 33.
    Manejo de variablesIdealmente debemos manejar las variables en su escala más alta Una variable puede ser reducida de escala Manejada en escala inferior no puede regresarse a una superior
  • 34.
    Cifras o FrecuenciasAbsolutas: Recuento de los datos. No sirven para compararse entre sí. Relativas: Provienen de relacionar cifras absolutas entre si. Ej: razones, proporciones, tasas, etc.
  • 35.
    RAZÓN Relación entrecantidades de naturaleza diferente Razón = a / b Inglés Ej: hombre/mujer = índice de masculinidad
  • 36.
    PROPORCIÓN Frecuencia conla cual se presenta cierto evento con respecto al total de unidades observadas Proporción = a / a + b Permiten comparar dos grupos de tamaño diferente Ej: Porcentajes
  • 37.
    TASA Frecuencia conque se presenta un determinado evento en el tiempo Tasa = a / a + b x base La base es un multiplicador para mejor comprensión. Ej: 1 x 1000 habitantes Concepto dinámico de comportamiento: deben indicar área geográfica y período de tiempo. Permite hacer comparaciones Inglés
  • 38.
    Medidas de TendenciaCentral Las más utilizadas son: Media o promedio (x o μ ) Mediana Moda
  • 39.
    Media Única parauna serie Se usa para datos cuantitativos Fácil de calcular Se deja afectar por los extremos Se debe acompañar de la desviación estándar
  • 40.
    Mediana Valor quedeja la mitad de los datos por debajo de él y la otra mitad por encima Se calcula de variables ordinales para arriba Para calcularla se ordenan los datos: si la serie es impar la mediana es el dato de la mitad. Si la serie es par, es el promedio de los datos de la mitad
  • 41.
    Mediana Única parauna serie de datos Sencilla de obtener Los valores extremos no la afectan
  • 42.
    Moda Dato ocategoría que ocurre con mayor frecuencia Se puede calcular para cualquier tipo de variable La serie puede ser unimodal, bimodal o multimodal
  • 43.
    Medidas de DispersiónAunque son varias, las más importantes son: Rango Varianza Desviación estándar
  • 44.
    Rango Amplitud orecorrido Diferencia entre el valor más grande y el más pequeño Fácil de calcular Muy susceptible con extremos Poco útil
  • 45.
    Varianza - s2 - σ 2 Establece la dispersión de los datos alrededor de la media Suma de las diferencias de cada dato con la media elevadas al cuadrado y divididas entre n-1 Representa unidades al cuadrado
  • 46.
    Desviación estándar -s - σ Representa las unidades originales Raíz cuadrada de la varianza Se utiliza con el promedio
  • 47.

Notas del editor

  • #2 Tomado de: Libro de Colimon p.19-24, Presentación CES Medición en epidemiología, Presentación clase Dr. Trillos, Bioestadística Amigable p. 1-16, libro de los paisas p. 34-35, libro de Guerrero 23-32
  • #35 Tomado de mis apuntes de epidemiología de Argentina