Comprendiendo la estructura de los datos Emiliana Peña
VARIABLE Cuantitativa Cualitativa Clasificación de las variables Continuas Discretas Nominal Ordinal
Variables cualitativas y cuantitativas Cualitativas Son atributos o propiedades No llevan valor numérico Ejemplos: Sexo, raza /etnicidad Cuantitativas Atributos basados en medidas numéricas Datos numéricos Ejemplos:  Edad, estatura, peso
Tipos de variables cuantitativas Continuas Número infinito de posibles valores Discretas Número limitado de posibles valores 0   10 0  1  2  3  4  5  6  7  8  9  10
Datos continuos Cuáles son algunos ejemplos de datos continuos? Los datos continuos frecuentemente vienen de  medidas . Estatura Peso Temperatura
Datos discretos Puede alguien pensar en ejemplos de datos discretos? Los datos discretos frecuentemente vienen en forma de  conteos. Número de hijos Número de refuerzos de vacunas recibidos Número de años de escolaridad completados
Variables nominales El uso de datos cualitativos   se clasifican en categorías,  no en orden relativo Ejemplos de variables nominales: Color de ojos Raza  Estado civil 1=azúl  2=café  3=verde
Variables dicotómicas Una clase de variables nominales en las cuales hay solamente  dos categorías Ejemplos de variables dicotómicas: Estatus de enfermedad Enfermo o sano Estatus de tabaquismo  Fumador o no-fumador OR
Variables ordinales Los datos son clasificados en categorías que tienen un  orden natural Los intervalos entre las categorías son desiguales o indefinidos Ejemplos de variables ordinales: Severidad de la enfermedad Estatus socioeconómico
Escalas de medidas Nominal  =  Datos nominales Ordinal  =  Datos ordinales Intervalo  Datos cuantitativos Razón
Escala de intervalo Es similar a la escala ordinal exceptuando que los valores o categorías están  igualmente espaciados  (con intervalos idénticos) Implicación:  La diferencia entre dos valores es significativa Ejemplos de variables de intervalo: Punteos de pruebas (61-70, 71-80, 81-90, 91-100) Años (2000, 2001, 2002, 2003, 2004 )
Escala de razón Igual que la escala de intervalo, pero la escala de razón requiere que sea  claramente definido el valor “0”  para la variable. El cero (0) representa la  ausencia  de lo que se está midiendo Implicación:  La razón de dos variables es significativa
Ejemplos:  Escalas de razón y Escalas de no-razón Escala de razón Estatura Ingreso Familiar Persona A: $20,000 Persona B: $10,000 A/B = $20,000/$10,000  = 2  Escala de No-razón Temperatura pH http://www.epa.gov/acidrain/education/site_students/phscale.html 0 = Cold 0 = Acidic 0 = Absence of Height
¿Qué estadísticas pueden ser usadas en diferentes escalas de medición ? Nominal Ordinal Intervalo Razón Moda SI SI SI SI Mediana NO SI SI SI Media NO NO SI SI
Resumen La bioestadística es el estudio de estadísticas aplicadas a problemas biológicos. La bioestadística se usa en epidemiología para describir tanto las variables cuantitativas como las cualitativas. La comprensión de la estructura de los datos como escalas nominales, ordinales, de intervalo y de razón lo ayudan a decidir cuáles son las medidas apropiadas para resumir los datos.
Referencias Medidas de Tendencia Central.  Secretaria de Salud de Honduras Programa CEAL. 2008.  Porta, M and Last, J.M. (Ed.). 2008.  A Dictionary of Epidemiology (5 th  ed.).  New York: Oxford University Press. Scales of Measurement.  http://www.stat.sfu.ca/~cschwarz/Stat-301/Handouts/node5.html Statistical Education Resource Kit.  http://www.stat.psu.edu/~resources/

Estructura de los datos

  • 1.
    Comprendiendo la estructurade los datos Emiliana Peña
  • 2.
    VARIABLE Cuantitativa CualitativaClasificación de las variables Continuas Discretas Nominal Ordinal
  • 3.
    Variables cualitativas ycuantitativas Cualitativas Son atributos o propiedades No llevan valor numérico Ejemplos: Sexo, raza /etnicidad Cuantitativas Atributos basados en medidas numéricas Datos numéricos Ejemplos: Edad, estatura, peso
  • 4.
    Tipos de variablescuantitativas Continuas Número infinito de posibles valores Discretas Número limitado de posibles valores 0 10 0 1 2 3 4 5 6 7 8 9 10
  • 5.
    Datos continuos Cuálesson algunos ejemplos de datos continuos? Los datos continuos frecuentemente vienen de medidas . Estatura Peso Temperatura
  • 6.
    Datos discretos Puedealguien pensar en ejemplos de datos discretos? Los datos discretos frecuentemente vienen en forma de conteos. Número de hijos Número de refuerzos de vacunas recibidos Número de años de escolaridad completados
  • 7.
    Variables nominales Eluso de datos cualitativos se clasifican en categorías, no en orden relativo Ejemplos de variables nominales: Color de ojos Raza Estado civil 1=azúl 2=café 3=verde
  • 8.
    Variables dicotómicas Unaclase de variables nominales en las cuales hay solamente dos categorías Ejemplos de variables dicotómicas: Estatus de enfermedad Enfermo o sano Estatus de tabaquismo Fumador o no-fumador OR
  • 9.
    Variables ordinales Losdatos son clasificados en categorías que tienen un orden natural Los intervalos entre las categorías son desiguales o indefinidos Ejemplos de variables ordinales: Severidad de la enfermedad Estatus socioeconómico
  • 10.
    Escalas de medidasNominal = Datos nominales Ordinal = Datos ordinales Intervalo Datos cuantitativos Razón
  • 11.
    Escala de intervaloEs similar a la escala ordinal exceptuando que los valores o categorías están igualmente espaciados (con intervalos idénticos) Implicación: La diferencia entre dos valores es significativa Ejemplos de variables de intervalo: Punteos de pruebas (61-70, 71-80, 81-90, 91-100) Años (2000, 2001, 2002, 2003, 2004 )
  • 12.
    Escala de razónIgual que la escala de intervalo, pero la escala de razón requiere que sea claramente definido el valor “0” para la variable. El cero (0) representa la ausencia de lo que se está midiendo Implicación: La razón de dos variables es significativa
  • 13.
    Ejemplos: Escalasde razón y Escalas de no-razón Escala de razón Estatura Ingreso Familiar Persona A: $20,000 Persona B: $10,000 A/B = $20,000/$10,000 = 2 Escala de No-razón Temperatura pH http://www.epa.gov/acidrain/education/site_students/phscale.html 0 = Cold 0 = Acidic 0 = Absence of Height
  • 14.
    ¿Qué estadísticas puedenser usadas en diferentes escalas de medición ? Nominal Ordinal Intervalo Razón Moda SI SI SI SI Mediana NO SI SI SI Media NO NO SI SI
  • 15.
    Resumen La bioestadísticaes el estudio de estadísticas aplicadas a problemas biológicos. La bioestadística se usa en epidemiología para describir tanto las variables cuantitativas como las cualitativas. La comprensión de la estructura de los datos como escalas nominales, ordinales, de intervalo y de razón lo ayudan a decidir cuáles son las medidas apropiadas para resumir los datos.
  • 16.
    Referencias Medidas deTendencia Central. Secretaria de Salud de Honduras Programa CEAL. 2008. Porta, M and Last, J.M. (Ed.). 2008. A Dictionary of Epidemiology (5 th ed.). New York: Oxford University Press. Scales of Measurement. http://www.stat.sfu.ca/~cschwarz/Stat-301/Handouts/node5.html Statistical Education Resource Kit. http://www.stat.psu.edu/~resources/

Notas del editor

  • #4 Lo que usted puede hacer con sus datos depende en la información que usted tenga. Hay dos clases básicas—datos cualitativos y datos cuantitativos. Los datos cualitativos tienen que ver con descripciones que frecuentemente enumeran las características de una persona o de un lugar. Las características cualitativas son aquellas que no llevan un valor numérico, sino que tienen un nombre o una palabra asociada a ellos. Algunos ejemplos son sexo o raza / etnicidad. Algunas veces, a los datos cualitativos en una serie de datos, se les asigna un número (por ejemplo, femenino = 1), pero es importante entender que este tipo de dato no tiene que ver con un valor real numérico. Por el otro lado, los datos cuantitativos tienen que ver con medidas y llevan una forma numérica. Ejemplos de datos cuantitativos incluyen edad, estatura y peso. Para muchas clases de análisis, usted utilizará ambas clases de datos.
  • #5 Hay dos tipos de datos cuantitativos: continuos y discretos. Los datos continuos son datos que tienen un número infinito de posibles valores, generalmente provienen de medidas. De manera que la medida de una variable continua que tiene un rango de 1 a 10, nos podría dar valores en cualquier rango que incluya fracciones decimales de un número. Nota al Instructor: De un clic para mostrar la animación Con los datos discretos, solamente hay un número limitado de posibles valores. Usando el mismo ejemplo, si estuviéramos midiendo una variable discreta que tiene un rango de 1 a 10, solo podríamos obtener ciertos valores (en este caso, números enteros) Nota al Instructor: De un clic para mostrar la animación
  • #6 Puede alguno de ustedes pensar en otros ejemplos de datos continuos? Nota al Instructor: De a los estudiantes la oportunidad de responder; si tienen problemas, de un clic para mostrar la sugerencia. Una clave que los puede ayudar a entender los datos continuos es que estos frecuentemente viene de medidas. Algunos ejemplos incluyen, estatura, peso, y temperatura.
  • #7 ¿Puede alguien pensar en ejemplos de datos discretos? Nota al Instructor: De a los estudiantes la oportunidad de responder, si tiene problemas, de un clic para mostrar la sugerencia Una sugerencia que podría ayudarlos a diferenciar los datos discretos es que estos datos frecuentemente provienen en forma de conteos. Algunos ejemplos incluyen al número de hijos, número de refuerzos de vacunación recibidos y número de años de escolaridad completados.
  • #8 La escala nominal se usa para datos cualitativos que se clasifican en categorías que no tienen un orden relativo. Algunos ejemplos de variables nominales incluyen color de ojos, raza y estado civil. El orden relativo simplemente significa que no hay una manera natural de hacer rangos para los datos—por ejemplo, los ojos azules no vienen antes o después de los ojos cafés, pero usted podría asignar a los ojos azules un valor de 1 y a los ojos cafés un valor de 2. Nota al instructor: Pregunte a la clase: Puede alguien pensar en otros ejemplos de variables nominales? Algunos ejemplos adicionales: Género, vecindario / ciudad, escuela, ocupación
  • #9 Las variables dicotómicas son un caso especial de variables nominales en las cuales hay solamente dos categorías. Las variables dicotómicas son las variables más comunes en los estudios epidemiológicos. Muchas variables dicotómicas se basan en preguntas con respuestas de “si” o “no” para información. Tuvo la persona la enfermedad o no la tuvo? Estuvo la persona expuesta o no estuvo? La persona es fumadora o no es fumadora? Todos estos son ejemplos de variables dicotómicas.
  • #10 La escala de variables ordinales es la escala de medición cuando los datos se clasifican en categorías que tienen un orden natural. La escala ordinal puede ser usada tanto para datos cualitativos como para datos cuantitativos, pero es más común para datos cualitativos de variables ordinales. Una característica clave a notar en la escala ordinal para variables es que los intervalos entre las categorías no son iguales o no hay una manera numérica de describir el intervalo (lo cual generalmente es el caso con los datos cualitativos). Algunos ejemplos de las variables ordinales incluyen la severidad de la enfermedad (evaluada ya sea como leve, moderada, o severa) o el estatus socioeconómico (evaluado como bajo, mediano, o alto). ¿Podría usted definir cuán más pobre es una persona de estatus bajo en comparación con una persona de clase media? El tener categorías ordenadas en donde usted no puede definir la diferencia entre las categorías debería darle la clave que no se trata de una variable ordinal. Nota al Instructor: Pregunte a la clase: Puede alguien pensar en otros ejemplos de variables ordinales? Algunos ejemplos adicionales: Opiniones (Definitivamente de acuerdo; De acuerdo; Neutro; En desacuerdo; Definitivamente en desacuerdo) Estado general de salud (Excelente, Bueno, Regular, Malo)
  • #11 A las formas de definir la categorización de los datos se les llama escalas de medición. Hay varias escalas de medición que pueden usarse cuando se están incluyendo datos nominales, ordinales, intervalos y razones. Discutiremos cada uno de estos en mayor detalle.
  • #12 Le escala de intervalo es similar a la escala ordinal. Su principal diferencia es que hay intervalos entre las categorías y éstos están espaciados de igual manera (intervalos iguales). La principal implicación de esto es que podríamos tomar la diferencia entre dos valores y esta diferencia sería significativa. La mayoría de las variables de intervalos usan datos cuantitativos. Un ejemplo de una variable de intervalos son los punteos de los exámenes (observe que cada categoría tiene 9 puntos porcentuales, de manera que están igualmente espaciadas). Otro ejemplo es el año (cada año en la lista está exactamente espaciado por un año)
  • #13 La última escala de medición es la escala de razón. Esta es la escala más cuantitativamente avanzada y tiene el mayor uso en el análisis de los datos. Esta escala es la misma que la escala de intervalo, pero requiere que sea claramente definida con un valor cero para la variable. Otra manera de pensar sobre esto es que el valor cero representa la ausencia de lo que se está midiendo. Esta implicación es que la razón de dos valores es significativa.
  • #14 Algunos ejemplos de las variables de razón incluyen estatura o ingreso familiar. Si usted tomó la razón de la persona A que gana $20,000 y la de la persona B que gana $10,00 usted podría correctamente decir que la persona A gana el doble que la persona B. Hay unos pocos ejemplos de variables de no-razón; uno de ellos siendo la temperatura (en grados Celsus o Fahrenheit), para los cuales una temperatura de cero no significa que no haya temperatura (realmente lo que significa es que hace frío atroz!). Tomando la razón de dos valores de temperatura no tendría ningún sentido. Otra es la variable del pH para la cual el cero no indica la ausencia de pH; en realidad significa que es algo con una excesiva acidez.
  • #15 Para resumir todo lo que hemos discutido el día de hoy, esta tabla es útil para entender cuáles estadísticas pueden ser utilizadas en diferentes escalas de medición. Recuerden que en nuestra primera presentación, “Introducción a la Bioestadística”, discutimos las escalas de medición. La moda puede ser usada para describir todos los tipos de variables. La mediana puede ser usada para describir todas las escalas excepto la escala nominal. La media puede ser usada solamente para la escala de variables de intervalo y de razón, y esto también es verdadero para calcular diferencias. La escala de razón, como lo implica su nombre, es la única escala que puede ser utilizada para calcular razones.
  • #16 Resumiendo: La bioestadística es el estudio de las estadísticas aplicadas a problemas biológicos La bioestadística se usa en epidemiología para describir tanto las variables cuantitativas como las variables cualitativas. Entendiendo la estructura de los datos y la escala nominal, la ordinal, la de intervalo, y las escalas de razón para medición, pueden ayudarlo a decidir qué medidas son las apropiadas para resumir los datos.