Presentación de datos estadísticos
PRESENTACIÓN DE DATOS
Hay tres formas básicas para el resumen y presentación de información acerca de
mediciones efectuadas sobre objetos, personas, períodos de tiempo, etc. Y aplicables tanto a
datos continuos como a datos discretos: presentación de datos mediante texto, mediante tablas y
mediante gráficos, que se combinan generalmente para lograr mayor claridad, transparencia e
interpretabilidad de la información.
PRESENTACIÓN DE DATOS MEDIANTE TEXTO
Se hace una descripción narrativa de la información. Las dos formas más comunes de la
presentación textual de la información comprenden a:
Presentación de todos y cada uno de los datos obtenidos,
Para lo cual se presenta un pequeño párrafo que explica el origen de los datos y a
continuación la “nube de datos”.
Presentación de datos en forma resumida mediante porcentajes o
promedios.
Es una forma adecuada de presentación cuando la cantidad de valores o porcentajes que
se pretenden ilustrar corresponden a situaciones interesantes que se pueden mostrar con
pocos datos.
Los datos se presentan en tablas, graficas y medidas resumen.
PRESENTACIÓN DE DATOS MEDIANTE TABLA
Si el volumen de la información es grande y no parece conveniente una presentación
textual, la mejor alternativa consiste en la presentación de datos por medio de tablas. Una tabla se
define como un arreglo ordenado de filas y columnas, clasificadas según el propósito y el tipo de
datos que se presenten.
La tabla debe tener titulo e información clara y concisa.
Parte de una tabla
Título
El titulo debe ser breve pero completo, además de corresponder exactamente a lo que se
está presentando en la tabla.
Cuerpo de la tabla
Lo componen las diferentes filas y columnas con sus correspondientes encabezamientos.
Para tablas de más de una variable, además de presentar la información univariada, se presentan
la distribución de frecuencias relativas por filas y columnas.
Distribución de frecuencias absolutas
Es una columna en la tabla que muestra el número de observaciones en categorías o clase
de una variable.
Distribución de frecuencias relativas
La frecuencia relativa de una clase o categoría de una variable es el número de
observaciones que caen dentro de ella, expresada como una porción del número total de datos.
Esta frecuencia se expresa mediante porcentajes o proporciones.
Distribución de frecuencias absolutas y relativas acumuladas
Son columnas en la tabla que muestran la distribución de frecuencias absolutas y relativas
acumuladas según el orden implícito de la variable. Las frecuencias se van acumulando, la última
categoría tendrá por valor acumulado la totalidad de las observaciones en el caso de frecuencias
absolutas y el valor 100% en el caso de frecuencias relativas.
Distribución de frecuencias absolutas y relativas acumuladas
Es una distribución de frecuencias relativas construida según el valor de la fila o columna
respectiva.
Notas explicativas
Pueden ser de encabezamiento, subtítulos o de pie de tabla.
Presentación de datos cuantitativos mediante tablas
Cuando se pretende presentar los datos de una variable continua mediante una tabla, la
primera tarea consiste en determinar el criterio usado para construir las clases o categorías de la
variable.
Sturges: Esta metodología consiste en la construcción de intervalos de igual amplitud,
donde la amplitud de cada clase se calcula como (Max-Min)/k, siendo k el número de intervalos,
que se calcula reemplazando el tamaño de la muestra n en la siguiente expresión:
K= 1+3.322 log10 (n)
Scott: En esta aproximación sugiere la construcción de intervalos de igual amplitud, donde
la amplitud está dada por la siguiente expresión, siendo s la desviación estándar:
H= (3.5)s(n)-1/3
Diaconis: Este criterio es análogo al propuesto por Scott en 1979. La amplitud está dada
por la siguiente expresión, siendo RI el rango intercuartílico.
H= 2(RI)(n)-1/3
Presentación de datos mediante tabla de dos dimensiones
Con frecuencia en la presentación de tablas de dos dimensiones se tiene como objetivo
principal la evaluación de la asociación entre una variable independiente (factor de exposición) y
una variable respuesta (desenlace). Por convención, se acostumbra ubicar la variable respuesta en
las columnas y la variable independiente en las filas.
Más de dos variables en una tabla la hacen pesada y difícil.
Recomendaciones acerca del uso de tablas
Cuando se tiene sólo una variable o criterio de clasificación, se acostumbra ubicar las
clases o categorías de la variable en la primera columna.
Debe evitarse en lo posible tablas con más de dos variables.
PRESENTACIÓN DE DATOS MEDIANTE GRÁFICOS
Un gráfico es un dibujo descriptivo que sirve para dar una idea visual y rápida del
comportamiento de un fenómeno o situación. Básicamente un gráfico es la representación de una
tabla mediante diagramas y se constituye, de forma general, de las mismas partes, adaptadas para
este tipo de presentación.
El comportamiento y la relación entre las variables se evalúan con gráficos.
Tipos de gráficos
Barras y pictograma
Es utilizado especialmente para representar variables cualitativas nominales y ordinales, y
cuantitativas discretas.
El gráfico de barras es popular por ser fácilmente comprensible.
Barras simples
En el eje horizontal del plano cartesiano se representan las modalidades o categorías que
toma la variable mediante barras de igual base y en el eje vertical se presenta la frecuencia
absoluta o la frecuencia relativa.
Barras agrupadas
El grafico de barras agrupadas se emplea para comparar varias poblaciones entre sí. Para
cada categoría que toma la variable se elevan tantas barras como poblaciones haya, cada una con
un color representativo.
Pictograma
Las frecuencias de las categorías de la variable se representan por dibujos alusivos al tema
de estudio.
Diagrama de torta o pie
Este gráfico se emplea para variables cualitativas nominales y ordinales. Para su
construcción se divide un círculo en tantas porciones como niveles tome la variable, de modo que
a cada nivel de la variable de corresponde un arco de círculo proporcional a su frecuencia absoluta
o relativa. Este tipo de gráfico se utiliza para destacar la importancia relativa de los niveles o
categorías dentro de un total.
Los diagramas de torta (pie) inclinados son inapropiados.
La tridimensionalidad en los gráficos distorsiona los datos.
Histograma y polígono de frecuencias
Histograma de frecuencias
Es un grafico utilizado para representar distribuciones de frecuencia de variables
cuantitativas continuas. Las barras deben ir siempre verticales pegadas una a otra. Sobre el eje
horizontal se representa la frecuencia absoluta o relativa.
Las variables continuas se ven bien con histogramas.
Polígono de frecuencia
El polígono de frecuencias es semejante al histograma, pero se usa cuando se quiere
comparar las distribuciones de una misma variable continua en dos o más poblaciones.
Diagrama de “Tallo y Hoja” (Stem and Leafplots)
Este es un método gráfico para representar la distribución de datos cuantitativos. Se trata
de un método rápido, sencillo y efectivo de mostrar la distribución de un conjunto de datos
usando para su representación la información original.
El diagrama de tallo y hoja describe bien y en detalle.
Pirámides poblacionales
Son una forma especial de histograma en la que se representa simultáneamente la
distribución por edad y sexo de una población. Estos histogramas (en realidad son 2, uno para
cada sexo) se dibujan verticalmente, las barras quedan horizontales pero antepuestas unas a
otras.
La pirámide de edad por sexos es una excelente opción.
Gráfico de caja y bigote (Box plot)
También conocido como box plot o diagrama de caja, es una representación gráfica de un
conjunto de datos o valores de una variable discreta o continua, para facilitar la percepción visual
de su localización, dispersión y del grado y la dirección del sesgo. También permite identificar
datos atípicos o extremos.
El gráfico de caja y bigote es muy completo y claro.
Algunos gráficos usados en métodos multivariados
En esta sección se hace una descripción de algunas de las graficas que ofrecen una alternativa para
el manejo de la presentación de dos o más variables simultáneamente.
Gráfico de dispersión
El gráfico de dispersión se emplea con variables de tipo cuantitativo. Este tipo de gráfica
ofrece una forma útil de ilustrar la relación entre dos variables.
Gráfico de línea
En general se usa para representar series en el tiempo o series de datos de tipo
cuantitativo.
La relación de dos variables se grafica con dispersión y líneas.
Caras de Chernoff
Estos gráficos se usan principalmente para caracterizar o perfilar un conjunto de
individuos, elementos u objetos a través de varias variables.
Gráfico de estrella
Cada observación se representa por una estrella en la que cada una de sus puntas
representa una variable. Para una observación específica, la punta se sitúa a una longitud del
centro que sea proporcional al valor de la variable que se está representando.
Para graficar más de dos variables hay múltiples opciones.
Matriz de dispersión
Las respuestas pueden ser exploradas inicialmente mediante la utilización de varios
gráficos de dispersión. Consiste en un arreglo de filas y columnas en cuya intersección se
encuentra el gráfico de dispersión correspondiente a dos variables.
La matriz de dispersión es útil en graficar regresión lineal múltiple.
Recomendaciones para el uso de gráficos
Los gráficos son la forma de presentación de datos más expresiva y tiene como objetivo
lograr comunicación rápida de situación, evolución o tendencia, enfatizar ciertas relaciones o
resaltar situaciones importantes, confusas o complejas.
La clasificación y nivel de medición determinan el gráfico.

Presentación de datos estadísticos

  • 1.
    Presentación de datosestadísticos PRESENTACIÓN DE DATOS Hay tres formas básicas para el resumen y presentación de información acerca de mediciones efectuadas sobre objetos, personas, períodos de tiempo, etc. Y aplicables tanto a datos continuos como a datos discretos: presentación de datos mediante texto, mediante tablas y mediante gráficos, que se combinan generalmente para lograr mayor claridad, transparencia e interpretabilidad de la información. PRESENTACIÓN DE DATOS MEDIANTE TEXTO Se hace una descripción narrativa de la información. Las dos formas más comunes de la presentación textual de la información comprenden a: Presentación de todos y cada uno de los datos obtenidos, Para lo cual se presenta un pequeño párrafo que explica el origen de los datos y a continuación la “nube de datos”. Presentación de datos en forma resumida mediante porcentajes o promedios. Es una forma adecuada de presentación cuando la cantidad de valores o porcentajes que se pretenden ilustrar corresponden a situaciones interesantes que se pueden mostrar con pocos datos. Los datos se presentan en tablas, graficas y medidas resumen. PRESENTACIÓN DE DATOS MEDIANTE TABLA Si el volumen de la información es grande y no parece conveniente una presentación textual, la mejor alternativa consiste en la presentación de datos por medio de tablas. Una tabla se define como un arreglo ordenado de filas y columnas, clasificadas según el propósito y el tipo de datos que se presenten. La tabla debe tener titulo e información clara y concisa. Parte de una tabla Título El titulo debe ser breve pero completo, además de corresponder exactamente a lo que se está presentando en la tabla.
  • 2.
    Cuerpo de latabla Lo componen las diferentes filas y columnas con sus correspondientes encabezamientos. Para tablas de más de una variable, además de presentar la información univariada, se presentan la distribución de frecuencias relativas por filas y columnas. Distribución de frecuencias absolutas Es una columna en la tabla que muestra el número de observaciones en categorías o clase de una variable. Distribución de frecuencias relativas La frecuencia relativa de una clase o categoría de una variable es el número de observaciones que caen dentro de ella, expresada como una porción del número total de datos. Esta frecuencia se expresa mediante porcentajes o proporciones. Distribución de frecuencias absolutas y relativas acumuladas Son columnas en la tabla que muestran la distribución de frecuencias absolutas y relativas acumuladas según el orden implícito de la variable. Las frecuencias se van acumulando, la última categoría tendrá por valor acumulado la totalidad de las observaciones en el caso de frecuencias absolutas y el valor 100% en el caso de frecuencias relativas. Distribución de frecuencias absolutas y relativas acumuladas Es una distribución de frecuencias relativas construida según el valor de la fila o columna respectiva. Notas explicativas Pueden ser de encabezamiento, subtítulos o de pie de tabla. Presentación de datos cuantitativos mediante tablas Cuando se pretende presentar los datos de una variable continua mediante una tabla, la primera tarea consiste en determinar el criterio usado para construir las clases o categorías de la variable. Sturges: Esta metodología consiste en la construcción de intervalos de igual amplitud, donde la amplitud de cada clase se calcula como (Max-Min)/k, siendo k el número de intervalos, que se calcula reemplazando el tamaño de la muestra n en la siguiente expresión: K= 1+3.322 log10 (n) Scott: En esta aproximación sugiere la construcción de intervalos de igual amplitud, donde la amplitud está dada por la siguiente expresión, siendo s la desviación estándar: H= (3.5)s(n)-1/3
  • 3.
    Diaconis: Este criterioes análogo al propuesto por Scott en 1979. La amplitud está dada por la siguiente expresión, siendo RI el rango intercuartílico. H= 2(RI)(n)-1/3 Presentación de datos mediante tabla de dos dimensiones Con frecuencia en la presentación de tablas de dos dimensiones se tiene como objetivo principal la evaluación de la asociación entre una variable independiente (factor de exposición) y una variable respuesta (desenlace). Por convención, se acostumbra ubicar la variable respuesta en las columnas y la variable independiente en las filas. Más de dos variables en una tabla la hacen pesada y difícil. Recomendaciones acerca del uso de tablas Cuando se tiene sólo una variable o criterio de clasificación, se acostumbra ubicar las clases o categorías de la variable en la primera columna. Debe evitarse en lo posible tablas con más de dos variables. PRESENTACIÓN DE DATOS MEDIANTE GRÁFICOS Un gráfico es un dibujo descriptivo que sirve para dar una idea visual y rápida del comportamiento de un fenómeno o situación. Básicamente un gráfico es la representación de una tabla mediante diagramas y se constituye, de forma general, de las mismas partes, adaptadas para este tipo de presentación. El comportamiento y la relación entre las variables se evalúan con gráficos. Tipos de gráficos Barras y pictograma Es utilizado especialmente para representar variables cualitativas nominales y ordinales, y cuantitativas discretas. El gráfico de barras es popular por ser fácilmente comprensible. Barras simples En el eje horizontal del plano cartesiano se representan las modalidades o categorías que toma la variable mediante barras de igual base y en el eje vertical se presenta la frecuencia absoluta o la frecuencia relativa. Barras agrupadas
  • 4.
    El grafico debarras agrupadas se emplea para comparar varias poblaciones entre sí. Para cada categoría que toma la variable se elevan tantas barras como poblaciones haya, cada una con un color representativo. Pictograma Las frecuencias de las categorías de la variable se representan por dibujos alusivos al tema de estudio. Diagrama de torta o pie Este gráfico se emplea para variables cualitativas nominales y ordinales. Para su construcción se divide un círculo en tantas porciones como niveles tome la variable, de modo que a cada nivel de la variable de corresponde un arco de círculo proporcional a su frecuencia absoluta o relativa. Este tipo de gráfico se utiliza para destacar la importancia relativa de los niveles o categorías dentro de un total. Los diagramas de torta (pie) inclinados son inapropiados. La tridimensionalidad en los gráficos distorsiona los datos. Histograma y polígono de frecuencias Histograma de frecuencias Es un grafico utilizado para representar distribuciones de frecuencia de variables cuantitativas continuas. Las barras deben ir siempre verticales pegadas una a otra. Sobre el eje horizontal se representa la frecuencia absoluta o relativa. Las variables continuas se ven bien con histogramas. Polígono de frecuencia El polígono de frecuencias es semejante al histograma, pero se usa cuando se quiere comparar las distribuciones de una misma variable continua en dos o más poblaciones. Diagrama de “Tallo y Hoja” (Stem and Leafplots) Este es un método gráfico para representar la distribución de datos cuantitativos. Se trata de un método rápido, sencillo y efectivo de mostrar la distribución de un conjunto de datos usando para su representación la información original. El diagrama de tallo y hoja describe bien y en detalle. Pirámides poblacionales Son una forma especial de histograma en la que se representa simultáneamente la distribución por edad y sexo de una población. Estos histogramas (en realidad son 2, uno para cada sexo) se dibujan verticalmente, las barras quedan horizontales pero antepuestas unas a otras.
  • 5.
    La pirámide deedad por sexos es una excelente opción. Gráfico de caja y bigote (Box plot) También conocido como box plot o diagrama de caja, es una representación gráfica de un conjunto de datos o valores de una variable discreta o continua, para facilitar la percepción visual de su localización, dispersión y del grado y la dirección del sesgo. También permite identificar datos atípicos o extremos. El gráfico de caja y bigote es muy completo y claro. Algunos gráficos usados en métodos multivariados En esta sección se hace una descripción de algunas de las graficas que ofrecen una alternativa para el manejo de la presentación de dos o más variables simultáneamente. Gráfico de dispersión El gráfico de dispersión se emplea con variables de tipo cuantitativo. Este tipo de gráfica ofrece una forma útil de ilustrar la relación entre dos variables. Gráfico de línea En general se usa para representar series en el tiempo o series de datos de tipo cuantitativo. La relación de dos variables se grafica con dispersión y líneas. Caras de Chernoff Estos gráficos se usan principalmente para caracterizar o perfilar un conjunto de individuos, elementos u objetos a través de varias variables. Gráfico de estrella Cada observación se representa por una estrella en la que cada una de sus puntas representa una variable. Para una observación específica, la punta se sitúa a una longitud del centro que sea proporcional al valor de la variable que se está representando. Para graficar más de dos variables hay múltiples opciones. Matriz de dispersión Las respuestas pueden ser exploradas inicialmente mediante la utilización de varios gráficos de dispersión. Consiste en un arreglo de filas y columnas en cuya intersección se encuentra el gráfico de dispersión correspondiente a dos variables. La matriz de dispersión es útil en graficar regresión lineal múltiple.
  • 6.
    Recomendaciones para eluso de gráficos Los gráficos son la forma de presentación de datos más expresiva y tiene como objetivo lograr comunicación rápida de situación, evolución o tendencia, enfatizar ciertas relaciones o resaltar situaciones importantes, confusas o complejas. La clasificación y nivel de medición determinan el gráfico.