2. 2
UNIVERSIDAD CENTROCCIDENTAL
“LISANDRO ALVARADO”
ESCUELA DE CIENCIAS VETERINARIAS
DEPARTAMENTO DE CIENCIAS SOCIALES Y ECONOMICAS
CATEDRA DE ESTADISTICA METODOLOGICA
METODOS DESCRIPTIVOS
UNIDAD I
GUIA DE ESTUDIO
PREPARADO POR
MARITZA LOPEZ DE RODRIGUEZ
AGOSTO, 2006
3. 3
ESTADISTICA EN SUS
MANOS
Maritza L. De Rodríguez
Profesor Asociado de Estadística
Escuela de Ciencias Veterinarias
de la Universidad
Centroccidental “Lisandro
Alvarado”
4. 4
INDICE
PAG
1. LINEAMIENTOS Y EVALUACION III
2. CONTENIDO IV
3. INTRODUCCION 1
4. OBJETIVOS DE LA UNIDAD I 3
5. FLUJOGRAMA DE LA SECUENCIA DE LAS ACTIVIDADES DE
APRENDIZAJE 4
6. INSTRUCCIONES GENERALES PARA EL DESARROLLO DE LOS
MODULOS 5
7. ORIENTANCION PARA LA UTILIZACION DE LA GUIA 6
8. OBJETIVOS EN SECUENCIA DE APRENDIZAJE 7
9. ACTIVIDADES DE APRENDIZAJE PARA EL LOGRO DE LOS
OBJETIVOS 8
10. BIBLIOGRAFIAS 100
5. 5
LINEAMIENTO PARA LA ADMINISTRACION Y EVALUACION
DEL MODULO
En la administración del aprendizaje se debe tener presente que el estudiante es un
adulto, sujeto de su propio aprendizaje, activo y responsable; que el facilitador (tutor)
cumple la función de orientador del proceso instruccional.
E n tal sentido, se presentan los siguientes lineamientos:
- El administrador del módulo debe tener una versión del conjunto de su contenido.
- Debe centrar el proceso de aprendizaje en el participante.
- Debe considerar que es un adulto, responsable de su aprendizaje.
- Debe estimular la reflexión, la creatividad y la auto-critica.
Se establecen criterios que permitan evaluar el módulo de una manera efectiva y
sistemática.
Se deben tomar en cuenta los aspectos siguientes:
- Los objetivos deben estar bien definidos y guardar correspondencia con el contenido
del material de instrucción.
- E l material impreso del módulo, debe presentar una información, clara, precisa e
imparcial y a su vez promover un análisis crítico.
El módulo debe ser adecuado al nivel de entrada de los estudiantes, de tal forma que
el contenido motive a su estudio, sin que se les presente alguna dificultad.
Se consideran los métodos de organización y desarrollo del contenido.
6. 6
METODOS DESCRIPTIVOS
UNIDAD I
Nº DE HORAS: 8
CONTENIDOS:
Sub-unidad 1: Introducción al campo de la estadística. Problemas de predicción
y decisión. Técnica de muestreo. Tipos de variables. Población y
muestra. Pasos de un problema estadístico. Parámetros y
estadísticos.
Sub unidad 2: Tabulación. Distribución de frecuencias. Amplitud de variación.
Intervalos de clases. Centro de clase. Representaciones gráficas.
Histogramas. Polígonos. Gráficas de barras y circulares. Razón.
Proporción. Porcentaje. Indice. Tasa.
Sub-unidad 3: Medidas de concentración. Media aritmética para datos agrupados
y no agrupados. Media ponderada o media de media. Mediana.
Moda. Ventajas y desventajas de cada una de estas medidas de
tendencia central.
Sub-unidad 4: Medidas de dispersión. Amplitud de variación. Desviación media.
Desviación estándar para datos agrupados y no agrupados. Uso
práctico de la desviación estándar. Coeficiente de variación.
Varianza promedio, teorema de Tchebysheff. Regla Empírica.
7. 7
INTRODUCCION
El objeto fundamental de esta unidad es proporcionar al alumno una serie de
actividades que paso a paso lo llevan a adquirir una base teórica y práctica de los
procedimientos a seguir en la recolección, tabulación y análisis numérico de los datos.
Esta unidad forma parte del curso de estadística metodológica administrado por el
sistema de instrucción personalizada (S. I. P.) y tiene como propósito proporcionarle una
serie de actividades que complementen y refuercen los conocimientos de estadísticas
descriptiva adquiridos hasta este momento.
La unidad “métodos descriptivos” se justifica considerando que el estudio
cuantitativo de los fenómenos naturales, económicos y sociales del país requiere de la
recolección, clasificación, presentación y análisis de datos numéricos para su medición.
Esta unidad de instrucción integrada por cuatro (4) sub-unidades, completa en si
misma e independiente, forma parte de una secuencia con otros módulos. En consecuencia,
para la organización de esta unidad se procedió de la siguiente manera:
1. Presentación en forma dosificada, de la información.
2. Conjuntamente con la información suministrada, aparecen en algunos casos un
ejercicio, un gráfico, un cuadro, con la finalidad de ayudar a comprender los
contenidos.
3. En cada sub-unidad se hace una o varias preguntas con la finalidad de
determinar la prosecución o no de la lectura de nueva información.
Para lograr una mayor comprensión de la sub-unidad en estudio se recomienda no
pasar a otro punto si no se domina el anterior. El dominio de las sub-unidades puede
determinarlo al responder las preguntas y catalogarlas con las de sus compañeros y el
profesor.
Si sus respuestas no son correctas, debes leer el texto nuevamente, observar
detenidamente los procedimientos, gráficos, cuadros e interpretar de nuevo.
Cuando considere que está preparado, pida al facilitador la evaluación de la unidad.
Recuerde que el aprendizaje por el S. I. P. es al propio ritmo y a la excelencia, por lo tanto,
usted decide el momento de la evaluación.
8. 8
…Avance confiado y… con seguridad…
OBJETIVOS DE LA UNIDAD IObjetivoTerminal
Aplicarálosconocimientosdelosmétodosdelaestadísticadescriptivaalarecolección,clasificación,presentacióny
análisisdedatosnuméricos.
Sub-Unidad 1
Definidos los principales términos básicos de la
estadística descriptiva, el estudiante empleará dichos
términos en forma adecuada en situaciones
agropecuarias que se le presenten.
Sub-Unidad 2
El estudiante aplicará las técnicas de tabulación y
representación gráfica a una serie numérica dada.
Sub-Unidad 3
Dado un conjunto de datos, el estudiante calculará las
medidas de tendencia central que la caracterizan,
explicando el significado, uso, importancia, ventajas y
desventajas de cada una.
Sub-Unidad 4
Dado una serie de datos, el estudiante calculará las
medidas de dispersión, explicando la importancia,
ventajas y desventajas del uso de cada una de las
medidas.
9. 9
FLUJOGRAMA DE LA SECUENCIA DE LAS
ACTIVIDADES DE APRENDIZAJE
Inicio de la Sub-Unidad I
Lee el Flujograma
Lee los objetivos en secuencia de aprendizaje
Lee el material bibliográfico señalado
Realiza los ejercicios sugeridos
Auto-evalúate
¿Lograste los objetivos?
Avanza a la
Sub-Unidad 2
Si
No
Revisa los objetivos en los que fallaste y realiza nuevamente
actividades de aprendizaje Consulta con el facilitador
Auto-evalúate
¿Lograste los objetivos? Si
10. 10
INSTRUCCIONES GENERALES PARA EL DESARROLLO DE LOS MODULOS
Los módulos han sido diseñados en función de cada una de las sub-unidades de
aprendizaje, en total de cuatro (4) que conforman la unidad curricular Métodos
Descriptivos. Están orientados a proporcionarle al estudiante, los conocimientos básicos
para la aplicación de algunas técnicas de la estadística descriptiva, que le permitirán realizar
investigación en el campo de las ciencias veterinarias e interpretar resultados de trabajos de
investigaciones propias, o de aquellos contenidos en la ciencia del agro.
Para el uso y manejo de los módulos, usted debe tomar en cuenta lo siguiente:
1. La unidad curricular se administrará a través de instrucción modular, clases
presenciales y consultas al profesor.
2. La estrategia de aprendizaje ha sido organizada de tal manera que estimule la
autoinstrucción, mediante el logro de los objetivos específicos y actividades de
aprendizaje a realizar para cada una de las unidades de aprendizaje. Igualmente se le
señala los recursos a utilizar para obtener conocimientos, habilidades y destrezas y
la forma cómo verificar si ha logrado los aprendizajes.
3. El éxito en el logro de los objetivos depende del tiempo, dedicación, esfuerzo y
responsabilidad que usted le imparta a su trabajo.
4. Para el logro de los objetivos en algunos caso es necesario la consulta a la
bibliografía señalada en las actividades de aprendizaje y a la bibliografía
complementaria señalada al final.
5. Los ejercicios propuestos deben tratar de desarrollarlos individualmente.
6. No debe avanzar en el desarrollo de objetivos sin antes haber dominado los
anteriores.
7. Para reforzar y comprobar el logro de los objetivos debe realizar todas las
actividades de aprendizaje que se recomiendan y las auto-evaluaciones.
11. 11
ORIENTACIONES PARA LA UTILIZACION DE LA GUIA
Para el logro de los objetivos de esta guía se te sugiere las siguientes orientaciones:
1. Lea cuidadosamente la guía a fin de cerciorarte de su contenido.
2. Estudie la secuencia del flujograma.
3. Reflexione sobre el objetivo terminal y los específicos de la unidad.
4. Analice cuidadosamente la bibliografía recomendada para cada tema de estudio, ello le
permitirá desarrollar las actividades de aprendizaje.
5. Realice los ejercicios prácticos antes de consultar las respuestas con sus compañeros y
el profesor.
6. Autoevalúese verificando sus respuestas con las de sus compañeros y el profesor.
7. Aclare dudas con su grupo de estudio y con el profesor.
8. Cada vez que logre un objetivo, presente la tarea al profesor. Recuerde que su
evaluación final será cuando domine todos los objetivos.
9. Si al presentar la tarea al profesor, tiene algunas fallas, no se preocupe con la
retroinformación que reciba, inténtelo de nuevo hasta que logre realizarla
satisfactoriamente.
10. Si el resultado es satisfactorio, recibe felicitaciones.
12. 12
UNIDAD I
SUB-UNIDAD I
Objetivo Terminal
Definidos los principales términos básicos de la estadística descriptiva,
el estudiante empleará dichos términos en forma adecuada en
situaciones agropecuarias que se le presenten.
(8) Explicará las diferencias entre predicción y decisión.
(7) Describirá los pasos de un problema estadístico, a partir del
análisis de trabajos de investigaciones dadas.
(6) Diferenciará los fenómenos que corresponden al estudio de la
estadística descriptiva, de los de la estadística inferencial.
(5) Explicará brevemente los tipos y clases de muestreo más
utilizados.
(4) Identificará los fenómenos que corresponden a la población y a la
muestra.
(3) Clasificará con exactitud las variables que corresponden a
discretas y continuas.
(2) Conceptualizará población, muestra, parámetro y estadístico.
(1) Analizados diferentes conceptos de estadística de varios autores, el
estudiante elaborará un concepto de estadística que englobe los
elementos básicos que le caracterizan.
ObjetivosEspecíficos
SecuenciadeAprendizaje
13. 13
ACTIVIDADES DE APRENDIZAJE PARA EL LOGRO DE LOS OBJETIVOS
1. Lee el objetivo Nº 1, página Nº 6 de la guía.
2. Lee la información que aparece a continuación en el contenido de información.
3. Leída e interpretada la información señalada, realiza el ejercicio Nº 1.
4. Analiza los siguientes conceptos de estadística enunciados.
1. La estadística es la compilación, organización, resumen, presentación y análisis de
datos numéricos (Ya- Lun Chou).
2. La estadística es un instrumento que orienta a la recolección, organización y análisis de
datos numéricos o de observaciones (Haber, A. y Runyon, R.).
3. La estadística es el campo de la ciencia que se refiere al acopio de datos de números
comparativamente pequeño de casos para obtener conclusiones lógicas acerca del caso
general (Gilbert, N.).
4. La estadística comprende el conjunto de métodos y procedimientos para obtener,
describir e interpretar conjuntos de datos y para basar decisiones y predecir fenómeno
que puedan expresarse en forma cuantitativa (Lothar, Sachs).
5. El principal objeto de la teoría estadística consiste en la investigación de la posibilidad
de obtener inferencias válidas a partir de datos estadísticos y en la construcción de
métodos para realizar dichas inferencias (Cramer, H.).
6. Se entiende por estadística los métodos científicos por medio de los cuales podemos
recolectar, organizar, resumir, presentar y analizar datos numéricos relativos o un
conjunto de individuos u observación y que nos permite extraer conclusiones válidas y
efectuar decisiones lógicas basadas en dicho análisis (Kohan, N. y Carro, J.)
14. 14
EJERCICIO Nº 1
Elabore una definición de estadística que contenga los elementos básicos de las
definiciones analizadas.
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
1. Lee el objetivo Nº 2 de la página Nº 6 de la guía.
2. Lee la información que a continuación aparece.
3. Leída e interpretada la información señalada realiza el ejercicio Nº 2.
En estadística frecuentemente se utiliza los términos de: Población, muestra,
parámetro y estadístico.
La población está constituida por el conjunto de medidas de las variables en estudio.
Es decir cada una de las variables en estudio constituye una población que viene dada por el
conjunto de valores que ella toma en las unidades que conforman el universo. Ejemplos: los
valores que toma la variable producción láctea en las distintas razas en estudio o en un
estado productor de leche.
Las unidades que forman una producción se llaman unidades de muestreo y puede ser
clasificada en dos clases: unidades elementales y unidades primarias. Se les llaman
unidades elementales a todas las contenidas en la población cuyas características han sido
medidas o contadas. Ejemplo: Caprinos del Distrito Torres. Las unidades pueden ser las
unidades elementales mismas o los grupos de unidades elementales, tales como caprinos
del Municipio Camacaro del Distrito Torres.
15. 15
Una muestra, es un conjunto de unidades de muestreo primario escogidos como un
microcosmo representativo de que puede hacerse inferencia sobre la población.
Parámetro, es un valor característico de la población, es decir, una expresión
numérica que sintetiza una propiedad de todos los N elementos de la población. Ejemplo,
una media (), una tasa.
Estadístico, es el valor característico correspondiente a una muestra, es decir, la
expresión numérica que sintetiza una propiedad que presenta los n elementos que
componen la muestra. Ejemplo: Una desviación típica (s). Los parámetros están basados
en todas las unidades de la población, en cambio los estadísticos se basan sólo en una parte
de la población, por lo cual estos estadísticos varían de una muestra a otra.
Para representar los parámetros de la población se utilizan las letras griegas (, ) y
letras itálicas (Y , s) para representar un estadístico de la muestra.
EJERCICIO Nº 2
Señala con tus propias palabra cuál es la diferencia entre población, muestra, parámetro
y estadístico.
________________________________________________________________________________________
________________________________________________________________________________________
________________________________________________________________________________________
________________________________________________________________________________________
________________________________________________________________________________________
________________________________________________________________________________________
_________________________________________________________________________________
16. 16
1. Lee el objetivo Nº 3 de la página N° 6 de la guía.
2. Con la información que obtengas estarás en condición de leer para buscar indicadores
relativos al tema en estudios.
3. Lee la información que aparece a continuación.
4. Leída e interpretada la información señalada, realiza el ejercicio Nº 3.
Variable: Discretas y Continuas
Los elementos componentes de un conjunto pueden estar expresados en cantidades
diferentes, como la temperatura de un grupo de becerros, las edades, el peso, la raza, el
sexo, etc.
A estos valores o categoría en que se expresan las características estudiadas, se les
llaman variables. Variable: Características o fenómenos que pueden tomar diferentes
valores.
Las variables pueden ser discretas si sólo puede tomar un conjunto finito de valores
(sexo, número de hijos, números de lechones por camada) y continuas si puede tomar
cualquier valor entre un conjunto finito de valores (peso de la canal, la alzada en equino,
temperatura rectal en becerro).
EJERCICIO Nº 3
A continuación se presenta una lista de variables, clasifique cada una de ellas como
continua o discreta.
Continua Discreta
Números de lechones por camada
Producción de leche
Longitud de la lana
Cabezas de ganado vacuno
Alzada en caballo de carreras
Temperatura rectal en becerros
17. 17
Ganancia de peso
Presión sanguínea en bovino
Razas vacunas
Postura en aves
1. Lee el objetivo Nº 4 de la página N° 6 de la guía.
2. Con la información que obtengas estarás en condición para obtener el material
bibliográfico necesario sobre las características de una población y una muestra.
3. Lee la información que aparece en el objetivo Nº 2 de la guía.
4. Leída e interpretada la información señalada, realiza el ejercicio Nº 4.
EJERCICIO Nº 4.
Identifica los fenómenos correspondientes a la población y a la muestra en las
siguientes expresiones:
1. Para estudiar la relación entre edad y presión sanguínea en bovinos, se seleccionaron 40
animales de distintas edades.
2. Se efectuaron ordeños, en el primer año de lactancia de vacas Jersey, determinándose la
cantidad de leche en Kg
3. En un laboratorio, se realizó un experimento que consistió en incubar suspensiones
normales de una variedad de bacterias a distintas temperaturas y se les midió el tiempo
en que decoloraban el azul de metileno.
4. Se realizó un estudio con 8 animales equinos y se determino el porcentaje de agua y de
grasa que contenía cada uno de ellos.
5. Se realizó un ensayo de suplementación con granos de sorgo molido, en novillos, para
estudiar la posibilidad de superar la baja disponibilidad de forraje durante el período
invernal. A cada grupo de animales se le suministró una ración de sorgo molido,
determinándosele la ganancia de peso expresada en gramos/día.
18. 18
1. Lee el objetivo Nº 5, de la página Nº 6 de la guía.
2. Con la información que obtengas estarás en condición de leer para obtener el material
bibliográfico, necesario sobre las características, ventajas y desventajas de las clases de
muestras más utilizadas.
3. Lee la información que aparece a continuación de esta página.
4. Lee en Félix L. Seijas Z., investigación por Muestreo. Clases de muestras, página 88-
131
5. Leída e interpretada la información señalada, realiza el ejercicio Nº 5.
La técnica de muestreo es un método eficiente en la obtención de las informaciones.
Consiste en tomar una parte de la población. Estas técnicas reduce significativamente los
costos de la investigación, aportan abundante información oportuna y confiable. Se dice
que la información que se obtiene es abundante, porque a través de esto métodos de
muestreo, se puede incluir un número suficiente de elementos en el vector información y
además son confiables porque el personal que interviene en su elaboración es
necesariamente de nivel calificado y solamente las estimaciones están sujetas a un error
denominado en este caso “Error de muestreo” el cual es cuantificable y uno “ajeno al
muestreo” que es perfectamente controlable. Además estas estimaciones son por lo general
insesgadas o con poco sesgo, pues se utilizan métodos de muestreo, tipo de selecciones y
estimadores apropiados.
Cuando se va a seleccionar una muestra se tiene que decidir, cuál es la vía a tomar, la
del muestreo no probabilístico o la del muestreo probabilístico y dentro de éstos, que clase
de muestra es la más conveniente.
Se llama muestreo probabilístico aquel en donde se ha determinado de antemano la
probabilidad de selección de cada uno de los elementos de la población, cuando es distinta
de cero. La selección de un elemento o de una muestra posible debe ser un experimento
aleatorio o de azar. Este tipo de selección es inherente al muestreo probabilístico. Estas
muestras son suceptibles a tratamientos estadístico y a través de ellos se puede inferir a la
19. 19
población. Los muestreos o muestras no probabilísticos son de dos tipos: intencionales u
opináticas y las llamadas sin normas, circunstanciales o erráticas.
Entre los métodos de muestreo probabilísticos existentes los de mayor uso en las
investigaciones económicas y sociales son:
-Muestreo aleatorio simple: en donde cada elemento tiene la misma probabilidad de
ser escogido directamente como parte de la muestra.
-Muestreo estratificado aleatorio: Cuando se divide en categorías o clases (estratos)
el universo. Dentro de cada estrato se hará una selección al azar. La división se
hace de acuerdo al objetivo de la investigación. El reparto de la muestra en cada
estrato se denomina “afijación”.
-Muestreo sistemático: Consiste en elegir de un marco poblacional, los individuos
de la muestra a intervalos iguales a partir de un primer individuo elegido al zar.
Para fijar el intervalo (n), se divide la población entre la cantidad de elementos
que integran la muestra. La elección del primer individuo se realizará por el
método de la lotería. Se tomará un número comprendido entre 1 y el intervalo
obtenido.
-Muestreo por conglomerado: Es una estratificación geográfica: se sortean áreas
determinadas en las que se recopila información de toda la población o parte de
ella. Se utilizan en estudios de comunidades.
EJERCICIO Nº 5
Señale las características de las clases de muestra y su uso.
1. Lee el objetivo Nº 6 de la página Nº 6 de la guía.
2. Con la información que obtengas estarás en condición de leer para obtener el material
bibliográfico necesario sobre la diferencia entre estadística descriptiva y estadística
inferencial.
3. Lee la información que aparece a continuación en esta página.
4. Leída e interpretada la información señalada realiza el ejercicio Nº 6.
20. 20
Según Rivas González, Ernesto (1979, pág. 9-11), la estadística se divide en dos
ramas: la descriptiva y la inductiva o inferencial.
La descriptiva trata de resumir todos los datos o característica de una serie de valores,
para de esta forma describir determinados aspectos d e la serie. Las principales medidas de
la estadística descriptiva que logran dicho resumen son:
Distribución de frecuencias.
Medidas de tendencia central o posición.
Medidas de dispersión o variabilidad.
Razones, tasas, porcentajes.
Curva normal.
La estadística descriptiva se usa en situaciones tales como:
Estadística de incidencias parasitarias.
Estadística de vacunaciones contra el mal de rabia.
Estadística de zoonosis (brucelosis, encefalitis equina, etc.)
La estadística inductiva, trata de estimar las características del universo estadístico
total a través del estudio de una parte de este universo, a esta parte se llama muestra. La
muestra se utiliza en casos donde la investigación no amerite el uso de la totalidad de los
elementos que conforman el universo. Partiendo del estudio de la muestra se determinan
todas las características del universo.
EJERCICIO Nº 6
Leído y analizado los párrafos anteriores sobre estadística descriptiva e inferencial,
señale en que se diferencian.
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
21. 21
_________________________________________________________________________
_________________________________________________________________________
Señale el tipo de estadística que se puede usar en los siguientes enunciados. Razone
sus respuestas.
En el departamento de Especies menores del Ministerio de Agricultura y Cría
desean determinar el número de caprinos existentes en el Distrito Torres del
Estado Lara.
__________________________________________________________________
__________________________________________________________________
__________________________________________________________________
En el laboratorio de Fisiología de la Escuela de Ciencias Veterinarias, desean
aplicar una droga para determinar la dosis letal 50.
__________________________________________________________________
__________________________________________________________________
__________________________________________________________________
El departamento de salud quiere conocer los niveles de impureza presente en la
leche pasteurizada al nivel de planta.
__________________________________________________________________
__________________________________________________________________
__________________________________________________________________
Se desea estimar la población total de bacterias de un determinado cultivo
obtenido experimentalmente.
__________________________________________________________________
__________________________________________________________________
__________________________________________________________________
Se desea conocer los efectos de un determinado fertilizante en el cultivo de un
vegetal alimenticio, en una finca con grandes extensiones de terreno que se ha
dividido en parcelas. Los efectos del fertilizante se mide en términos de la
productividad media por parcela.
22. 22
__________________________________________________________________
__________________________________________________________________
1. Lee el objetivo Nº 7 de la página Nº 6 de la guía.
2. Con la información que obtengas estarás en condición de leer para obtener el material
bibliográfico necesario sobre los pasos de un problema estadístico.
3. Lee lo relacionado con etapas de una investigación estadística en Ya-Lun Chou.
Análisis estadístico páginas 3-8.
4. Leída e interpretada la información señalada realiza el ejercicio Nº 7.
EJERCICIO Nº 7
Leída la bibliografía señalada, indica los pasos de un problema estadístico en forma
resumida y razonada.
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
1. Lee el objetivo Nº 8 de la página Nº 6 de la guía.
2. Lee lo relacionado con problema de predicción y decisión en Ya-Lun Chou. Análisis
estadístico páginas 394-523.
EJERCICIO Nº 8
Señalada las diferencias entre predicción y decisión.
_________________________________________________________________________
_________________________________________________________________________
23. 23
_________________________________________________________________________
_________________________________________________________________________
AUTOEVALUACION.
A continuación se le presente una serie de proposiciones, con la finalidad de que se
compruebe si ha logrado los objetivos propuestos en la sub-unidad de aprendizaje. Trate de
contestar por sus propios medios y luego compare sus respuestas con el grupo.
1. Elabore un concepto de Estadística.
__________________________________________________________________
__________________________________________________________________
__________________________________________________________________
2. Indicar cuáles de las siguientes variables representan series discretas y cuales
series continuas.
a) El número de ordeños diarios en una finca lechera.
__________________________________________________________________
__________________________________________________________________
b) La longitud de una canal.
__________________________________________________________________
__________________________________________________________________
__________________________________________________________________
c) El peso del vellón en ovejas Corriedale.
__________________________________________________________________
__________________________________________________________________
__________________________________________________________________
3. En qué se diferencia una población de una muestra.
__________________________________________________________________
__________________________________________________________________
__________________________________________________________________
24. 24
__________________________________________________________________
__________________________________________________________________
__________________________________________________________________
4. En qué se diferencia el muestreo probabilístico del no probabilístico.
__________________________________________________________________
__________________________________________________________________
__________________________________________________________________
__________________________________________________________________
__________________________________________________________________
5. Señale la clase de muestreo que se debe utilizar en los siguientes casos, razone sus
respuestas.
Se desea estudiar una población universitaria (UCLA: 12.000 alumnos). Se
toma como criterio para seleccionar la muestra el 10% (1.200).
________________________________________________________________
________________________________________________________________
_____________________________________________________________
Un fabricante desea controlar la cantidad de sus productos tomando muestras
de tiempo en tiempo para su examen.
________________________________________________________________
________________________________________________________________
_____________________________________________________________
El sindicato de obrero de la UCLA ha de escoger una muestra entre sus
miembros, para determinar la actitud de ellos, hacia un programa de
actividades sociales recientemente introducido.
________________________________________________________________
________________________________________________________________
_____________________________________________________________
Se desea estimar el número de cría promedio por cerda, de una determinada
cochinera. En dicha cochinera están presentes dos razas porcinas.
26. 26
UNIDAD I
SUB-UNIDAD 2
Objetivo Terminal
Aplicara las técnicas de tabulación, representación gráfica y
cálculo de índice de una serie numérica dada.
(6) Describirá los pasos que se realizan para calcular, proporciones,
tasas, índice y porcentajes numéricos.
erencias entre predicción y decisión.
(5) Explicará cada una de las formas para graficar datos numéricos.
(4) Explicará los pasos a seguir en la construcción de una tabla de
distribución de frecuencias, a partir de una muestra dada.
(3) Explicará cada una de las formas empleadas para tabular datos
numéricos.
(2) Describirá los elementos que conforman una gráfica de datos
dada.
(1) Describirá cada uno los elementos que conforman una tabla de
datos dada.
ObjetivosEspecíficos
SecuenciadeAprendizaje
27. 27
ACTIVIDADES DE APRENDIZAJE PARA LOGRAR LOS OBJETIVOS
1. Lee el objetivo Nº 1 de la página Nº 19 de la guía.
2. Con la información que obtengas, estarás en condición de leer para buscar indicadores
respecto al tema en estudio.
3. Lee la información que aparece a continuación
4. Leída e interpretada la información señalada, realiza el ejercicio Nº 1.
Los datos, el conjunto de valor específicos observados en un experimento,
comprenden lo que se conoce como una muestra, de la cual deseamos deducir alguna
propiedad acerca del conjunto de todos los valores posibles que podrían haber resultado, es
decir, acerca de la población.
Todo los proceso de reunir, organizar y describir datos es motivado por el deseo de
conocer algo acerca d una población.
Para obtener más información y obtenerla rápidamente, necesitamos organizar los
datos en forma sistemática, es por esto, que dentro de las ciencias estadísticas ocupa un
lugar preferencial la presentación de los resultados, la cual puede hacerse en forma tabular
y gráfica que son las más usadas según RIVAS G., Ernesto (1979 pp. 38-42).
Forma tabular.
Es aquella que se realiza a través d los cuadros o tablas estadísticas, entendiéndose
por cuadros o tablas estadísticas a una ordenación de datos numéricos en filas y columnas
con las especificaciones correspondientes acerca de la naturaleza de los datos. De manera
generalizada se utilizará la expresión “tabla estadística” para designar a la forma tabular.
Componentes de un cuadro o tabla estadística:
1. El título, comprende el número de cuadro (cuando se presenta varios cuadro); el
tema del cuadro (qué), referencia geográfica (dónde); referencia cronológica
(cuándo); tipo de cifra.
2. Encabezamiento, comprende los títulos de cada columna de datos.
28. 28
3. La columna matriz abarca las designaciones de cada fila de datos y se encuentra
en la parte izquierda del cuadro.
4. El cuerpo o contenido presente las cifras, símbolos que se encuentran colocados
en las filas y columnas del cuadro por debajo del encabezamiento y a la derecha
de la columna matriz.
5. Las notas, aparecen en cualquier parte de la tabla, y explican algunas aclaratorias
sobre los datos.
6. Fuente, indica de donde provienen o donde se tomaron los datos.
29. 29
(Título)
A continuación se presenta el Ejemplo Nº 1, donde pueden observarse cada uno de
los componentes de un cuadro o tabla estadística.
CUADRO 1
CONTAJE EN PLACA Y PRESENCIA DE ALGUNOS GERMENES
PATOGENOS EN EL QUESO DE CABRA.
MUESTRA
Nº
NMP*
Coliformes
Recuento en
placas** E.Col
Staph
Patógeno
Staph
Epidermis
(Columna)
(Fila)
1 930 Incontable +
(CuerpooContenido)
2 230 ´´
3 11.000 ´´ + +
4 930 ´´ + +
5 90 38.000 + +
6 0 75.000 +
7 0 20.000 +
8 140 Incontable +
9 11.000 ´´ +
10 0 400 +
11 0 57.400 +
12 1.200 Incontable + +
13 90 ´´ +
Porcentajes positivos 46.2 38.5
Nota: *NMP, número más probable
**Gérmenes por gramo
FUENTE: BIOAGRO. Revista de las Escuelas de Agronomía y Veterinaria UCLA.
Volumen Nº 1 y Nº 2, Julio-Diciemdre, 1983
30. 30
PROCEDIMIENTO PARA LA ELABORACIÓN DE
CUADROS O TABLAS ESTADÍSTICAS
I. Título
A. Numeración del cuadro: Cuando el cuadro forma parte de un grupo o conjunto
deben ser enumerados en la parte superior central de la hoja.
B. Título propiamente dicho:
1. Deberá colocarse centrado en la parte superior del cuadro sin subrayar y
usando letras mayúsculas para todo el enunciado.
2. Redactarse con claridad y que se exprese concisamente los datos que se
presentan en el cuadro.
3. El enunciado tendrá el siguiente orden:
a) Referencia geográfica.
b) Naturaleza de los datos.
c) Referencia cronológica.
II. Encabezamiento
Debe disponerse en la parte superior del cuadro y las designaciones que
comprenden deberán escribirse en lo posible horizontalmente, se dispondrán en un
orden lógico de izquierda a derecha.
Tanto el encabezamiento como las diversas columnas deben separarse con rayas,
cerrando el cuadro por la parte superior e inferior con una raya, en la actualidad
existe la tendencia a no rayar verticalmente el encabezamiento.
III. Columna matriz o principal.
Cuando se trata de países, ciudades o cualquier otro concepto cualitativo,
deberán ordenarse alfabéticamente cuando se trata de concepto cuantitativos, puede
hacerse el arreglo en orden ascendente o descendente. Para sucesión de meses de
años, días de la semana, se comenzará con enero y lunes, respectivamente y si
fuesen series largas de año, deberá separarse éstos por grupos de cinco o diez años.
Para meses, sepárense éstos en grupos de tres.
31. 31
Cuando la información que se presenta en la columna matriz siguiente en orden
jerárquico, no se debe ordenar alfabéticamente los datos.
IV. Rayado del cuadro.
Todo cuadro deberá enmarcarse con una raya horizontal debajo del título:
Paralela a ésta, trazará otra a fin de encerrar el encabezado (título de cada una de las
columnas), y se trazará una última línea paralela a las anteriores, para cerrar el
cuadro.
Los cuadros o tablas no se cerrarán mediante raya por los lados.
V. Tamaño.
Todo cuadro deberá en lo posible hacerse en tamaño carta, y debe planificarse de
tal manera que no sea ni muy largo y angosto, ni muy ancho y corto.
Ventajas de la presentación tabular.
1. Permite resumir los principales resultados obtenidos.
2. Permite observar relacionado los diversos datos presentados en su mismo cuadro
o en cuadros diferentes.
3. De acuerdo a la finalidad de la investigación se sigue un orden o plan establecido.
EJERCICIO Nº 1
Leídos y analizados los párrafos anteriores sobre los componentes de un cuadro o
tabla estadística, tratan de construir un cuadro o tabla estadística, utilizando un grupo de
datos u observaciones referente a una o más variables.
Identifica los elementos componentes del siguiente cuadro
32. 32
CUADRO 2
AMIBIASIS. CASOS Y MUERTES. DISTRIBUIDOS POR AÑOS Y ESTADOS
REGION CENTRO OCCIDENTAL. PERIODO 1979-1983.
Años Lara Falcón Portuguesa Yaracuy Total
C M C M C M C M C M
1979 865 7 350 - 442 2 483 - 2.140 9
1980 1.034 3 100 - 752 1 315 - 2.801 4
1981 1.691 3 206 - 50 - 100 - 2.047 3
1982 2.000 3 774 - 1.647 - 299 - 2.720 3
1983 2.425 3 1.125 - 1.277 - 942 - 5.769 3
Total 8.615 19 2.555 - 4.168 3 2.139 - 17.477 22
FUENTE: RUIZ PADILLA; LUIS. Vigilancia Epidemiológica de algunas
enfermedades de interés en salud pública. Región Centro Occidental.
1979-1983. UCLA, 1985.
1. Lee el objetivo Nº 2 de la página Nº 19 de la guía.
2. Con la información que obtengas, estarás en condición de leer para buscar indicadores
respecto al tema en estudio.
3. Lee la información que aparece a continuación
4. Leída e interpretada la información señalada, realiza el ejercicio Nº 2.
Los cuadros o tablas estadísticas presentan los elementos de un conjunto de datos en
forma que permite apreciar algunas características fundamentales, la representación gráfica
hace posible una visión intuitiva de esas características y por ellos, su uso se ha
generalizado como complemento de una adecuada presentación.
33. 33
Las representaciones gráficas hechas con el propósito de estudiar cambios en una
variable, o de comparar varias similares o de relacionar variables, reciben el nombre de
gráficos.
Aunque los gráficos no ofrecen una mayor información que aquella que se obtiene de
las cifras arregladas en forma tabular, generalmente éstos hacen resaltar los hechos
importantes más claramente. Además la forma gráficas más practica, puesto que con el uso
de dibujos geométricos, el color o diferentes trazos, se representa la característica de los
datos cuantitativos y/o cualitativos del fenómeno que se estudia.
Las tablas de distribución de frecuencia se presentan los elementos de un conjunto de
datos en forma que permite apreciar algunas de la característica fundamentales; la
representación gráfica hace posible una visión intuitiva de esas característica y por ello, su
uso se ha generalizado como complemento de una adecuada presentación.
Un gráfico es la representación de datos cuantitativos mediante dibujos geométricos,
los cuales permiten al lector darse cuenta rápidamente de las características esenciales dl
fenómeno en sí y de las diferencias cuantitativas de los elementos que se integran.
Las formas más utilizadas en la presentación son: histograma, polígono de frecuencia,
gráfico de barras, gráfico circular o sectorial.
Los componentes de un gráfico son:
-Título
-El gráfico propiamente dicho.
-La fuente.
-La nota explicativa, si hubiese necesidad de aclarar algún aspecto de la gráfica.
-La leyenda.
EJERCICIO Nº 2
De acuerdo a la lectura realizada sobre los componentes de un gráfico, señala y
realiza un breve resumen sobre ellos.
35. 35
En igual forma las respuestas o preguntas dicotómicas y múltiples pueden ponerse en
clave asignando a cada una un número o símbolo.
Como consecuencia de una encuesta o experimentación, ser suele tener un largo
número de hojas de datos; vistos éstos así, generalmente, es difícil conocer la información
que contienen; cuando la encuesta es de tamaño pequeño la clasificación y tabulación
puede hacerse a mano. A continuación, los cuadros 3, 4 y 5 muestran como se clasificaron
y tabularon el número de consulta caninas atendidas durante un mes en una clínica
veterinaria de la ciudad d Barquisimeto.
CUADRO 3
NÚMERO DE CONSULTA CANINAS ATENDIDAS
POR UNA CLINICA VETERINARIA
DIA POR DIA DURANTE UN MES
Lunes Martes Miércoles Jueves Viernes Sábado Domingo
5 8 4 2 9 2 1
3 2 1 1 10 1 0
2 4 2 4 5 4 2
1 3 5 3 7 3 4
FUENTE: Propia
CUADRO 4
LOS DIAS CLASIFICADOS POR NUMERO DE CONSULTAS
CANINAS DURANTE UN MES EN UNA
CLINICA VETERINARIA
Número de Consulta Número de días
0 = 1
1 = 5
2 = 5
3 = 4
36. 36
4 = 5
5 = 3
6 = 0
7 = 1
8 = 1
9 = 1
10 = 1
FUENTE: Propia
Otro resumen que se deduce de estos datos, sería el número de consultas de acuerdo a
los días de la semana.
CUADRO 5
Días de la semana Números de consulta
Lunes 11
Martes 17
Miércoles 12
Jueves 10
Viernes 31
Sábado 10
Domingo 7
FUENTE: Propia
Otra forma de clasificar y tabular, es a través de tarjetas recortadas, para lo cual se
requiere pasar los datos del formulario de la encuesta a unas tarjetas recortando los bordes
con una tijera.
Para grandes encuestas el mejor procedimiento es el uso de máquina diseñadas para
este fin, que requieren también el uso de tarjetas, pero de diseño diferente a los anteriores.
Cuando se tienen más de una característica cuya información esta repartida en más de
una posibilidad o categoría. Su tabulación se puede realizar a través de una tabla de doble
37. 37
entrada o contingencia. El ejemplo que a continuación se ilustra corresponde a una tabla de
contingencia o doble entrada.
La presente tabla se empleó para registra los resultados de clasificar a 200 pacientes
que padecían una infección ocular después de haber recibido alguno de ellos tratamiento.
CUADRO 6
Curados No curados Total
Tratados 140 20 160
No tratados 10 30 40
Total 150 50 200
FUENTE: Propia
Dentro de la presentación tabular también se encuentran la tabla de distribución de
frecuencia, que consiste en presenta en dos columnas, entre las que se corresponden en las
hileras, las categorías de la variable de observación y las frecuencias correspondientes, de
manera que en una hilera se indica una categoría y su frecuencia correspondiente.
EJERCICIO Nº 3
Con los datos que a continuación se dan, realizar una tabla estadística.
En una experiencia de cruza de dos razas de animales, se obtuvieron 72 crías que se
clasificaron por la longitud de las patas y el tamaño de la cabeza de las siguientes
maneras:
20 patas cortas y cabeza chica.
4 patas largas y cabeza grande.
38. 38
18 cabeza chica y pata larga.
30 patas cortas y cabeza grande.
1. Lee el objetivo Nº 4 de la página Nº 19 de la guía.
2. Lee la información que a continuación aparece.
3. Leída e interpretada la información señalada, realiza el ejercicio Nº 4.
Para condensar y simplificar datos sin perder muchos detalles, es conveniente
distribuir éstos en clases o categorías, y determinar el número de datos de cada clase, a
estos se denomina frecuencia de clase, y el cuadro que resulta se llama cuadro de
distribución de frecuencia. En la distribución por frecuencia influyen algunas
consideraciones importantes. Pero, debemos exponer primero algunos términos técnicos
asociados con un cuadro de frecuencias.
A la diferencia entre el dato más alto y el más bajo se denomina amplitud de
variación y se expresa por AV. No es necesario tener los datos ordenados para conocer la
amplitud de variación. A cada valor de la variable le llamamos, cuando se trabaja con los
datos agrupados, clase. Los números situados a la izquierda que conforman las clases, se
llaman límites inferiores y los números situados a la derecha, límites superiores de clase. A
la distancia entre los límites se le llama intervalo de clase y se expresa por (IC). El tamaño
del intervalo de clase depende de: 1) la amplitud que abarcan los valores de la variable y, 2)
la cantidad de observaciones. Con pocos intervalos desperdiciamos información; con
muchos intervalos ahorramos poco trabajo. Conviene utilizar el mismo tamaño a lo largo
de la distribución. En general, cuando sea posible, a los intervalos de clases se les debe
asignar valores de enteros o múltiplos de 5 para comodidad en cálculos posteriores.
Un problema previo reside en la construcción de las categorías de la distribución o
clases (K), que pueden coincidir o no con las categorías de la escala de observaciones y
que tiene por objeto destacar la influencia en las variaciones de frecuencia por parte de
dada una de las categorías. Esto obliga a establecer un número de categoría que no sea muy
39. 39
grande (para que se destaquen las variaciones de frecuencias), ni tampoco muy pequeño,
para que no resulten absorbidas esas diferencias que precisamente deseamos destacar. En
general el número de clase se establece arbitrariamente. Una regla empírica establece que el
número de clase varía entre 5 y 15. Obviamente el número real de unidades de clase que
debe establecerse depende del número de unidad de la muestra y de la amplitud de los
valores observados. Según la ecuación matemática de Stuggest señala: K=1+3·3 log n.
Al punto medio de la clase se llama centro de clase, y se expresa por (C.C). A veces
puede formarse una distribución sin límite inferior para la primera clase o sin límite
superior para la última clase, o sin ambos límites. Se dice que esas clases son de extremo
abiertos. El intervalo para una clase de extremo abiertos es el infinito y su punto medio es
Con los datos que se dan a continuación se construirá una tabla de distribución de
frecuencias.
Se realizó un ensayo de suplementación con una dieta baja en calorías para estudiar la
posibilidad de controlar el aumento de peso durante el periodo de vacaciones. A cada sujeto
se le suministro la misma dieta obteniéndose al final del ensayo las siguientes pesadas en
Kg.
62 64 60 85 70 64 83 99 87 65
74 89 86 91 75 63 78 85 68 73
81 67 61 71 81 89 91 95 77 80
1. Se ordenan los datos, en este caso en forma ascendente.
60 63 65 70 74 78 81 85 89 91
61 64 67 71 75 80 83 86 89 95
62 64 68 73 77 81 85 87 91 99
2. Amplitud de variación (AV).
40. 40
Es la diferencia entre el valor mayor y el valor menor de la serie de datos. En el
presente ejemplo, está dado por la diferencia entre 99 menos 60, resultando una
amplitud de variación igual a 39.
3. Número de clase (K).
El número de clase usadas no debe ser muy grande ni muy pequeño. Un gran número
de clase puede que no condense los datos suficientemente para ser de valor práctico;
un número pequeño de clase tiende a resumir en exceso los datos, por lo que se pierde
mucha información valiosa. Obviamente, el número real de clases que debe
emplearse depende del número de unidades de la muestra y de la amplitud de los
valores observados.
K=1+3 , 3 log 30 = 5.87 6
4. Intervalo clase (IC).
Se obtiene dividiendo la amplitud de variación entre el número de clases. Para el
ejemplo sería:
39 / 6 = 6.5 7
5. Formación de las clases
El valor menor de la serie de datos, representa el límite inferior de la primera clase,
sumándole a éste el intervalo de clase menos una unidad, se obtiene el límite superior
de dicha clase. Para el ejemplo, la primera clase quedaría formada de la siguiente
manera:
60 - 66 (límites reales); 60 - 67 (Límites irreales).
El límite inferior de la segunda clase, será el número consecutivo al límite superior de
la primera clase, al cual se le suma el intervalo de clase menos una unidad, para así
obtener el límite superior de esta clase. Este procedimiento se repite para las clases
siguientes hasta alcanzar el número de clases establecidas. Si tomada la última clase,
quedasen valores de la serie de datos por incluir, se recomienda formar una o dos
clases adicionales, para evitar pérdida de información. Los límites que forman estas
clases se le llama límites reales o verdaderos, por ser igual a su valor aparente más o
menos una mitad de la unidad de medida.
41. 41
La construcción de límites irreales o aparentes, se logra agregándole al valor menor
de la serie de datos o límite inferior de la primera clase el intervalo de clase (60+7),
obteniéndose así el límite superior de la primera clase e inferior de la segunda, a la
cual se le sumaría el intervalo de clase, nuevamente para obtener el límite superior de
la segunda e inferior de la tercera y así sucesivamente para las siguientes clases.
Para el ejemplo, las clases con límite real y límites irreales quedaron formadas de la
siguiente
Clases Clases
60 – 66 60 – 67
67 – 73 67 – 74
74 – 80 74 – 81
81 – 87 81 – 88
88 – 94 88 – 95
95 – 101 95 – 102
6. Frecuencia absoluta (Fi)
Representa el número de acurrencia de cada clase, y la sumatoria de la frecuencia
absoluta es igual al número de observaciones de la serie de datos tabulados. Para el
ejemplo, la sumatoria de la frecuencia absoluta es igual a 30 observaciones.
7.Frecuencia acumulada (Fa)
Se obtiene sumando la frecuencia absoluta de las clases inferiores a una clase dada,
incluyendo la frecuencia de esta clase. Para el ejemplo dado, la frecuencia
acumulada de la segunda clase se obtiene sumando la frecuencia absoluta de la
primera y segunda clase (7+5=12). Para la primera clase Fi = Fa.
8. Frecuencia relativa (Fr) expresada en porcentaje
Se obtiene de dividir, la frecuencia absoluta de cada clase entre el número total de
observaciones y se expresa en porcentaje. Para la primera clase del ejemplo dado, la
frecuencia relativa es igual a 7 30 x 100 = 23%
42. 42
9. Frecuencia acumulada relativa (Far) expresada en porcentaje.
Se obtiene dividiendo la frecuencia acumulada de cada clase entre el número de
observaciones y se expresa en porcentaje. Es decir; 100
n
FaFar . Para el
ejemplo la frecuencia acumulada relativa de la segunda clase sería 12 30 x100 =
40%.
Resumiendo las tablas de distribución de frecuencia del ejemplo dado, tanto para
límites reales y límites irreales, son las siguientes:
TABLA 1
DISTRIBUCION DE FRECUENCIA DEL PESO (Kg)
DE 30 PACIENTES
Clases c.c Fi Fa Fr % Far %
60-66 63 7 7 23 23
67-73 70 5 12 17 40
74-80 77 5 17 17 57
81-87 84 7 24 23 80
88-94 91 4 28 13 93
95-101 98 2 30 7 100
Total 30 100
FUENTE: PROPIA
TABLA 2
DISTRIBUCIÓN DE FRECUENCIA DEL PESO (Kg)
DE 30 NOVILLOS.
Clases C.C Fi Fa Fr % Far %
43. 43
60-67 63.5 8 8 26 26
67-74 70.5 5 13 17 43
74-81 77.5 6 19 20 63
81-88 84.5 5 24 17 80
88-95 91.5 5 29 17 93
95-102 98.5 1 30 3 100
Total 30 100
FUENTE: PROPIA
EJERCICIO Nº4
Construye una tabla de distribución de frecuencia, para el peso de un grupo de recién
nacidos en un hospital
4.3 4.4 4.2 3.8 3.6
3.8 4.5 3.8 4.0 3.9
3.9 3.9 3.9 4.1
4.0 4.6 4.3 4.0
1. Lee el objetivo Nº 5 de la página Nº 19 de la guía.
2. Con la información que obtengas, estarás en condición de leer para buscar indicadores
respecto al tema.
44. 44
3. Lee el texto de José Calzada Benza “Introducción a la Estadística”, desde la página 20
hasta la 42 inclusive.
4. Leída e interpretada la información señalada, realiza el ejercicio Nº 5.
La información clasificada y tabulada puede presentarse en forma de gráfica, de
muchas maneras. En este objetivo se tratarán de ellas.
Gráfico de barras.
Son serie de rectángulos o barras, de acuerdo a su longitud y anchura representan un
fenómeno. El gráfico de barras hace comparaciones, utilizando barras paralelas colocadas
bien horizontal o verticalmente. Cuando dichas barras son utilizadas como medio de
identificación, o para expresar series cualitativas, es decir, distintas modalidades de un
atributo, las horizontales son más recomendables. Las barras verticales se utilizan
principalmente para la representación de datos cuyas magnitudes varían con el tiempo; tales
datos son conocidos como series cronológicas. En estas gráficas la amplitud de las barras es
uniforme y su longitud proporcional a los valores representados.
La escala para construir gráficos de barras, debe estar en función a los fenómenos a
representar, y la separación que debe existir entre las barras, depende del número de barra a
construir y el espacio con que se cuenta, esto determinará si las barras van unidas o
separadas. Si va separadas, el espacio entre barra y barra debe ser igual y por lo general
será la mitad del tamaño de las barras.
Con los datos del cuadro siguientes se construyó un gráfico de barras dobles, con el
objeto de ilustrar lo referente a las barras.
BRUCELOSIS, MORBILIDAD POR ESTADOS Y ESPECIES
REGIÓN CENTRO OCCIDENTAL
PERIODO 1979-1983
45. 45
Estados Bovinos Suinos Caprinos Equinos Total
Lara 804 445 174 - 1.423
Falcón 686 - 3 - 689
Portuguesa 290 37 - 2 329
Yaracuy 326 - - - 326
Total 2.106 482 177 2 2.767
FUENTE: RUIZ PADILLA, Luis. Vigilancia Epidemiológica de
Algunas enfermedades de interés en salud pública.
Región Centro Occidental 1979-1983. UCLA, 1985.
46. 46
GRAFICO 1
BRUCELOSIS. MORBILIDAD POR ESTADOS Y ESPECIES
REGIÓN CENTRO OCCIDENTAL. PERIODO 1979-1983
Lara 804 619
Falcón 686 3
Portuguesa 290 39
Yaracuy 326
0
100
200
300
400
500
600
700
800
900
Lara
F
alcón
P
ortuguesa
Y
aracuy
Bovinos
Otros: Suino, Caprino,
Equino
47. 47
Gráfico Circular o Sectorial.
Es un circulo que representa el total de un fenómeno, que se divide en tantos sectores
como componentes tenga el mismo. Permite mostrar la distribución del total entre sus
partes componentes, las cuales se expresan como porcentaje del total, y están representadas
por segmentos de un círculo de una circunferencia cuyos ángulos centrales son los
correspondientes a los porcentajes de 360 grados. Este tipo de gráfico no debe subdividirse
en muchas categorías (gráfico 2).
El procedimiento que se sigue en su construcción es el siguiente:
Se traza un círculo que representa el total del fenómeno y constituye 360 grados.
La superficie del circulo se divide en tantos segmentos como parte componentes
tenga el fenómeno en estudio, y la superficie de los segmentos debe ser
proporcional a la magnitud de cada componente representado.
El total del fenómeno constituye el 100 por ciento y cada componente representa un
porcentaje de ese 100 por ciento.
El gráfico circular se usa para ilustrar proporciones de un total de manera llamativa.
A partir de los datos del cuadro siguiente se construyó un gráfico circular a manera de
ejemplo.
HEPATITIS. MORBILIDAD POR ESTADOS
REGION CENTRO OCCIDENTAL
PERIODO 1979-1983.
Estados Morbilidad %
Lara 1.275 49
Falcón 348 13
Portuguesa 462 18
Yaracuy 514 20
Total 2.599 100
FUENTE: RUIZ PADILLA, Luis. Vigilancia Epidemiológica de
Algunas enfermedades de interés en salud pública.
Región Centro Occidental 1979-1983. UCLA, 1985.
48. 48
GRAFICO 2
HEPATITIS. MORBILIDAD POR ESTADOS
REGION CENTRO OCCIDENTAL
PERIODO 1979-1983
Estados %
Lara 49
Falcón 13
Portuguesa 18
Yaracuy 20 Lara
Falcón
Portuguesa
Yaracuy
49. 49
Histograma.
Histograma proviene del griego y significa columna. Cada rectángulo tiene como
base la amplitud del intervalo real y como altura el cociente de la frecuencia del intervalo
dividida por la amplitud del mismo. Es decir, el histograma es un conjunto de rectángulos.
El histograma de frecuencia está formado por un conjunto de rectángulo que tienen
sus bases en el eje horizontal de la X (corresponden las clases) y cuyas alturas son iguales a
las frecuencias de la clase a que corresponden y se ubican el eje vertical de la Y (gráfico 3).
Polígono de frecuencias.
Es una línea basada en la unión de los puntos medio o centros de clase de los techos
de los rectángulos que forman el histograma. Sin embargo, no es necesario elaborar un
histograma ante de construir un polígono de frecuencia. Todo lo que debe hacerse es
marcar un punto en el sitio correspondiente a las cimas de las barras y luego unir estos
puntos (gráfico 3).
50. 50
GRAFICO 3
HISTOGRAMA Y POLÍGONO DE FRECUENCIA
PESO DE 30 PACIENTES.
8
7
6
5
4
3
2
1
Frecuenciaabsoluta(pacientes)
Y
60 67 74 81 88 95 102
Clases (pesos/ Kg)
x
51. 51
EJERCICIO Nº 5
Construir un histograma y un polígono de frecuencias con la tabla de distribución de
frecuencia del ejercicio Nº 4 de la pagina Nº
1. Lee el objetivo Nº 6 de la página Nº 19 de la guía.
2. Con la información que obtengas, estarás en condición de leer para buscar indicadores
respecto al tema.
3. Lee la información que aparece a continuación.
4. Leída e interpretada la información señalada, realiza el ejercicio Nº 6.
De todas las estadísticas de uso cotidiano, probablemente las peores entendidas y
empleadas son aquellas que contienen el cálculo de la razón, proporción, porcentaje e
índice.
Razón
Se calcula una razón cuando se compara el número de individuos que están en una
categoría con el número de individuo que está en otra. Una razón es la relación entre dos
frecuencias absolutas de distinta naturaleza.
Para el ejemplo siguiente, el cálculo de la razón sería:
NACIMIENTOS DE NIÑOS, DISTRIBUIDOS POR SEXO
EN EL HOSPITAL ANTONIO MARIA PINEDA, BARQUISIMETO MAYO 2004
Sexo Número de nacimientos
Varones 40
Hembras 35
Total 75
FUENTE: PROPIA
52. 52
Razón: Hembras Varones= Número de hembras = 35 40 = 0.88
Número de varones
Aproximadamente 1:1
Razón: Macho Hembra = Número de Varones = 40 35= 1.14
Número de Hembras
Para el ejemplo la razón de nacimientos en el sexo masculino en relación con el
femenino, fue 1.14 1. Por cada 100 nacimientos de hembras, ocurrieron 114 varones.
Proporción
Cuando el número de individuos de una categoría se relaciona con el total general del
grupo, se trata de una proporción.
Para el ejemplo, la proporción de hembra será igual.
Proporción de hembras = Número de hembras = 35 =7
Total de población 75 15
Indice
Consiste en modificar la expresión de quebrado en número fraccionario. Para el
ejemplo el índice de hembras será igual:
Indice de hembras =35 = 0.46
75
Porcentaje
Un porcentaje es un índice multiplicado por 100; así, el ejemplo de nacimientos
hembras fue de 46%.
53. 53
Tasas
Muy utilizada en el área epidemiológica, para expresar el comportamiento sanitario
de las poblaciones. Consiste en expresar un índice de un valor absoluto demasiado
pequeño, multiplicando los porcentajes por 1.000, 10.000, 100.000 entre otros. Para las
tasas debe indicarse la zona geográfica y el momento en que se llevó a cabo el estudio del
fenómeno.
Tasa de mortalidad = Número de muerto x Factor de amplitud: 1.000, 10.000
Población suceptibles.
Tasa de letalidad = Número de muertos x Factor de ampliación
Número de enfermos.
EJERCICIO Nº 6
Con los datos del cuadro siguiente, calcular la tasa de letalidad y el porcentaje por
año.
INTOXICACION POR PESTICIDAS. CASOS Y MUERTES.
DISTRIBUCION POR AÑOS.
REGION CENTRO OCCIDENTAL
PERIODO 1979-1983
Años Casos Muertes Tasa de letalidad Porcentaje
1979 53 5
1980 102 10
1981 79 8
1982 264 28
1983 207 12
Total 705 63
54. 54
FUENTE: RUIZ PADILLA, Luis. Vigilancia Epidemiológica
de algunas enfermedades de interés en salud
pública. Región Centro Occidental 1979-1983.
UCLA, 1985.
AUTOEVALUACION.
A continuación se le presenta una serie de proposiciones, con la finalidad de que
compruebe si ha logrado los objetivos propuestos en la sub-unidad de aprendizaje. Trate de
contestar con sus propios medios y luego compare sus respuestas con el grupo.
1. En la tabla que se presenta a continuación identifique los elementos que la
forman.
TABLA 1.1
TONELADA DE EXPORTACION DE CARNE VACUNA
DE UN PAIS
Meses
Años
E F M A M J J A S O N D
75 85 80 92 101 132 141 120 119 93 86 68 70
76 78 78 91 102 135 128 117 105 92 87 75 94
77 103 101 121 333 156 158 135 118 95 91 91 109
78 118 116 143 142 164 160 129 109 92 87 86 97
79 108 104 121 129 157 151 123 102 91 94 92 105
80 114 114 129 135 151 149 127 109 92 93 92 103
81 115 110 124 135 159 148 125 106 90 100 94 105
82 118 113 129 132 150 144 126 97 86 91 90 107
2. Con los datos de la tabla 1.1 del ejercicio 1, construye una tabla de frecuencias.
55. 55
3. Con la tabla de distribución de frecuencia del ejercicio 2, construye un histograma
y un polígono.
4. Representa gráficamente los datos de la tabla siguiente.
Años Producción anual de huevos de una
Granja en miles
1968 65
1969 80
1970 83
1971 76
1972 77
1973 71
1974 75
1975 74
1976 69
1977 67
1978 78
FUENTE: Propia
5. De un total de 200 pacientes que padecían una infección ocular fueron tratados el
80 por ciento, de los cuales se curaron el 70 por ciento. Del 20 por ciento no
tratados, el 15 por ciento no curaron.
a) Una tabla de contingencia.
b) En gráfico sectorial
56. 56
6. Completar la siguiente tabla de distribución de frecuencias.
TABLA 6.1
EPISODIOS (DIAS) DE FIEBRE DE ADOLESCENTES
DE UNA REGION DEL PAIS
Días c.c Fi Fa Fr Far
6-10 6
46
16-20 41,3
26-30 196
Total 196
FUENTE: Propia
7. A partir de la tabla 6.1, responde:
¿Cómo son los límites de las clases?
Abiertos o cerrados
____________________________________________________________
____________________________________________________________
____________________________________________________________
Reales o irreales
____________________________________________________________
____________________________________________________________
____________________________________________________________
¿Cuantos adolescentes presentaron fiebre?
57. 57
UNIDAD I
SUB-UNIDAD 3
ObjetivosEspecíficos
Objetivo Terminal
Presentado un conjunto de datos, el estudiante calculará las medidas de
tendencia central, explicando el significado, uso, ventaja y desventaja
de cada una de las medidas
(6) Dada una distribución de frecuencia, el estudiante calculará la
media aritmética, la media y la moda, empleado la fórmula
explicada en clase para los datos agrupados.
(5) Calculará sin margen de error, la media aritmética, la mediana la
moda y la media ponderada, para una serie numérica dados,
utilizando el procedimiento para datos no agrupados.
(4) Señalará las ventajas y desventajas del cálculo de la media
aritmética, la mediana y la moda.
(3) Explicará brevemente el uso de la media aritmética, la mediana y
la moda
(2) Definirá la media aritmética, la mediana, la moda y la media
ponderada.
(1) Conceptualizará que son medidas de tendencia central.
SecuenciadeAprendizaje
58. 58
Lee el objetivo Nº 1 de la página Nº 50 de la guía.
Lee la información que a continuación aparece.
Leída e interpretada la información señalada, realiza el ejercicio Nº1.
Las medidas de tendencia central, son valores típicos o números alrededor de los
cuales tienden a concentrarse todo un conjunto de datos. Las medidas de tendencia central
más comúnmente usadas son: la media aritmética, la mediana y la moda. Cada una de esta
medidas es representativa de una serie de datos en una forma muy particular.
El objeto de estudiar las medidas de tendencia central, es el de establecer una medidas
tales como las anteriormente mencionadas, que caractericen lo mejor posible a una
distribución de frecuencia. Si se encuentran característica adecuadas que definen una
distribución de frecuencias, será posible usar tales características en vez de sus
distribuciones de frecuencias.
Las medidas de tendencia central que nos interesan son las de posición central, que
característica la distribución.
EJERCICIO Nº1
Define medidas de tendencia central.
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
59. 59
1. Lee el objetivo Nº 2 de la página Nº 50 de la guía.
2. Con la información que obtengas, estarás en condición de leer para obtener el material
bibliográfico necesario sobre el tema de estudio.
3. Lee la información que a continuación aparece.
4. Leída e interpretada la información señalada, realiza el ejercicio Nº2.
Media aritmética ( o )
La media aritmética es lo que frecuentemente se llama promedio, sin embargo, el
término “promedio” también es utilizado para las otras medidas de tendencia central.
La media aritmética es la suma de las calificaciones o de los valores d una variable
dividida por su número.
Expresado en forma algebraica;
n
i
n
n
iy
ni
yyyy
y
1
31 ...
Donde
y la media y se le llama Y barra
y = representa la suma de las puntuaciones u observaciones.
ni Número total de puntuaciones u observaciones.
La media aritmética tiene algunas propiedades matemáticas. Primero es un valor
típico, porque es el centro de gravedad, un punto de equilibrio, también es típica porque su
valor puede substituir al valor de cada dato de la serie sin cambiar el total. Otras
propiedades de la media aritmética son que la suma algebraica de las desviaciones con
relación a la media es cero. La tercera propiedad matemática de la media es que la suma de
las desviaciones elevada el cuadrado de los datos de la media es menor que la suma de las
60. 60
desviaciones elevadas al cuadrado de cualquier otro punto. Debido a esta propiedad la
media generalmente sirve de base para medida de dispersión. Las puntuaciones extremas
afectan o modifican la media, por lo tanto, en conjuntos de valores donde existan valores
muy extremos, no se debe calcular la media.
Teóricamente, todas las medidas aritmética son ponderadas, si no se dan pesos
específicos a todos y cada uno de los valores de la serie, a cada observación se le asigna
implícitamente un peso de 1. Al calcular la media aritmética partiendo de datos agrupados,
como veremos más adelante, las frecuencias de clase pueden ser consideradas como una
serie de pasos para los distintos puntos medio.
Cuando se obtiene la media aritmética con pesos iguales, debe llamársele media
aritmética simple, como a menudo se le designa o media aritméticas no ponderada.
Media aritmética ponderada:( y )
La medida aritmética ponderada de un conjunto de muestras, puede expresarse como
la suma de producto de cada una de lasa muestras por sus correspondientes medias
aritmética, dividida entre la suma de las muestras.
Expresado en forma algebraica:
ni
iyni
nnn
ynynyn
y
k
kk )(
...
...
1
11
Donde:
y Es la media total de todas las observaciones correspondientes de todos los
conjuntos dados, considerados como un solo conjunto.
iy Es la media aritmética del conjunto genérico i.
ni Es la cantidad de observaciones del conjunto genérico i.
Mediana (Md)
La mediana es como lo indica su nombre, el valor medio de una serie cuando los
valores se disponen según su magnitud. Es decir, el punto medio arriba o debajo del cual
61. 61
caen el 50 por ciento de las puntuaciones. Una característica sobresaliente de la mediana es
su insensibilidad hacia las calificaciones extremas.
Para calcular la mediana se ordenan las puntuaciones en orden creciente o
decreciente. En el caso de que el número de caso sea impar; la puntuación mediana es el
puntaje del centro.
En el caso de número impar de observaciones una vez ordenados creciente o
decreciente, vamos a encontrar en la puntuación mediana dos valores centrales. Siendo la
mediana el promedio de estos dos valores centrales.
Moda (Mo).
Es el valor que aparece con más frecuencia en una serie de datos.
Aún cuando la moda es un concepto sencillo y útil, su aplicación presenta muchos
aspectos. Primero una distribución puede revelar que dos o más valores se repiten un
número igual de veces, y en tal situación no hay forma lógica de determinar que valor debe
ser escogido como la moda. La moda es un valor muy inestable.
EJERCICIO Nº 2.
Defina brevemente las medidas de tendencia central.
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
62. 62
1. Lee el objetivo Nº 3 de la página Nº 50 de la guía.
2. Lee la información que a continuación aparece.
3. Leída e interpretada la información señalada, realiza el ejercicio Nº3.
Uso de las medidas de tendencia central
1. Es la medida de tendencia central de uso más frecuente.
2. Es de fácil cálculo, de sencilla definición y toma en consideración todos los
valores para su cálculo.
3. Se utiliza para cálculos posteriores.
4. Cuando la distribución es simétrica, o sea la media, la mediana y la moda son
idénticas.
5. Es la más estable o confiable. Si se toman muestras repetidas de una población, la
media general mostraría una menor fluctuación que la correspondiente a la
mediana o la moda.
Mediana.
1. Se utiliza la mediana si la distribución de frecuencia es asimétrica, o sea, si las
frecuencias están casi totalmente concentradas hacia cualquier de los extremos de
la escala de valores.
2. Se usa en casos de series abiertas o truncadas, en que no se conocen los valores en
uno de los extremos o en ambos.
Moda.
1. Es la medida apropiada. Siempre que se desee una estimación aproximada, rápida
de la tendencia central.
2. Cuando se está interesado en el caso más típico de la distribución.
63. 63
EJERCICIO Nº 3.
Señala las diferencias de las medidas de tendencia central de acuerdo al uso.
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
1. Lee el objetivo Nº 4 de la página Nº 50 de la guía.
2. Con la información que obtengas, estarás en condición de obtener material bibliográfico
sobre el aspecto en estudio.
3. Lee en Ya-Lou Chou, Análisis Estadístico, lo referente a medidas de tendencia central,
páginas 44-50 y Haber/Runyon, Estadística general, página 73-83.
4. Lee la información que a continuación aparece.
5. Leída e interpretada la información señalada, realiza el ejercicio Nº4.
En general, la media aritmética es la medida preferida para representar la tendencia
central a causa de las diversas propiedades deseables que posee. De allí su empleo en
análisis estadístico más avanzados. La media aritmética es a más estable o la más confiable
de las medidas de tendencia central. Cuando la distribución es simétrica, la media, la
mediana y la moda son idénticas. En estas circunstancias deberá emplearse la media. Sin
embargo, como hemos visto cuando la distribución es visiblemente asimétrica, la media
proporciona una estimación falsa de la tendencia central.
La mediana es la medida que se elige en las distribuciones en los cuales hay valores
indeterminados y cuando los valores de una variable están sesgados hacia los valores altos.
La moda es la medida apropiada siempre que se desee una estimación aproximada
rápida de la tendencia central, o cuando estamos interesados únicamente en el caso típico.
64. 64
EJERCICIO Nº4.
Realiza un resumen breve de las ventajas y desventajas del cálculo de cada una de la
tendencia central.
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
1. Lee el objetivo Nº 5 de la página Nº 50 de la guía.
2. Con la información que obtengas, estarás en condición de obtener material bibliográfico
sobre el aspecto en estudio.
3. Lee la información que a continuación aparece.
4. Leída e interpretada la información señalada, realiza el ejercicio Nº5.
Cálculo de la Media Aritmética, La Mediana; La Moda y La Media Ponderada.
Para el cálculo de las medidas de tendencias central, se utiliza el siguiente ejemplo:
Los datos corresponden a la producción de leche (Lts.) por lactancia de los vientres,
fluctuando ésta entre 6-8 meses, para las razas: Nubian Criollo, Alpino Criollo y Criollo.
1. Nubian x Criollo.
15.80; 4.37; 9.30; 5.80; 12.40; 10.45; 10.65; 9.44; 6.77; 10.42
2. Alpino Francés x Criollo.
14.25 - 16.34 - 15.14 - 19.85 - 11.90 - 14.25 - 14.25
3. Criollo
4.41 - 4.20 - 8.94 - 8.99 - 8.94 - 8.95 - 8.95 - 7.02
65. 65
Media aritmética: )(y
ni
yi
y
EJEMPLOS
1. Nubian x Criollo.
10
42.1077.644.965.1045.1040.1280.530.937.480.15
y
litrosy 54.9
10
40.95
y = 9.54 litros
La raza Nubian x Criollo, tiene una producción media de 9,54 litros.
2.Alpinos Francés x Criollo.
litrosy 14.15
7
95.105
7
25.1425.1490.1185.1914.1534.1625.14
y = 15.14 litros
La raza Alpino Francés x Criollo, tiene una producción media de 15,14 litros.
3. Criollo.
litrosy 55.7
8
37.60
8
00.795.894.899.894.820.441.4
66. 66
y = 7.54 litros
La raza Criolla tiene una producción de 7,54 litros.
Las puntuaciones extremas afectan o modifican la media; a saber: Las razas Nubian x
Criollo y Criollo, donde se observan valores extremos alejados del resto, las medias
resultaron 9,54 litros y 7,54 litros respectivamente. Para la raza Alpino Francés x Criollo,
donde los valores son muy parecidos tiene una media igual a 15,14 litros. En conjuntos d
valores donde existan valores muy extremos, no se debe calcular la media aritmética. En
estos casos se recomienda calcular la mediana.
Mediana (Md).
Se ordenan los datos en forma creciente o decreciente. En el caso de que el número de
casos sea impar, la puntuación mediana es el puntaje del centro. Si el número de casos es
par la puntuación mediana, resulta de sumar y dividir entre los dos puntajes centrales de la
serie de datos.
EJEMPLOS:
1. Nubian x Criollo.
4.37 - 5.80 - 6.77 - 9.30 – 9.44 – 10.42 – 10.45 – 10.62 - 12.40 - 15.80
La mediana: litrosMd 93.9
2
42.1044.9
Md = 9.93 litros
Para la raza Nubian x Criollo por debajo y por encima de 9.93 litros se encuentran el
50% de los casos, es decir, que el 50% del rebaño tiene una producción superior a los
9.93 litros y el otro 50 % del rebaño inferior a 9.93 litros.
67. 67
2. Alpino Francés x Criollo.
11.90 - 14.25 - 14.25 - 14.25 - 15.14 - 16.34 - 19.85
La mediana: Md = 14.25 litros.
Md = 14.25 litros
En la raza Alpino Francés x Criollo, el 50% del rebaño tienen una producción
superior a los 14.25 litros y el 50% restante inferior a dicho valor.
3. Criollo.
4.41 - 4.20 - 7.02 - 8.94 - 8.94 - 8.95 - 8.95
La mediana: litrosMd 94.8
2
94.894.8
Md = 8.94 litros
Para la raza Criolla, el 50% de ellos, tienen una producción superior a los 8.94 litros y
el otro 50% inferior a dicho valor.
Moda (Mo).
Es el valor que aparece con más frecuencia en una serie de datos.
EJEMPLOS
Nubian x Criollo.
4.37– 5.80 – 6.77 – 9.30 – 9.44 – 10.42 – 10.45 – 10.65 – 12.40 - 15.80
Para esta raza, ningún valor se repite, por lo tanto no hay moda.
Alpino Francés x Criollo.
11.90 –14.25 – 14.25 – 14.25 – 15.14 – 16.34 – 19.85
La moda: Mo = 14.25 litros.
Mo= 14.25 lts.
68. 68
Este valor se repite tres veces.
Criollo.
4.20 – 4.41 – 7.02 – 8.94 – 8.94 – 8.95- 8.95 – 8.99
La moda: Mo = 8.94 litros y Mo = 8.95 litros.
En este caso, los valores 8.94 y 8.95, se repiten dos veces, por lo tanto, existe dos
modas. Siendo la distribución bimodal.
De acuerdo al número de modas, una distribución puede ser: modal, bimodal,
multimodal.
La media ponderada ( y )
Por ejemplo la media ponderada para las tres razas ovinas:
8710
854.7713.151024.9
31
332211
nnn
nYnYnY
Y
litrosy 46.10
25
63.261
25
32.6091.1054.95
La media ponderada de las tres razas es igual a 10.46 litros.
Y = 10.46 lts
69. 69
EJERCICIO Nº 5
Seleccione un conjunto de medidas para una variable discreta y una continua y calcule la
media aritmética, la mediana y la moda para cada una de las series numéricas escogidas
Edad en vacas de primer parto (días):
1.190 – 1.135 – 1.230 – 1.195 – 1.205 – 1.195 – 1.201 – 1.159 – 1.200
Peso del vellón (Kg) de ovinos:
4.3 – 3.8 – 3.9 – 4.0 – 4.4 – 4.5 – 3.9 – 3.8 – 4.9 – 4.9
1. Lee el objetivo Nº 6 de la página Nº 50 de la guía.
70. 70
2. Lee la información que a continuación aparece.
3. Leída e interpretada la información señalada, realiza el ejercicio Nº6.
Cálculo de la media aritmética, la mediana y la moda, para una tabla de distribución de
frecuencias.
EPISODIOS (DÍAS) TABLA DE 6.1 DE FIEBRE EN ADOLESCENTES EN
UNA REGION DEL PAIS
Clases c.c Fi Fa Fr Far
(días)
6-10 8 6 6 3.1 3.1
11-15 13 40 46 20.4 23.5
16-20 18 81 127 41.3 64.8
21-25 23 59 186 30.1 94.9
26-30 28 10 196 5.1 100
Total 196 100
FUENTE: Propia
La media aritmética ( y )
Cuando los datos se encuentran tabulados, para calcular la media aritmética, se utiliza
la formula para datos agrupados:
Fi
Ficc
y
Donde:
Ficc Es la sumatoria de los productos de cada frecuencia por el valor del centro de
clase.
71. 71
Fi Número total de casos que representa la sumatoria de las frecuencias
absolutas.
Veamos cada uno de los pasos para calcular la media aritmética, para la tabla de
distribución de frecuencias correspondientes a: Episodios (días) de fiebre en adolescentes.
1. Se elabora una columna con el producto de cada frecuencia por su centro de clase
(c.c x Fi).
2. Se suman los valore de la columna (c.c x Fi), para obtener la cc x Fi.
3. Se reemplazan los valores en la formula.
Clase c.c Fi cc x fi
6-10 8 6 48
11-15 13 40 520
16-20 18 81 1458
21-25 23 59 1357
26-30 28 10 280
Total 196 3663
FUENTE: Propia
días
Fi
Ficc
y 7.18
196
3663
y =18.7 días
La duración promedio de la fiebre es aproximadamente de 19 días.
La mediana (Md)
Para calcular la mediana a partir de un conjunto de datos que han sido organizados
previamente en una tabla de distribución de frecuencias, se procede de la siguientes
manera: a partir de la tabla sobre los episodios (días), de fiebre en adolescentes. En este
caso, se utiliza la formula para datos agrupados:
72. 72
IC
Fi
Fan
LiMd
2
Donde:
Li = límite inferior de la clase medianal.
2
N = Mitad del número total de casos.
Fa = frecuencia acumulada de la clase que precede a la contiene a la mediana.
Fi = frecuencia absoluta de la clase que contiene a la mediana.
IC = intervalo de clase.
Veamos los pasos para su cálculo.
1. Dividir entre 2 el número total de casos (
2
N ). Es decir, se determina el número
de casos que han de estar por encima y por debajo de la mediana.
En el ejemplo, N, es igual a 196, por lo tanto
2
N =
2
196 = 98. Así la mediana
es el valor que deja 98 observaciones, tanto por debajo como por encima de él.
2. Identificar en la columna de frecuencia acumulada (Fa), un valor que sea igual o
inmediato superior a 2
N ; en la clase correspondiente está la mediana, si
observamos en la tabla del ejemplo, la columna (Fa), aparece el valor 127 que es
inmediato superior a 98. Por lo tanto, la clase medianal es igual a 16-20 y
contiene la mediana.
3. Identificar el límite inferior de la clase medianal. En nuestro ejemplo el límite
inferior de la clase medianal es igual a 16.
4. Identificar la frecuencia acumulada (Fa) de la clase anterior a la contiene a la
mediana. En nuestro caso es la frecuencia acumulada que precede a la clase
medianal.
5. Identificar la frecuencia absoluta (Fi) de la clase medianal. Siendo en el ejemplo
igual a 81.
Resumiendo y reemplazando en la fórmula.
Clases c.c Fi Fa
73. 73
Clase
Medianal
6-10 8 6 6
11-15 13 40 46
16-20 18 81 127
21-25 23 59 186
26-30 28 10 196
Total 196
IC
Fi
Fan
LiMd
2
1920.195
81
4698
16
Md
Md = 19 días
La moda.
La moda es igual a:
ICLiMo
21
1
Donde:
Li = Límite inferior de la clase modal.
1 = Frecuencia absoluta de la clase modal menos la frecuencia absoluta de la clase
premodal.
2 = Frecuencia absoluta de la clase modal menos la frecuencia absoluta de la clase
posmodal.
I.C = Intervalo de clase
74. 74
Para el cálculo de la moda se siguen los siguientes pasos:
1. Identificar la clase modal, que corresponde a la clase con mayor frecuencia
absoluta. Para el ejemplo, la clase modal, va de 16-20.
2. Identificar el límite inferior de la clase modal. En el ejemplo el límite inferior de
la clase modal es igual a 16.
3. Calcular la diferencia entre la frecuencia absoluta de clase modal y la frecuencia
absoluta de la clase premodal para obtener el 1. Para el ejemplo sería:
1 = 81 – 40 =41
4. Calcula la diferencia entre la frecuencia absoluta de la clase modal y la
frecuencia absoluta de la clase posmodal, para obtener el 2. Para el ejemplo
sería: 2 =81-59=22
5. Calcular el intervalo de clase. En el ejemplo es igual a 5.
6. Sustituir en la fórmula los valores obtenidos:
Clases Fi
6-10 6
11-15 40
Clase modal 16-20 81
21-25 59
26-30 10
Total 196
5
2241
41
16Mo Mo=19.25
Mo = 19 días
El valor que más se repite es 19.
75. 75
AUTOEVALUACION
A continuación se le presenta una serie de situaciones a que las resuelva, y así ponga
en práctica los objetivos alcanzados para la sub-unidad 3.
1. Calcule la media aritmética, la mediana y la moda, para cada uno de los
siguientes conjuntos de medidas.
Niveles de anticuerpos de cero protección.
0.0 – 0.5 – 1.0 – 1.5 – 2.0 – 2.5 - 3.0 – 3.5 – 4.0
Porcentaje de agua en el cuerpo humano.
70 – 65 – 49 – 55 – 52 – 50 – 45 – 43 – 52 - 70
Porcentaje de hemoglobina en Varones
35 – 40 - 15-15 – 30 – 35 – 20 – 25 – 25 – 25 – 35 – 35 – 40 - 70
15 – 13 – 16 – 16 – 13 – 12 – 12 – 12 – 12 - 10 – 13 – 14 – 10 – 10 – 15
Millones de glóbulos rojos por milímetro cúbico
7.3-6.5-7.7-5.4-6.7-5.1-7.0-8.5-7.8-6.7-6.7-8.6-7.5-7.2-6.5-5.8
2. En cual de los conjuntos de medidas del ejercicio anterior (1) es la medida
aritmética una medida de tendencia central inadecuada? Explique por qué y cuál
medida considera debe usarse en este caso.
3. Los valores siguientes representan volumen sanguíneo expresado en cm cúbico:
Clases Fr
1.10-1.59 10
1.60-2.09 3
76. 76
2.10-2.59 6
2.60-3.09 3
3.10-3.59 4
3.60-4.09 1
a) Calcule.
Media aritmética.
Mediana.
Moda.
b) Interprete los resultados obtenidos.
4. Se compararon dos grupos de niños varones 6 meses después de aplicar dos
tratamientos para aumentar de peso, los pesos individuales resultantes fueron
Tratamiento Peso (Kgrs)
(A) 120 – 137 – 101 – 104 – 117 – 119 – 115 – 125 – 135
(B) 22 – 30 – 39 – 12 – 30 – 20 – 15 – 25 – 35
Calcule, la media ponderada e interprete el resultado obtenido.
UNIDAD I
Objetivo Terminal
Dada una serie numérica, el estudiante calculará las medidas de
dispersión, explicando la razón del uso de cada una de las medidas y
utilizará la regla empírica y el teorema Tchebysheff para describir la
serie numérica.
SUB-UNIDAD 4
77. 77
1. Lee el objetivo Nº 1 de la página Nº 70 de la guía.
SecuenciadeAprendizaje
78. 78
2. Con la información que obtengas, estarás en condición de leer para buscar indicadores
respecto al tema en estudio.
3. Lee detenidamente la información que aparece a continuación.
4. Una vez realizada esta actividad, realiza el ejercicio Nº1.
Las medidas de tendencia central no son suficientes para describir una determinada
población, pues diferentes poblaciones que presentan medidas de concentración iguales
pueden distribución alrededor de su media de forma completamente distinta. Por
consiguiente, se hace necesario medir estas variaciones para poder evaluar el tipo de
distribución alrededor de la media. Esto es posible, por medio de las medidas de dispersión.
Una medida de variabilidad es un número que expresa la medida en que los valores de una
serie de datos varían alrededor de una medida de tendencia central. La variabilidad baja
indica una distribución homogénea, mientras que una variabilidad alta indica una
distribución relativamente heterogénea
Las medidas de dispersión, son proporcionales a la variabilidad de las observaciones;
es decir, presentarán valores mayores en las poblaciones de menor uniformidad en sus
observaciones. Las medidas más utilizadas son:
Amplitud de Variación (AV).
Desviación Media (DM).
Desviación Típica Estándar (S).
Varianza (S2)
Coeficiente de Variación (CV)
EJERCICIO Nº1.
Define, medidas de dispersión.
79. 79
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
1. Lee el objetivo Nº 2 de la página Nº 70 de la guía.
2. Con la información que obtengas, estarás en condición de leer para buscar indicadores
respecto al tema en estudio.
3. Lee detenidamente la información que aparece a continuación.
4. Leída la información señalada, realiza el ejercicio Nº 2.
Amplitud de Variación (AV)
La medida más sencilla de dispersión es la amplitud. Se usa cuando queremos una
comparación rápida entre dos distribuciones. No nos informa nada acerca de su forma. Es,
sencillamente, la diferencia entre los valores extremos presentado por las observaciones
consideradas.
Expresado en forma algebraica:
AV = VM – vm
Donde:
VM = valor mayor.
Vm = valor menor.
Desviación Media (DM).
La desviación media tuvo gran importancia en el pasado, es útil para tratar
situaciones en las que no se requiere un análisis minucioso. Como base para la comparación
de la dispersión existente en varias distribuciones, es bastante práctica. Así, por ejemplo,
cuando mayor es la dispersión de calificaciones, tanto mayor es el valor de la desviación
media.
80. 80
La desviación media se define, como la media aritmética de todas las desviaciones
respecto de la media, sin tener en cuenta los signos, es decir, tomados en su valor absoluto.
Debe ser la suma en valor absoluto, pues ya sabemos que si se tiene en cuenta el signo, la
suma de los desvíos a la media da siempre cero.
Expresado en forma algebraica:
n
yy
DM
Donde:
(Sigma) = Sumatoria.
yy = Diferencia absoluta de cada observación con respecto a la media
aritmética.
N = Número total de casos.
Desviación Típica ( o s)
Es el índice de variabilidad más común y de mayor confianza, es decir, aquel que
varía menos cuando se calcula para distintas muestras extraídas de la mismas población o
universo. Es un valor simple, un índice que representa todas las diferencias individuales de
las observaciones respecto a un punto de referencia común, que es la media aritmética. Se
entiende entonces que cuando este valor es pequeño, las diferencias de los valores respecto
a la media, es decir, los desvíos, son menores y, por lo tanto, el grupo de observaciones es
más “homogéneo”. O sea, que a menor dispersión mayor homogeneidad en el conjunto, y
mayor dispersión menor homogeneidad.
La desviación típica se define, como la raíz cuadrada de la suma de los cuadrados de
las desviaciones con respecto a la media dividida por el número total de casos. Su valor se
expresa en las misma unidades que la variable.
Algebraicamente, la desviación típica se expresa:
Para la población:
81. 81
N
Yi
2
o
N
YiYi n
2
2
Donde:
2
Yi Sumatoria de las diferencias al cuadrado de cada una de las
observaciones con respecto a la media poblacional ( ).
N = Número total de casos en la población.
Para la muestra:
1
2
n
YYi
s o
1
2
2
n
YiYi
s
n
Donde :
2
YYi = Sumatoria de las diferencias al cuadrado de cada una de las
observaciones con respecto a la media muestral (Y ).
N = Número total de casos presente en la muestra.
2
Yi = Sumatoria del cuadrado de cada una de las observaciones.
2
Yi = Cuadrado de la suma de las observaciones y se representa en forma
simplificada por “SC”.
A los denominadores de las últimas fórmulas se les denomina “grados de libertad”, y
se representan en forma simplificada por “GL”.
Varianza (2
o s2
).
82. 82
Se obtiene elevando al cuadrado la desviación típica, su símbolo es por lo tanto la
desviación típica al cuadrado; sigma al cuadrado 2
cuando se requiere indicar el verdadero
parámetro de la población s2
para la estimación a partir de una muestra.
Tanto la desviación típica como la varianza tiene algunas propiedades, como por
ejemplo, si todo los valores se suman o se restan por una constante, la desviación típica y la
varianza no cambian. Si todos los valores se multiplican o dividen por una constante, la
desviación estándar y la varianza resultan multiplicadas o divididas por la constante
utilizada.
Simbólicamente la varianza se expresa:
Población:
N
Yi
2
2
o también
N
YiYi n
2
2
2
Muestra:
1
2
2
n
YYi
s o también
1
2
2
n
YiYi
s
n
Varianza Promedio (Sp2
)
Si se tiene dos o más muestras, cada una de ellas con: n1, n2 y nk, conocidas, podemos
determinar la varianza promedio, utilizando la siguiente expresión algebraica:
1...11
1...11
21
2
2
2
2
2
2
21
2
2
1
2
k
kk
nnn
nYYSnYYSnYYS
Sp
83. 83
Cuando: YYYY n 21 entonces:
1...11
1...11
21
2
2
2
21
2
12
k
kk
nnn
nSnSnS
Sp
Cuando: YYYY n 21 además n1 = n2= nn entonces:
2
2
2
2
12 SS
Sp
Coeficiente de Variación (CV).
Las medidas de variación relativa permiten la comparación de dos o más series,
cualesquiera sean las magnitudes de las medidas de tendencia central y la naturaleza de las
unidades originales de las distribuciones.
Las medidas de dispersión relativa son relaciones entre medidas de dispersión
absoluta ( amplitud de variación, desviación típica) y medidas de tendencia central: las
cuales vienen expresadas en porcentajes.
La medida de variación relativa de mayor importancia y la que más se emplea, es el
coeficiente de variación que se expresa en porcentaje y se calcula por la relación que existe
entre la desviación típica y la media aritmética.
Expresada en forma algebraica:
100.
Y
S
VC
Una característica útil del coeficiente de variación consiste en que es independiente
de las unidades en las cuales se han efectuado las medidas. Así, si se desea, se puede
comparar arrobas de carne, con litros de leche.
A continuación se presentan diferentes situaciones que se debe tomar en cuenta para
utilizar el coeficiente de variación.
1. Cuando las distribuciones se refieren a conjuntos de la misma especie y tienen
medias similares, es el único caso en que sus desviaciones típicas pueden
84. 84
compararse entre sí directamente; si dos grupos de animales tienen pesos cuyas
medias son iguales, pero medidas de variabilidad distintas, se puede afirmar que
son más homogéneas las pesadas del grupo, con medidas de variabilidad menores.
2. Cuando las distribuciones se refieren a conjuntos de distintas especies; por
ejemplo: alzadas y pesos.
3. Cuando las distribuciones son conjuntos de igual denominación o especie y tiene
medias diferentes.
En estos dos últimos casos no son comparables directamente las medidas de
variabilidad de una y otra absoluta; para hacerlas comparables se relacionan con algunas
medida de la distribución relativa, la más usada es el coeficiente de variación.
Otros casos donde puede ser usado el coeficiente de variación.
Cuando en un conjunto se quiere saber donde hay mayor variabilidad en cuanto a dos
características (unidades desiguales). Por ejemplo, entre porcentaje de grasa y producción
láctea en el ganado tipo Carora.
Cuando se tiene dos grupos y se quiere saber, donde hay mayor variabilidad en
cuanto las características. Por ejemplo, entre la producción láctea de un rebaño de la raza
Holstein y un rebaño de la raza Pardo Suizo.
El coeficiente de variación, no se debe emplear cuando la variable utilizada no tiene
un cero verdadero. Por lo tanto, esta medida sirve para comparar las dispersiones de dos o
más distribuciones, cuyas observaciones han sido medidas en escala de razones
únicamente.
EJERCICIO Nº2
1. En qué se diferencia las medidas de dispersión absolutas de las dispersión relativa.
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
85. 85
2. Todas las medidas de dispersión se expresan en las misma unidades de la variable.
Razone su respuesta.
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
3. Qué diferencia hay entre medidas de dispersión y medidas de concentración.
4. Que importancia tienen las medidas de dispersión
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
1. Lee el objetivo Nº 3 de la página Nº 70 de la guía.
2. Lee la información que a continuación se presenta.
3. Leída e interpretada la información, realiza el ejercicio Nº 3.
Uso de las medidas de dispersión:
Amplitud de variación (AV).
Es la medida de variabilidad más fácil de calcular y la más sencilla, pero la menos
utilizada debido a que es la menos confiable por depender sólo de los dos valores extremos,
es la menos estable ya que de una muestra a otra la amplitud varía más que cualquiera de
las otras medidas.
86. 86
Desviación Media (DM).
Es una medida de variabilidad que toma en cuenta todos los valores observados. Es
útil para tratar situaciones en las que no se requiere un análisis minucioso.
Desviación Típica ( o s )
Es la medida más utilizada, ya que es la más confiable y estable. Es confiable por
cuanto en su cálculo intervienen todos los valores de la distribución, y es estable ya que al
ser calculada en diferentes muestras sus resultados no varían mucho.
Varianza Promedio (Sp2
)
Se utiliza cuando se tienen dos más muestras y se desea conocer la varianza total o
promedio de las muestras.
Coeficiente de variación (CV).
Es una medida relativa de dispersión y se utiliza para comparar las dispersiones de
dos más distribuciones, cuyas observaciones han sido medidas en escalas de razones
únicamente.
EJERCICIO Nº3.
Entre las medidas de dispersión, cual considera usted que presta mayor utilidad,
razone su respuesta.
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
________________________________________________________________________
1. Lee el objetivo Nº 4 de la página Nº 70 de la guía.
87. 87
2. Lee la información que a continuación se presenta.
3. Leída e interpretada la información, realiza el ejercicio Nº 4.
Cálculo de las Medidas de Dispersión.
Amplitud de Variación (AV)
AV = VM - vm
EJEMPLOS:
1. Nubian x Criollo
4.37 - 5.80 - 6.77 - 9.30 - 9.44 - 10.42 - 10.45 - 10.65 - 12.40
15.80 AV = 15.80 – 4.37 = 11.43 lts.
AV = 11.43
2. Alpino Francés x Criollo
11.90 - 14.25 - 14.25 - 14.25 - 15.14 - 16.34 - 19.85
AV = 19.85 – 11.90 = 7.95 lts.
AV= 7.95
3. Criollo.
4.20 - 4.41 - 7.02 - 8.94 - 8.94 - 8.95 - 8.95 - 8.99
AV = 8.99 - 4.20 =4.79 lts.
AV = 4.79 lts.