Actividad de aprendizaje_iasa_nro_01_ramiro_guerron
1. ANÁLISIS EXPLORATORIO DE DATOS
GUÍA 1 – Ejercicios de Aplicación
Actividad de aprendizaje semana 1
Análisis Exploratorio de Datos
2. Nombre del estudiante
Carrera Ingerniería Agropecuaria
NRC 7500
Nombre del profesor Ramiro Guerrón Varela
Indicaciones:
• Ponga el nombre en todas las hojas de su deber
• Realizar en orden los siguientes ejercicios
• Encerrar su respuesta en un rectángulo
• Entregar en la fecha establecida
3. Guía No. 01
ESTADÍSTICA A501
Resuelva cada uno de los siguientes ejercicios
1. De un registro de los nacimientos de un hato de ganado bovino, se tuvo la siguiente información:
Tabla 1. Registro nacimientos bovinos
ID
Peso al
nacer
(kg)
Raza
madre
Raza del
padre
Fecha
nacimiento
Edad madre al
parto
(meses)
Intervalo del
parto
(días)
Sexo
Número
de
parto
H24.13 24,5 3/4 SP 3/4 SP 12/1/2021 98 320 H 1
H24.14 25,2 3/4 SP 3/4 SP 20/2/2021 114 360 H 2
H24.15 27,1 3/4 SP 3/4 SP 22/2/2021 160 340 M 3
H24.16 26,3 3/4 SP 3/4 SP 4/4/2021 120 300 M 2
Determinar:
a. ¿Cuántas variables hay en este conjunto de datos?
b. ¿Cuántas observaciones hay en este conjunto de datos?
c. ¿Cuántas variables son cualitativas?
d. ¿Cuáles variables son cualitativas?
e. ¿Cuáles variables son cualitativas nominales?
f. ¿Cuáles variables son cuantitativas?
2. En un diseño de experimentos en la producción de maíz, se generó una base de datos que generó la siguiente información:
Basado en información de la tesis de graduación “CARACTERIZACIÓN AGRO-MORFOLOGICA DEL MAÍZ (Zea mays L.) de la localidad
San José de Chazo” desarrollada por Edison Fernando Guacho Abarca, Escuela Superior Politécnica de Chimborazo (2014)
Tabla 2. Información cualitativa y cuantitativa de maíz
Obs.
Forma de la
mazorca
Disposición
hileras de
grano
Forma del
grano
Forma
superficie
del grano
Longitud
mazorca
(cm)
Diámetro
mazorca
(cm)
Peso de
mazorca
(g)
Número
hileras
mazorca
Número
granos
por
hilera
Peso
medio
grano
(g)
Porcentaje
humedad
(%)
001 Cilíndrica Regular Puntiagudo Plano 14,5 6,2 225,7 12 21 37,2 18,5
002 Cónica Espiral Redondo Puntiagudo 15,2 5,8 215,1 11 23 35,3 18,7
003 Alargada Irregular Amarillo Redondo 12,7 6,2 182,8 13 20 34,0 11,8
004 Cilíndríca-cónica Espiral Blanco Plano 14,2 5,9 201,5 12 21 36,4 15,5
005 Alargada Irregular Blanco Plano 14,8 6,2 244,5 12 21 41,0 21,4
006 Cilíndríca-cónica Espiral Blanco Plano 16,0 6,2 262,6 11 22 48,6 19,8
007 Cónica Irregular Blanco Puntiagudo 13,5 6,4 209,4 13 22 35,2 13,3
008 Alargada Regular Amarillo Redondo 16,7 6,3 270,4 11 23 45,1 19,3
009 Cilíndrica Regular Blanco Plano 14,8 6,2 215,4 12 23 35,7 19,4
010 Cónica Espiral Blanco Puntiagudo 14,9 6,1 220,5 12 22 38,8 18,8
Determinar:
a. ¿Cuántas variables hay en este conjunto de datos?
b. ¿Cuántas observaciones (elementos, registros) hay en este conjunto de datos?
c. ¿Cuántas variables son cualitativas?
d. ¿Cuáles variables son cualitativas?
e. ¿Cuáles variables son cualitativas nominales?
f. ¿Cuáles variables son cuantitativas?
g. ¿Cuáles variables son cuantitativas discretas?
h. Construir una tabla de frecuencias de la forma de la mazorca
i. Construir una tabla de frecuencias relativas de la forma de la mazorca
j. Construir un diagrama de frecuencias (tabla de frecuencias) de forma de la mazorca
k. Construir un diagrama de pastel (circular, pie) de la forma del grano
4. 3. Una empresa de producción de carne ha registrado las características promedias de sus animales, la que se presenta en la siguiente tabla:
Tabla 3. Características de ganado bovino
ID Sexo Raza Color
Peso
maduro
(kg)
Alzada
(cm)
Temperamento
Peso
nacer
(kg)
Promedio
lactancia
Días de
gestación
Porcentaje
de grasa
(leche)
Porcentaje
proteína
(leche)
Procedencia
001 H Holstein Blanco y negro 600 140 Dócil 35,0 6080 279 4,0 3,3 Holanda
002 H Jersey Cervuno 400 127 Nerviosa 25,0 4007 279 6,0 4,2 Reino Unido
003 H Pardo suizo Castaño 630 138 Dócil 36,0 5153 290 4,0 3,7 Suiza
004 H Ayrshire Rojo y blanco 540 135 Nervioso 30,0 5058 279 4,1 3,5 Escocia
005 H Normando Café con blanco 700 135 Dócil 29,0 4100 283 4,2 3,6 Francia
006 M Holstein Blanco y negro 990 140 Dócil 39,0 6080 279 4,0 3,3 Holanda
007 M Jersey Cervuno 700 155 Nerviosa 27,0 4007 279 6,0 4,2 Reino Unido
008 M Pardo suizo Castaño 900 128 Dócil 40,0 5153 290 4,0 3,7 Suiza
009 M Ayrshire Rojo y blanco 835 137 Nervioso 34,0 5058 279 4,1 3,5 Escocia
010 M Normando Café con blanco 1100 155 Dócil 34,0 4100 283 4,2 3,6 Francia
4. Según información tomada de la FAO, la producción por continente de arroz en el año 2015, se distribuyó de la siguiente manera:
Tabla 4. Producción mundial de arroz
Continente Producción Millones (TM)
Asia 669,2
África 28,7
América 36,8
Europa 4,2
Oceanía 0,7
Total 739,6
Se pide construir:
a. Tabla de distribución de frecuencias relativas y relativas porcentuales.
b. Tabla de distribución de frecuencias relativas acumuladas y relativas acumuladas porcentuales
c. Diagrama de Pareto
d. Diagrama de Pastel
5. De acuerdo al III Censo Agropecuario, tomado del Informe “Nota de Análisis Sectorial Agricultura y Desarrollo Rural” realizado por el Centro
de Inversiones de la FAO y la Corporación Andina de Fomento (CAF), en su página 7 (http://www.fao.org/3/ak168s/ak168s00.pdf), se obtuvo
la siguiente información:
Tabla 5. Uso del suelo en Ecuador (2000)
Uso del Suelo Hectáreas
Cultivos perennes 1.363.400
Cultivos transitorios y barbecho 1.231.675
Descanso 381.304
Pastos cultivados 3.357.167
Pastos naturales 1.129.701
Otros usos 4.892.584
Fuente: III Censo Agropecuario 2002
Construya:
a. Una tabla de distribución de frecuencias relativas
b. Una tabla de distribución de frecuencias acumuladas
c. Un diagrama de distribución de frecuencias
d. Un diagrama de distribución de frecuencias relativas
e. Un diagrama de Pareto
f. Un diagrama de pastel (circular)
5. 6. En la encuesta de superficie y producción agropecuaria realizada en el año 2012, se registró la cantidad de cabezas de ganado existentes, a nivel
nacional. Los tipos de ganado en Ecuador son los siguientes: “Tomado de la tesis de Saragozín Herrera, Tanya Carolina (2015). Aplicación de la
NIC 41 (Agricultura, en la empresa Sotomayor Roche e Hijos Cía. Ltda. dedicada a la producción y venta de leche cruda. Trabajo de investigación
para optar por el grado de Ingeniera en Contabilidad y Auditoría CPA. Facultad de Ciencias Administrativas. Quito UCE.”
(http://www.dspace.uce.edu.ec/bitstream/25000/9011/1/T-UCE-0003-CA176-2015.pdf )
Tabla 6. Cabezas de ganado
Ganado Cantidad (miles)
Vacuno 5 200
Porcino 1 200
Ovino 711
Asnal 121
Caballar 338
Mular 120
Caprino 109
Realizar:
a. Una tabla de distribución de frecuencias relativas
b. Una tabla de distribución de frecuencias acumuladas
c. Un diagrama de distribución de frecuencias
d. Un diagrama de distribución de frecuencias relativas
e. Un diagrama de Pareto
f. Un diagrama de pastel (circular)
7. La siguiente información es tomada del informe 196 del COE Nacional del Ecuador,
Tabla 7. Número de fallecidos COVID
Con esta información construir:
a. Una tabla de distribución de frecuencias relativas
b. Una tabla de distribución de frecuencias acumuladas
c. Un diagrama de distribución de frecuencias
d. Un diagrama de distribución de frecuencias relativas
e. Un diagrama de Pareto
f. Un diagrama de pastel (circular)
6. 8. Una empresa productora de jugo de frutas, adquirió un lote de naranjas, del cual extrajo una muestra de 40 unidades y se registró el peso
en gramos, los resultados se presentan en la siguiente tabla:
Tabla 8. Peso de un lote de naranjas (g)
147 154 157 163 164 165 171 175
177 178 179 180 193 195 198 200
202 204 204 207 210 211 213 217
220 220 221 224 233 233 239 241
245 246 247 257 281 284 331 336
Con esta información encontrar:
a. media.
b. moda
c. mediana
d. desviación media
e. varianza.
f. desviación estándar
g. coeficiente de variación
h. error típico
i. El coeficiente de asimetría (sesgo).
j. La curtosis.
k. Hallar el rango intercuartílico
9. Con la información tomada del COE Nacional,
Tabla 9. Fallecidos por COVID-19 por sexo
a. media.
b. moda
c. mediana
d. desviación media
e. varianza.
f. desviación estándar
g. coeficiente de variación
h. error t pico
i. El coeficiente de asimetría (sesgo).
j. La curtosis.
k. Hallar el rango intercuartílico
7. 10. La información siguiente es proporcionada por el Instituto Nacional de Estadística y Censos, sobre la producción de Silvicultura y
extracción de madera desde el 2006 hasta el 2019.
Tabla 10. Venta de producción silvicultura y extracción de madera en (Millones USD)
Año Silvicultura Extracción de madera
2006 11,8 18,7
2007 13,5 24,1
2008 15,2 30,5
2009 16,9 34,3
2010 16,5 33,7
2011 19,9 40,3
2012 18,5 45,1
2013 17,5 61,7
2014 18,3 59,4
2015 11,2 64,0
2016 9,4 55,0
2017 9,7 47,7
2018 11,0 51,4
2019 9,2 45,7
Con esta información encontrar de cada tiene de producción El(la):
a. Media
b. Moda
c. Mediana
d. Desviación media
e. Varianza.
f. Desviación estándar
g. Coeficiente de variación
h. Error típico
i. El coeficiente de asimetría.
j. La curtosis.
k. Hallar el rango intercuartílico .
11. Con la información del ejercicio anterior, construir:
a. Diagrama de puntos
b. Diagrama de tallo y hojas
c. Caja y bigotes (boxplot)
d. Histograma
12. Si dispone del siguiente conjunto de datos que representan las longitudes de 40 tallos de rosas que fueron tomados en proceso de
muestreo
Tabla 11. Longitudes de tallos a la cosecha
71,5 72,4 72,7 74,0 74,0 76,2 77,0 77,0 77,1 77,1
79,1 80,3 81,0 82,3 82,7 83,7 85,3 86,4 87,0 87,1
87,1 87,1 88,3 88,5 88,6 88,7 89,0 89,1 89,8 90,7
91,2 91,4 92,5 93,3 93,5 94,9 95,2 95,8 95,9 96,9
97,0 97,0 97,2 97,4 99,3 103,0 106,0 108,0 108,1 110,3
Con esta información encontrar de cada tiene de producción El(la): Media
a. Moda
b. Mediana
8. c. Desviación media
d. Varianza.
e. Desviación estándar
f. Coeficiente de variación
g. Error típico
h. El coeficiente de asimetría.
i. La curtosis.
j. Hallar el rango intercuartílico
13. Con la información del ejercicio anterior, construir:
a. Diagrama de puntos
b. Diagrama de tallo y hojas
c. Caja y bigotes (boxplot)
d. Histograma
14. Una empresa productora de madera, tiene una siembra de pino(Pinus Patula), ha tomado una muestra de la altura de 100 árboles,
que se presenta a continuación:
31,3 28,6 24,7 32,2 29,9 29,5 32,1 34,8 26,2 28,5
28,2 22,7 29,1 35,0 22,4 32,0 36,0 32,8 33,4 28,7
24,0 33,8 31,8 24,5 33,4 28,5 31,3 22,5 29,5 29,5
25,3 31,2 29,7 31,0 37,3 27,5 29,4 16,8 33,2 39,5
32,7 32,2 27,5 34,1 28,2 23,5 30,1 24,7 31,7 25,2
28,7 30,7 30,2 29,4 30,0 28,8 32,5 28,6 28,2 27,9
34,0 25,8 29,2 32,4 24,5 35,1 34,6 27,7 30,5 26,4
35,0 32,4 26,1 28,4 29,5 22,4 26,4 35,0 28,4 29,9
24,0 32,6 25,7 29,5 29,9 30,3 31,8 24,4 29,3 31,3
33,8 29,1 30,3 28,1 32,5 28,2 26,0 36,8 25,1 24,5
Con esta información encontrar de cada tiene de producción El(la):
a. Media
b. Moda
c. Mediana
d. Desviación media
e. Varianza.
f. Desviación estándar
g. Coeficiente de variación
h. Error típico
i. El coeficiente de asimetría.
j. La curtosis.
k. Hallar el rango intercuartílico
15. Con la información del ejercicio anterior, construir:
a. Diagrama de puntos
b. Diagrama de tallo y hojas
c. Caja y bigotes (boxplot)
d. Histograma