2. ESTADÍSTICA DESCRIPTIVA
Objetivo:
Informar sobre los propósitos generales de la Estadística y de la
experimentación agrícola destacando su importancia en la
generación de conocimiento y tecnología
3. La experimentación es un método científico de
investigación que consiste en planear y hacer
operaciones prácticas, a nivel de campo y
laboratorio, destinadas a demostrar, comprobar o
descubrir la naturaleza de los fenómenos biológicos o
de los principios básicos que los rigen.
La investigación científica consiste en la búsqueda
permanente de la verdad de los hechos, mediante el
uso de métodos objetivos, adecuados y precisos.
4. El investigador agropecuario en su trabajo
cotidiano se enfrenta a dos tareas fundamentales:
• Descubrir y entender las complejas relaciones entre
variables
• Alcanzar este objetivo a pesar de que los datos estén
contaminados con error experimental
Sir Ronald Fisher mostró como los métodos
estadísticos, y en particular el diseño de
experimentos, ayudan a resolver estos
problemas. El fue quien desarrolló y usó por
primera vez el análisis de varianza como
herramienta fundamental para el análisis
estadístico.
5. El análisis estadístico de una población o universo de datos tiene
como objetivo final descubrir las características y propiedades de
aquello que generó los datos.
Por ejemplo, se tiene una población de plantas frutales y se les
mide la altura. El conjunto de datos de altura constituye una
población o universo estadístico. El análisis de estos datos de
altura sirve para caracterizar la población de plantas frutales.
Si un técnico controla un proceso agroindustrial y recoge una
serie de mediciones que luego las analiza, no es porque esté
interesado en jugar con los números, sino porque a través de los
datos numéricos puede evaluar el comportamiento del proceso,
que es lo que realmente le interesa.
6. El proceso de investigación y transferencia de tecnología
debe concebirse como un proceso continuo de demanda-
oferta-demanda de tecnología.
Los problemas agroproductivos, las alternativas de
solución y los métodos de investigación se definen
participativamente con los actores de la cadena
productiva: Investigadores, productores, organizaciones,
asesores técnicos, comercializadores, procesadores,
industriales y consumidores
7. Investigadores y
Líderes de productores
Asesores técnicos-
Capacitadores - Promotores
Organizaciones de
productores
Dominio de recomendación
Dirección del proceso
Generación Validación Transferencia y
capacitación
Adopción
Retroalimentación
8. La generación de tecnología es un proceso de obtención de
conocimientos, información y recomendaciones útiles para
resolver uno o más factores limitantes de la producción
agropecuaria, mediante la experimentación científica.
GENERACIÓN DE TECNOLOGÍA
Ejemplo: Efecto de la fertilización nitrogenada y del riego
sobre el rendimiento del Cacao de la variedad
Nacional, en la zona de Jipijapa, provincia de
Manabí.
10. La validación de tecnología es una fase de la investigación
agrícola aplicada que se orienta a probar la validez de las
recomendaciones técnicas en diversos ambientes y confirmar
los resultados experimentalmente.
Este proceso de verificación permite, además, incrementar la
confianza en la recomendación técnica, adaptar los
procedimientos a las particulares circunstancias socio
económicas y ecológicas de las fincas de los productores y
demostrar sus bondades en condiciones comerciales.
VALIDACIÓN DE TECNOLOGÍA
11. Una alternativa tecnológica es aplicable a un Dominio de
Recomendación.
Este término se refiere al grupo de agricultores que tienen sus fincas en
un área geográfica con condiciones agro climáticas y socio económicas
similares y aplican prácticas agrícolas con un parecido nivel
tecnológico, de modo que la recomendación probada en una localidad
puede aplicarse, con una alta confianza, en las fincas de esa zona de
influencia.
Ejemplo: Comportamiento del clon de Cacao Nacional ETP-
103, en la zona de Archidona, provincia de Napo.
12. La transferencia de tecnología es una fase
complementaria de la investigación agrícola aplicada
que se orienta a difundir las bondades -en términos
productivos, económicos, sociales y ambientales- de
las recomendaciones técnicas, para promover su
adopción por parte de los productores.
La transferencia de tecnología y capacitación debe
planificarse de manera articulada a un sistema
integrado a otros instrumentos para el desarrollo y la
participación de actores institucionales y gremiales.
TRANSFERENCIA DE TECNOLOGÍA Y CAPACITACIÓN
13. • Generar información útil para innovar los procesos de
producción vegetal y animal
• Adquirir conocimientos sobre las relaciones entre las
plantas cultivadas, los animales y hombre, y de estos con
el ambiente biofísico donde se desarrollan
• Identificar alternativas tecnológicas para corregir y
controlar los factores que limitan la obtención de los
niveles óptimos de producción agropecuaria
• Aprovechar racionalmente los recursos naturales,
económicos y tecnológicos
• Contribuir al desarrollo sostenible del sector agropecuario y
del país.
OBJETIVOS DE LA EXPERIMENTACIÓN AGRÍCOLA
14. VARIACIÓN BIOLÓGICA
Objetivo:
Analizar los principios de la variabilidad biológica,
cuantitativa y cualitativa, las escalas de medición
y su importancia en la experimentación científica
15. La variación biológica es la tendencia de todos los seres vivos
a diferenciarse unos de otros. Es una propiedad de los seres
vivos (vegetales y animales).
En la naturaleza no existen individuos exactamente iguales,
cuando mucho son parecidos.
Los gemelos idénticos, los clones y los híbridos tienden a ser
similares en sus características genotípicas y fenotípicas. Sin
embargo, por los condiciones del ambiente (entorno) tienden a
diferenciarse.
16. Factor genético (G)
Influencia del medio ambiente (A)
Interacción del genotipo y el medio ambiente (G.A)
Efectos mutacionales
La variación biológica se debe a los siguientes factores:
Todo carácter o rasgo fenotípico de un individuo que presenta
variación se conoce como variable.
Estas variaciones pueden ser medidas usando instrumentos de
medición o mediante apreciaciones subjetivas.
17. La variación continua es aquella donde se observa una continuidad de
los efectos que determinan un carácter fenotípico de un individuo o de
los individuos de una población.
La variación continua se asocia un carácter de herencia cuantitativa
(intervienen gran cantidad de genes) y se puede representar en la
denominada distribución normal.
Esta variación se mide usando instrumentos de medición (por ejemplo:
balanza, regla graduada, calibrador de Vernier, espectrofotómetro) y
en base de escalas de intervalo constante.
TIPOS DE VARIABILIDAD BIOLOGICA
La variación biológica puede ser continua o discontinua.
VARIACIÓN CONTINUA
18. A la variación continua se asocian los caracteres cuantitativos o métricos
como: Altura de planta y Peso de los frutos.
La variación continua se manifiesta en el fenotipo de los seres vivos
(variables cuantitativas) y depende del genotipo, ambiente e interacción
genotipo x ambiente.
Fenotipo de un individuo = Genotipo+ Ambiente + Interacción genotipo x ambiente
F= f (G + A + G.A)
19. La variación discontinua es la tendencia, que se observa en los individuos
y las poblaciones vegetales y animales, a presentar discontinuidad en sus
rasgos o caracteres; es decir, que los fenotipos son fácilmente diferenciables
en forma visual.
En este caso las diferencias entre los individuos son de naturaleza
cualitativa.
Ejemplo: Color de los
frutos
1. Rojos
2. Amarillos
VARIACIÓN DISCONTINUA
20. Los efectos mutacionales se expresan en la variación cualitativa de un rasgo o
carácter fenotípico.
Un caso de mutación podría describirse si en una población de plantas de porte
alto, de manera casual se encuentra una planta enana que en las generaciones
posteriores reproduce esta característica.
Los efectos mutacionales se expresan en una variación de naturaleza
discontinua de los caracteres fenotípicos.
21. La medición de la variación constituye el acto de registrar la
información (toma de datos) de cada variable, en los individuos que
conforman una muestra o población, empleando escalas.
A cada escala de medición le corresponde un cierto conjunto de
operaciones admisibles.
ESCALAS DE MEDICIÓN DE LA VARIABILIDAD
22. Las escalas de medición pueden ser:
Nominal,
Ordinal,
De intervalo constante sin cero real; y,
De intervalo constante con cero real.
23. La medición de variables discontinuas en escala nominal se da en un
nivel elemental por clasificación cualitativa, sin relación entre sí.
Las medidas en escala nominal simplemente nombran o etiquetan los
caracteres cualitativos.
ESCALA NOMINAL
24. Las letras, solo tienen el propósito de etiquetar un listado de
cultivos o variedades, respectivamente.
Las principales características de la escala nominal se
representan en los siguientes elementos:
Relaciones definidas: Equivalencia
Técnicas estadísticas: No paramétricas
Operaciones admisibles: Moda, distribución de frecuencias y coeficiente de
contingencia
26. La medición en escala ordinal de individuos u objetos considera la relación entre
categorías, estableciendo un orden o rango.
Ejemplo: Escala para clasificar las variedades de café por su grado de resistencia a la roya
ESCALA ORDINAL
27. Relaciones definidas: Equivalencia de mayor a menor
Técnicas estadísticas: No paramétricas
Operaciones admisibles: Moda, Frecuencias, mediana,
percentiles, Correlaciones rs de
Sperman; R y W de Kendall.
La escala ordinal se caracteriza por los
siguientes elementos:
28. Ejercicio: Clasificación de las variedades de café cultivadas en el
Ecuador en relación a los diferentes grados de resistencia a
la roya.
29. La escala de intervalo constante sin cero real tiene los elementos de la escala
ordinal y, además, permite conocer la distancia entre dos números
consecutivos de la medición, a partir de un cero arbitrario.
ESCALA DE INTERVALO CONSTANTE SIN CERO REAL
Ejemplos de escalas de intervalo constante sin cero real:
• Medición de la temperatura (grados centígrados o grados Fahrenheit:
• F0 = 9/5 C0 + 32).
• Medición del tiempo en horas (cero horas = 24HOO).
• Medición de la latitud geográfica (la línea equinoccial es latitud 0°).
30. Relaciones definidas: Equivalencia de mayor a menor, proporción conocida de
intervalo en la escala de medición.
Técnicas estadísticas: Paramétricas y no paramétricas
Operaciones admisibles: Media, correlación r de Pearson, correlaciones múltiples,
desviación estándar y todas las pruebas no
paramétricas.
Esta escala de medición tiene las siguientes características:
31. La escala de intervalo constante con cero real tiene en su origen un punto
0; los datos son obtenidos mediante mediciones empleando instrumentos
(p.e.: cinta métrica, balanza), de esta manera se conoce la distancia entre
dos números consecutivos de la medición y se consideran como verdaderos
números.
ESCALA DE INTERVALO CONSTANTE CON CERO REAL-RAZÓN O
PROPORCIÓN
Ejemplos: * Altura de planta (m)
* Peso del fruto /planta (g).
32. Relaciones definidas: Equivalencia de mayor a menor, proporción
conocida de intervalo en la escala de medición,
valores reales de la escala.
Técnicas estadísticas: Paramétricas y no paramétricas
Operaciones admisibles: Media, correlación r de Pearson, correlaciones,
múltiples, media geométrica, desviación
estándar, coeficiente de variación y todas las
pruebas no paramétricas.
La escala de intervalo constante con cero real se caracteriza por los
siguientes elementos:
33. • Datos Discretos. Son los que resultan de hacer conteos y por lo general
son números enteros.
• Datos Continuos. Son los que resultan de hacer mediciones y pueden
asumir cualquier valor de la recta real.
Son aquellos que resultan de hacer mediciones o conteos. Se
clasifican en dos subtipos:
TIPOS DE DATOS
• Cuantitativos; o,
• Cualitativos
Los datos obtenidos mediante el uso de las escalas de
medición, pueden ser:
DATOS CUANTITATIVOS
34. • Datos Nominales. Son aquellos datos categóricos que pueden ser
codificados numéricamente pero donde hay una relación arbitraria
entre los números asignados y el valor de la variable.
• Datos Ordinales. Son aquellos que al ser codificados numéricamente
deben guardar una correspondencia entre los números asignados y el
verdadero valor de la variable.
Son aquellos que expresan atributos o categorías. Para facilitar el
análisis estadístico de este tipo de datos frecuentemente se codifican
a números. Esta codificación da lugar a dos subtipos de datos
categóricos:
DATOS CUALITATIVOS O CATEGÓRICOS
35. FORMAS DE RECOLECCIÓN DE DATOS
Datos existentes
• Fuentes primarias (encuesta, censo)
• Fuentes secundarias (literatura)
Datos no existentes
• Entrevista (personal, telefónica, por correo)
• Observación directa
• Ensayos
RECOLECCIÓN DE DATOS
36. CARACTERÍSTICAS DE UN INSTRUMENTO DE MEDICIÓN
Se refiere al grado de precisión en que un instrumento mide lo
que se desea medir.
Validez:
Confiabilidad:
Se refiere al grado en que su aplicación repetida, al
mismo sujeto u objeto, produce el mismo resultado.
Los factores que afectan la confiabilidad y la validez son: la improvisación,
instrumentos no validados, lenguaje del instrumento y condiciones de
ambiente
37. ESTADÍSTICA DESCRIPTIVA
Objetivo:
Conocer las aplicaciones del análisis de frecuencias,
la descripción de una variable cuantitativa, estadística
Descriptiva bidimensional y el análisis multivariado.
38. La estadística descriptiva tiene el propósito de describir los rasgos o caracteres
fenotípicos de las poblaciones vegetales o animales; así como, las características
de los objetos que son medibles mediante diferentes escalas, en determinadas
condiciones de tiempo y espacio.
Como parte de la estadística descriptiva se mencionan: el análisis de
frecuencias, las medidas de tendencia central y las medidas de dispersión y
diferentes técnicas de análisis bivariado y multivariado.
39. El análisis de frecuencias es una técnica NO PARAMÉTRICA que
permite interpretar los fenómenos biológicos. Este análisis puede ser en
uno o dos sentidos. El investigador deberá planear cuidadosamente la
recolección de datos para asegurar la calidad de la información
resultante.
Para el análisis de frecuencias se debe iniciar con una graficación de las
distribuciones para valorar los resultados y facilitar la interpretación.
ANÁLISIS DE FRECUENCIAS
40. En la investigación agropecuaria, normalmente se planea, registra y
analiza una variable que se define como la de mayor interés. Los datos
de la variable en estudio deben ser sometidos a un riguroso análisis para
poder generar información confiable.
El análisis de frecuencias, involucra cálculos y graficaciones de los datos
obtenidos en el muestreo.
DISTRIBUCIÓN DE FRECUENCIAS DE UNA
VARIABLE
41. Ejercicio: Realizar un análisis de frecuenciasde los siguientes datos de producción de café cereza:
7601228030
7501046029
730930028
6501155027
650850026
650148025
640735024
580625023
550275022
500267021
4802513620
4602911519
4501845018
4501440017
4501335016
450543015
4301545014
4001745013
400476012
3502465011
3501675010
33037309
300286508
280306407
250235806
25024505
136204004
115193303
70212502
50226501
gramosN° observación(gramos)N° observación
Producción café cerezaPlantaProducción café
cereza
Planta
Datos OrdenadosDatos de campo
42. 8Variabilidad relativa (%)
46Coeficiente de variación (%)
36Error estándar
197Desviación estándar
38823Varianza
450Moda
450Mediana
430Media
710Rango
Cálculo de estadísticos
46. Método STEM & LEAF
Es un método de representación de un histograma de distribución dibujando los datos.
6050307
5050406
8050005
806050505030004
505030003
8050502
36151
70500
Tallo Hojas
6050307
5050406
8050005
806050505030004
505030003
8050502
36151
70500
6050307
5050406
8050005
806050505030004
505030003
8050502
36151
70500
Tallo Hojas
Ejercicio: S & L de la producción de café cereza (gramos / planta)
47. Cuartiles
El análisis de los cuartiles es una técnica de análisis de la
distribución de datos. Para ello se procede de la
siguiente manera:
• Ordenar las observaciones en orden creciente y localizar la
mediana.
• El primer cuartil Q1 es la mediana de las observaciones situadas a
la izquierda de la mediana de la distribución.
• El tercer cuartil Q3 es la mediana de las observaciones situadas a la
derecha de la mediana de la distribución
48. Los cuartiles son medidas de tendencia no central de una distribución.
Los datos ordenados se dividen en 4 cuartos iguales:
El segundo cuartil de una distribución es su mediana.
El Rango Intercuartil es la diferencia entre el tercer y el primer cuartil (Q3-Q1).
25% 25% 25% 25%
Q1 Q2 Q3
25% 25% 25% 25%
Q1 Q2 Q3
290 450 610
Gramos café cereza/planta
610 – 290 = 320 gramos café cereza/planta
49. Percentiles
Los percentiles son otro conjunto de medidas de
tendencia no central de una distribución.
Dividen los datos ordenados en 100 partes iguales.
Percentil 25 = 290 gramos café cereza/planta
Percentil 50 = 450 gramos café cereza/planta
Percentil 75 = 610 gramos café cereza/planta
50. Diagrama de caja
Los cinco números que resumen una distribución de
datos son representados gráficamente por un
diagrama de caja.
L = Observación máxima
Q3 = Tercer cuartil
Q2 = Mediana
Q1 = Primer cuartil
S = Observación mínima
51. Los lados inferior y superior de la caja van del primer al tercer
cuartil. Por tanto, la altura de la caja es la amplitud del 50% de
los datos centrales.
El segmento del interior de la caja indica la mediana. Los
extremos de los segmentos perpendiculares a los lados superior
e inferior indican, respectivamente, los valores máximo y
mínimo de la distribución de datos.
S LQ1 Q2
Q3
50 g 760 g290 g 450 g 610 g
S LQ1 Q2
Q3
50 g 760 g290 g 450 g 610 g
52. DISTRIBUCIÓN DE FRECUENCIAS DE DOS
VARIABLES
La distribución de frecuencias de dos variables, también denominada en
dos sentidos, significa que se analizan dos variables de manera simultánea.
Por ejemplo, analizar la producción de frutos y la altura de las plantas; la
producción de frutos y el área foliar, la producción de frutos y el diámetro
del tallo.
55. Análisis de frecuencias de dos variables
10036,736,726,7POR CIENTO
1003011118TOTAL
103210700<
206321501 – 700
4313463301 – 500
206222101 – 300
72002< 100
8 <5 a 8< 5
TOTAL
PRODUCCION
Gramos /planta
FRECUENCIA
RELATIVA
(%)
PROCENTAJE DE GRANO VANO
10036,736,726,7POR CIENTO
1003011118TOTAL
103210700<
206321501 – 700
4313463301 – 500
206222101 – 300
72002< 100
8 <5 a 8< 5
TOTAL
PRODUCCION
Gramos /planta
FRECUENCIA
RELATIVA
(%)
PROCENTAJE DE GRANO VANO
56. Una variable cuantitativa puede describirse mediante
diferentes medidas que se clasifican en:
DESCRIPCIÓN DE UNA VARIABLE CUANTITATIVA
Medidas de tendencia central
Medidas de dispersión
57. Las medidas de tendencia central son:
Media (simple, aritmética, geométrica, ponderada)
Mediana
Moda
MEDIDAS DE TENDENCIA CENTRAL
58. Xi Máxima = 80
Xi Mínima = 54
Media simple = (80 + 54)/2 = 67
Ejercicio: En un registro de datos se tiene los siguientes valores de
peso: 54, 55, 55, 55, 56, 56, 57, 57, 58,58, 58, 59, 60,
60, 60, 60, 60, 62, 63, 64, 65, 65, 66, 67, 69, 70, 70, 71,
75, 77, 80.
Media simple
(Xi Máxima + Xi Mínima)
2
X =
(Xi Máxima + Xi Mínima)
2
(Xi Máxima + Xi Mínima)
2
(Xi Máxima + Xi Mínima)
22
X =
59. Media aritmética
Ejercicio: Con los datos indicados para la media simple, calcular la media aritmética:
x = 1942/31 = 62.6
n
Xi
X =
n
Xi
X =
31
(54+55+55+55+56+56+57+57+58+58+58+59+60+60+60+60+60+62+63+64+
65+65+66+67+69+70+70+71+75+77+80)
X =
31
(54+55+55+55+56+56+57+57+58+58+58+59+60+60+60+60+60+62+63+64+
65+65+66+67+69+70+70+71+75+77+80)
31
(54+55+55+55+56+56+57+57+58+58+58+59+60+60+60+60+60+62+63+64+
65+65+66+67+69+70+70+71+75+77+80)
X =
60. Clase Límite inferior Límite superior Media (M) Frecuencia (F) M.F
1 50 59 54,5 12 654,0
2 60 69 64,5 13 838,5
3 70 79 74,5 5 372,5
4 80 89 84,5 1 84,5
31 1949,5Suma
Cálculo de la media a partir de datos agrupados
A partir de datos agrupados en clases, se puede calcular la media con la fórmula
siguiente:
Media = M.F/n
Media = 1949.5/31 =62.89
61. Media geométrica
Ejercicio: Un clon de cacao produce un promedio de 10 mazorcas/año y otro clon de cacao produce un
promedio de 60 mazorcas/año. Si estos dos clones se cruzan ¿Cuál es la media de producción
esperada en la primera descendencia?
X =
n
(X1 . X2 . Xn)1 2 . n
X =
n
(X1 . X2 . Xn)1 2 . n
n
(X1 . X2 . Xn)1 2 . n
X1 = 10
X2 = 60
Media geométrica = (10 x60)0.5
= 24.49 unidades
62. La media ponderada es un estadístico que se usa cuando hay diferentes frecuencias de datos. La
fórmula para el cálculo de este tipo de media es la siguiente:
Media ponderada
X =
W i
[ Wi Xi]
X =
[ Wi Xi][ Wi Xi]
X =
[ Wi Xi][ Wi Xi]
X =
[ Wi Xi] Wi
Xi
X =
W i
[ Wi Xi][ Wi Xi]
X =
[ Wi Xi][ Wi Xi]
X =
[ Wi Xi][ Wi Xi]
X =
[ Wi Xi] Wi
Xi
0.282000Septiembre
0.453600Agosto
0.251500Julio
Precio (X)
dólares/litro
Producción mensual (W)
litros
Mes
0.282000Septiembre
0.453600Agosto
0.251500Julio
Precio (X)
dólares/litro
Producción mensual (W)
litros
Mes
Ejercicio: En una finca, por tres meses consecutivos, venden su producción mensual de
leche (litros), a diferentes precios (dólares/litro) según la siguiente descripción:
¿Cuál es el precio promedio/litro?
X = 2555/7100 = 0.36 dólares/litro
Media ponderada= 1500x0.25 + 3600x0.45 + 2000x0.28
1500+3600+2000
63. La Mediana (Md) es el valor central de un grupo
ordenado de datos.
Mediana
Ejercicio: Determinar la mediana en la serie de datos expuestos para
el cálculo de las medias simple y aritmética.
El valor central en la serie de datos referida es el 60.
Md = 60
64. Ejercicio: En la serie de datos referidos para el cálculo de la media simple y
aritmética, estimar la moda
Moda
La Moda (Mod) es el valor mas frecuente en una serie ordenada de
datos.
En la serie de datos mencionada, el valor mas frecuente corresponde
al número 60.
Mod = 60
65. MEDIDAS DE DISPERSIÓN
Las medidas de dispersión son:
Rango o amplitud
Varianza
Desviación estándar
Error estándar
Intervalo de confianza
Variabilidad relativa
Coeficiente de variación de la muestra.
66. El rango o amplitud (Rn) es la diferencia de valores extremos de
una serie de datos. Es una medida que permite definir cuanto se
alejan los puntos extremos con respecto a la media de una
muestra.
Rango o Amplitud
Rn = 80 – 54 = 26
Rn = Xi Máxima – Xi Mínima
Ejercicio: En la serie de datos expuesta para el cálculo de la media simple y
media aritmética, calcular el rango:
67. La varianza es una medida de dispersión que permite conocer la variabilidad de
un carácter o rasgo de objetos de una muestra o población, expresada en unidades
cuadráticas.
El estadístico correspondiente es la media de los cuadrados.
Varianza
Xi
2 - (Xi)2
n
S2 =
n – 1
Xi
2 - (Xi)2
n
S2 =
n – 1
69. Reemplazando los datos en la fórmula de la varianza, se tiene:
7491 - 9
S2 = 152.22/8 =19.03
8
66049
7491 - 9
S2 = 152.22/8 =19.03
8
66049
7491 - 9
S2 = 152.22/8 =19.03
8
66049
7491 - 9
S2 = 152.22/8 =19.03
8
66049
Datos: n = 9
Σ X = 257
(Σ X)2 = (257)2 = 66049
Σ X2 = 7491
Xi
2 - (Xi)2
n
S2 =
n – 1
Xi
2 - (Xi)2
n
S2 =
n – 1
70. La desviación estándar se expresa en las mismas unidades en que fueron
medidas las variables (kilos, libras, gramos, metros, centímetros, etc.) y se
define como la raíz cuadrada de la varianza. Matemáticamente es la
distancia sobre el eje de abscisas desde la media hasta el punto de inflexión
de una curva normal
Desviación estándar
S = S2S = S2
72. Ejercicio: A partir de la varianza del ejercicio anterior,
calcular la desviación estándar.
La fórmula para calcular la desviación
estándar es la siguiente:
S = 19.03 = 4.36S = 19.03 = 4.36
S = S2S = S2
S2 = 19.03
Por lo tanto:
73. El error estándar permite conocer el campo probable de localización de la media de
la población μ. Cuando los datos provienen de un censo, el error estándar de la
media es igual a cero. En un muestreo siempre existe un margen de error en la
estimación de la media de la muestra que es un estimador de la media de la
población. El error estándar constituye la desviación estándar de las medias.
Error estándar
χ
EEx EE x
χ
EEx EE x
74. La fórmula para el cálculo del error estándar es la siguiente:
Ejercicio: Calcular el error estándar empleando los datos de la desviación
estándar (S = 4.36), y n = 9, del ejercicio anterior
S
n
EE=
S
n
EE=
4.36
= 1.45EE=
9
4.364.36
= 1.45EE=
9
75. El intervalo de confianza es un estadístico que se asocia con el nivel de significación fijado por
el investigador. En la agricultura se acepta un 95% de confianza; es decir, un máximo del 5%
como probabilidad de equivocarse, en una prueba de dos colas.
El intervalo de confianza permite estimar los límites superior e inferior de confianza, donde se
encontraría la media de la población, con la seguridad prefijada (95%). Como la curva de
distribución normal está asociada con el estadístico “Z”, cuando el nivel de significación es del
5%, se tiene:
α = 0.05
Z = 1.96 ≈ 2.0
Definido el nivel de significación estadística en 5%, el cálculo del intervalo de confianza (IC)
se reduce a la siguiente fórmula: IC = 1.96 (EE) ≈ 2 EE
Intervalo de confianza
76. Ejercicio: Considerando los datos del ejercicio de la varianza, calcular los límites superior e inferior de
confianza con una confianza del 95 por ciento.
Esto significa, que la media de la población μ puede encontrase, con el 95 %
de confianza, entre los límites superior e inferior:
X ± 2 EE: 28.56 ± 2.9
Límite inferior de confianza LIC = 25.66
Límite central o media LC = 28.56
Límite inferior de confianza LSC = 31.46
X = 28.56X = 28.56
EE = 1.45
IC = 2 EE
IC = 2 (1.45) = 2.9
77. La variabilidad relativa es un estadístico que también permite medir la variabilidad biológica
intrínseca y es muy empleada en estudios entomológicos y de dinámica de poblaciones (ecología
cuantitativa)
6.2.2.6. Variabilidad relativa
Ejercicio: Con los datos del Error estándar y media del ejercicio anterior, calcular la variabilidad
relativa.
EE
VR % = . 100EEEE
x
EEEE
VR % = . 100EEEE
x
1.45
VR % =
28.56
. 100
1.451.45
VR % =
28.56
. 100
VR % = 5.08
X = 28.56
EE = 1.45
X = 28.56
EE = 1.45
78. DEFINICIONES BASICAS DE ESTADISTICA
ESTADISTICA
DESCRIPTIVA INFERENCIAL
POBLACIONES
No de personas UPEC
MUESTRA
No de personas 1er año.
VARIABLES
CUALITATIVAS
CUANTITATIVAS
CONTINUAS
DISCRETAS
79. PRESENCIA DE UNA MARCA A NIVEL MUNDIAL
POBLACION
•El Mundo entero
MUESTRA
•Ciudades más representativas
VARIABLE
•No de sucursales
TIPO DE
VARIABLE
•Cuantitativa discreta
80. PESO REPORTADO POR LA POBLACIÓN INFANTIL DE TULCÁN
POBLACION
•Niños que viven en la ciudad
MUESTRA
•Edad entre 5 y 9 años
VARIABLE
•Peso reportado en Kg
TIPO DE
VARIABLE
•Cuantitativa continua.
81. GUSTOS MUSICALES EN LA COMUNIDAD JUVENIL DE LA UPEC
POBLACION
• Jóvenes de la UPEC
MUESTRA
• Comunidad juvenil entre 20 y 22 años
VARIABLE
• Genero musical preferido
TIPO DE
VARIABLE
• Cualitativa
82. FRECUENCIA ABSOLUTA Y FRECUENCIA ABSOLUTA
ACUMULADA
VARIABLE DATOS No de Individuos
REPETICIONES
CUANTITATIVA FRECUENCIA
CUALITATIVA
84. CONTEO DE
DATOS
Se reportan los datos
correspondientes a la edad de
20 estudiantes, en el curso de
Estadística
19 17 18 20 17
20 21 18 18 19
18 20 19 18 18
19 18 16 17 20
N= 20
Xi ni Ni
16 1 1
17 3 4
18 7 11
19 4 15
20 4 19
21 1 20
85. Se presentan los géneros musicales
preferidos por 15 habitantes de una
misma cuadra
Rock Jazz Clásica Latina Latina
Jazz ClásicaClásica Rock Rock
Clásica Latina Rock Jazz Rock
N= 15
Xi ni Ni
Rock 5 5
Jazz 3 8
Clásica 4 12
Latina 3 15
87. Se presentan los géneros musicales
preferidos por 15 habitantes de
una misma cuadra
Rock Jazz
Clásic
a Latina Latina
Jazz
Clásic
a
Clásic
a Rock Rock
ClásicaLatina Rock Jazz Rock
N= 15
Xi ni Ni
Rock 5 5
Jazz 3 8
Clásica 4 12
Latina 3 15
Xi ni Ni fi Fi
Rock 5 5 33% 33%
Jazz 3 8 20% 53%
Clásic
a 4 12 27% 80%
Latina 3 15 20% 100%
88. CONSTRUCCION DE UNA TABLA DE
FRECUENCIAS
Se reportan los datos correspondientes a la
edad de 20 estudiantes, en el curso de
Estadística
19 17 18 20 17
20 21 18 18 19
18 20 19 18 18
19 18 16 17 20
Xi
CATEGORIAS DE
DATOS
Xi ni Ni fi Fi
16 1 1 5% 5%
17 3 4 15% 20%
18 7 11 35% 55%
19 4 15 20% 75%
20 4 19 20% 95%
21 1 20 5% 100%