1. Núcleo Monagas, Campus Juanico
Postgrado en Agricultura Tropical
Universidad de Oriente
Ramón Silva-Acuña (Ph. D)
Renny Barrios M. (M. Sc.)
Maturín, Mayo 2015
Estadística Experimental:
Organización de la Data Estadística
2. Recolección , organización y presentación de los datos.
Cuadros y Figuras. Datos brutos o no procesados. Arreglo
de datos. Datos no agrupados, datos agrupados. Distribución
de frecuencias (construcción de cuadros de frecuencias,
histogramas, polígonos simples y acumulativos).
Tema 2. Organización de la data estadística
3. H. G. Wells (1866-1946)
“Un día las estadísticas serán tan
necesarias para la vida ciudadana como
el leer y escribir”
4. ESTADÍSTICA INDUCTIVA Y DEDUCTIVA
Uno de los problemas fundamentales de la Estadística es el estudio
de la relación existente entre la población y sus muestras.
DEDUCTIVA
Conocimiento de
la población
Se caracteriza cada
muestra posible
Conocimiento de
una muestra
Se pretende caracterizar
la población
INDUCTIVA
5. Que caracterizan la totalidad de los mismos.
Estadística descriptiva se refiere:
a la recolección
presentación
descripción
análisis e interpretación de una colección de datos
Resumirlos con elementos de información
(Medidas descriptivas)
Y poder elaborar las propias conclusiones
7. Conjunto de técnicas que se utiliza para obtener
conclusiones que sobrepasan los límites del conocimiento
aportado por los datos.
Estadística inferencial
(2)-Información de la muestra para responder a
interrogantes sobre la población.
Entre sus particularidades esta :
(1)- Características de la muestra para hacer inferencias sobre
las características de la población.
La estimación(1) y el contraste(2) de hipótesis
8. Las observaciones son la materia prima con la cual trabajan
los investigadores
Para poderlas aplicar a la estadística deben estar en la forma
numérica
Por ejemplo:
En fitomejoramiento los registros pueden ser en Kg/parcela,
gramos / planta
En fitopatología podrían ser datos de incidencia y severidad
de la enfermedad
Los valores de las evaluaciones
9. En investigación medica podría ser el tiempo de recuperación
bajo determinado tratamiento
En suelo podrían ser……………………
Tales números constituyen datos y su característica común es
la variabilidad o variación
En entomología podrían ser……………………
En ecología podrían ser………………………………
En agronomía podrían ser………………………………………….
Los valores de las evaluaciones
10. Poblaciones y muestras
Población: consiste en todos los valores posibles
para una variable y sus valores son parámetros.
= Media
2 = Varianza
= Desviación estándar
11. Muestra: es una parte de la población y sus valores
son características
La muestra debe ser representativa* de la población para
poder hacer inferencias validas
S2 = Varianza
S = Desviación estándar
Media
*Error de tipo representacional
12. La aleatoriedad es el resultado de un proceso mecánico
para asegurar que los sesgos individuales, conocidos
o desconocidos en su naturaleza, no influyan en la
selección de las observaciones de la muestra.
Para obtener una muestra representativa, el principio de
aleatoriedad se incorpora a la regla para obtener la
muestra. Métodos de muestreo.
No olvidar cual es el significado de PARAMETRO y el
de una CARACTERISTICA o VARIABLE.
¿Como obtener esa muestra?
13. Tipos de variables: Cuantitativas y cualitativas
Variables cuantitativas: aquellas observaciones resultantes de
Mediciones, ejemplo, altura de plantas, peso de raíces, severidad
de la enfermedad, discutir sobre tratamientos cualitativos y cuantitativos
Las variables cuantitativas pueden ser continuas y discretas
Cuantitativa continua la que asume una infinidad de valores entre
dos puntos por ejemplo entre 1,5 y 1,6
Cuantitativa discreta la que presenta valores numéricos fijos sin
valores intermedios por ejemplo numero de lesiones por hoja,
numero de huevos de nematodos por ooteca, numero de colonias
bacterianas por placa.
14. Variables cualitativas: aquellas que no asumen valores
numéricos mensurables
La observación es obtenida cuando un individuo es señalado
en una de categorías mutuamente exclusivas ( y solamente en
una). Esa observación no pueden ser ordenadas o medidas,
solamente clasificadas y enumeradas: ejemplos
Color: de las semillas, de los frutos
Tipo de colonia: plana, cóncava, convexa
forma de los frutos
Olores
15. ¿Como pueden ser obtenidos los valores estadísticos
de las variables en experimentos?
1. Por enumeración
2. Por medición
El observador registra la presencia o ausencia de un atributo
en una serie de individuos y/o objetos, el cuenta los que poseen
o no poseen
Las observaciones se refieren a la intensidad de una grandeza
continua como la altura, peso, etc.
Por enumeración:
Por medición
16. TIPOS DE EXPERIMENTOS
1- Preliminares
2- Críticos
3- Demostrativos
¿Qué es un experimento?
Es una investigación planificada para obtener nuevos
hechos y/o aceptar o rechazar resultados de un
experimento anterior
17. 1- Preliminares (para seleccionar entre muchos los promisores)
TIPOS DE EXPERIMENTOS
Se caracterizan por:
a- Numero grande de tratamientos
b- Numero reducido de repeticiones
c- Tamaño reducido de parcelas
En consecuencia son de menor precisión.
Son previos a los estudios de investigación
18. 2- Críticos
TIPOS DE EXPERIMENTOS
Se caracterizan porque seleccionan ciertos
tratamientos con base en experimentos preliminares.
En ellos el objetivo es confirmar o rechazar hipótesis.
El tamaño de las parcelas y numero de repeticiones
debe ser el indicado estadísticamente.
19. 3- Demostrativos
TIPOS DE EXPERIMENTOS
Son comúnmente utilizados por los extensionistas.
Los mejores resultados de los experimentos críticos
se comparan con las recomendaciones locales o de
un referencial tecnológico.
20. PRINCIPIOS BASICOS DE LA EXPERIMENTACIÓN
¿SERA DE LA EXPERIMENTACIÓN O DE
LA INVESTIGACION?
Pregunto:
1- Repetición
2- Aleatorización
3- Control local
En los tiempos de Pasteur el conocimiento sobre
fisiología, bioquímica,…………..
¿ Hay diferencia entre experimentar e investigar ?
21. 1- Repetición
PRINCIPIOS BASICOS DE LA EXPERIMENTACION
Dícese cuando un tratamiento aparece mas de una vez
en un experimento
Funciones de la repetición
Provee la estimativa del error experimental
Aumenta la precisión del experimento al disminuir la
desviación estándar de la media de los tratamientos
Controla la varianza residual
Al aumentar el numero de repeticiones aumenta la precisión del
experimento, obviamente empleando material homogéneo.
22. 2- Aleatorización
PRINCIPIOS BASICOS DE LA EXPERIMENTACION
El objetivo de la casualización es garantizar que un
tratamiento sea favorecido* o perjudicado*
continuamente en las diferentes repeticiones.
* por causas conocidas o desconocidas
La aleatorización significa que la localización de los
tratamientos en las unidades experimentales es hecha
al azar o "por sorteo"
Permite la obtención del error experimental además de
garantizar la aplicación de las pruebas de significancia
23. 3- Control local
PRINCIPIOS BASICOS DE LA EXPERIMENTACION
Es de uso frecuente mas no obligatorio. Cuando
se tiene un área con una diferencia acentuada por
ejemplo de humedad, fertilidad,….etc.
Cuando no se realiza el control local decimos que
los experimentos son completamente aleatorizados,
caso bloques ya introduce el control local
Al introducir el control local ocurre reducción del
numero de grados de libertad del error experimental
24. EL ERROR EXPERIMENTAL
Es la medida de las variaciones existentes entre los
datos observados en las unidades experimentales
que recibieron el mismo tratamiento
¿Como controlar el error experimental?
1- Al seleccionar el diseño experimental adecuado para
evitar la heterogeneidad del soporte experimental
2- Emplear material experimental que permita disminuir
la variabilidad inherente a los seres vivos (igual variedad,
aislamiento, reactivo, o equipos empleados)
3- Seleccionar el tamaño adecuado de las parcelas
experimentales y considerar las características del área
utilizada
25. En resumen……………………………
Aleatorización Repetición Control local
Válida la estimación
del error experimental
Permite la aplicación de
pruebas de significancia
Permite estimar
el error experimental
Reduce el error
experimental
PRINCIPIOS BÁSICOS DE LA INVESTIGACIÓN
26. Recolección de datos
Instrumentos
Planillas para cuantificar las variables a analizar
¿Que vamos a cuantificar o medir?
De acuerdo con los objetivos de la investigación a realizar, se
elaboran los instrumentos de captación de la información.
Encuestas
Bibliográficos: como registros en hospitales, transito, bolsa
de valores, cotizaciones de comoditis, censos,
prensa, bibliotecas, etc.,
27. Las observaciones son la materia prima con la cual trabajan
los investigadores
Para poderlas aplicar a la estadística deben estar en la forma
numérica
Por ejemplo:
En fitomejoramiento los registros pueden ser en Kg/parcela,
gramos / planta
En fitopatología podrían ser datos de incidencia y severidad
de la enfermedad
Los valores de los datos o observaciones
28. En investigación medica podría ser el tiempo de recuperación
bajo determinado tratamiento
En administración podrían ser……………………
Tales números constituyen datos y su característica común es
la variabilidad
En entomología podrían ser……………………
En ecología podrían ser………………………………
En gerencia podrían ser………………………………………….
Los valores de los datos o observaciones
29. Los datos son colecciones de un número cualquiera de
observaciones relacionadas entre si.
Los datos estadísticos
Permiten llegar a conclusiones lógicas
y tomar decisiones bien fundamentadas
La organización de los datos permite :
1- Facilitar su entendimiento y análisis
2- Analizar tendencias
3- Describir relaciones
4- Determinar relaciones causa-efecto
30. Cuadro: Es el arreglo sistemático de datos numéricos dispuestos
en columnas o líneas para fines comparativos
En Cuadros y en Figuras (mencionar UDO Agrícola)
Tablas y Graficas términos ambiguos en cuanto a su
denominación
Figura: visualización grafica de resultados experimentales para
fines comparativos, utilizando los medios de representación
que proporciona la geometría.
¿Como organizar y presentar la información estadística?
31. Cuadro 1*…………… en función del contenido
Tratamientos
Hojas enfermas
Por época (días después de la siembra)
10 15 20 30
A
B
C
Titulo y numeración
Encabezado
Cuerpo
Notas en el pieLos valores indicados son transformados en raíz de x
¿Como organizar y presentar la información estadística?
El Cuadro
*Ubicación de la leyenda
40. 26.34 31.46 36.59 41.72 46.84
Variable
0.00
0.02
0.04
0.06
0.08
frecuenciasrelativas
Distribución de frecuencias con varianzas diferentes
¿Que representa la varianza, como resumen de la
distribución de frecuencia?
s2=2 s2=1
s2=0,4
Distribución de frecuencias con varianzas diferentes
La figura
Muestra
41. 26.85 32.39 37.92 43.45 48.98
variable
0.00
0.01
0.02
0.02
0.03
frecuenciasrelativas
Distribución de frecuencias con medias diferentes
¿Que representa la media, como resumen de
la distribución de frecuencia?
=30 =40 =45
La figura
Población
42. La figura*
¿Como organizar y presentar la información estadística?
Figura 1. Tasa de imbibición (agua absorbida) por las semillas
de diferentes cultivos sometidas a diferentes tiempo
de imbibición en agua.
43. Variable cuantitativa (X)
Respuesta
(Y)
.
.. .
Modelo lineal
Modelo cuadrático
Al incluir el ultimo punto el
ajuste se modifica
Importante: No usar la ecuación fuera de los limites para los
cuales fue definida.
Figura: en ecuaciones de regresión
44. Y
Variable aleatoria
Respuesta o
dependiente
X
Variable independiente
Fija
....
....
....
....
Cuando se tienen repeticiones
Calcular promedio y ajustar
Su
respuesta esta
en función del
nivel de X
Se establece
a priori
La ecuación estimara una línea entre esos
puntos que haga la distancia minima entre
ellos, o la menor suma de cuadrados
45. Organización de datos
Se refiere a la forma de presentar y/o organizar los datos en una
forma ascendente o descendente
4- Se puede observar la distancia entre valores consecutivos.
Ventajas
1- Se identifican los valores mínimos y máximos
2- Al organizar los datos se pueden dividir fácilmente en
secciones
3- Se visualizan los valores que aparecen más de una vez
46. Distribución de frecuencias
Es una forma de sintetizar los datos y consiste en valerse de
una tabla para clasificar los datos según su magnitud. En
ella se señala el número de veces que aparece cada uno de
los valores.
Para variables discretas o continuas, tiene sentido formar un
cuadro o figura que presente la distribución de frecuencias de los
datos agrupados en intervalos o clases.
47. DISTRIBUCIÓN DE FRECUENCIAS
Organización de datos agrupados
Se definen cerrados, cuando contienen ambos límites
Intervalos de clase: Grupo de valores que describen una
característica.
Incluir todas las observaciones y ser excluyentes.
Deben contener los límites de clase que son los puntos
extremos del intervalo.
Se definen abiertos, si incluyen solo un límite.
Los intervalos de clase deben:
[Definiciones]
48. Distribución de frecuencias
Limites reales: Sirven para mantener la continuidad de las clases
Amplitud del intervalo: es la diferencia entre los límites reales
de una clase
Número de clases: es el número total de grupos en que se
clasifica la información, se recomienda
que no sea menor que 5 ni mayor que 15
Marca de clase: es el punto medio del intervalo de clase, se
recomienda observar que los puntos medios
coincidan con los datos observados para
minimizar el error
[Definiciones]
49. Frecuencia: es el número de veces que aparece un valor
Distribución de frecuencias
Frecuencia acumulada: Indica cuantos casos hay por debajo o arriba
de un determinado valor o límite de clase.
Frecuencia relativa: Indica la proporción que representa la frecuencia
de cada intervalo de clase en relación al total, es
útil para comparar varias distribuciones con
parámetros de referencia uniformes.
Frecuencia acumulada relativa: Indica la proporción de datos que se
encuentra por arriba o debajo de cierto valor o límite de clase.
[Definiciones]
50. Distribución de frecuencias
[Definiciones]
Figuras de una distribución de frecuencias
Son útiles porque ponen en relieve y aclaran las tendencias
que no se captan fácilmente en el cuadro.
Ayudan a estimar valores con una simple ojeada y,
Ofrecen una verificación gráfica de la veracidad de las
soluciones.
51. Histograma
Figura formada por rectángulos cuya base es la amplitud del
intervalo y la altura corresponde a los casos o frecuencia de
cada tramo de valores.
Puede construirse con clases que tienen intervalos constantes o
variables
De esta manera se logra que las observaciones estén mejor
repartidas dentro del intervalo
Uso de intervalos de amplitud variable: cuando en alguno de los
intervalos, de amplitud constante, se presente la frecuencia cero
o la frecuencia de alguno o algunos de los intervalos sea mucho
mayor que la de los demás
52. Polígono de frecuencias
Se obtiene uniendo cada punto medio (marca de clase) de los
rectángulos del histograma con líneas rectas, teniendo
cuidado de agregar al inicio y al final marcas de clase
adicionales, con el objeto de asegurar la igualdad del área.
Curvas de frecuencia
Curva suavizada que se traza sobre el polígono y representa la
asimetría y la curtosis que tiene la distribución. Visualiza el
esquema del patrón de datos.
53. Tipos de curva de frecuencia
Unimodales,.
Curvas en forma de J
Simétricas
Asimétricas (sesgada a la derecha o a la izquierda),
Bimodales y
Multimodales
54. Ojivas
La ojiva representa gráficamente la forma en que se acumulan
los datos y permiten ver cuantas observaciones se hallan
por arriba o debajo de ciertos valores. Es útil para obtener
una medida de los cuartiles, deciles, percentiles.
Cuando se trata de relacionar observaciones en un mismo
aspecto para dos colectivos diferentes no es posible ejecutar
comparaciones sobre la base de la frecuencia, es necesario
tener una base estándar, la frecuencia relativa.
55. Polígono de frecuencias
Periodo latente
( Días )
Frecuencia
( F )
Puntos medio de
la clase ( Pm )
F X Pm
1 - 5 25 3 75
6 - 10* 30 * 8 240
11 - 15* 30 * 13 390
16 - 20 20 18 360
21 - 25 10 23 230
26 - 30 5 28 140
31 - 35 4 33 132
124
∑ (F x Pm )
PLM =
F
1567
1567
124
12,6 días= =
56. EJERCICIO DE ESTADISTICA BÁSICA
(Histogramas, polígonos de frecuencias, ojivas en rol de datos)
Núcleo Monagas, Campus Juanico
Postgrado en Agricultura Tropical
Universidad de Oriente
Maturín, Abril-Septiembre, 2015
[Primer periodo]
57. 77,97 13,02 17,97 89,19 12,18 8,15
34,40 43,13 79,61 90,99 43,66 29,75
7,42 93,91 20,64 21,10 17,64 81,59
60,94 43,97 32,67 43,66 51,69 53,40
68,13 11,10 12,98 38,74 70,15 25,68
EJEMPLO: Saldos de las cuentas a crédito de una bodega.
Muestra 30 cuentas, en Bs. F.
58. 7,42 8,15 11,10 12,18 12,98 13,02
17,64 17,97 20,64 21,10 25,68 29,75
32,67 34,40 38,74 43,13 43,66 43,66
43,97 51,69 53,40 60,94 68,13 70,15
77,97 79,61 81,59 89,19 90,99 93,91
Limite inferior: 7,42
Limite superior: 93,91
2- Calculo de R (Amplitud de los datos)
R= | Li – Ls |
R = | 7,42 – 93,91 | = 86,49
59. 3- Calculo del numero de clases
Se emplea la formula de Sturges o se extrae la raíz cuadrada
del numero de observaciones.
K= 1+ 3,322 (Log N)
K= 1+ 3,322 (Log 30)
K= 1+ 3,322 (1,477)
K= 1+ 4,9069
K= 5,9069
Se lee 5,9069 ≈ pero se emplea 6 clases
Raíz cuadrada de 30 = 5,47
Se lee 5,47 ≈ pero se emplea
6 clases
60. 4- Calculo de la amplitud de las clases “C”
Amplitud de los datos
Numero de clases
C =
86,49
6
C =
C = 14,415
61. Clases Pm Fi Fr Fa↓ Fa↑ Fra↓ Fra↑
7,42 – 21,835 14,628 10 33,34 10 30 33,34 100,00
21,835 – 36,250 29,043 4 13,34 14 20 46,68 66,66
36,250 – 50,665 43,458 5 16,66 19 16 63,34 53,32
50,665 – 65,080 57,873 3 10,00 22 11 73,34 36,66
65,080 – 79,495 72,288 3 10,00 25 8 83,34 26,66
79,495 – 93,91 86,702 5 16,66 30 5 100,00 16,66
5- Cuadro del calculo de las frecuencias absolutas y
relativas por intervalo de clases
Total 30
C =14,415
Amplitud de clases
Limite inferior: 7,42
Limite superior: 93,91
62. Figura 1. Histograma de frecuencias
Limites de las clases
Frecuenciaabsolutas(Fi)
1- Datos fáciles de
visualizar y entender.
2- De una ojeada
se ve la naturaleza
de la distribución.
3- Se pueden sobreponer
los valores con los de
otra distribución para
comparar los datos.
¿Para que hacer
estas figuras?
63. Figura 2. Histogramas y polígonos de frecuencia
Limites de las clases
Frecuenciaabsoluta
Frecuenciarelativas
El polígono de
frecuencia
tiende a suavizar
la curva de donde
se extrajo la
muestra.
¿Para que hacer
estas figuras?
64. OJIVAS
Figuras que se construyen utilizando una distribución
acumulativa de frecuencias.
El orden de acumulación se aplica al cuadro de distribución
de frecuencia y pueden ser descendentes ( fa ↓ ó far ↓)
o ascendente fa ↑ ó far ↑.
La ojiva que se forma al unir los puntos del polígono
es contraria al orden anunciado.
Descendente ↑ Ascendente ↓
65. Limites de las clases
Frecuenciasabsolutasacumuladas
Frecuenciasrelativasacumuladas
Figura 3. Frecuencias absolutas y relativas
acumuladas (Ojivas).
¿Para que hacer
estas figuras?
1- Hay que
investigar