Este documento presenta un reporte de práctica sobre el uso de estadística paramétrica para construir modelos de volumen a partir de datos de parcelas permanentes. Se realizaron análisis de correlación para identificar las variables con mejor correlación, como diámetro y volumen. Luego, mediante regresión lineal y no lineal se construyeron 11 modelos para estimar volumen. Los resultados muestran los modelos y sus estadísticos, encontrando que algunos modelos como aquellos con diámetro presentan buen ajuste.
RETO MES DE ABRIL .............................docx
Correlacion y regresion zas
1. UNIVERSIDAD AUTÓNOMA AGRARIA
ANTONIO NARRO
DIVISION DE AGRONOMIA
DEPARTAMENTO FORESTAL
REPORTE DE PRÁCTICA:
Uso de estadística parametrica
(correlación y regresión) para construir
modelos de volumen
ASIGNATURA: EPIDOMETRIA FOR 415
TITULAR: DR.JORGE MENDEZ GONZALEZ
EQUIPO # 3:
ESTRADA GARCIA JUAN
PATRICIO HERNANDEZ NAZARETH
DIAZ PEREZ LIBNIN SAMUEL
MARTINEZ SANCHEZ EMILIO IRENE
VAZQUEZ DE LA TORRE CARLOS DE JESUS
ESPECIALIDAD: ING. FORESTAL
CUARTO SEMESTRE GRUPO 1
BUENAVISTA SALTILLO COAHUILA A 12 MARZO DE 2010
2. INTRODUCCION
En probabilidad y estadística, la correlación indica la fuerza y la dirección de
una relación lineal entre dos variables aleatorias. Se considera que dos
variables cuantitativas están correlacionadas cuando los valores de una de
ellas varían sistemáticamente con respecto a los valores homónimos de la otra:
si tenemos dos variables (A y B) existe correlación si al aumentar los valores de
A lo hacen también los de B y viceversa. La correlación entre dos variables no
implica, por sí misma, ninguna relación de causalidad
Recordemos que para el caso de una variable, la varianza era un parámetro
que nos mostraba cuanta variación existía entre la media un conjunto de datos.
En el mismo tenor, estamos en determinar la dependencia entre dos variables
por lo que una primera propuesta es construir una medida que nos permita en
forma análoga tratar la “variación”.
La regresión estadística o regresión a la media es la tendencia de una
medición extrema a presentarse más cercana a la media en una segunda
medición. La regresión se utiliza para predecir una medida basándonos en el
conocimiento de otra.
En este caso realizaremos el grado de la relación existente entre variables
utilizando modelos matemáticos y representaciones de grafica. Así pues, para
representar la relación entre dos o más variables desarrollaremos ecuaciones
que permitan estimar una variable en función de la otra.
La correlación es el grado de relación entre dos variables; para presentar esta
relación utilizaremos una representación grafica
llamada diagrama de
dispersión y finalmente el modelo matemático para estimar el valor de una
variable basándose en el valor de la otra, en lo que llamaremos análisis de
regresión.
3. JUSTIFICACION
El motivo por el cual se realiza el análisis de correlación es determinar cuáles
variables estimadas en nuestras parcelas permanentes tienen una buena
correlación o en otras palabras cuales tienen mejor igualdad o relación entre
ellas para determinar cuáles son las que tienen mejor relación par utilizarlas
para poder estimar otras variables por ejemplo estimar el volumen mediante las
variables altura y diámetro. Por lo que respecta al análisis de regresión es la
continuación del análisis de regresión que nos sirve para poder estimar
cualquier variable con la ayuda de dos variables con mejor correlación
realizando varias o ejecutando varios modelos para determinar cuál es el mejor
se ajuste para ocuparlo en la determinación u estimación de cualquier variable.
OBJETIVOS DE LA PRÁCTICA
Aplicar estadística paramétrica (correlación) para identificar variables
dasométricas útiles para construir modelos de regresión.
Aplicar estadística paramétrica (regresión) para construir modelos de
volumen.
Fomentar el uso de programas estadísticos para analizar datos reales
provenientes de ecosistemas forestales.
METODOLOGÍA
Obtuvimos datos de nuestras parcelas y
utilizamos un método estadístico para hacer
correlaciones.
Ya teniendo todos los datos ordenados de
nuestra parcela en Excel, revisamos el video
para observar el procedimiento que se seguía
y así poder realizar las correlaciones.
Después colocamos los comandos en el
editor, donde el comando input seguido de el
colocamos todas las variables y que se
utilizarían, dando el comando de cards para
introducir todos los valores de cada variable,
todo esto al final con “punto y coma” hasta que apareciera un color amar
4. En este caso obtuvimos los datos de todas
variable, es decir de todas las subparcelas
manera general. Luego le presionamos en
pestaña del mismo programa para eliminar
valores que tenia log y output.
las
de
la
los
Posteriormente regresamos al editor para introducir
los otros comandos o cambiar para tener resultados
por subparcelas individuales.
Luego introducimos los comandos para que nos ordenara los datos y al tener
que darle clic en el ejecutor no nos iba a dar ninguno resultado si no que solo
ordenaba.
Por ultimo obtivimos las graficas por subparcelas.
Resultados
Mediante los analisis de correlacion realizados con los datos de las parcelas
permanentes obtuvimos las siguientes graficas, mismas que interpretan que
variables de subparcela tienen mejor correlacion entre ellas se encontraron:
5. Como se muestra en el
grafico de la correlación
entre el DAP y el VOL son
las que mostraron mayor
correlación con una r de
0.9606 por tanto podemos
decir que esta es la mejor
correlación que se presento
en el sitio 4.
.
6. Conclusiones.
Con la ayuda del software sas 9.1 obtuvimos 2 subparcelas que presentaban
una correlacion positiva, siendo estas la subparcela 4 con las variables
diametro y volumen con una r de 0.9606, la otra parcela fue: subparcela 12 con
las variables diametro a la altura de pecho con volumen ya que presento un
coeficiente de correlacion alto mismo que fue de 0.9227. por tanto según el
coeficiente de correlacion entre mas alto sea sin rebasar el 1 significa que la
correlacion de estas variables es buena.
Ademas pudimos observar que algunas de nuestras parcelas presentaban
correlacion negativa por tanto se descartan las variables para continuar con el
proceso llamado regresion ya que no si no tienen relacion no sirven para
estimar otras variables.
REGRESIÓN LINEAL Y NO LINEAL
Metodología segunda parte
Para comenzar con la realización de estos análisis comenzamos por abriendo
el programa de zas versión 9.1 castellano para lo cual al comenzar a trabajar le
cambiamos
la
fecha
a
la
computadora a al 30 de enero.
Una vez ejecutado el programa zas
ya en el editor comenzamos a
escribir unos comandos o texto que
se introducen en el zas para que
pueda correr los modelos.
Como se muestra en la figura se
introduce los datos de volumen, el
nombre de las variables y después
los valores de cada variable estas
siempre separándolas con un punto
y coma para diferenciarlos.
7. Después le procedíamos a realizar
una regresión no lilial por el método
de
derivadas,
se
le
anexaban
parámetros con valore cualquiera,
se sustituía el modelo y por ultimo
correr.
Este procedimiento se realizaba para solo para modelos no lineales si después
en salida verificamos si el modelo fue correcto mediante la nota pudimos ver si
nuestro modelo fue corrido o ejecutado correctamente.
Por lo que respecta a los modelos no lineales a continuación se menciona el
procedimiento.
De la misma forma que en los lineales introducir el comando con lo que trabaja
el zas con la variable a estimar: data volumen; input; cards; después de
introducir el nombre de las variables y sus valores respectivos indicamos que
se proceda a realizar una regresión lineal.
8. Como se indica en la figura se le indica al programa que proceda a realizar una
regresión lineal de los datos de volumen y después se anexa la el modelo y run
o correr para que el software comience a buscar los parámetros.
Y estos fueron los procedimientos por los cuales se corrieron modelos lineales
y no lineales para encontrar los valores del parámetro b0, b1, b2 según tengan
los modelos para después sustituirlos en Excel y así poder estimar o predecir
los valores de volumen ya que en este caso es la variable a estimar.
RESULTADOS Y DISCUSIÓN.
Ajuste de los modelos pudimos obtener las siguientes graficas las cuales
interpretan cada modelo y con su grafica de residuales cada
18. Matorral Espinoso Tamaulipeco del noreste de México. Tesis de maestría.
Facultad de ciencias forestales, UANL. N.L. México. 93 p.
Steel,
R.G.D.
and
Torrie,
J.H.
(1988).
Bioestadística:
principios
y
procedimientos. México, McGraw-Hill. 613 p.
Klepac, D. (1976). Crecimiento e incremento de árboles y masas forestales.
UACh. México. 356 p. Clave: SD 555, K53, C3, 1976.
TESIS RECIENTES
Domingo López López (2009). Crecimiento de Picea mexicana Martínez en las
Poblaciones naturales de México. Tesis de licenciatura. Universidad Autónoma
agraria Antonio Narro.