SlideShare una empresa de Scribd logo
1
Tareas del curso
Francisco
Arias 2023-
02-15
Tarea 1
1. Hacer las dos primeras lecciones del curso programacion-estadistica-r en swirl.
Al terminar las lecciones haga un corte pequeño de la pantalla que recoja la última
pregunta y el 100% de cumplimiento.
11: programacion-estadistica-r
1:Obtener Ayuda
Figure 1: Captura de pantalla - programacion-estadistica-r
2
R facilita la obtención de información acerca de las funciones de paquetes instalados, para
conseguir esta información debe escribirse en la linea de comandos un signo de interrogación (?),
seguidamente de la función a conocer, por ejemplo: ?Print. Ya ejecutado el comando se abrira la pestaña
“Help” con una breve descripción de la función, de como usarla, etcétera. Hay otras formas de
buscar ayuda, como escribir directamente en la barra de busqueda el comando que se necesita conocer, o
ejecutar help(“-”).
Figure 1: Captura de pantalla - Finalización de la 1ra lección
3
2: Objetos Tipos de Datos y Operaciones
R puede utilizarse como calculadora ya que realiza operaciones aritmétricas, además de
operaciones lógicas. Puedes registrar valores en variables con el operador de asignación (<-)
por ejemplo: 15-3 -> Resta. Tambien pueden crearse vectores con la función c() (combine)
tanto de valores numeric o string, al igual que matrices con la función “matrix()”. R
también soporta operadores lógicos como el AND, OR, <, >, =, etc.
Figure 2: Captura de pantalla - finalización de la 2da lección
Tarea 2 - Análisis exploratorio de datos (Gompertz)
Presentación de datos
## Registered S3 method overwritten by ’printr’:
## method from
## knit_print.data.frame rmarkdown
Tiempo PBM
0 0.00000
1 16.50962
2 55.50036
3 86.95201
4
4 108.73394
5 142.28456
## The data contains 20 observations of the following 2 variables:
##
## - Tiempo: Mean = 9.50, SD = 5.92, range: [0, 19], Skewness = 0.00, Kurtosis =
## -1.20
## - PBM: Mean = 192.23, SD = 94.18, range: [0, 289.72], Skewness = -0.84,
## Kurtosis = -0.54
5
Gráfico de dispersión
0 50 100 150 200 250 300
Potencial de biometanización
Se puede observar que se presenta una tendencia potencial, por lo que, el potencial de
biometanización incrementa con el pasar del tiempo.
Residuals vs Fitted
50 100 150 200 250 300
Fitted values
lm(GOMP$PBM ~ GOMP$Tiempo)
1 2 20
Tiempo
Residuals
0
5
10
15
−40
−20
0
20
6
Normal Q−Q
−2 −1 0 1 2
Theoretical Quantiles
lm(GOMP$PBM ~ GOMP$Tiempo)
Scale−Location
50 100 150 200 250 300
Fitted values
lm(GOMP$PBM ~ GOMP$Tiempo)
1 20 2
1 2 20
Standardized
residuals
Standardized
residuals
0.0
0.4
0.8
1.2
−1.5
−0.5
0.5
1.0
7
Residuals vs Leverage
0.5
0.00 0.05 0.10 0.15
Leverage
lm(GOMP$PBM ~ GOMP$Tiempo)
Las gráficas anteriores son llamadas “gráficas de diagnóstico”, conformada por el siguiente grupo de
gráficos:
La residual vs Fitted muestra si los residuos tienen patrones no lineales. La linea roja debe
ser lo mas recta posible, en este caso, al parecer tienen relacion lineal debido al
comportamiento de la linea roja.
La gráfica QQ Normal muestra si los residuos se distribuyen normalmente, se puede notar si
estan alineados con la linea principal. En este caso, no presentan una distribución normal.
La gráfica Scale-Location muestra si los residuos se distribuyen por igual a lo largo de los
rangos de predic- tores. Así es como puede verificar el supuesto de varianza igual.
El gráfico Residuals vs Leverage ayuda a encontrar casos atípicos influyentes en los resultados
finales. Estos suelen ser los valores fuera de la distancia de cook. En este caso, encontramos
que la observación 2 atípica es la unica influyente en los resultados.
##
## Call:
## lm(formula = GOMP$PBM ~ GOMP$Tiempo, data = GOMP)
##
## Residuals:
## Min 1Q Median 3Q Max
## -48.307 -23.925 7.187 27.328 29.456
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
2
Cook's distance
20
1
Standardized
residuals
−2.0
−1.0
0.0
0.5
1.0
8
## (Intercept) 48.307
## GOMP$Tiempo 15.150
## ---
12.806 3.772 0.0014 **
1.152 13.146 1.15e-10 ***
9
Tiemp
o
## Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1
##
## Residual standard error: 29.72 on 18 degrees of freedom
## Multiple R-squared: 0.9057, Adjusted R-squared: 0.9004
## F-statistic: 172.8 on 1 and 18 DF, p-value: 1.146e-10
Análisis de correlación
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
0
0 100
value
200 300
Tiempo_9
Tiempo_8
Tiempo_7
Tiempo_6
Tiempo_5
Tiempo_4
Tiempo_3
Tiempo_2
Tiempo_19
Tiempo_18
Tiempo_17
Tiempo_16
Tiempo_15
Tiempo_14
Tiempo_13
Tiempo_12
Tiempo_11
Tiempo_10
Tiempo_1
Tiempo_0
PBM
Features
PBM
Correlation Meter
Features
PBM
Tiempo_0
Tiempo_1
Tiempo_10
Tiempo_11
Tiempo_12
Tiempo_13
Tiempo_14
Tiempo_15
Tiempo_16
Tiempo_17
Tiempo_18
Tiempo_19
Tiempo_2
Tiempo_3
Tiempo_4
Tiempo_5
Tiempo_6
Tiempo_7
Tiempo_8
Tiempo_9
1
0
El gráfico de correlación nos permite demostrar si hay una relación existente entre dos
clases de datos y cuantificar la intesidad de dicha relación. En este caso, el PBM y el tiempo
estan fuertemente correlacionados, presentando una correlación positiva perfecta
Tarea 3
library(UsingR)
## Loading required package: MASS
## Loading required package: HistData
## Loading required package: Hmisc
## Loading required package: lattice##
Loading required package: survival##
Loading required package: Formula##
Loading required package: ggplot2
##
## Attaching package: ’Hmisc’
Tarea 4 - Regresión lineal con Halterofilia.csv
Peso Arrancada Dos.Tiempos Total Categori
a
Sexo
55.61 132 160 292 menos 56 M
55.64 127 161 288 menos 56 M
55.87 130 150 280 menos 56 M
55.73 123 150 273 menos 56 M
55.93 120 149 269 menos 56 M
55.87 127 140 267 menos 56 M
1
1
1
2
El coeficiente de correlación nos indica que exciste una correlación discreta fuerte (0.74),
además, debe rechazarse la hipotesis nula debido a que el valor P es menor a 0.001.
La función lineal nos dice que el intercepto en el eje y sucede en el valor 37, con un incremento
vertical de
1
3
1.1 a razon del desplazamiento horizontal.
1
4
## We fitted a linear model (estimated using OLS) to predict Arrancada with Peso2
## (formula: Arrancada ~ Peso2 - 1). The model explains a statistically
## significant and substantial proportion of variance (R2 = 0.96, F(1, 461) =
## 10696.80, p < .001, adj. R2 = 0.96). The model’s intercept, corresponding to ,
## is at (t() = , p ). Within this model:
##
## - The effect of Peso2 is statistically significant and positive (beta = 1.56,
## 95% CI [1.53, 1.59], t(461) = 103.43, p < .001; Std. beta = 0.74, 95% CI [0.68,
## 0.80])
##
## Standardized parameters were obtained by fitting the model on a standardized
## version of the dataset. 95% Confidence Intervals (CIs) and p-values were
## computed using a Wald t-distribution approximation.
## Effect sizes were labelled following Cohen’s (1988) recommendations.
##
## medium (Std. beta = 0.74, 95% CI [0.68, 0.80])
Paramet
C
er
oefficien
C
tI CI_lowCI_high t df_error
p Std_Coeffic
Sit
e
d
n
_
t CoefficienS
t_
td
C
_
IC
_o
lo
ew
fficient_CF
I_
ithigh
1 Peso2 1.5604690.95 1.530811
9.590111
903.4253461 0 0.7369878 0.6751255 0.79885 NA
2 NA NA NA NA NA NA NA NA NA NA NA NA
3 AIC NA NA NA NA NA NA NA NA NA NA 4326.8811396
4 AICc NA NA NA NA NA NA NA NA NA NA 4326.9072834
5 BIC NA NA NA NA NA NA NA NA NA NA 4335.1522693
6 R2 NA NA NA NA NA NA NA NA NA NA 0.9586836
7 R2 NA NA NA NA NA NA NA NA NA NA 0.9585940
(adj.)
9 Sigma NA NA NA NA NA NA NA NA NA NA 26.0648505
## beta = 1.56, 95% CI [1.53, 1.59], t(461) = 103.43, p < .001; Std. beta = 0.74, 95% CI [0.68, 0.80]
Tarea 5 - T de Student
Exploración de datos
Peso Arrancada Dos.Tiempos Total Categori
a
Sexo
55.6
1
132 160 292 menos 56 M
55.64 127 161 288 menos 56 M
55.87 130 150 280 menos 56 M
55.7
3
123 150 273 menos 56 M
55.93 120 149 269 menos 56 M
55.87 127 140 267 menos 56 M
## Attaching packages tidyverse 1.3.2
## v tibble 3.1.8
## v tidyr 1.3.0
## v readr 2.1.3
## v purrr 1.0.1
v dplyr 1.1.0
v stringr 1.5.0
v forcats 1.0.0
1
5
## Conflicts tidyverse_conflicts()
1
6
Dos tiempos
250
200
150
100
50
F M
Los gráficos de caja son excelentes para la exploracion de datos, ya que puede ser visible los
valores atípicos fuera de la caja, representados como puntos dispersos. El investigador ya puede
ir deduciendo los resultados del test observando el comportamiento de los datos en el
plotbox.
tStudent(460)  −26.27 p 1.35e−93 g
Hedges  −2.55 C9
I5% [−2.80 −2.31]o
n
bs  462
250
200
150
100
50
F M
Dos.Tiempos
Dos.Tiempos
1
7
Sexo
1
8
Prueba
##
## Welch Two Sample t-test
##
## data: fpesas$Dos.Tiempos and mpesas$Dos.Tiempos
## t = -27.874, df = 459.54, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -69.90673 -60.69888
## sample estimates:
## mean of x mean of y
## 113.2540 178.5568
Comprobación de supuestos
Prueba de Levene - Homogeneidad de Varianza
## Warning in leveneTest.default(y = y, group = group, ...): group coerced to
## factor.
Df F value Pr(>F)
group 1 25.67956 6e-07
Df F value Pr(>F)
460 NA NA
Esta prueba generalmente es utiliza para verificar el supuesto de homogeneidad de varianzas
de los grupos comparados. Contrasta la Hipótesis Nula de que las varianzas de las poblaciones
comparadas son idénticas.
Normalidad - Procedimientos gráficos Una primera posibilidad consiste en obtener histogramas con
una distribución con forma de campana. Otra posibilidad son las gráficas QQ que sitúan los
cuantiles de la distribución de la muestra respecto de los cuantiles del modelo de
distribución normal. Cuando ambas distribuciones coinciden los puntos se sitúan sobre una recta,
y en la medida que la distribución de la muestra difiera de la distribución normal se sitúan
fuera de la recta.
1
9
Histogram of mpesas$Dos.Tiempos
100 150
mpesas$Dos.Tiempos
200 250
Histogram of fpesas$Dos.Tiempos
60 80 100 120
fpesas$Dos.Tiempos
140 160 180
Frequency
Frequency
0
10
20
30
40
0
20
40
60
2
0
2
1
Generalmente, cuando hay demasiados datos, se tiende a presentar una distribución normal,
aunque el t de student lo contradiga.
Prueba de bondad de ajuste - Prueba de Shapiro-Wilks Procedimiento preciso basado en pruebas
de bondad de ajuste que someten a contraste la hipótesis de que la distribución de la
muestra se ajusta al modelo Normal. Pruebas como la de Shapiro-Wilks pueden ser utilizadas
para este propósito.
##
## Shapiro-Wilk normality
test##
## data: mpesas$Dos.Tiempos
## W = 0.98274, p-value = 0.002198
##
## Shapiro-Wilk normality test
##
## data: fpesas$Dos.Tiempos
## W = 0.98482, p-value = 0.03903
Vemos que en ambos casos el valor de probabilidad (p) es interior al nivel elegido (0.05),
por lo que, se rechaza la hipótesis nula.
Reporte
## Effect sizes were labelled following Cohen’s (1988)
recommendations.##
## The Welch Two Sample t-test testing the difference between
fpesas$Dos.Tiempos ## and mpesas$Dos.Tiempos (mean of x = 113.25, mean of y =
178.56) suggests that## the effect is negative, statistically significant, and
large (difference =
## -65.30, 95% CI [-69.91, -60.70], t(459.54) = -27.87, p < .001; Cohen’s d =
## -2.56, 95% CI [-2.80, -2.31])
Hay evidencia suficiente en los datos disponibles para concluir que las dos poblaciones de
donde se extraen las muestras son diferentes. Se acepta la hipótesis alternativa.
2
2
Hola<- read.csv("C:/Rruta/Halterofilia.csv")
attach(Hola)
head(Hola)
## The following objects are masked from ’package:base’:
##
## format.pval, units
##
## Attaching package: ’UsingR’
## The following object is masked from ’package:survival’:
##
## cancer
## Peso.Arrancada.Dos.Tiempos.Total.Categoria.Sexo
## 1 55.61;132;160;292;menos 56;M
## 2 55.64;127;161;288;menos 56;M
## 3 55.87;130;150;280;menos 56;M
## 4 55.73;123;150;273;menos 56;M
## 5 55.93;120;149;269;menos 56;M
## 6 55.87;127;140;267;menos 56;M

Más contenido relacionado

Similar a Tarea fra.docx

Diseño muestral...teoria
Diseño muestral...teoriaDiseño muestral...teoria
Diseño muestral...teoriajavier4445
 
Trabajo cec.docx final
Trabajo cec.docx finalTrabajo cec.docx final
Trabajo cec.docx final
norbilmedina
 
Econometria Salida Stata
Econometria Salida StataEconometria Salida Stata
Econometria Salida Stata
Ilse Herrera
 
Sesion 5 - Medidas de Dispersión (2).docx
Sesion 5 - Medidas de Dispersión (2).docxSesion 5 - Medidas de Dispersión (2).docx
Sesion 5 - Medidas de Dispersión (2).docx
EdyBenjaminUrbinaAlv1
 
Aprendizaje y percepción - memoria de prácticas
Aprendizaje y percepción - memoria de prácticasAprendizaje y percepción - memoria de prácticas
Aprendizaje y percepción - memoria de prácticas
David Villota Beltrán
 
Presentación de ejercicio ent 5
Presentación de ejercicio ent 5Presentación de ejercicio ent 5
Presentación de ejercicio ent 5
GERENCIA MTTO 3ER CORTE
 
Ejercicios de variables unidimensionales
Ejercicios de variables unidimensionalesEjercicios de variables unidimensionales
Ejercicios de variables unidimensionales
Inmaculada Leiva Tapia
 
Problemas v. unidimensionales
Problemas v. unidimensionalesProblemas v. unidimensionales
Problemas v. unidimensionales
ilt19
 
2. ejercicios pruebas_no_param_tricas
2. ejercicios pruebas_no_param_tricas2. ejercicios pruebas_no_param_tricas
2. ejercicios pruebas_no_param_tricas
Darwin Izurieta Calle
 
Introduction to R by David Lucy Cap 12-16
Introduction to R by David Lucy Cap 12-16Introduction to R by David Lucy Cap 12-16
Introduction to R by David Lucy Cap 12-16Luis Pons
 
FUNCIONES DE STELLA
FUNCIONES DE STELLAFUNCIONES DE STELLA
FUNCIONES DE STELLA
Shirley Contreras Ulloa
 
Estadística y probabilidad de la universidad nacional de la amazonia peruana
Estadística y probabilidad de la universidad nacional de la amazonia peruanaEstadística y probabilidad de la universidad nacional de la amazonia peruana
Estadística y probabilidad de la universidad nacional de la amazonia peruana
JosueDavidTuanamaLin
 
2. ejercicios pruebas_no_parametricas
2. ejercicios pruebas_no_parametricas2. ejercicios pruebas_no_parametricas
2. ejercicios pruebas_no_parametricas
daser wicho
 
Control pid
Control pidControl pid
Control pid
Santana Bucano
 
Proceso Estadistico Peter Meletz
Proceso Estadistico Peter MeletzProceso Estadistico Peter Meletz
Proceso Estadistico Peter MeletzPiter Meletz
 
12 2 pruebas de_ajuste hidrologia
12 2 pruebas de_ajuste hidrologia12 2 pruebas de_ajuste hidrologia
12 2 pruebas de_ajuste hidrologia
Fátima Lds
 
Mic sesión 13
Mic sesión 13Mic sesión 13
Mic sesión 13
Metodos_Cuantitativos
 

Similar a Tarea fra.docx (20)

Diseño muestral...teoria
Diseño muestral...teoriaDiseño muestral...teoria
Diseño muestral...teoria
 
Trabajo cec.docx final
Trabajo cec.docx finalTrabajo cec.docx final
Trabajo cec.docx final
 
Econometria Salida Stata
Econometria Salida StataEconometria Salida Stata
Econometria Salida Stata
 
Sesion 5 - Medidas de Dispersión (2).docx
Sesion 5 - Medidas de Dispersión (2).docxSesion 5 - Medidas de Dispersión (2).docx
Sesion 5 - Medidas de Dispersión (2).docx
 
Computacion
ComputacionComputacion
Computacion
 
Aprendizaje y percepción - memoria de prácticas
Aprendizaje y percepción - memoria de prácticasAprendizaje y percepción - memoria de prácticas
Aprendizaje y percepción - memoria de prácticas
 
Presentación de ejercicio ent 5
Presentación de ejercicio ent 5Presentación de ejercicio ent 5
Presentación de ejercicio ent 5
 
Ejercicios de variables unidimensionales
Ejercicios de variables unidimensionalesEjercicios de variables unidimensionales
Ejercicios de variables unidimensionales
 
Problemas v. unidimensionales
Problemas v. unidimensionalesProblemas v. unidimensionales
Problemas v. unidimensionales
 
Example pricing methods
Example pricing methodsExample pricing methods
Example pricing methods
 
2. ejercicios pruebas_no_param_tricas
2. ejercicios pruebas_no_param_tricas2. ejercicios pruebas_no_param_tricas
2. ejercicios pruebas_no_param_tricas
 
Introduction to R by David Lucy Cap 12-16
Introduction to R by David Lucy Cap 12-16Introduction to R by David Lucy Cap 12-16
Introduction to R by David Lucy Cap 12-16
 
FUNCIONES DE STELLA
FUNCIONES DE STELLAFUNCIONES DE STELLA
FUNCIONES DE STELLA
 
Estadística y probabilidad de la universidad nacional de la amazonia peruana
Estadística y probabilidad de la universidad nacional de la amazonia peruanaEstadística y probabilidad de la universidad nacional de la amazonia peruana
Estadística y probabilidad de la universidad nacional de la amazonia peruana
 
2. ejercicios pruebas_no_parametricas
2. ejercicios pruebas_no_parametricas2. ejercicios pruebas_no_parametricas
2. ejercicios pruebas_no_parametricas
 
Presentacion ops umayor-2011
Presentacion ops umayor-2011Presentacion ops umayor-2011
Presentacion ops umayor-2011
 
Control pid
Control pidControl pid
Control pid
 
Proceso Estadistico Peter Meletz
Proceso Estadistico Peter MeletzProceso Estadistico Peter Meletz
Proceso Estadistico Peter Meletz
 
12 2 pruebas de_ajuste hidrologia
12 2 pruebas de_ajuste hidrologia12 2 pruebas de_ajuste hidrologia
12 2 pruebas de_ajuste hidrologia
 
Mic sesión 13
Mic sesión 13Mic sesión 13
Mic sesión 13
 

Último

informecbdlp-240603151721-44655eeh2.docx
informecbdlp-240603151721-44655eeh2.docxinformecbdlp-240603151721-44655eeh2.docx
informecbdlp-240603151721-44655eeh2.docx
IsabellaCortes7
 
etiqueta que se utiliza en un restaurante .pdf
etiqueta que se utiliza en  un restaurante  .pdfetiqueta que se utiliza en  un restaurante  .pdf
etiqueta que se utiliza en un restaurante .pdf
Vhope6
 
Patrimundi Recuperadora Bancaria en Cancun
Patrimundi Recuperadora Bancaria en CancunPatrimundi Recuperadora Bancaria en Cancun
Patrimundi Recuperadora Bancaria en Cancun
DianaArtemizaCP
 
Proyecto_individulal_entre_pares_Ricardo_Aray_Lobo.pdf
Proyecto_individulal_entre_pares_Ricardo_Aray_Lobo.pdfProyecto_individulal_entre_pares_Ricardo_Aray_Lobo.pdf
Proyecto_individulal_entre_pares_Ricardo_Aray_Lobo.pdf
RicardoArayaLobo
 
Portfolio_itsmevalen/ Valentina Balmaceda
Portfolio_itsmevalen/ Valentina BalmacedaPortfolio_itsmevalen/ Valentina Balmaceda
Portfolio_itsmevalen/ Valentina Balmaceda
ValentinaBalmaceda2
 
1x10.documento bueno para comunidades jefas y jefes de comunidades q les soli...
1x10.documento bueno para comunidades jefas y jefes de comunidades q les soli...1x10.documento bueno para comunidades jefas y jefes de comunidades q les soli...
1x10.documento bueno para comunidades jefas y jefes de comunidades q les soli...
Sarai747172
 
MAPAS MIXTOS DE LA EVOLUCIÓN DEL COMPUTADOR Y EL DISEÑO GRÁFICO
MAPAS MIXTOS DE LA EVOLUCIÓN DEL COMPUTADOR Y EL DISEÑO GRÁFICOMAPAS MIXTOS DE LA EVOLUCIÓN DEL COMPUTADOR Y EL DISEÑO GRÁFICO
MAPAS MIXTOS DE LA EVOLUCIÓN DEL COMPUTADOR Y EL DISEÑO GRÁFICO
MarianellaMalaveCazo
 
Museo de Arte Contemporáneo del Siglo XXI - HISTORIA DE LA ARQUITECTURA .pdf
Museo de Arte Contemporáneo del Siglo XXI - HISTORIA DE LA ARQUITECTURA .pdfMuseo de Arte Contemporáneo del Siglo XXI - HISTORIA DE LA ARQUITECTURA .pdf
Museo de Arte Contemporáneo del Siglo XXI - HISTORIA DE LA ARQUITECTURA .pdf
MarianaVillenaAyala
 
mapa mental gestion del capital humano.pdf
mapa mental gestion del capital humano.pdfmapa mental gestion del capital humano.pdf
mapa mental gestion del capital humano.pdf
andreakathe12
 
capitulo-18-sistema--706807-downloadable-2573126.pdf
capitulo-18-sistema--706807-downloadable-2573126.pdfcapitulo-18-sistema--706807-downloadable-2573126.pdf
capitulo-18-sistema--706807-downloadable-2573126.pdf
ProfesorCiencias2
 
Movimiento Moderno en Venezuela Arquitectura
Movimiento Moderno en Venezuela ArquitecturaMovimiento Moderno en Venezuela Arquitectura
Movimiento Moderno en Venezuela Arquitectura
LeonardoDantasRivas
 
Lectura. Reseña ilustrada, novela Albert Camus
Lectura.  Reseña ilustrada, novela Albert CamusLectura.  Reseña ilustrada, novela Albert Camus
Lectura. Reseña ilustrada, novela Albert Camus
RenataGrecia
 
Arquitecto Cerro Larraín - Cerro Barón - Valparaíso
Arquitecto Cerro Larraín - Cerro Barón  - ValparaísoArquitecto Cerro Larraín - Cerro Barón  - Valparaíso
Arquitecto Cerro Larraín - Cerro Barón - Valparaíso
ArquitecturaClculoCe
 
Introduccion-a-la-vida-de-Johannes-Kepler.pptx
Introduccion-a-la-vida-de-Johannes-Kepler.pptxIntroduccion-a-la-vida-de-Johannes-Kepler.pptx
Introduccion-a-la-vida-de-Johannes-Kepler.pptx
albujarluisl
 
Arquitectura Ecléctica e Historicista en Latinoamérica
Arquitectura Ecléctica e Historicista en LatinoaméricaArquitectura Ecléctica e Historicista en Latinoamérica
Arquitectura Ecléctica e Historicista en Latinoamérica
imariagsg
 
Propuesta de diseño de marca para Fred, muebles de diseño
Propuesta de diseño de marca para Fred, muebles de diseñoPropuesta de diseño de marca para Fred, muebles de diseño
Propuesta de diseño de marca para Fred, muebles de diseño
Mariano Salgado
 
DIA DE LA BANDERA PERUANA EL 7 DE JUNIO DE 1820
DIA DE LA BANDERA PERUANA EL 7 DE JUNIO DE 1820DIA DE LA BANDERA PERUANA EL 7 DE JUNIO DE 1820
DIA DE LA BANDERA PERUANA EL 7 DE JUNIO DE 1820
62946377
 
VERTEDEROS CRESTA ANCHA- PRESENTACION FINAL CON PREGUNTAS.pptx
VERTEDEROS CRESTA ANCHA- PRESENTACION FINAL CON PREGUNTAS.pptxVERTEDEROS CRESTA ANCHA- PRESENTACION FINAL CON PREGUNTAS.pptx
VERTEDEROS CRESTA ANCHA- PRESENTACION FINAL CON PREGUNTAS.pptx
ingridavila20
 
DIAGRAMA DE FLUJO.pptx : Ventas en linea
DIAGRAMA DE FLUJO.pptx : Ventas en lineaDIAGRAMA DE FLUJO.pptx : Ventas en linea
DIAGRAMA DE FLUJO.pptx : Ventas en linea
EduarRamos7
 
Estilos de cajas Flexibles CSS-Flexbox-y-Grid.pdf
Estilos de cajas Flexibles CSS-Flexbox-y-Grid.pdfEstilos de cajas Flexibles CSS-Flexbox-y-Grid.pdf
Estilos de cajas Flexibles CSS-Flexbox-y-Grid.pdf
JosueJuanez1
 

Último (20)

informecbdlp-240603151721-44655eeh2.docx
informecbdlp-240603151721-44655eeh2.docxinformecbdlp-240603151721-44655eeh2.docx
informecbdlp-240603151721-44655eeh2.docx
 
etiqueta que se utiliza en un restaurante .pdf
etiqueta que se utiliza en  un restaurante  .pdfetiqueta que se utiliza en  un restaurante  .pdf
etiqueta que se utiliza en un restaurante .pdf
 
Patrimundi Recuperadora Bancaria en Cancun
Patrimundi Recuperadora Bancaria en CancunPatrimundi Recuperadora Bancaria en Cancun
Patrimundi Recuperadora Bancaria en Cancun
 
Proyecto_individulal_entre_pares_Ricardo_Aray_Lobo.pdf
Proyecto_individulal_entre_pares_Ricardo_Aray_Lobo.pdfProyecto_individulal_entre_pares_Ricardo_Aray_Lobo.pdf
Proyecto_individulal_entre_pares_Ricardo_Aray_Lobo.pdf
 
Portfolio_itsmevalen/ Valentina Balmaceda
Portfolio_itsmevalen/ Valentina BalmacedaPortfolio_itsmevalen/ Valentina Balmaceda
Portfolio_itsmevalen/ Valentina Balmaceda
 
1x10.documento bueno para comunidades jefas y jefes de comunidades q les soli...
1x10.documento bueno para comunidades jefas y jefes de comunidades q les soli...1x10.documento bueno para comunidades jefas y jefes de comunidades q les soli...
1x10.documento bueno para comunidades jefas y jefes de comunidades q les soli...
 
MAPAS MIXTOS DE LA EVOLUCIÓN DEL COMPUTADOR Y EL DISEÑO GRÁFICO
MAPAS MIXTOS DE LA EVOLUCIÓN DEL COMPUTADOR Y EL DISEÑO GRÁFICOMAPAS MIXTOS DE LA EVOLUCIÓN DEL COMPUTADOR Y EL DISEÑO GRÁFICO
MAPAS MIXTOS DE LA EVOLUCIÓN DEL COMPUTADOR Y EL DISEÑO GRÁFICO
 
Museo de Arte Contemporáneo del Siglo XXI - HISTORIA DE LA ARQUITECTURA .pdf
Museo de Arte Contemporáneo del Siglo XXI - HISTORIA DE LA ARQUITECTURA .pdfMuseo de Arte Contemporáneo del Siglo XXI - HISTORIA DE LA ARQUITECTURA .pdf
Museo de Arte Contemporáneo del Siglo XXI - HISTORIA DE LA ARQUITECTURA .pdf
 
mapa mental gestion del capital humano.pdf
mapa mental gestion del capital humano.pdfmapa mental gestion del capital humano.pdf
mapa mental gestion del capital humano.pdf
 
capitulo-18-sistema--706807-downloadable-2573126.pdf
capitulo-18-sistema--706807-downloadable-2573126.pdfcapitulo-18-sistema--706807-downloadable-2573126.pdf
capitulo-18-sistema--706807-downloadable-2573126.pdf
 
Movimiento Moderno en Venezuela Arquitectura
Movimiento Moderno en Venezuela ArquitecturaMovimiento Moderno en Venezuela Arquitectura
Movimiento Moderno en Venezuela Arquitectura
 
Lectura. Reseña ilustrada, novela Albert Camus
Lectura.  Reseña ilustrada, novela Albert CamusLectura.  Reseña ilustrada, novela Albert Camus
Lectura. Reseña ilustrada, novela Albert Camus
 
Arquitecto Cerro Larraín - Cerro Barón - Valparaíso
Arquitecto Cerro Larraín - Cerro Barón  - ValparaísoArquitecto Cerro Larraín - Cerro Barón  - Valparaíso
Arquitecto Cerro Larraín - Cerro Barón - Valparaíso
 
Introduccion-a-la-vida-de-Johannes-Kepler.pptx
Introduccion-a-la-vida-de-Johannes-Kepler.pptxIntroduccion-a-la-vida-de-Johannes-Kepler.pptx
Introduccion-a-la-vida-de-Johannes-Kepler.pptx
 
Arquitectura Ecléctica e Historicista en Latinoamérica
Arquitectura Ecléctica e Historicista en LatinoaméricaArquitectura Ecléctica e Historicista en Latinoamérica
Arquitectura Ecléctica e Historicista en Latinoamérica
 
Propuesta de diseño de marca para Fred, muebles de diseño
Propuesta de diseño de marca para Fred, muebles de diseñoPropuesta de diseño de marca para Fred, muebles de diseño
Propuesta de diseño de marca para Fred, muebles de diseño
 
DIA DE LA BANDERA PERUANA EL 7 DE JUNIO DE 1820
DIA DE LA BANDERA PERUANA EL 7 DE JUNIO DE 1820DIA DE LA BANDERA PERUANA EL 7 DE JUNIO DE 1820
DIA DE LA BANDERA PERUANA EL 7 DE JUNIO DE 1820
 
VERTEDEROS CRESTA ANCHA- PRESENTACION FINAL CON PREGUNTAS.pptx
VERTEDEROS CRESTA ANCHA- PRESENTACION FINAL CON PREGUNTAS.pptxVERTEDEROS CRESTA ANCHA- PRESENTACION FINAL CON PREGUNTAS.pptx
VERTEDEROS CRESTA ANCHA- PRESENTACION FINAL CON PREGUNTAS.pptx
 
DIAGRAMA DE FLUJO.pptx : Ventas en linea
DIAGRAMA DE FLUJO.pptx : Ventas en lineaDIAGRAMA DE FLUJO.pptx : Ventas en linea
DIAGRAMA DE FLUJO.pptx : Ventas en linea
 
Estilos de cajas Flexibles CSS-Flexbox-y-Grid.pdf
Estilos de cajas Flexibles CSS-Flexbox-y-Grid.pdfEstilos de cajas Flexibles CSS-Flexbox-y-Grid.pdf
Estilos de cajas Flexibles CSS-Flexbox-y-Grid.pdf
 

Tarea fra.docx

  • 1. 1 Tareas del curso Francisco Arias 2023- 02-15 Tarea 1 1. Hacer las dos primeras lecciones del curso programacion-estadistica-r en swirl. Al terminar las lecciones haga un corte pequeño de la pantalla que recoja la última pregunta y el 100% de cumplimiento. 11: programacion-estadistica-r 1:Obtener Ayuda Figure 1: Captura de pantalla - programacion-estadistica-r
  • 2. 2 R facilita la obtención de información acerca de las funciones de paquetes instalados, para conseguir esta información debe escribirse en la linea de comandos un signo de interrogación (?), seguidamente de la función a conocer, por ejemplo: ?Print. Ya ejecutado el comando se abrira la pestaña “Help” con una breve descripción de la función, de como usarla, etcétera. Hay otras formas de buscar ayuda, como escribir directamente en la barra de busqueda el comando que se necesita conocer, o ejecutar help(“-”). Figure 1: Captura de pantalla - Finalización de la 1ra lección
  • 3. 3 2: Objetos Tipos de Datos y Operaciones R puede utilizarse como calculadora ya que realiza operaciones aritmétricas, además de operaciones lógicas. Puedes registrar valores en variables con el operador de asignación (<-) por ejemplo: 15-3 -> Resta. Tambien pueden crearse vectores con la función c() (combine) tanto de valores numeric o string, al igual que matrices con la función “matrix()”. R también soporta operadores lógicos como el AND, OR, <, >, =, etc. Figure 2: Captura de pantalla - finalización de la 2da lección Tarea 2 - Análisis exploratorio de datos (Gompertz) Presentación de datos ## Registered S3 method overwritten by ’printr’: ## method from ## knit_print.data.frame rmarkdown Tiempo PBM 0 0.00000 1 16.50962 2 55.50036 3 86.95201
  • 4. 4 4 108.73394 5 142.28456 ## The data contains 20 observations of the following 2 variables: ## ## - Tiempo: Mean = 9.50, SD = 5.92, range: [0, 19], Skewness = 0.00, Kurtosis = ## -1.20 ## - PBM: Mean = 192.23, SD = 94.18, range: [0, 289.72], Skewness = -0.84, ## Kurtosis = -0.54
  • 5. 5 Gráfico de dispersión 0 50 100 150 200 250 300 Potencial de biometanización Se puede observar que se presenta una tendencia potencial, por lo que, el potencial de biometanización incrementa con el pasar del tiempo. Residuals vs Fitted 50 100 150 200 250 300 Fitted values lm(GOMP$PBM ~ GOMP$Tiempo) 1 2 20 Tiempo Residuals 0 5 10 15 −40 −20 0 20
  • 6. 6 Normal Q−Q −2 −1 0 1 2 Theoretical Quantiles lm(GOMP$PBM ~ GOMP$Tiempo) Scale−Location 50 100 150 200 250 300 Fitted values lm(GOMP$PBM ~ GOMP$Tiempo) 1 20 2 1 2 20 Standardized residuals Standardized residuals 0.0 0.4 0.8 1.2 −1.5 −0.5 0.5 1.0
  • 7. 7 Residuals vs Leverage 0.5 0.00 0.05 0.10 0.15 Leverage lm(GOMP$PBM ~ GOMP$Tiempo) Las gráficas anteriores son llamadas “gráficas de diagnóstico”, conformada por el siguiente grupo de gráficos: La residual vs Fitted muestra si los residuos tienen patrones no lineales. La linea roja debe ser lo mas recta posible, en este caso, al parecer tienen relacion lineal debido al comportamiento de la linea roja. La gráfica QQ Normal muestra si los residuos se distribuyen normalmente, se puede notar si estan alineados con la linea principal. En este caso, no presentan una distribución normal. La gráfica Scale-Location muestra si los residuos se distribuyen por igual a lo largo de los rangos de predic- tores. Así es como puede verificar el supuesto de varianza igual. El gráfico Residuals vs Leverage ayuda a encontrar casos atípicos influyentes en los resultados finales. Estos suelen ser los valores fuera de la distancia de cook. En este caso, encontramos que la observación 2 atípica es la unica influyente en los resultados. ## ## Call: ## lm(formula = GOMP$PBM ~ GOMP$Tiempo, data = GOMP) ## ## Residuals: ## Min 1Q Median 3Q Max ## -48.307 -23.925 7.187 27.328 29.456 ## ## Coefficients: ## Estimate Std. Error t value Pr(>|t|) 2 Cook's distance 20 1 Standardized residuals −2.0 −1.0 0.0 0.5 1.0
  • 8. 8 ## (Intercept) 48.307 ## GOMP$Tiempo 15.150 ## --- 12.806 3.772 0.0014 ** 1.152 13.146 1.15e-10 ***
  • 9. 9 Tiemp o ## Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1 ## ## Residual standard error: 29.72 on 18 degrees of freedom ## Multiple R-squared: 0.9057, Adjusted R-squared: 0.9004 ## F-statistic: 172.8 on 1 and 18 DF, p-value: 1.146e-10 Análisis de correlación 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 0 100 value 200 300 Tiempo_9 Tiempo_8 Tiempo_7 Tiempo_6 Tiempo_5 Tiempo_4 Tiempo_3 Tiempo_2 Tiempo_19 Tiempo_18 Tiempo_17 Tiempo_16 Tiempo_15 Tiempo_14 Tiempo_13 Tiempo_12 Tiempo_11 Tiempo_10 Tiempo_1 Tiempo_0 PBM Features PBM Correlation Meter Features PBM Tiempo_0 Tiempo_1 Tiempo_10 Tiempo_11 Tiempo_12 Tiempo_13 Tiempo_14 Tiempo_15 Tiempo_16 Tiempo_17 Tiempo_18 Tiempo_19 Tiempo_2 Tiempo_3 Tiempo_4 Tiempo_5 Tiempo_6 Tiempo_7 Tiempo_8 Tiempo_9
  • 10. 1 0 El gráfico de correlación nos permite demostrar si hay una relación existente entre dos clases de datos y cuantificar la intesidad de dicha relación. En este caso, el PBM y el tiempo estan fuertemente correlacionados, presentando una correlación positiva perfecta Tarea 3 library(UsingR) ## Loading required package: MASS ## Loading required package: HistData ## Loading required package: Hmisc ## Loading required package: lattice## Loading required package: survival## Loading required package: Formula## Loading required package: ggplot2 ## ## Attaching package: ’Hmisc’ Tarea 4 - Regresión lineal con Halterofilia.csv Peso Arrancada Dos.Tiempos Total Categori a Sexo 55.61 132 160 292 menos 56 M 55.64 127 161 288 menos 56 M 55.87 130 150 280 menos 56 M 55.73 123 150 273 menos 56 M 55.93 120 149 269 menos 56 M 55.87 127 140 267 menos 56 M
  • 11. 1 1
  • 12. 1 2 El coeficiente de correlación nos indica que exciste una correlación discreta fuerte (0.74), además, debe rechazarse la hipotesis nula debido a que el valor P es menor a 0.001. La función lineal nos dice que el intercepto en el eje y sucede en el valor 37, con un incremento vertical de
  • 13. 1 3 1.1 a razon del desplazamiento horizontal.
  • 14. 1 4 ## We fitted a linear model (estimated using OLS) to predict Arrancada with Peso2 ## (formula: Arrancada ~ Peso2 - 1). The model explains a statistically ## significant and substantial proportion of variance (R2 = 0.96, F(1, 461) = ## 10696.80, p < .001, adj. R2 = 0.96). The model’s intercept, corresponding to , ## is at (t() = , p ). Within this model: ## ## - The effect of Peso2 is statistically significant and positive (beta = 1.56, ## 95% CI [1.53, 1.59], t(461) = 103.43, p < .001; Std. beta = 0.74, 95% CI [0.68, ## 0.80]) ## ## Standardized parameters were obtained by fitting the model on a standardized ## version of the dataset. 95% Confidence Intervals (CIs) and p-values were ## computed using a Wald t-distribution approximation. ## Effect sizes were labelled following Cohen’s (1988) recommendations. ## ## medium (Std. beta = 0.74, 95% CI [0.68, 0.80]) Paramet C er oefficien C tI CI_lowCI_high t df_error p Std_Coeffic Sit e d n _ t CoefficienS t_ td C _ IC _o lo ew fficient_CF I_ ithigh 1 Peso2 1.5604690.95 1.530811 9.590111 903.4253461 0 0.7369878 0.6751255 0.79885 NA 2 NA NA NA NA NA NA NA NA NA NA NA NA 3 AIC NA NA NA NA NA NA NA NA NA NA 4326.8811396 4 AICc NA NA NA NA NA NA NA NA NA NA 4326.9072834 5 BIC NA NA NA NA NA NA NA NA NA NA 4335.1522693 6 R2 NA NA NA NA NA NA NA NA NA NA 0.9586836 7 R2 NA NA NA NA NA NA NA NA NA NA 0.9585940 (adj.) 9 Sigma NA NA NA NA NA NA NA NA NA NA 26.0648505 ## beta = 1.56, 95% CI [1.53, 1.59], t(461) = 103.43, p < .001; Std. beta = 0.74, 95% CI [0.68, 0.80] Tarea 5 - T de Student Exploración de datos Peso Arrancada Dos.Tiempos Total Categori a Sexo 55.6 1 132 160 292 menos 56 M 55.64 127 161 288 menos 56 M 55.87 130 150 280 menos 56 M 55.7 3 123 150 273 menos 56 M 55.93 120 149 269 menos 56 M 55.87 127 140 267 menos 56 M ## Attaching packages tidyverse 1.3.2 ## v tibble 3.1.8 ## v tidyr 1.3.0 ## v readr 2.1.3 ## v purrr 1.0.1 v dplyr 1.1.0 v stringr 1.5.0 v forcats 1.0.0
  • 16. 1 6 Dos tiempos 250 200 150 100 50 F M Los gráficos de caja son excelentes para la exploracion de datos, ya que puede ser visible los valores atípicos fuera de la caja, representados como puntos dispersos. El investigador ya puede ir deduciendo los resultados del test observando el comportamiento de los datos en el plotbox. tStudent(460)  −26.27 p 1.35e−93 g Hedges  −2.55 C9 I5% [−2.80 −2.31]o n bs  462 250 200 150 100 50 F M Dos.Tiempos Dos.Tiempos
  • 18. 1 8 Prueba ## ## Welch Two Sample t-test ## ## data: fpesas$Dos.Tiempos and mpesas$Dos.Tiempos ## t = -27.874, df = 459.54, p-value < 2.2e-16 ## alternative hypothesis: true difference in means is not equal to 0 ## 95 percent confidence interval: ## -69.90673 -60.69888 ## sample estimates: ## mean of x mean of y ## 113.2540 178.5568 Comprobación de supuestos Prueba de Levene - Homogeneidad de Varianza ## Warning in leveneTest.default(y = y, group = group, ...): group coerced to ## factor. Df F value Pr(>F) group 1 25.67956 6e-07 Df F value Pr(>F) 460 NA NA Esta prueba generalmente es utiliza para verificar el supuesto de homogeneidad de varianzas de los grupos comparados. Contrasta la Hipótesis Nula de que las varianzas de las poblaciones comparadas son idénticas. Normalidad - Procedimientos gráficos Una primera posibilidad consiste en obtener histogramas con una distribución con forma de campana. Otra posibilidad son las gráficas QQ que sitúan los cuantiles de la distribución de la muestra respecto de los cuantiles del modelo de distribución normal. Cuando ambas distribuciones coinciden los puntos se sitúan sobre una recta, y en la medida que la distribución de la muestra difiera de la distribución normal se sitúan fuera de la recta.
  • 19. 1 9 Histogram of mpesas$Dos.Tiempos 100 150 mpesas$Dos.Tiempos 200 250 Histogram of fpesas$Dos.Tiempos 60 80 100 120 fpesas$Dos.Tiempos 140 160 180 Frequency Frequency 0 10 20 30 40 0 20 40 60
  • 20. 2 0
  • 21. 2 1 Generalmente, cuando hay demasiados datos, se tiende a presentar una distribución normal, aunque el t de student lo contradiga. Prueba de bondad de ajuste - Prueba de Shapiro-Wilks Procedimiento preciso basado en pruebas de bondad de ajuste que someten a contraste la hipótesis de que la distribución de la muestra se ajusta al modelo Normal. Pruebas como la de Shapiro-Wilks pueden ser utilizadas para este propósito. ## ## Shapiro-Wilk normality test## ## data: mpesas$Dos.Tiempos ## W = 0.98274, p-value = 0.002198 ## ## Shapiro-Wilk normality test ## ## data: fpesas$Dos.Tiempos ## W = 0.98482, p-value = 0.03903 Vemos que en ambos casos el valor de probabilidad (p) es interior al nivel elegido (0.05), por lo que, se rechaza la hipótesis nula. Reporte ## Effect sizes were labelled following Cohen’s (1988) recommendations.## ## The Welch Two Sample t-test testing the difference between fpesas$Dos.Tiempos ## and mpesas$Dos.Tiempos (mean of x = 113.25, mean of y = 178.56) suggests that## the effect is negative, statistically significant, and large (difference = ## -65.30, 95% CI [-69.91, -60.70], t(459.54) = -27.87, p < .001; Cohen’s d = ## -2.56, 95% CI [-2.80, -2.31]) Hay evidencia suficiente en los datos disponibles para concluir que las dos poblaciones de donde se extraen las muestras son diferentes. Se acepta la hipótesis alternativa.
  • 22. 2 2 Hola<- read.csv("C:/Rruta/Halterofilia.csv") attach(Hola) head(Hola) ## The following objects are masked from ’package:base’: ## ## format.pval, units ## ## Attaching package: ’UsingR’ ## The following object is masked from ’package:survival’: ## ## cancer ## Peso.Arrancada.Dos.Tiempos.Total.Categoria.Sexo ## 1 55.61;132;160;292;menos 56;M ## 2 55.64;127;161;288;menos 56;M ## 3 55.87;130;150;280;menos 56;M ## 4 55.73;123;150;273;menos 56;M ## 5 55.93;120;149;269;menos 56;M ## 6 55.87;127;140;267;menos 56;M