SlideShare una empresa de Scribd logo
Explorando Datos Multivariados 1 POP Psicología de la Educación
Estructura y Representación de los Datos Multivariados Gráficos de distribución de los datos Datos perdidos y/o extremos 	2.1. Medias Restringidas 	2.2. Medias Semirestringidas 2
Estructura y Representación de los Datos Observar los datos gráficamente nos permite ver cómo se distribuyen, si se cumplen los criterios para la aplicación de una determinada prueba paramétrica.. Etc…  Una vez obtenidos los datos. Observarlos graficándolos de distintas maneras. Observar los datos nos permite ahorrar tiempo en los análisis paramétricos. Seleccionando la prueba adecuada. 3
Estructura y Representación de los Datos Tipos de gráficos: Histograma de Frecuencia: Nos permite intuir la distribución de probabilidad de los datos, normalidad, simetría, etc. Diagrama de Tallos y Hojas Útil para muestra de datos pequeñas. Nos da la información del histograma pero observando los valores de la variable. Cajas y bigotes Permite estudiar la simetría de los datos, y detectar valore atípicos. Gráfico de Normalidad P-P Nos permite comprobar si unos datos se ajustan a la distribución normal. Gráfico de dispersión Utilizados para ver la distribución conjunta de dos variables o más. 4
Sentencia Explore 5
Outliers Se define como aquel valor que está entre 1,5 y 3 IQR (amplitud intercuartílica P75-P25 Como inspeccionamos los outliers: Haciendo un gráfico de cajas y bigotes (boxplot) Observando los datos tipificados de la variable (puntuaciones-z) sentencia RANK (p.e. RANK ci / NORMAL) Una vez identificados los outliers ¿Qué hacemos con ellos? Quitar el caso Cambiar el dato (p.e. media grupo, media condición, media sujeto, etc.) Transformación de los datos (esto se hace en cualquier caso cuando la distribución de los datos es asimétrica) 6
Outliers Tipos de transformaciones… Tranformaciones logaritmicas (Log (Xi)). En este caso hay que tener en cuenta que si los datos están muy próximos a cero o son negativos hay que previamente transformarlos sumando una constante.  Tranformación con la raíz cuadrada Tranformación recíproca (1/Xi). En este caso los valores altos se convertirán en valores próximos a cero, y los valores bajos serán los más altos. Lo que hacemos es utilizar la fórmula 1/Xmayor-Xi) Todas estas tranformaciones se utilizan para tranformar distribuciones asimétricas tanto positivas como negativas.. Una familia de transformaciones especialmente útiles es la “escalera de potencias” de Tukey 7
Corrigen asimetría negativa Corrigen asimetría positiva Outliers Escalera de potencias de Tukey 8
Outliers Si la transformación falla, podemos reemplazar el dato… ¿cómo? por el valor más alto mas uno Reemplazarlo por el valor que tiene en 3 desviaciones típicas Una variación del anterior es cambiar el valor por el que corresponde a 2 desviaciones típicas Lo mejor es transformar los datos, en lugar de quitar o sustituir, cuando tenemos outliers. Si transformamos una variable porque su distribución es asimétrica, tenemos que hacer lo mismo con todas las demás.  9
Ejemplo. Datos de TR de un participante No sólo que hay algunas puntuaciones atípicas a ambos lados, sino que hay una clara asimetría positiva.
Ejemplo. Datos (transformados; raiz cuadrad) de TR de un participante (cont.) HEMOS EFECTUADO LA RAIZ PARA HACER MÁS SIMETRICA LA DISTRIBUCIÓN. No sólo que aún queda algo de asimetría positiva. Con el logaritmo, podremos reducir más la asimetría positiva, es lo que haremos ahora
Ejemplo. Datos (transformados; logaritmo) de TR de un participante (cont.) Nota: Si algún valor fuera 0, emplear log(1+x) En este caso no sólo que la asimetría positiva ha desaparecido (si acaso hay cierta asimetría negativa causada por unas pocas puntuaciones atípicas).
Ejemplo. Datos (transformados; cuadrado) de TR de un participante (cont.) Nota: Emplear el cuadrado no se debe hacer para corregir la asimetría positiva...sólo la negativa! Lo que hemos hecho es aumentar la asimetría positiva y eso no es lo que queríamos...(y si empleamos el cubo, aún peor para nuestros fines).
Transformación de Variables Esta familia de transformaciones (“escalera de Tukey”) tiene importantes propiedades: Preservan el orden de los valores; es decir, los valores mayores de la escala original seguirán siendo los valores mayores en la escala transformada. 2. Modifican la distancia entre los valores. Con potencias p<1 (raíz x o log x) se comprimen los datos en la parte superior de la distribución en relación a los valores menores; Con potencias p>1 (como el cuadrado de x) se tiene el efecto contrario. 3. El efecto sobre la forma de la distribución cambia sistemáticamente con p. Si raíz x hace menos pronunciada la asimetría positiva de una distribución, el log x provocará que la distribución resultante sea aún menos asimétrica positiva (en relación a raíz x). 14
Transformación de Variables En definitiva, las transformaciones de potencia pueden hacer que la variable transformada tenga menos asimetría. ¿Por qué es eso importante? – Las distribuciones que muestran una clara asimetría son difíciles de estudiar.  – Los valores originales aparentemente atípicos se encontrarán más cercanos al grueso de los datos. – Los métodos estadísticos suelen emplear la media aritmética; pero la media de una distribución asimétrica no es un buen índice del grueso de los datos. 15
Estructura y Representación de los Datos Estadísticos (Estimadores) robustos (ESTADÍSTICA INFERENCIAL): Son aquellos estadísticos (estimadores) que funcionan bien para varios tipos distintos de distribuciones teóricas, aunque pueden no ser el mejor estimador para ningún tipo concreto de distribución. Es decir, son el “mejor compromiso”. La media no es un estimador robusto. La mediana es un estimador más robusto que la media, si bien hay otros estimadores más robustos que veremos en el punto siguiente del temario. 16
Medidas robustas de tendencia central 1. Medias Recortadas Consiste en calcular la media aritmética sobre un subconjunto central del conjunto de datos, no considerándose una determinada proporción p por cada extremo. (p se expresa normalmente como porcentaje). Por ejemplo, una media recortada al 40% en una secuencia de 10 datos implica no tener en cuenta ni los 4 valores menores ni los 4 valores mayores. Observar que la media recortada al 0% es la media aritmética. A la media recortada al 25% se la denomina centrimedia. 17
Medidas robustas de tendencia central 1. Medias Recortadas (cont) Calculamos la media recortada al 10%  de los siguientes datos: 3, 4, 4, 5, 5, 6, 7, 8, 9, 11 El valor es 6 Calcula la centrimedia El valor es 5.8 18
Medidas robustas de tendencia central 2. Media Winsorizada Es análogo a las medias recortadas excepto en que las puntuaciones eliminadas, ya no lo son sino que se sustituyen por los valores menor y mayor que quedan para el cómputo de la media winsorizada. Así, en la media recortada a nivel 2 implicaría eliminar las dos puntuaciones mayores y las 2 menores: 3, 4, 4, 5, 5, 6, 7, 8, 9, 11 Y quedan los datos: 4, 5, 5, 6, 7, 8 y se calcula la media de los mismos En la media winsorizada, los datos 3 y 4 (los dos menores) y el 9 y 11 (los dos mayores) se sustituyen por 4 y 8 respectivamente. Es decir, 4, 4, 4, 5, 5, 6, 7, 8, 8, 8 y se calcula la media de los mismos, que será la media winsorizada a nivel 2 (debe de dar 5.9) 19
Medidas robustas de tendencia central 3. Otros tipos de media en la que se recortan datos En muchas ocasiones lo que se hace es emplear un valor mínimo y uno máximo más allá del cual se eliminan los datos que sobrepasen tales valores. Por ejemplo, en experimentos de tiempo de reacción para discriminar palabras/pseudopalabras se pueden eliminar datos menores de 200 ms y mayores de 1500 ms. (Menos de 200 ms es demasiado rápido; más de 1500 ms es demasiado lento.) De esta manera, si todos los datos están en el rango 200-1500 ms no se elimina ningún dato 20
Medidas robustas de tendencia central 4. Trimedia Es un índice de tendencia central que consiste en calcular una media aritmética ponderada de tres medidas, la Mediana (con peso doble) y el primer y tercer cuartil. Pensemos que en un conjunto de datos, el primer cuartil es 51, la mediana es 55 y el tercer cuartil es 63. La trimedia es: 21
Medidas robustas de tendencia central 5. Otras medidas robustas El estimador-M de Huber, el estimador biponderado de Tukey, el estimador M-redescendente de Hampel y el estimador en onda de Andrew. Estos estimadores se diferencian entre sí por el tipo de ponderación aplicada sobre los datos. Por ejemplo, en el Estimador-M de Huber (Estimador M de posición): Las puntuaciones típicas que sean menores que una constante, reciben un peso de 1. Los casos que tienen los mayores valores absolutos tienen pesos tanto más pequeños cuanto mayor es su distancia respecto a cero. La constante es 1.339.  Cálculo: lo da el SPSS. 22
Sentencia Explore Nos permite obtener una serie de datos tanto numéricos como gráficos sobre nuestros datos. (hay otras sentencias para estudiar desde un punto de vista descriptivo los datos. ES BUENO PRACTICAR!!!) 23
Glastonburyfestival.sav 24
Sentencia Explore 25
Sentencia Explore 26
Sentencia Explore 27
Sentencia Explore 28
Sentencia Explore 29
Sentencia Explore 30

Más contenido relacionado

La actualidad más candente

EstadíStica Inferencial Y Conceptos BáSicos
EstadíStica Inferencial Y Conceptos BáSicosEstadíStica Inferencial Y Conceptos BáSicos
EstadíStica Inferencial Y Conceptos BáSicos
Ricardo Andrade Albarracin
 
Métodos y distribución de muestreo
Métodos y distribución de muestreoMétodos y distribución de muestreo
Métodos y distribución de muestreo
UANL
 
Medidas de tendencia central
Medidas de tendencia centralMedidas de tendencia central
Medidas de tendencia central
Claudia Quintero
 
minería de textos
minería de textosminería de textos
Pruebas de hipótesis Por mi
Pruebas de hipótesis Por miPruebas de hipótesis Por mi
Pruebas de hipótesis Por mi
Gonzalo Vazquez
 
ESTADISTICA (II Bimestre Abril agosto 2011)
ESTADISTICA  (II Bimestre Abril agosto 2011)ESTADISTICA  (II Bimestre Abril agosto 2011)
ESTADISTICA (II Bimestre Abril agosto 2011)
Videoconferencias UTPL
 
Medidas de tendencia central con excel (1)
Medidas de tendencia central con excel (1)Medidas de tendencia central con excel (1)
Medidas de tendencia central con excel (1)
Ayelen Pascolo
 
Distribuciones Muestrales
Distribuciones MuestralesDistribuciones Muestrales
Distribuciones Muestrales
Hector Funes
 
Anova. presentacion. lennys.
Anova. presentacion. lennys.Anova. presentacion. lennys.
Anova. presentacion. lennys.
LennysNJ
 
Estadistica unidad 1
Estadistica unidad 1Estadistica unidad 1
Estadistica unidad 1
smileinfected
 
5 ejercicios de correlación
5 ejercicios de correlación5 ejercicios de correlación
5 ejercicios de correlación
1010karen
 
Medidas de posicion
Medidas de posicionMedidas de posicion
Medidas de posicion
BillyToms
 
Medidas de tendencia central
Medidas de tendencia centralMedidas de tendencia central
Medidas de tendencia central
k4rol1n4
 
Ejecicio Resuelto Datos Agrupados .pdf
Ejecicio Resuelto Datos Agrupados .pdfEjecicio Resuelto Datos Agrupados .pdf
Ejecicio Resuelto Datos Agrupados .pdf
SistemadeEstudiosMed
 
Estadistica
Estadistica Estadistica
Estadistica
Sita Yani's
 
Prueba de hipótesis
Prueba de hipótesisPrueba de hipótesis
Prueba de hipótesis
UANL
 
Diseño completamente aleatorizado
Diseño completamente aleatorizadoDiseño completamente aleatorizado
Diseño completamente aleatorizado
n3n4
 
Modulo de estadística para la educacion superior
Modulo de estadística para la educacion superiorModulo de estadística para la educacion superior
Modulo de estadística para la educacion superior
Escuela Militar de Ingeniería (EMI)
 
Distribuciones muestrales. distribucion muestral de medias
Distribuciones muestrales. distribucion muestral de mediasDistribuciones muestrales. distribucion muestral de medias
Distribuciones muestrales. distribucion muestral de medias
eraperez
 
Exposicion 5.3 Prueba de Hipotesis Equipo Ramirez Elias Francisco
Exposicion 5.3 Prueba de Hipotesis Equipo Ramirez Elias FranciscoExposicion 5.3 Prueba de Hipotesis Equipo Ramirez Elias Francisco
Exposicion 5.3 Prueba de Hipotesis Equipo Ramirez Elias Francisco
Ariel Saenz
 

La actualidad más candente (20)

EstadíStica Inferencial Y Conceptos BáSicos
EstadíStica Inferencial Y Conceptos BáSicosEstadíStica Inferencial Y Conceptos BáSicos
EstadíStica Inferencial Y Conceptos BáSicos
 
Métodos y distribución de muestreo
Métodos y distribución de muestreoMétodos y distribución de muestreo
Métodos y distribución de muestreo
 
Medidas de tendencia central
Medidas de tendencia centralMedidas de tendencia central
Medidas de tendencia central
 
minería de textos
minería de textosminería de textos
minería de textos
 
Pruebas de hipótesis Por mi
Pruebas de hipótesis Por miPruebas de hipótesis Por mi
Pruebas de hipótesis Por mi
 
ESTADISTICA (II Bimestre Abril agosto 2011)
ESTADISTICA  (II Bimestre Abril agosto 2011)ESTADISTICA  (II Bimestre Abril agosto 2011)
ESTADISTICA (II Bimestre Abril agosto 2011)
 
Medidas de tendencia central con excel (1)
Medidas de tendencia central con excel (1)Medidas de tendencia central con excel (1)
Medidas de tendencia central con excel (1)
 
Distribuciones Muestrales
Distribuciones MuestralesDistribuciones Muestrales
Distribuciones Muestrales
 
Anova. presentacion. lennys.
Anova. presentacion. lennys.Anova. presentacion. lennys.
Anova. presentacion. lennys.
 
Estadistica unidad 1
Estadistica unidad 1Estadistica unidad 1
Estadistica unidad 1
 
5 ejercicios de correlación
5 ejercicios de correlación5 ejercicios de correlación
5 ejercicios de correlación
 
Medidas de posicion
Medidas de posicionMedidas de posicion
Medidas de posicion
 
Medidas de tendencia central
Medidas de tendencia centralMedidas de tendencia central
Medidas de tendencia central
 
Ejecicio Resuelto Datos Agrupados .pdf
Ejecicio Resuelto Datos Agrupados .pdfEjecicio Resuelto Datos Agrupados .pdf
Ejecicio Resuelto Datos Agrupados .pdf
 
Estadistica
Estadistica Estadistica
Estadistica
 
Prueba de hipótesis
Prueba de hipótesisPrueba de hipótesis
Prueba de hipótesis
 
Diseño completamente aleatorizado
Diseño completamente aleatorizadoDiseño completamente aleatorizado
Diseño completamente aleatorizado
 
Modulo de estadística para la educacion superior
Modulo de estadística para la educacion superiorModulo de estadística para la educacion superior
Modulo de estadística para la educacion superior
 
Distribuciones muestrales. distribucion muestral de medias
Distribuciones muestrales. distribucion muestral de mediasDistribuciones muestrales. distribucion muestral de medias
Distribuciones muestrales. distribucion muestral de medias
 
Exposicion 5.3 Prueba de Hipotesis Equipo Ramirez Elias Francisco
Exposicion 5.3 Prueba de Hipotesis Equipo Ramirez Elias FranciscoExposicion 5.3 Prueba de Hipotesis Equipo Ramirez Elias Francisco
Exposicion 5.3 Prueba de Hipotesis Equipo Ramirez Elias Francisco
 

Destacado

gpc eda presentación bogota
gpc eda presentación bogotagpc eda presentación bogota
gpc eda presentación bogota
Carlos Mantilla
 
Bioestadística ANOVA 1, TUKEY,ENDODONCIA
Bioestadística ANOVA 1, TUKEY,ENDODONCIABioestadística ANOVA 1, TUKEY,ENDODONCIA
Bioestadística ANOVA 1, TUKEY,ENDODONCIA
Mauricio Ruiz Tinajero
 
Significancia estadistica – relevancia clinica
Significancia estadistica – relevancia clinicaSignificancia estadistica – relevancia clinica
Significancia estadistica – relevancia clinica
ramolina22
 
Diseño Experimental
Diseño ExperimentalDiseño Experimental
Diseño Experimental
Juan de Jesus Sandoval
 
Gpc 08complet eda diarrea
Gpc 08complet eda diarreaGpc 08complet eda diarrea
Gpc 08complet eda diarrea
Carlos Mantilla
 
ANOVA Prueba de tukey
ANOVA  Prueba de tukeyANOVA  Prueba de tukey
ANOVA Prueba de tukey
Jaime Inca Guerrero
 
Prueba de tukey
Prueba de tukeyPrueba de tukey
Prueba de tukey
erikapuerto
 
Conceptos de diseño experimental
Conceptos de diseño experimentalConceptos de diseño experimental
Conceptos de diseño experimental
Marisol A
 

Destacado (8)

gpc eda presentación bogota
gpc eda presentación bogotagpc eda presentación bogota
gpc eda presentación bogota
 
Bioestadística ANOVA 1, TUKEY,ENDODONCIA
Bioestadística ANOVA 1, TUKEY,ENDODONCIABioestadística ANOVA 1, TUKEY,ENDODONCIA
Bioestadística ANOVA 1, TUKEY,ENDODONCIA
 
Significancia estadistica – relevancia clinica
Significancia estadistica – relevancia clinicaSignificancia estadistica – relevancia clinica
Significancia estadistica – relevancia clinica
 
Diseño Experimental
Diseño ExperimentalDiseño Experimental
Diseño Experimental
 
Gpc 08complet eda diarrea
Gpc 08complet eda diarreaGpc 08complet eda diarrea
Gpc 08complet eda diarrea
 
ANOVA Prueba de tukey
ANOVA  Prueba de tukeyANOVA  Prueba de tukey
ANOVA Prueba de tukey
 
Prueba de tukey
Prueba de tukeyPrueba de tukey
Prueba de tukey
 
Conceptos de diseño experimental
Conceptos de diseño experimentalConceptos de diseño experimental
Conceptos de diseño experimental
 

Similar a EDA

Estadística y software aplicado
Estadística y software aplicadoEstadística y software aplicado
Estadística y software aplicado
glavador95
 
Power point presentacion, medidas tendenciales de andris ramires
Power point presentacion, medidas tendenciales de andris ramiresPower point presentacion, medidas tendenciales de andris ramires
Power point presentacion, medidas tendenciales de andris ramires
andris345
 
Power point presentacion, medidas tendenciales de andris ramires
Power point presentacion, medidas tendenciales de andris ramiresPower point presentacion, medidas tendenciales de andris ramires
Power point presentacion, medidas tendenciales de andris ramires
Kelly Moreno
 
Estadistica 3. Medidas de Tendencia Central
Estadistica   3. Medidas de Tendencia CentralEstadistica   3. Medidas de Tendencia Central
Estadistica 3. Medidas de Tendencia Central
Edward Ropero
 
Power point presentacion, medidas tendenciales 456
Power point presentacion, medidas tendenciales 456Power point presentacion, medidas tendenciales 456
Power point presentacion, medidas tendenciales 456
Kelly Moreno
 
Trabajo de estadistica 3 parcial fernando
Trabajo de estadistica 3 parcial fernandoTrabajo de estadistica 3 parcial fernando
Trabajo de estadistica 3 parcial fernando
Tina Campos
 
Biometria clase 1_2a
Biometria clase 1_2aBiometria clase 1_2a
Biometria clase 1_2a
Javiera Saavedra
 
1.3 Medidas De Tendencia Central
1.3 Medidas De Tendencia Central1.3 Medidas De Tendencia Central
1.3 Medidas De Tendencia Central
ITCM
 
Tema 2
Tema 2Tema 2
Tema 2
pabloteba
 
The fisher assumptions and how to check them
The fisher assumptions and how to check themThe fisher assumptions and how to check them
The fisher assumptions and how to check them
Alex
 
Biometria clase 3
Biometria clase 3Biometria clase 3
Biometria clase 3
Javiera Saavedra
 
Biometria clase 3
Biometria clase 3Biometria clase 3
Biometria clase 3
Javiera Saavedra
 
Estadistica
EstadisticaEstadistica
Estadistica
shirley rivera
 
Presentacion elena paca
Presentacion   elena pacaPresentacion   elena paca
Presentacion elena paca
0603271735
 
Capitulo 1
Capitulo 1Capitulo 1
Capitulo 1
0603271735
 
Estadística. Medidas de tendencia central.
Estadística. Medidas de tendencia central.Estadística. Medidas de tendencia central.
Estadística. Medidas de tendencia central.
Mariangel Vivenzio Guzman
 
Estadística 1
Estadística 1Estadística 1
Estadística 1
juan vazquez
 
Asimetra
AsimetraAsimetra
Asimetra
IMELDALUZ
 
Clase2
Clase2Clase2
Clase2
Dianis Lu
 
Revista Control de calidad
Revista Control de calidadRevista Control de calidad
Revista Control de calidad
Joseht Flores Jr.
 

Similar a EDA (20)

Estadística y software aplicado
Estadística y software aplicadoEstadística y software aplicado
Estadística y software aplicado
 
Power point presentacion, medidas tendenciales de andris ramires
Power point presentacion, medidas tendenciales de andris ramiresPower point presentacion, medidas tendenciales de andris ramires
Power point presentacion, medidas tendenciales de andris ramires
 
Power point presentacion, medidas tendenciales de andris ramires
Power point presentacion, medidas tendenciales de andris ramiresPower point presentacion, medidas tendenciales de andris ramires
Power point presentacion, medidas tendenciales de andris ramires
 
Estadistica 3. Medidas de Tendencia Central
Estadistica   3. Medidas de Tendencia CentralEstadistica   3. Medidas de Tendencia Central
Estadistica 3. Medidas de Tendencia Central
 
Power point presentacion, medidas tendenciales 456
Power point presentacion, medidas tendenciales 456Power point presentacion, medidas tendenciales 456
Power point presentacion, medidas tendenciales 456
 
Trabajo de estadistica 3 parcial fernando
Trabajo de estadistica 3 parcial fernandoTrabajo de estadistica 3 parcial fernando
Trabajo de estadistica 3 parcial fernando
 
Biometria clase 1_2a
Biometria clase 1_2aBiometria clase 1_2a
Biometria clase 1_2a
 
1.3 Medidas De Tendencia Central
1.3 Medidas De Tendencia Central1.3 Medidas De Tendencia Central
1.3 Medidas De Tendencia Central
 
Tema 2
Tema 2Tema 2
Tema 2
 
The fisher assumptions and how to check them
The fisher assumptions and how to check themThe fisher assumptions and how to check them
The fisher assumptions and how to check them
 
Biometria clase 3
Biometria clase 3Biometria clase 3
Biometria clase 3
 
Biometria clase 3
Biometria clase 3Biometria clase 3
Biometria clase 3
 
Estadistica
EstadisticaEstadistica
Estadistica
 
Presentacion elena paca
Presentacion   elena pacaPresentacion   elena paca
Presentacion elena paca
 
Capitulo 1
Capitulo 1Capitulo 1
Capitulo 1
 
Estadística. Medidas de tendencia central.
Estadística. Medidas de tendencia central.Estadística. Medidas de tendencia central.
Estadística. Medidas de tendencia central.
 
Estadística 1
Estadística 1Estadística 1
Estadística 1
 
Asimetra
AsimetraAsimetra
Asimetra
 
Clase2
Clase2Clase2
Clase2
 
Revista Control de calidad
Revista Control de calidadRevista Control de calidad
Revista Control de calidad
 

Más de Moises Betancort

Carta a los padres y madres
Carta a los padres y madresCarta a los padres y madres
Carta a los padres y madres
Moises Betancort
 
Probabilidad 1
Probabilidad 1Probabilidad 1
Probabilidad 1
Moises Betancort
 
Probabilidad 3
Probabilidad 3 Probabilidad 3
Probabilidad 3
Moises Betancort
 
Probabilidad 2
Probabilidad 2 Probabilidad 2
Probabilidad 2
Moises Betancort
 
Diseños de investigacion en logopedia mb
Diseños de investigacion en logopedia mbDiseños de investigacion en logopedia mb
Diseños de investigacion en logopedia mb
Moises Betancort
 
Manova mb
Manova mbManova mb
Manova mb
Moises Betancort
 
Discriminante mb
Discriminante mbDiscriminante mb
Discriminante mb
Moises Betancort
 
Modelos mixed
Modelos mixedModelos mixed
Modelos mixed
Moises Betancort
 
AF Master Educacion
AF Master EducacionAF Master Educacion
AF Master Educacion
Moises Betancort
 
Anova3
Anova3Anova3
Anova2
Anova2Anova2
Anova1
Anova1Anova1
Introduccion al SPSS
Introduccion al SPSSIntroduccion al SPSS
Introduccion al SPSS
Moises Betancort
 
Tema 2 Organización de los datos
Tema 2 Organización de los datosTema 2 Organización de los datos
Tema 2 Organización de los datos
Moises Betancort
 
Tema 3 Medidas De Tendencia Central
Tema 3 Medidas De Tendencia CentralTema 3 Medidas De Tendencia Central
Tema 3 Medidas De Tendencia Central
Moises Betancort
 
Tema 3 Medidas De Dispersión
Tema 3 Medidas De DispersiónTema 3 Medidas De Dispersión
Tema 3 Medidas De Dispersión
Moises Betancort
 
Tema 3 Medidas De Posición
Tema 3 Medidas De PosiciónTema 3 Medidas De Posición
Tema 3 Medidas De Posición
Moises Betancort
 
Tema 1 Conceptos Basicos
Tema 1 Conceptos BasicosTema 1 Conceptos Basicos
Tema 1 Conceptos Basicos
Moises Betancort
 

Más de Moises Betancort (18)

Carta a los padres y madres
Carta a los padres y madresCarta a los padres y madres
Carta a los padres y madres
 
Probabilidad 1
Probabilidad 1Probabilidad 1
Probabilidad 1
 
Probabilidad 3
Probabilidad 3 Probabilidad 3
Probabilidad 3
 
Probabilidad 2
Probabilidad 2 Probabilidad 2
Probabilidad 2
 
Diseños de investigacion en logopedia mb
Diseños de investigacion en logopedia mbDiseños de investigacion en logopedia mb
Diseños de investigacion en logopedia mb
 
Manova mb
Manova mbManova mb
Manova mb
 
Discriminante mb
Discriminante mbDiscriminante mb
Discriminante mb
 
Modelos mixed
Modelos mixedModelos mixed
Modelos mixed
 
AF Master Educacion
AF Master EducacionAF Master Educacion
AF Master Educacion
 
Anova3
Anova3Anova3
Anova3
 
Anova2
Anova2Anova2
Anova2
 
Anova1
Anova1Anova1
Anova1
 
Introduccion al SPSS
Introduccion al SPSSIntroduccion al SPSS
Introduccion al SPSS
 
Tema 2 Organización de los datos
Tema 2 Organización de los datosTema 2 Organización de los datos
Tema 2 Organización de los datos
 
Tema 3 Medidas De Tendencia Central
Tema 3 Medidas De Tendencia CentralTema 3 Medidas De Tendencia Central
Tema 3 Medidas De Tendencia Central
 
Tema 3 Medidas De Dispersión
Tema 3 Medidas De DispersiónTema 3 Medidas De Dispersión
Tema 3 Medidas De Dispersión
 
Tema 3 Medidas De Posición
Tema 3 Medidas De PosiciónTema 3 Medidas De Posición
Tema 3 Medidas De Posición
 
Tema 1 Conceptos Basicos
Tema 1 Conceptos BasicosTema 1 Conceptos Basicos
Tema 1 Conceptos Basicos
 

Último

Business Plan -rAIces - Agro Business Tech
Business Plan -rAIces - Agro Business TechBusiness Plan -rAIces - Agro Business Tech
Business Plan -rAIces - Agro Business Tech
johnyamg20
 
Los Dominios y Reinos de los Seres Vivos
Los Dominios y Reinos de los Seres VivosLos Dominios y Reinos de los Seres Vivos
Los Dominios y Reinos de los Seres Vivos
karlafreire0608
 
Estás conmigo Jesús amigo_letra y acordes de guitarra.pdf
Estás conmigo Jesús amigo_letra y acordes de guitarra.pdfEstás conmigo Jesús amigo_letra y acordes de guitarra.pdf
Estás conmigo Jesús amigo_letra y acordes de guitarra.pdf
Ani Ann
 
Mundo ABC Examen 1 Grado- Tercer Trimestre.pdf
Mundo ABC Examen 1 Grado- Tercer Trimestre.pdfMundo ABC Examen 1 Grado- Tercer Trimestre.pdf
Mundo ABC Examen 1 Grado- Tercer Trimestre.pdf
ViriEsteva
 
Sesión de clase: El conflicto inminente.
Sesión de clase: El conflicto inminente.Sesión de clase: El conflicto inminente.
Sesión de clase: El conflicto inminente.
https://gramadal.wordpress.com/
 
La vida de Martin Miguel de Güemes para niños de primaria
La vida de Martin Miguel de Güemes para niños de primariaLa vida de Martin Miguel de Güemes para niños de primaria
La vida de Martin Miguel de Güemes para niños de primaria
EricaCouly1
 
1.- manual-para-la-creacion-33-dias-de-manifestacion-ulises-sampe.pdf
1.- manual-para-la-creacion-33-dias-de-manifestacion-ulises-sampe.pdf1.- manual-para-la-creacion-33-dias-de-manifestacion-ulises-sampe.pdf
1.- manual-para-la-creacion-33-dias-de-manifestacion-ulises-sampe.pdf
MiNeyi1
 
Lecciones 11 Esc. Sabática. El conflicto inminente docx
Lecciones 11 Esc. Sabática. El conflicto inminente docxLecciones 11 Esc. Sabática. El conflicto inminente docx
Lecciones 11 Esc. Sabática. El conflicto inminente docx
Alejandrino Halire Ccahuana
 
Prueba/test conoce tus heridas de la infancia
Prueba/test conoce tus heridas de la infanciaPrueba/test conoce tus heridas de la infancia
Prueba/test conoce tus heridas de la infancia
LudmilaOrtega3
 
1° T3 Examen Mtro JP 23-24.pdf completos
1° T3 Examen Mtro JP 23-24.pdf completos1° T3 Examen Mtro JP 23-24.pdf completos
1° T3 Examen Mtro JP 23-24.pdf completos
ROCIORUIZQUEZADA
 
Power Point: El conflicto inminente (Bosquejo)
Power Point: El conflicto inminente (Bosquejo)Power Point: El conflicto inminente (Bosquejo)
Power Point: El conflicto inminente (Bosquejo)
https://gramadal.wordpress.com/
 
La necesidad de bienestar y el uso de la naturaleza.pdf
La necesidad de bienestar y el uso de la naturaleza.pdfLa necesidad de bienestar y el uso de la naturaleza.pdf
La necesidad de bienestar y el uso de la naturaleza.pdf
JonathanCovena1
 
Evaluacion-Formativa-Nueva Escuela Mexicana NEM-ok.pdf
Evaluacion-Formativa-Nueva Escuela Mexicana NEM-ok.pdfEvaluacion-Formativa-Nueva Escuela Mexicana NEM-ok.pdf
Evaluacion-Formativa-Nueva Escuela Mexicana NEM-ok.pdf
EfranMartnez8
 
tema 7. Los siglos XVI y XVII ( resumen)
tema 7. Los siglos XVI y XVII ( resumen)tema 7. Los siglos XVI y XVII ( resumen)
tema 7. Los siglos XVI y XVII ( resumen)
saradocente
 
UrkuninaLab.pdfsadsadasddassadsadsadasdsad
UrkuninaLab.pdfsadsadasddassadsadsadasdsadUrkuninaLab.pdfsadsadasddassadsadsadasdsad
UrkuninaLab.pdfsadsadasddassadsadsadasdsad
JorgeVillota6
 
Este documento contiene, el programa completo de un acto para realizar la pro...
Este documento contiene, el programa completo de un acto para realizar la pro...Este documento contiene, el programa completo de un acto para realizar la pro...
Este documento contiene, el programa completo de un acto para realizar la pro...
romina395894
 
Mapa Mental documentos que rigen el sistema de evaluación
Mapa Mental documentos que rigen el sistema de evaluaciónMapa Mental documentos que rigen el sistema de evaluación
Mapa Mental documentos que rigen el sistema de evaluación
ruthmatiel1
 
Evaluacion del tercer trimestre del 2023-2024
Evaluacion del tercer trimestre del 2023-2024Evaluacion del tercer trimestre del 2023-2024
Evaluacion del tercer trimestre del 2023-2024
israelsouza67
 
POESÍA POR EL DIA DEL PADREEEEEEEEEE.pdf
POESÍA POR EL DIA DEL PADREEEEEEEEEE.pdfPOESÍA POR EL DIA DEL PADREEEEEEEEEE.pdf
POESÍA POR EL DIA DEL PADREEEEEEEEEE.pdf
karlavasquez49
 
Presentación de proyecto en acuarela moderna verde.pdf
Presentación de proyecto en acuarela moderna verde.pdfPresentación de proyecto en acuarela moderna verde.pdf
Presentación de proyecto en acuarela moderna verde.pdf
LuanaJaime1
 

Último (20)

Business Plan -rAIces - Agro Business Tech
Business Plan -rAIces - Agro Business TechBusiness Plan -rAIces - Agro Business Tech
Business Plan -rAIces - Agro Business Tech
 
Los Dominios y Reinos de los Seres Vivos
Los Dominios y Reinos de los Seres VivosLos Dominios y Reinos de los Seres Vivos
Los Dominios y Reinos de los Seres Vivos
 
Estás conmigo Jesús amigo_letra y acordes de guitarra.pdf
Estás conmigo Jesús amigo_letra y acordes de guitarra.pdfEstás conmigo Jesús amigo_letra y acordes de guitarra.pdf
Estás conmigo Jesús amigo_letra y acordes de guitarra.pdf
 
Mundo ABC Examen 1 Grado- Tercer Trimestre.pdf
Mundo ABC Examen 1 Grado- Tercer Trimestre.pdfMundo ABC Examen 1 Grado- Tercer Trimestre.pdf
Mundo ABC Examen 1 Grado- Tercer Trimestre.pdf
 
Sesión de clase: El conflicto inminente.
Sesión de clase: El conflicto inminente.Sesión de clase: El conflicto inminente.
Sesión de clase: El conflicto inminente.
 
La vida de Martin Miguel de Güemes para niños de primaria
La vida de Martin Miguel de Güemes para niños de primariaLa vida de Martin Miguel de Güemes para niños de primaria
La vida de Martin Miguel de Güemes para niños de primaria
 
1.- manual-para-la-creacion-33-dias-de-manifestacion-ulises-sampe.pdf
1.- manual-para-la-creacion-33-dias-de-manifestacion-ulises-sampe.pdf1.- manual-para-la-creacion-33-dias-de-manifestacion-ulises-sampe.pdf
1.- manual-para-la-creacion-33-dias-de-manifestacion-ulises-sampe.pdf
 
Lecciones 11 Esc. Sabática. El conflicto inminente docx
Lecciones 11 Esc. Sabática. El conflicto inminente docxLecciones 11 Esc. Sabática. El conflicto inminente docx
Lecciones 11 Esc. Sabática. El conflicto inminente docx
 
Prueba/test conoce tus heridas de la infancia
Prueba/test conoce tus heridas de la infanciaPrueba/test conoce tus heridas de la infancia
Prueba/test conoce tus heridas de la infancia
 
1° T3 Examen Mtro JP 23-24.pdf completos
1° T3 Examen Mtro JP 23-24.pdf completos1° T3 Examen Mtro JP 23-24.pdf completos
1° T3 Examen Mtro JP 23-24.pdf completos
 
Power Point: El conflicto inminente (Bosquejo)
Power Point: El conflicto inminente (Bosquejo)Power Point: El conflicto inminente (Bosquejo)
Power Point: El conflicto inminente (Bosquejo)
 
La necesidad de bienestar y el uso de la naturaleza.pdf
La necesidad de bienestar y el uso de la naturaleza.pdfLa necesidad de bienestar y el uso de la naturaleza.pdf
La necesidad de bienestar y el uso de la naturaleza.pdf
 
Evaluacion-Formativa-Nueva Escuela Mexicana NEM-ok.pdf
Evaluacion-Formativa-Nueva Escuela Mexicana NEM-ok.pdfEvaluacion-Formativa-Nueva Escuela Mexicana NEM-ok.pdf
Evaluacion-Formativa-Nueva Escuela Mexicana NEM-ok.pdf
 
tema 7. Los siglos XVI y XVII ( resumen)
tema 7. Los siglos XVI y XVII ( resumen)tema 7. Los siglos XVI y XVII ( resumen)
tema 7. Los siglos XVI y XVII ( resumen)
 
UrkuninaLab.pdfsadsadasddassadsadsadasdsad
UrkuninaLab.pdfsadsadasddassadsadsadasdsadUrkuninaLab.pdfsadsadasddassadsadsadasdsad
UrkuninaLab.pdfsadsadasddassadsadsadasdsad
 
Este documento contiene, el programa completo de un acto para realizar la pro...
Este documento contiene, el programa completo de un acto para realizar la pro...Este documento contiene, el programa completo de un acto para realizar la pro...
Este documento contiene, el programa completo de un acto para realizar la pro...
 
Mapa Mental documentos que rigen el sistema de evaluación
Mapa Mental documentos que rigen el sistema de evaluaciónMapa Mental documentos que rigen el sistema de evaluación
Mapa Mental documentos que rigen el sistema de evaluación
 
Evaluacion del tercer trimestre del 2023-2024
Evaluacion del tercer trimestre del 2023-2024Evaluacion del tercer trimestre del 2023-2024
Evaluacion del tercer trimestre del 2023-2024
 
POESÍA POR EL DIA DEL PADREEEEEEEEEE.pdf
POESÍA POR EL DIA DEL PADREEEEEEEEEE.pdfPOESÍA POR EL DIA DEL PADREEEEEEEEEE.pdf
POESÍA POR EL DIA DEL PADREEEEEEEEEE.pdf
 
Presentación de proyecto en acuarela moderna verde.pdf
Presentación de proyecto en acuarela moderna verde.pdfPresentación de proyecto en acuarela moderna verde.pdf
Presentación de proyecto en acuarela moderna verde.pdf
 

EDA

  • 1. Explorando Datos Multivariados 1 POP Psicología de la Educación
  • 2. Estructura y Representación de los Datos Multivariados Gráficos de distribución de los datos Datos perdidos y/o extremos 2.1. Medias Restringidas 2.2. Medias Semirestringidas 2
  • 3. Estructura y Representación de los Datos Observar los datos gráficamente nos permite ver cómo se distribuyen, si se cumplen los criterios para la aplicación de una determinada prueba paramétrica.. Etc… Una vez obtenidos los datos. Observarlos graficándolos de distintas maneras. Observar los datos nos permite ahorrar tiempo en los análisis paramétricos. Seleccionando la prueba adecuada. 3
  • 4. Estructura y Representación de los Datos Tipos de gráficos: Histograma de Frecuencia: Nos permite intuir la distribución de probabilidad de los datos, normalidad, simetría, etc. Diagrama de Tallos y Hojas Útil para muestra de datos pequeñas. Nos da la información del histograma pero observando los valores de la variable. Cajas y bigotes Permite estudiar la simetría de los datos, y detectar valore atípicos. Gráfico de Normalidad P-P Nos permite comprobar si unos datos se ajustan a la distribución normal. Gráfico de dispersión Utilizados para ver la distribución conjunta de dos variables o más. 4
  • 6. Outliers Se define como aquel valor que está entre 1,5 y 3 IQR (amplitud intercuartílica P75-P25 Como inspeccionamos los outliers: Haciendo un gráfico de cajas y bigotes (boxplot) Observando los datos tipificados de la variable (puntuaciones-z) sentencia RANK (p.e. RANK ci / NORMAL) Una vez identificados los outliers ¿Qué hacemos con ellos? Quitar el caso Cambiar el dato (p.e. media grupo, media condición, media sujeto, etc.) Transformación de los datos (esto se hace en cualquier caso cuando la distribución de los datos es asimétrica) 6
  • 7. Outliers Tipos de transformaciones… Tranformaciones logaritmicas (Log (Xi)). En este caso hay que tener en cuenta que si los datos están muy próximos a cero o son negativos hay que previamente transformarlos sumando una constante. Tranformación con la raíz cuadrada Tranformación recíproca (1/Xi). En este caso los valores altos se convertirán en valores próximos a cero, y los valores bajos serán los más altos. Lo que hacemos es utilizar la fórmula 1/Xmayor-Xi) Todas estas tranformaciones se utilizan para tranformar distribuciones asimétricas tanto positivas como negativas.. Una familia de transformaciones especialmente útiles es la “escalera de potencias” de Tukey 7
  • 8. Corrigen asimetría negativa Corrigen asimetría positiva Outliers Escalera de potencias de Tukey 8
  • 9. Outliers Si la transformación falla, podemos reemplazar el dato… ¿cómo? por el valor más alto mas uno Reemplazarlo por el valor que tiene en 3 desviaciones típicas Una variación del anterior es cambiar el valor por el que corresponde a 2 desviaciones típicas Lo mejor es transformar los datos, en lugar de quitar o sustituir, cuando tenemos outliers. Si transformamos una variable porque su distribución es asimétrica, tenemos que hacer lo mismo con todas las demás. 9
  • 10. Ejemplo. Datos de TR de un participante No sólo que hay algunas puntuaciones atípicas a ambos lados, sino que hay una clara asimetría positiva.
  • 11. Ejemplo. Datos (transformados; raiz cuadrad) de TR de un participante (cont.) HEMOS EFECTUADO LA RAIZ PARA HACER MÁS SIMETRICA LA DISTRIBUCIÓN. No sólo que aún queda algo de asimetría positiva. Con el logaritmo, podremos reducir más la asimetría positiva, es lo que haremos ahora
  • 12. Ejemplo. Datos (transformados; logaritmo) de TR de un participante (cont.) Nota: Si algún valor fuera 0, emplear log(1+x) En este caso no sólo que la asimetría positiva ha desaparecido (si acaso hay cierta asimetría negativa causada por unas pocas puntuaciones atípicas).
  • 13. Ejemplo. Datos (transformados; cuadrado) de TR de un participante (cont.) Nota: Emplear el cuadrado no se debe hacer para corregir la asimetría positiva...sólo la negativa! Lo que hemos hecho es aumentar la asimetría positiva y eso no es lo que queríamos...(y si empleamos el cubo, aún peor para nuestros fines).
  • 14. Transformación de Variables Esta familia de transformaciones (“escalera de Tukey”) tiene importantes propiedades: Preservan el orden de los valores; es decir, los valores mayores de la escala original seguirán siendo los valores mayores en la escala transformada. 2. Modifican la distancia entre los valores. Con potencias p<1 (raíz x o log x) se comprimen los datos en la parte superior de la distribución en relación a los valores menores; Con potencias p>1 (como el cuadrado de x) se tiene el efecto contrario. 3. El efecto sobre la forma de la distribución cambia sistemáticamente con p. Si raíz x hace menos pronunciada la asimetría positiva de una distribución, el log x provocará que la distribución resultante sea aún menos asimétrica positiva (en relación a raíz x). 14
  • 15. Transformación de Variables En definitiva, las transformaciones de potencia pueden hacer que la variable transformada tenga menos asimetría. ¿Por qué es eso importante? – Las distribuciones que muestran una clara asimetría son difíciles de estudiar. – Los valores originales aparentemente atípicos se encontrarán más cercanos al grueso de los datos. – Los métodos estadísticos suelen emplear la media aritmética; pero la media de una distribución asimétrica no es un buen índice del grueso de los datos. 15
  • 16. Estructura y Representación de los Datos Estadísticos (Estimadores) robustos (ESTADÍSTICA INFERENCIAL): Son aquellos estadísticos (estimadores) que funcionan bien para varios tipos distintos de distribuciones teóricas, aunque pueden no ser el mejor estimador para ningún tipo concreto de distribución. Es decir, son el “mejor compromiso”. La media no es un estimador robusto. La mediana es un estimador más robusto que la media, si bien hay otros estimadores más robustos que veremos en el punto siguiente del temario. 16
  • 17. Medidas robustas de tendencia central 1. Medias Recortadas Consiste en calcular la media aritmética sobre un subconjunto central del conjunto de datos, no considerándose una determinada proporción p por cada extremo. (p se expresa normalmente como porcentaje). Por ejemplo, una media recortada al 40% en una secuencia de 10 datos implica no tener en cuenta ni los 4 valores menores ni los 4 valores mayores. Observar que la media recortada al 0% es la media aritmética. A la media recortada al 25% se la denomina centrimedia. 17
  • 18. Medidas robustas de tendencia central 1. Medias Recortadas (cont) Calculamos la media recortada al 10% de los siguientes datos: 3, 4, 4, 5, 5, 6, 7, 8, 9, 11 El valor es 6 Calcula la centrimedia El valor es 5.8 18
  • 19. Medidas robustas de tendencia central 2. Media Winsorizada Es análogo a las medias recortadas excepto en que las puntuaciones eliminadas, ya no lo son sino que se sustituyen por los valores menor y mayor que quedan para el cómputo de la media winsorizada. Así, en la media recortada a nivel 2 implicaría eliminar las dos puntuaciones mayores y las 2 menores: 3, 4, 4, 5, 5, 6, 7, 8, 9, 11 Y quedan los datos: 4, 5, 5, 6, 7, 8 y se calcula la media de los mismos En la media winsorizada, los datos 3 y 4 (los dos menores) y el 9 y 11 (los dos mayores) se sustituyen por 4 y 8 respectivamente. Es decir, 4, 4, 4, 5, 5, 6, 7, 8, 8, 8 y se calcula la media de los mismos, que será la media winsorizada a nivel 2 (debe de dar 5.9) 19
  • 20. Medidas robustas de tendencia central 3. Otros tipos de media en la que se recortan datos En muchas ocasiones lo que se hace es emplear un valor mínimo y uno máximo más allá del cual se eliminan los datos que sobrepasen tales valores. Por ejemplo, en experimentos de tiempo de reacción para discriminar palabras/pseudopalabras se pueden eliminar datos menores de 200 ms y mayores de 1500 ms. (Menos de 200 ms es demasiado rápido; más de 1500 ms es demasiado lento.) De esta manera, si todos los datos están en el rango 200-1500 ms no se elimina ningún dato 20
  • 21. Medidas robustas de tendencia central 4. Trimedia Es un índice de tendencia central que consiste en calcular una media aritmética ponderada de tres medidas, la Mediana (con peso doble) y el primer y tercer cuartil. Pensemos que en un conjunto de datos, el primer cuartil es 51, la mediana es 55 y el tercer cuartil es 63. La trimedia es: 21
  • 22. Medidas robustas de tendencia central 5. Otras medidas robustas El estimador-M de Huber, el estimador biponderado de Tukey, el estimador M-redescendente de Hampel y el estimador en onda de Andrew. Estos estimadores se diferencian entre sí por el tipo de ponderación aplicada sobre los datos. Por ejemplo, en el Estimador-M de Huber (Estimador M de posición): Las puntuaciones típicas que sean menores que una constante, reciben un peso de 1. Los casos que tienen los mayores valores absolutos tienen pesos tanto más pequeños cuanto mayor es su distancia respecto a cero. La constante es 1.339.  Cálculo: lo da el SPSS. 22
  • 23. Sentencia Explore Nos permite obtener una serie de datos tanto numéricos como gráficos sobre nuestros datos. (hay otras sentencias para estudiar desde un punto de vista descriptivo los datos. ES BUENO PRACTICAR!!!) 23