1. Copia de seguridad:jnl automóviles (Automóviles2008), camiones y furgonetas (Camionesyfurgonetas2008),
EDICIÓN/OPCIONES/UBICACIÓN ARCHIVO/DIARIO DE LA SESIÓN/registrar: “carpeta creada” (donde oficinas bancarias (Oficinasbancarias2008), actividades comerciales minoristas
lo guardamos) (Actividadescomercialesminoristas2008). Estime el modelo de regresión
FUSIÓN DE ARCHIVOS: correspondiente y evalúe las siguientes cuestiones:
excel a spss. 1.FUSIONAMOS: miramos rango Excel (E17:q142) 1. ANALIZAR/RERESION LINEAL. Dependiente: cuotamercado2008. Indep:
2. DATOS/FUNDIR CASOS/ sex y sexo (seleccionar)/par. Aceptar. poblacion2008;telefonosfijos2008;automóviles2008;camionesyfurgonetas2008;oficinasbancarias20
(3. En el nuevo archivo spss donde tenemos los datos de Excel, fusionamos el hipotecas_1.sav 08;actividadcomercial2008.
(datos/fundir archivo/añadir casos) de spss a spss)
a) ¿Qué le parece la bondad del ajuste? El R2 es 1, por tanto el modelo se ajusta perfectamente.
3. DATOS/COPIAR PROPIEDADES DATOS/ SIGUIENTE.
4. Datos/ ordenar casos/identificador/forma ascendente. b) ¿Le parece significativo el modelo? La tabla ANOVA nos muestrauna significación del 0’000
5. guardar como/ nombre del archivo. trabajamos con éste por tanto el modelo es significativo.
CREAR VARIABLES: c) ¿Cuál es la variable con mayor importancia en el modelo? La variable más importante es
-Calcular (nueva variable)Genere una nueva variable de nombre Hipotot con la etiqueta: número aquella donde la b estandarizada es mayor, en este caso: los teléfonos fijos.
total de hipotecas que recoja la suma del número de hipotecas urbanas y
rústicas.TRANSFORMAR/CALCULAR VARIABLE/ variable destino: hipotot. Formula: nº hipotecas
7) Si con las variables explicativas del apartado anterior se plantea realizar un análisis en
urbanas y rusticas.
-Recodificar en distintas variables(quieres hacer grupos de una variable): A partir de la variable componentes principales, con una rotación varimax y reteniendo aquellas componentes con
edad genere una nueva variable de nombre edadr que recoja los siguientes grupos de edad: valor mayor a 1, valore las siguientes cuestiones:
TRANSFORMAR/ RECODIFICAR EN DISTINTAS VARIABLES/VARIABLE NUMERICA:EDAD;VARIABLE 1. ANALIZAR/REDUCCION DE DIMENSIONES/FACTORES/ variables:
cuanti/descriptivos: descriptivos univariados/solución analizar: matriz de correlaciones:
RESULTADO: EDADR. Valores antiguos y nuevos: ponemos tabla con codificación.
marcar todos lo de la izquierda. Extracción/matriz de correlaciones/ visualización: solución
ANALISIS UNIVARIADO: (estudiamos una variable) facotrial sin rotar y grafico de sedimentación. Extraer: numero de factores que te dicen que
-análisis de frecuenciaV.cualis cuantas veces se da un caso . analizar/est.descrip/frecuencias extraigas, sino te dicen nada, extraes todos. Rotación: varimaz, grafico de saturación.
-descriptivo v.cuantis ej: la media de edad. Analizar/est.descrip/descrip/variables: v. analizar Puntuaciones: guardar como variables/método de regresión. Mostrar matriz de
-exploratoriov. cuanti. pregunta intervalo. Est.descrip/explorar.Solo poner variable indep. coeficientes…
-Asignar rangos a los casos par hacer un orden. TRANSFORMAR/ASIGNAR RANGOS A
CASOS/V.que queremos ordenar/asignar rango 1 a valor mayor/tipos de rango: rango y ntiles. PARA a) ¿Tiene sentido realizar un análisis en componentes principales?
VER EL RESULTADO: descriptivos (si me pone bº por empleados, en descrip.la variable sería: El determinantes es muy próximo a 0, el KMO tiene un valor 0’8 considerado muy bueno para
empleado. realizar componentes principales junto con la prueba de Bartlett que nos da significativa (<0’05). Los
ANALISIS BIVARIADO: (estudiamos 2 v.) coeficientes de correlación son muy elevados y el MSA son también elevados.
-Tablas de Contingencia (2v. cuali) Obtenga un resultado que considerando el total de personas de b) ¿Cuantas componentes se retienen y cuál es el porcentaje de inercia
la base de datos le permita conocer cuántos son fumadores y el porcentaje según sea su nivel retenida?
educativo como son variables cualitativas hacemos TABLA DE CONTINGENCIA Con una única componente se retiene el 99’2% de la inercia total
(analizar/est.descrip./tablas de contingencia/filas: v.dependiente:fumador/columna: v.indep: nivel c) ¿Qué variables se relacionan con la primera componente?
estud. ESTADISTICOS: chi cuadrado/ CASILLAS: fila;columna;total. Como solo hemos retenido una componente principal no podemos realizar rotación varimax, y
a) ¿Cuál es el nivel educativo con mayor porcentaje de fumadores? Miramos el grupo de SI todas las variables originales se encuentran muy correlacionadas con la primera componente
FUMADOR y dentro de éste el nivel educativo y el porcentaje mayor a esta variable: 55’6% principal.
b) Del grupo con estudios de bachillerato, ¿Qué porcentaje son fumadores? Miramos
bachillerato/grupo de sí fumador/ y %segun nivel de estudios. 37’2% GRAFICOS
c) Dentro del grupo de los fumadores, ¿Qué porcentaje son universitarios? 25’3%+18’9%
d) ¿Existe algún tipo de asociación entre el nivel educativo y el hecho de que sea fumador? Lineasevolución.
Justifique su respuesta. MIRAMOS CHI-CUADRADO/ sign=0’706 (>0’05) RHO (asociación entre Barras de error comparar medias
variables). Por tanto diremos que no hay asociación entre las variables. Dispersión correlacion y regresión lineal
-Regresión(2 v. cuanti) ¿Puede establecerse una relación de dependencia entre el importe Histograma por defecto o te lo dicen.
de las fincas urbanas respecto: al número de fincas urbanas hipotecadas, el número de
fincas rústicas hipotecadas y el importe de las fincas rústicas? Analizar/regresión/lineal/v.dep PREGUNTAS EXAMEN:
y las indep.En guardar que hay que marcar: no tipificados y no tipificados).Grafico: dispersión. - Segmentar y frecuencias
¿Puede establecerse una relación de dependencia entre el importe de las fincas urbanas respecto: Obtenga un resumen de los casos que recoja para cada Comunidad Autónoma (CC.AA) el
al número de fincas urbanas hipotecadas, el número de fincas rústicas hipotecadas y el importe de número de municipios que aparecen en la base de datos según (provincia) y responda a
las fincas rústicas? las siguientes cuestiones:
1. REGRESIÓN LINEAL
a) ¿Tiene sentido el modelo? SIGN >0’05 Tiene sentido el modelo Rho (Y=ß= ß= ß=0) 1. Segmentar archivo/comparar grupos según CCAA
b) Explique el valor correspondiente a la bondad del ajuste. 0’918. El modelo se ajusta muy bien. 2. Analaizar/est.descripitivos/frecuencia/mostrar tabla de frecuencias.
c) ¿Cuál es la variable más importante? ¿Por qué? Número de fincas urbanas hipotecadas, porque
es la beta tipificada más alta.
PONDER CASOS: cuando queremos muestra representativa. Datos/ponderar casos. - Calcular nueva variable y ponderar
SEGMENTAR: cuando queremos hacer un análisis comporando dos grupos: 1. DATOS/SEGMENTAR
ARCHIVO/ grupos absados en: variable que queremos dividir Genere una nueva variable de nombre INCPOB que recoja el porcentaje de variación de la
SELECCIONAR: cuando solo realizamos un estudio de una parte de la muestra(filtro) 1.
población entre el año 1998 y 2008 (Población2008, Población1998) para cada
SELECCIONAR CASOS/SI SATISFACE LA CONDICION : fumadores=1
municipio. A partir de la variable anterior calcule los incrementos medios de la población
por Comunidad Autónoma (CC.AA) para este periodo.
AGREGAR(escribir un nuevo archivo): Nota: Para este último cálculo considere la población de 1998 como factor de ponderación.
Genere un nuevo archivo que recoja el valor de todas las variables numéricas y que proporcione la 1. datos/segmentar archivo/grupos basados en CCAA.
suma según el mes correspondiente. A partir del archivo originado obtenga un gráfico que le 2. datos/calcular variable/ ((población 2008/población 1998)-1)x100
permita visualizar los importes correspondientes a las fincas urbanas y rústicas según el mes del 3. datos/ponderar casos/ponderar casos mediante: población 1998
año. Guarde este archivo con el nombre AGREGAR.SAV DATOS/AGREGAR/variable de 4. analizar/estd.descriptivos/descriptivos/ variable: INCPO opciones:media.
segmentación: mes/ variables agregadas: todas las numéricas. FUNCIÓN: SUMA.2. ESCRIBIR UN
NUEVO ARCHIVO: agregar 3. en el nuevo archivo: graficos/barras/agrupado/distintas variables Genere una nueva variable de nombre Hipotot con la etiqueta: número total de hipotecas
COMPARAR MEDIAS: graficos de error
que recoja la suma del número de hipotecas urbanas y rústicas. A partir de esta nueva
Antes debemos hacer la segmentación la K_S 1 y quitar segmentación
variable genere un gráfico de líneas que le permita visualizar la evolución durante este
K_S 1 muestra: analizar/pruebas no paramétricas/ cuadros de diálogos antiguos/KS_1 muestra
T para una muestra: (ingresos medios es el mismo para todos los fumadores)cuando solo hay un período del total de hipotecas.
grupo. Analizar/comparar medias/t para una muestra. 1. TRANSFORMAR/CALCULAR VARIABLE/ variable destino: hipotot. Formula: nº hipotecas
T muestras independientes: (ingreso medio es el mismo para HOMBRES y MUJERES)2 grupos AL urbanas y rusticas.
mirar el la significación de levene vemos que la significación es significativa y por tanto 2. restablecer
miramos la línea de abajo. Y la significación es 0’00 y Rho. Por tanto no se acepta la 2. graficos/de líneas/ simple/ para casos individuales
igualdad del importe medio de las fincas urbanas. 4. La línea respresenta: hipotot / variable: year.
ANOVA: (Ingreso medio para cada grupo de edad que tengamos)más de dos grupos. Si es
A partir de la variable edad genere una nueva variable de nombre edadr que recoja los
significativa decimos que el modelo es bueno.
¿Puede aceptarse estadísticamente que el nivel de ingresos medios es el mismo siguientes grupos de edad:
independiente del sexo de la persona? Se ponen en relación 2 variables analisis bivariado Genere también las etiquetas correspondientes. 1. TRANSFORMAR/ RECODIFICAR EN
(descartamos descriptivos) Como nos pide la media hay que hacer: ANALISIS DE MEDIAS, DISTINTAS VARIABLES/VARIABLE NUMERICA:EDAD;VARIABLE
primero KS_1 muestra para saber si la variable es normal. Y si lo es, hacemos el análisis de RESULTADO: EDADR. Valores antiguos y nuevos: ponemos tabla Grupo Etiqueta
medias: T 1 18 a 24 años
con codificación.
1. Primero, debemos segmentar el archivo según el sexo: DATOS/SEGMENTAR 2. ¿Podemos aceptar que todos los grupos de edad tienen el
2 25 a 44 años
ARCHIVO/GRUPOS BASADOS EN SEXO. 3 45 a 64 años
mismo ingreso medio? Justifique su respuesta mediante el
2. ANALIZAR/ PRUEBAS NO PARAMETRICAS/ks_1 UNA MUESTRA 4 65 o más años
Como vemos que la significación tanto para los hombres como para las mujeres es >0’05 procedimiento estadístico y gráfico correspondiente.
no rechazamos Ho (las variables son normales). Por tanto las variables son normales y 1. KS_1 muestra. SEGMENTAMOS ARCHIVO/ KS_1 : lista contraste variables: ingresos. Las
podemos hacer la comparación de medias. 4 significaciones (una para cada grupos) nos dan no significativas. Por tanto son variables
3. SI ES SIGNIFICATIVO HACEMOS: quitamos la segmentación/comparar medias/t para qe siguen la ley normal. HACEMOS ANOVA.
muestras independientes (porque tenemos dos variables independientes: mujeres y 2. TABLA ANOVA (porque en grupos de edad tenemos 4 grupos (+2 grupos). Es sinificativa
hombres)/ variables para contrastar : ingreso/variable de agrupación:sexo/definir grupos: 1
por tanto Rho ( todos los grupos tienen el mismo ingreso) por tanto diremos que el ingreso
y 2.
es diferente según el grupo de edad.
4. Miramos prueba de Levene y como la sign (>0’05) no son significativas (las varianzas
son iguales) por tanto miramos la primera fila. Miramos la significación y es 0’791>0’05, no 3. GRAFICOS/ Etiquetamos los grupos en: vista de variables/GRAFICOS/BARRAS DE
es significativa y se acepta la Ho que decía: el nivel de ingresos no es el mismo para ERROR/ SIMPLE/GRUPOS DE VARIABLES. Variable: ingresos. Eje: edadr
hombres y mujeres.
Genere una nueva variable de nombre año1 que asigne los casos a dos grupos según
COMP.PRINCIPALES pertenezcan a un año anterior al 2000 o de este en adelante..
Según el anuario de la Caixa, La cuota de mercado (Cuotademercado2008) es un índice 1. Recodificar en distinta variable/ variable de entrada: año/nombre: año1/cambiar
que expresa la capacidad de consumo comparativa de los municipios a partir de las 2. valores antiguos y nuevos: rango menor hasta 1999 valor 1/rango valor hasta superior:
variables: población (Población2008), teléfonos fijos (Telefonosfijos2008), 2000 valor 2. Continuar.
2. c) Dentro del grupo de los fumadores, ¿Qué porcentaje son universitarios? 25’3%+18’9%
- T para una muestra relacionada d) ¿Existe algún tipo de asociación entre el nivel educativo y el hecho de que sea fumador?
Seleccione los municipios de Andalucía. ¿Puede aceptarse estadísticamente que la tasa de Justifique su respuesta. MIRAMOS CHI-CUADRADO/ sign=0’706 (>0’05) RHO (asociación
paro de hombres (%paro de varones) y mujeres (%paro de mujeres) es igual? entre variables). Por tanto diremos que no hay asociación entre las variables.
Justifique su respuesta.
1. datos/seleccionar casos/si se cumple la condición que CCAA=”Andalucia”. Genere una tabla que recoja el total de operaciones urbanas efectuadas en cada año y en
Analizar/pruebas no paramétricas/KS_1 muestra/contrastar variables:%paro mujeres, cada mes y responda a las siguientes preguntas:
%paro hombres 1. ponderar casos/ fincas urbanas
Al hacer la prueba KS_1 muestra, vemos que las significaciones no nos dejan rechazar la 2. analizar/descriptivos/tablas contingencia/filas: year/columna:month
hipótesis nula (sing>0’05) sobre si las variables se distribuyen mediante una ley normal. Así 3. Casillas: recuentos y porcentajes.
pues se acepta la normalidad de las dos variables y podemos seguir contrastando con el
contraste paramétrico correspondiente (prueba T para muestras relacionadas)..
- T para muestras independientes
-analizar/comparar medias/ t para variables relacionadas. Variables relacionadas: %paro
mujeres, %paro hombres. ¿Puede aceptarse estadísticamente que el nivel de ingresos medios es el mismo
independiente del sexo de la persona? Justifique su respuesta.
Vemos que la significación es >0’05 (0’238), el intervalo engloba el valor 0 (-1’1572;0’2945)
Se ponen en relación 2 variables analisis bivariado (descartamos descriptivos) Como nos
y la T es 1’19 (<1’96), por lo que no podemos rechazar la Ho (paro varones y paro mujeres pide la media hay que hacer: ANALISIS DE MEDIAS, primero KS_1 muestra para saber si la
es igual). Para hacerse el análisis adecuadamente, debería haberse ponderado por la variable es normal. Y si lo es, hacemos el análisis de medias: T
población de hombres y mujeres, que en este caso no esta disponible. 1. Primero, debemos segmentar el archivo según el sexo: DATOS/SEGMENTAR
ARCHIVO/GRUPOS BASADOS EN SEXO.
- Generar un nuevo archivo/agregar 2. ANALIZAR/ PRUEBAS NO PARAMETRICAS/ks_1 UNA MUESTRA
Como vemos que la significación tanto para los hombres como para las mujeres es >0’05
Genere un nuevo archivo, de nombre ARAGÓN que recoja solo para las provincias de esta no rechazamos Ho (las variables son normales). Por tanto las variables son normales y
Comunidad Autónoma, el número total de (motocicletas), el total km2 (ExtensiónKm2), podemos hacer la comparación de medias.
el número de municipios (Municipio) y el número de habitantes (Población2008), según 3. SI ES SIGNIFICATIVO HACEMOS: quitamos la segmentación/comparar medias/t para
provincia. Sobre este archivo, calcule una nueva variable motos_habi que recoja el muestras independientes (porque tenemos dos variables independientes: mujeres y
número de motocicletas por cada 1.000 habitantes. ¿Cuál es el valor correspondiente para hombres)/ variables para contrastar : ingreso/variable de agrupación:sexo/definir grupos: 1
esta nueva variable a la provincia de Huesca? 47’58 y 2.
1. datos /seleccionar casos/ si cumple la condición si CCAA=”Aragón”
4. Miramos prueba de Levene y como la sign (>0’05) no son significativas (las varianzas
2. Datos / agregar/ variables de segmentación: provincia. Variables agregadas: motocicletas,
son iguales) por tanto miramos la primera fila. Miramos la significación y es 0’791>0’05, no
función, Estadísticos de resumen: suma, ExtensiónKm2, función, Estadísticos de resumen: suma, es significativa y se acepta la Ho que decía: el nivel de ingresos no es el mismo para
Municipio, función, Número de casos sin ponderar, Población2008, función, Estadísticos de hombres y mujeres.
resumen: suma./ESCRIBIR UN NUEVO ARCHIVO DE DATOS QUE TENGA SOLAMENTE LAS VARIABLES
AGREGADAS. - Regresión lineal
A partir del nuevo archivo: TRANSFORMAR/CALCULAR VARIABLE: moto_habi=(suma motos/suma ¿Puede explicarse el porcentaje de ahorro en función de la edad y el nivel de ingresos?
población 1998)x100. Mirar Huesca 1. analizar/regresión lineales (porque nos pide el análisis de dos variables en concreto, si
fueran todas deberíamos hacer componentes principales para poder eliminar variables).
Genere un nuevo archivo de trabajo que muestre, para cada nivel de estudios, los
Dependiente: ahorrom/indepnd: edad y nivel de ingresos
siguientes estadísticos de la variable ingresos: media, máximo, mínimo y el número de
En ANOVA vemos que la significación es (<0’05) por tanto el modelo es significativo, por
casos. Denomine a este nuevo fichero Resumen.SAV. Con este fichero realice un gráfico
de barras que recoja los ingresos medios según el nivel de estudios (en el gráfico tanto el ahorro se explica mediante la edad y el nivel de ingresos.
introduzca los valores correspondientes a los ingresos). ¿Qué grupo tiene los mayores Comente la bondad del ajuste. LA R2 es muy baja (0’052) lo que indica un muy mal ajuste.
ingresos? ¿Cuál es la variable más importante del modelo? el nivel de ingresos, porque en ANOVA
1. Nuevo archivo de trabajo nueva hoja de SPSS: con variables: ingresos:media, max, min, nº de vemos que las betas tipificadas, la mayor corresponde a nivel de ingresos.
casos. Nombre del archivo: resumen.sav
a) DATOS/AGREGAR/ VARIABLE SEGMENTACIÓN: NIVEL DE ESTUDIS/VARIABLES - Explorar
AGREGADAS/INGRESOS (añadimos ingreso por cada función diferente) Seleccione la variable correspondiente al número de fincas rústicas hipotecadas y facilite
b)ESCRIBIR UN NUEVO ARCHIVO DE DATOS/lo gardamos en la carpeta con el nombreRESUMEN los siguientes estadísticos mediante un único procedimiento del programa.
2. GRAFICO/BARRAS/SIMPLE/VALORES INDIVIDUALES DE LOS CASOS/ LAS BARRAS REPRESENTAN: 1. analizar/descriptivos/explorar.(solo una variable, si hubiera más tabla de contingencia)
INGRESOS MEDIOS/ VARIABLE: NIVEL DE ESTUDIO.
3. DOBLE CLIK EN UN GRAFICO/CLIK DERECHO: mostrar etiquetas
- Grafico de barras
Realice un gráfico de barras que recoja la población para el año 2008 (Población2008)
por Comunidad Autónoma (CC.AA). ¿Cuál es la Comunidad Autónoma con mayor
población?. Graficos/barras/simple/resúmenes para los grupos de casos/ otro estadístico:
población 2008, eje categorías: CCAA. Vemos que la CCAA con mayor población es Madrid.
- Fusión de datos
Fusione la información proporcionada por los archivos fumador_1.SAV y
fumador_1.XLS en un único archivo. Incorpore la información de las variables del archivo
Datos fumador.SAV Ordene la base de datos de forma ascendente mediante la variable
identifi. Guarde la información del archivo con nombre fumador.SAV, ¿Qué porcentaje
de hombres tienen unos ingresos iguales o inferiores a 1.700€?
1.FUSIONAMOS: miramos rango Excel (E17:q142)
2. DATOS/FUNDIR CASOS/ sax y sexo (seleccionar)/par. Aceptar.
3. DATOS/COPIAR PROPIEDADES DATOS/ SIGUIENTE.
4. Datos/ ordenar casos/identificador/forma ascendente.
5. guardar como/ fumador.
6. seleccionar casos (cuando solo nos interesa un grupo) (lo segmentamos cuando
queremos la información en dos grupos)/si satisface la condición: sexo=1.
ANALIZAR/EST.DESCRIPRTIVOS/FRECUENCIAS/MIRAR PORCENTAJE ACUMULADO HASTA
169156’2%
El 56’2% de los hombres tienen unos ingresos iguales o inferiores a 1700 €.
Fusione la información contenida en los ficheros hipotecas Catalunya.XLS e
hipotecas_1.Sav en un único fichero SAV. Observará que existen tres variables fecha
(mes, año y fecha), elimine estas variables y genere el formato fecha correspondiente
con el SPSS (si no puede fusionar los archivos, trabaje con el fichero Hipotecas_2.Sav,
pero tenga presente que tendrá penalización en la puntuación del examen?
1.MIRAMOS RANGO EXCEL: (A6:i174). Cerramos Excel
2. ARCHIVO/ABRIR/DATOS/ buscamos el Excel.
3. En el nuevo archivo spss donde tenemos los datos de Excel, fusionamos el
hipotecas_1.sav (datos/fundir archivo/añadir casos)
4. Vista variables: borramos: mes, año, fecha.
5. DATOS / DEFINIR FECHA: año,mes. Año:1995 y mes:1
- TABLAS DE CONTINGENCIA
Obtenga un resultado que considerando el total de personas de la base de datos le permita
conocer cuántos son fumadores y el porcentaje según sea su nivel educativo. Responda
a las siguientes cuestiones:
1. como son variables cualitativas hacemos TABLA DE CONTINGENCIA
(analizar/est.descrip./tablas de contingencia/filas: v.dependiente:fumador/columna:
v.indep: nivel estud. ESTADISTICOS: chi cuadrado/ CASILLAS: fila;columna;total.
a) ¿Cuál es el nivel educativo con mayor porcentaje de fumadores? Miramos el grupo de SI
FUMADOR y dentro de éste el nivel educativo y el porcentaje mayor a esta variable: 55’6%
b) Del grupo con estudios de bachillerato, ¿Qué porcentaje son fumadores? Miramos
bachillerato/grupo de sí fumador/ y %segun nivel de estudios. 37’2%