3. El SPSS se inicia siempre ofreciendo la imagen, similar a una hoja de
cálculo, del Editor de Datos. Este Editor dispondrá las variables en
columnas y los casos en filas. Nuestro primer objetivo será definir el
fichero de datos y almacenar esos datos en el editor.
El archivo de datos puede crearse directamente en SPSS o
importarse ya creado de otro programa, normalmente de una hoja de
cálculo. La definición de las variables será, sin embargo, una tarea a
realizar obligatoriamente en el SPSS.
Los datos se observan en la pantalla "Vista de Datos" de SPSS en
una presentación muy similar a una hoja de cálculo clásica: casos
ocupan filas y variables ocupan columnas.
Obtención de datos e introducción directa en SPSS
4.
5. Comenzando por la captura externa, para importar un archivo de hoja
de cálculo debe seleccionarse el tipo xls en el cuadro “Abrir” del menú
“Archivo”. Una vez elegido el archivo de datos debe indicarse al SPSS
si la primera fila del archivo de excel contiene cabeceras de columnas
(es decir, nombre de las variables) y el rango a leer en la misma si los
datos que desea leer de la hoja de cálculo no comienzan en la primera
fila ni en la primera columna.
Obtención de datos e introducción directa en SPSS
Para introducir directamente los datos en SPSS deberán
completarse, para cada variable los siguientes pasos:
1. Asignar un nombre y una etiqueta a la variable
2. Identificar el tipo de variable
3. Definir sus posibles valores y las etiquetas de los mismos
4. Definir el o los valores perdidos
24. Presione la tecla Ejemplo, para indicar el porciento de
la población que integrará la muestra aleatoria
25. Seleccionemos aproximadamente el 30 % de la población,
escribiendo con el teclado, en la ventana que se indica , el por
ciento deseado y dando click en Continuar posteriormente.
27. Observa que algunos datos están tachados; esos no forman parte de la muestra aleatoria. Ya
tenemos la muestra aleatoria, ahora comenzamos a construir el intervalo de confianza para la
media población con un 95 % de seguridad.
28.
29. Estimación puntual e intervalos de confianza
Estimación: Averiguar los valores de los parámetros poblacionales a partir de los valores de los
estadísticos muestrales de dichas poblaciones. Se puede hacer:
Puntual: un único valor.
Por intervalo: Margen de valores dentro del cual se tiene la confianza de que se encuentre el
parámetro estimado
A partir de la observación de un conjunto de datos obtenidos en condiciones independientes y tales que
siguen una distribución con forma conocida, pero con parámetros desconocidos, la estimación puntual
consiste es estimar dichos parámetros.La información proporcionada por la estimación puntual es, en
general, insuficiente, por lo que una alternativa es proporcionar un intervalo tal que, con una probabilidad
fijada a priori, contenga al verdadero valor del parámetro. El intervalo de confianza para un parámetro al
nivel de confianza Ψ = 1 – α es el intervalo de longitud mínima tal que contiene al verdadero valor del
parámetro con una probabilidad igual a Ψ. A Ψ se le conoce como nivel de confiabilidad de la estimación
y a α como nivel de significación.
Las propiedades clásicas de los buenos estadísticos – estimadores son:
Estimadores insesgados.
Estimadores consistente.
Estimadores eficiente.
Estimadores suficientes.
30.
n
zx
n
zx
2
1
2
1
;
n
s
ntx
n
s
ntx 1;)1(
2
1
2
1
n
qp
zp
n
qp
zpp
ˆˆ
ˆ;
ˆˆ
ˆ
2
1
2
1
2
)1(
2
2
2
)1(
2
1
2
2 1
;
1
nn
snsn
Intervalos de confianza para
2
,, p
Para (Media poblacional)
Para P (Proporción poblacional)
Para la (Varianza poblacional)
2
Conocida 2
Desconocida
2
31. Ya tenemos la muestra aleatoria, ahora comenzamos a construir el intervalo de
confianza para la media poblacional con un 95 % de seguridad. Activa Analizar.
Intervalos de Confianza de con el uso del SPSS 22.0
44. El límite inferior del intervalo = 280.1355, El límite inferior del intervalo = 381.6034. Por lo
tanto: con un 95 % de confiabilidad. 6034.381;1355.280
47. Un estadígrafo muy importante y necesario para cualquier análisis
estadístico es la descripción de frecuencia que permite: tener
información acerca del rango de valores de la variable, número de casos
válidos, número de casos sin información y las veces que se repite cada
valor que tiene esa variable en la base de datos.
Nota: De ahora en adelante suponemos que estamos en el Editor de
texto del SPSS y con la base de datos satisf .sav abierta.
48. La forma más directa de obtener una frecuencia de variables es la
siguiente: Analizar / Estadísticos descriptivos / Frecuencias
49. Elegida esa secuencia de menús obtenemos la siguiente Pantalla:
En el cuadro de la izquierda de la pantalla aparece el listado de todas las
variables que contiene la base de datos, es necesario seleccionar las
variables de las cuales se desea obtener la distribución de frecuencia y
luego se elige la opción de aceptar.
50. Obtengamos la distribución de frecuencias de la variable satisfacción
con la variedad. Como resultado obtenemos la siguiente tabla:
51. Análisis de regresión en SPSS versión 22
El análisis de regresión está relacionado con el estudio de la dependencia de una
variable, la variable dependiente , de una o más variables adicionales, las
variables explicativas, con la perspectiva de estimar y/o predecir el valor
(poblacional) medio o promedio de la primera en términos de valores conocidos o
fijos ( en muestreos repetidos) de las segundas.
Algunas situaciones en donde es recomendable aplicar el Análisis de Regresión
son las siguientes:
-Conocidas las edades y las estaturas de un grupo de estudiantes, se puede
estimar la estatura promedio que corresponde a una edad determinada.
-Se puede estar interesado en estudiar la dependencia que existe entre los gastos
personales de consumo y el ingreso personal real.
-Conocer la demanda de un producto ante los cambios en el precio.
-Se puede conocer la dependencia existente entre los niveles de producción de
una fábrica y la productividad de sus trabajadores.
-Conocer la dependencia existente entre el rendimiento de un motor y el consumo
de combustible del mismo.
52. Ejemplo 1.
En una fábrica de Lamborghini
Aventador LP 700-4b se selecciona una
muestra aleatoria de 15 trenes de
potencia dentro de los que resultaron
defectuosos luego de las pruebas de
calidad realizadas, con el fin de estimar
su velocidad de aceleración atendiendo
al tiempo de cambio de su caja de
velocidad.
Análisis de regresión en SPSS versión 22
Velocidad de
aceleración (km/h) (Y)
Tiempo de cambio
(milisegundos) (X)
90 45,0
95 47,5
93 46,5
94 47,0
90 45,0
92 46,0
93 46,5
95 47,5
97 48,5
98 49,0
99 49,5
91 45,5
95 47,5
97 48,5
93 46,5
a) Ajuste los datos al modelo:
b) Verifique el supuesto de Normalidad de los
residuos o errores.
xY 10
53. Diagrama de dispersión o nube de puntos
Antes de seleccionar el modelo matemático para ajustar las observaciones
de los datos, es recomendable obtener la representación gráfica de los
valores de Y ( estaturas) frente a los valores de x (edades) o sea, el diagrama
de dispersión, el cual nos permite visualizar la tendencia de los datos y así
poder seleccionar el modelo matemático que mejor puede ajustarse a la nube
de puntos.
Veamos como se procede utilizando el SPSS versión 22 en la
representación gráfica de la nube de puntos.
54. Active la opción Gráficos
Diagrama de dispersión o nube de puntos
55. Diagrama de dispersión o nube de puntos
Luego de ir a Gráficos , seleccionar Gráficos de variables de regresión
56. Diagrama de dispersión o nube de puntos
Se observa en el diagrama de dispersión, que a medida que aumenta el tiempo de
cambio (x), aumenta también la Velocidad de aceleración (y). Se podría ajustar una
línea recta a esa nube de puntos y la recta que se obtiene utilizando el método de
los mínimos cuadrados es la que pasa justamente por el centro de la nube de
puntos.
57. En el caso de una única variable independiente, X, se habla de
regresión lineal simple. La correspondiente ecuación de regresión
será del tipo: XY 10
Y, en particular, para cada observación:
iii xy 10 Ni ,....,2,1
En nuestro caso, se trata de obtener una función lineal de la variable
independiente tiempo de cambio (x) que permita estimar la velocidad de
aceleración (y), para cualquier estudiante i:
iii tiempoVelocidad 10
Donde son parámetros desconocidos a estimar y los proceden
de variables independientes, normales, de media 0 y la misma varianza.
10 ,
El criterio para obtener los coeficientes de regresión b0 y b1 estimaciones de
los parámetros B0 y B1, respectivamente, es el de los mínimos cuadrados,
que consiste en minimizar la suma de los cuadrados de los residuos. Si
ii xbby 10
ˆ El residuo correspondiente ei será la desviación de
cada observación al valor estimado:
iii yye ˆ
¿Cómo procedemos utilizando el SPSS 22
Regresión lineal simple
i
iyˆ
60. Se debe introducir la variable dependiente Y(Velocidad de aceleración) en el cuadro
Dependiente x(Tiempo de cambio), activándola previamente ,haciendo clic sobre ella.
61. Se oprime el botón Estadísticos para activar el estadístico de
Durbin-Watson, que se usará más adelante para la prueba de
Autocorrelación de los errores.