CIS




      Introducción a SPSS
       Gestión de Base de Datos



                       Sandro Miguel Honores Vasquez
Conceptos Previos
¿Que es SPSS?
• Statistical package for the social sciences
  (Software estadístico para las CC.SS.)
• Permite construir una base de datos
• Realiza análisis descriptivo de los datos
• Elabora gráficos y tablas complejas
• Tiene una finalidad estadística y tiene su
  propio lenguaje de programación
• Se utiliza en ciencia, investigación y negocios
Iniciando en SPSS


                                          Crea un nuevo
                                             archivo

                                         Importa los datos
                                          de un archivo de
  Permite abrir                            base de datos
todos los archivos
    de datos                                 Define los
                                         parámetros de un
                                          archivo de base
                                             de datos
Tipos de archivos
                        DATOS (.sav)
              Son los generados por el editor o
                         importados


                    RESULTADOS (.spo)
TIPOS        Son los archivos generados por el
              sistema se muestran resultados


                       SINTAXIS (.sps)
              Contienen la líneas de código de
               los procedimientos realizados
El entorno de Edición Datos
                                                 Menú
   Barra de
 Herramientas
Numero de caso y
  nombre de
   variable

    Variables                                 Editor de
                                              contenido




 Casos, registros u
  observaciones
                      Vistas de   Vistas de
                        datos     variables
Casos y Variables
        Casos                       Variables
     Va en las filas             Van en las columnas

                                    Son las         Cada
Son los casos       Son los     características   variables
   o datos        registros y    que definen cuenta con 10
 específicos    observaciones     los datos o   propiedades
                                    «casos»      diferentes
• Se ha ingresado un
  caso, un dato. Este
  tiene dos variables:

                             Nombre y
                                         Edad
                              apellido
• De forma automática se genera dos nombre de
  variables con sus propiedades



            Variable
Propiedades de las Variables
Variables Nombres: Debe ser único, hasta 64 bytes
             Tipo: Puede ser numérico, coma y/o punto, notación
             científica, fecha, moneda, etc.
             Anchura: Máximo de dígitos

             Decimales: Numero de decimales

             Etiqueta: Para describir la variable

             Valores: Es la leyenda que visualiza la categoría del datos
Perdidos: Se aplica cuando no se obtiene una respuesta
coherente de algún entrevistado

Columnas: Se refiere al formato de presentación

Alineación: Determina la alineación del dato

Medidas: Son las escalas de medición
Ordinal: Indican
                           superioridad,
                       relaciones de mayor
                        o menor. Nivel de
                          ingresos, nivel
                          educativo , etc.        Escala:
Nominal: Indican                                Representan
  categorías o a un
                                                magnitudes,
      grupo de
                                             intervalos. Edad,
pertenencia. Genero,
  estado civil, etc.                          ventas, la altura,
                                             temperatura, etc.




                        Medida
Nominal                  Ordinal                    Escala

• Es una variable        • Es una variable         • Es una variable
  cualitativa que          cualitativa que posee     cuantitativa
  agrupa datos sin         orden, secuencia          numérica, pueden
  jerarquía entre si       progresión, jerarquía     asumir cantidad
• Nombres, países,       • Grados de                 infinita de valores
  razas, estado civil,     desnutrición, nivel       (continuas) o una
  etc.                     de instrucción, nivel     cantidad
                           socio económico,          finita(discretas).
                           días de la semana,      • Continuas: Peso,
                           etc.                      talla, ingreso
                                                     personal.
                                                   • Discretas: Numero
                                                     de hijos
Creando una base de datos
Recuerde…
La estadística:
• Recolecta datos
• Analiza la frecuencia con que se repiten
  ciertos fenómenos
• Explica e interpreta las condiciones regulares
  con que ocurren fenómenos de tipo
  aleatorios.
           «Cuando alguien deja de cumplir un compromiso,
           hay un 95% de probabilidad de que eso vuelva a
           suceder.»
Se quiere realizar una encuesta con el personal
de una fabrica y realizar el análisis estadístico
usando SPSS. Los pasos van a ser los siguientes:
Paso 1: Definir Variables
Paso 2: Ingresar Datos
Paso 3: Elaborar gráficos
Paso 4: Análisis Estadístico
Paso 1: Definiendo variables
• Ir a «vista de variables» y escribir lo siguiente:
Paso 2: Editando las variables
• Editando el tipo de valor en Apellidos y
  Nombres a cadena de 20 caracteres
• Ir a la variable «sexo»   • Colocando los valores a
  aplicando 0 decimales       las categorías 1(M) y 2(F)
• Editando los valores de la variable
  «Instrucción»
Paso 3. Ingresando los datos
• Ir a vista de datos e ingresar la siguiente
  información
• Para mostrar y/o ocultar las etiquetas de valor.
  ir a vista de datos y activar o desactivar dicho
  comando:
Recodificación de Variables
• Es usual que luego ingresar los datos sea
  necesario categorizar los datos, en este caso
  se aplica la recodificación en una nueva
  variable.
• Vamos a recodificar la variable remuneración
  añadiendo una variable referida al tipo de
  categoría de remuneración de forma que 1
  sea hasta 900, 2 de 1000 a 1999, y 3 para los
  valores de 2000 a mas.
Recodificando
variables: Ir a
transformar/Recodifica
ción en distintas
variables
• Añadir la variable remuneración y añadir al panel.
                                     • Añadir
                                       nombre
                                       «Remun_Cat,
                                       etiqueta
                                       «Categoria de
                                       remuneración
                                       »
• Aplicar «Valores antiguos y nuevos»
• En ventana de recodificación añadir lo siguiente:

1




                  2

•   Finalmente no olvide
    convertir la variable en
    ordinal y modificar los    3
    decimales
Paso 4. Generando una distribución de
             frecuencias
• Ir al menú Analizar, estadísticos descriptivos,
Frecuencias
• Seleccionar las
  variables
  referidas al
  nivel de
  instrucción y
  luego hacer
  clic en aceptar
• En la vista
  resultado
  aparece la
  distribución
  de
  frecuencias
Paso 5. Generando el gráfico de una
               variable
• Repetir el procedimiento e ir al botón gráficos
  y elegir «Gráficos de Barras»
• En la vista
  resultado aparece
  el gráfico de
  barras.
Paso 6. Generando Tablas
           personalizadas
• Ir a
  Analizar/Tablas
• Arrastrar las
  variables sexo e
  instrucción en
  columnas
• En filas arrastrar
  remuneración
• Activar ocultar y
  en posición
  activar «Por
  defecto»
• Para aplicar
  mas opciones
  hacer doble clic
  en la tabla
• Se abre un
  menú para
  modificar
  aspectos de la
  tabla.
Paso 7. Generando Percentiles
• Ir al menú Analizar/ estadísticos
  descriptivos/Frecuencias/Estadísticos
• Añadir percentil 20,30,70




• Active: cuartiles,
  media, máximo,
  mínimo y
  asimetría.
MEDIA: Es la suma de
       todas las puntuaciones
      dividas por el numero de
            puntuaciones

      ASIMETRIA: Nos indica si
     los datos se distribuyen de
          forma uniforme.

Asimetría = 0 Es simétrica cuando la
misma cantidad de valores se encuentran
a los dos lados de la media

Asimetría > 0 Es asimétrica + pues los
valores se tiende a reunir más en la parte
derecha de la media (Son mayores).

Asimetría < 0 Es asimétrica - pues los         PERCENTILES: Calcula los
valores se tiende a reunir más en la parte    valores por debajo de los
izquierda de la media (Son menores).         cuales se encuentra el 25%,
                                             el 50% y el 75% de los casos
• La asimetría nos permite saber en que zona se concentra los
   valores de la variable.
               Media                        Media




Asimetría negativa (a la                     Asimetría positiva (o a
izquierda): Hay valores                      la derecha): Hay valores
más separados de la                          más separados de la
media a la izquierda.                        media a la derecha.
Interpretando el resultado
• La media del nivel de instrucción es de 2.30,
  es decir se acercan al nivel superior.
• La asimetría es de -,687, es asimetría negativa
• La instrucción menor es 1 y mayor es 3
• El percentil 20, indica que el 20% de los
  encuestados tiene un nivel de instrucción
  cerca al 1 (Primaria)
Ejercicio 1
• Crear la siguiente base de datos de los pacientes ingresados
  al tratamiento considerando las siguientes variables:
       - Apellidos y Nombres
       - Sexo
       - Edad
       - Peso al ingreso
       - Peso1
       - Peso2
       - Peso3
• Ingresa los datos de 10 personas y genera: Frecuencias,
  grafico de barras, asimetría, desviación, máximo, mínimo y
  percentiles.
Ejercicio 2
• Crear la siguiente base de datos sobre la
  aplicación de un Test Psicométrico. Las Variables
  son:
• Nombre y apellido
• Sexo
• Edad
• Item 1: Valores a,b,c,d y e
• Item 2: Valores a,b,c,d y e. Igual hasta el item 5.
Ejercicio 3
• Crear la siguiente base de datos de los
  postulantes considerando las siguientes variables:
      - Apellidos y Nombres
      - Sexo
      - Edad
      - Ocupación: Tiene 5 valores: Obrero,
Empleado, Gerente, Independiente, Sin empleo
      - Lugar de Nacimiento: Tiene 3 valores: Lima,
provincias o extranjero.
      - AFP: Valores Si o No

Sesion14 spss 1

  • 1.
    CIS Introducción a SPSS Gestión de Base de Datos Sandro Miguel Honores Vasquez
  • 2.
  • 3.
    ¿Que es SPSS? •Statistical package for the social sciences (Software estadístico para las CC.SS.) • Permite construir una base de datos • Realiza análisis descriptivo de los datos • Elabora gráficos y tablas complejas • Tiene una finalidad estadística y tiene su propio lenguaje de programación • Se utiliza en ciencia, investigación y negocios
  • 4.
    Iniciando en SPSS Crea un nuevo archivo Importa los datos de un archivo de Permite abrir base de datos todos los archivos de datos Define los parámetros de un archivo de base de datos
  • 5.
    Tipos de archivos DATOS (.sav) Son los generados por el editor o importados RESULTADOS (.spo) TIPOS Son los archivos generados por el sistema se muestran resultados SINTAXIS (.sps) Contienen la líneas de código de los procedimientos realizados
  • 6.
    El entorno deEdición Datos Menú Barra de Herramientas Numero de caso y nombre de variable Variables Editor de contenido Casos, registros u observaciones Vistas de Vistas de datos variables
  • 7.
    Casos y Variables Casos Variables Va en las filas Van en las columnas Son las Cada Son los casos Son los características variables o datos registros y que definen cuenta con 10 específicos observaciones los datos o propiedades «casos» diferentes
  • 8.
    • Se haingresado un caso, un dato. Este tiene dos variables: Nombre y Edad apellido • De forma automática se genera dos nombre de variables con sus propiedades Variable
  • 9.
    Propiedades de lasVariables Variables Nombres: Debe ser único, hasta 64 bytes Tipo: Puede ser numérico, coma y/o punto, notación científica, fecha, moneda, etc. Anchura: Máximo de dígitos Decimales: Numero de decimales Etiqueta: Para describir la variable Valores: Es la leyenda que visualiza la categoría del datos
  • 10.
    Perdidos: Se aplicacuando no se obtiene una respuesta coherente de algún entrevistado Columnas: Se refiere al formato de presentación Alineación: Determina la alineación del dato Medidas: Son las escalas de medición
  • 11.
    Ordinal: Indican superioridad, relaciones de mayor o menor. Nivel de ingresos, nivel educativo , etc. Escala: Nominal: Indican Representan categorías o a un magnitudes, grupo de intervalos. Edad, pertenencia. Genero, estado civil, etc. ventas, la altura, temperatura, etc. Medida
  • 12.
    Nominal Ordinal Escala • Es una variable • Es una variable • Es una variable cualitativa que cualitativa que posee cuantitativa agrupa datos sin orden, secuencia numérica, pueden jerarquía entre si progresión, jerarquía asumir cantidad • Nombres, países, • Grados de infinita de valores razas, estado civil, desnutrición, nivel (continuas) o una etc. de instrucción, nivel cantidad socio económico, finita(discretas). días de la semana, • Continuas: Peso, etc. talla, ingreso personal. • Discretas: Numero de hijos
  • 13.
  • 14.
    Recuerde… La estadística: • Recolectadatos • Analiza la frecuencia con que se repiten ciertos fenómenos • Explica e interpreta las condiciones regulares con que ocurren fenómenos de tipo aleatorios. «Cuando alguien deja de cumplir un compromiso, hay un 95% de probabilidad de que eso vuelva a suceder.»
  • 15.
    Se quiere realizaruna encuesta con el personal de una fabrica y realizar el análisis estadístico usando SPSS. Los pasos van a ser los siguientes: Paso 1: Definir Variables Paso 2: Ingresar Datos Paso 3: Elaborar gráficos Paso 4: Análisis Estadístico
  • 16.
    Paso 1: Definiendovariables • Ir a «vista de variables» y escribir lo siguiente:
  • 17.
    Paso 2: Editandolas variables • Editando el tipo de valor en Apellidos y Nombres a cadena de 20 caracteres
  • 18.
    • Ir ala variable «sexo» • Colocando los valores a aplicando 0 decimales las categorías 1(M) y 2(F)
  • 19.
    • Editando losvalores de la variable «Instrucción»
  • 20.
    Paso 3. Ingresandolos datos • Ir a vista de datos e ingresar la siguiente información
  • 21.
    • Para mostrary/o ocultar las etiquetas de valor. ir a vista de datos y activar o desactivar dicho comando:
  • 22.
    Recodificación de Variables •Es usual que luego ingresar los datos sea necesario categorizar los datos, en este caso se aplica la recodificación en una nueva variable. • Vamos a recodificar la variable remuneración añadiendo una variable referida al tipo de categoría de remuneración de forma que 1 sea hasta 900, 2 de 1000 a 1999, y 3 para los valores de 2000 a mas.
  • 23.
  • 24.
    • Añadir lavariable remuneración y añadir al panel. • Añadir nombre «Remun_Cat, etiqueta «Categoria de remuneración »
  • 25.
    • Aplicar «Valoresantiguos y nuevos»
  • 26.
    • En ventanade recodificación añadir lo siguiente: 1 2 • Finalmente no olvide convertir la variable en ordinal y modificar los 3 decimales
  • 27.
    Paso 4. Generandouna distribución de frecuencias • Ir al menú Analizar, estadísticos descriptivos, Frecuencias
  • 28.
    • Seleccionar las variables referidas al nivel de instrucción y luego hacer clic en aceptar
  • 29.
    • En lavista resultado aparece la distribución de frecuencias
  • 30.
    Paso 5. Generandoel gráfico de una variable • Repetir el procedimiento e ir al botón gráficos y elegir «Gráficos de Barras»
  • 31.
    • En lavista resultado aparece el gráfico de barras.
  • 32.
    Paso 6. GenerandoTablas personalizadas • Ir a Analizar/Tablas
  • 33.
    • Arrastrar las variables sexo e instrucción en columnas • En filas arrastrar remuneración • Activar ocultar y en posición activar «Por defecto»
  • 34.
    • Para aplicar mas opciones hacer doble clic en la tabla • Se abre un menú para modificar aspectos de la tabla.
  • 35.
    Paso 7. GenerandoPercentiles • Ir al menú Analizar/ estadísticos descriptivos/Frecuencias/Estadísticos • Añadir percentil 20,30,70 • Active: cuartiles, media, máximo, mínimo y asimetría.
  • 36.
    MEDIA: Es lasuma de todas las puntuaciones dividas por el numero de puntuaciones ASIMETRIA: Nos indica si los datos se distribuyen de forma uniforme. Asimetría = 0 Es simétrica cuando la misma cantidad de valores se encuentran a los dos lados de la media Asimetría > 0 Es asimétrica + pues los valores se tiende a reunir más en la parte derecha de la media (Son mayores). Asimetría < 0 Es asimétrica - pues los PERCENTILES: Calcula los valores se tiende a reunir más en la parte valores por debajo de los izquierda de la media (Son menores). cuales se encuentra el 25%, el 50% y el 75% de los casos
  • 37.
    • La asimetríanos permite saber en que zona se concentra los valores de la variable. Media Media Asimetría negativa (a la Asimetría positiva (o a izquierda): Hay valores la derecha): Hay valores más separados de la más separados de la media a la izquierda. media a la derecha.
  • 38.
    Interpretando el resultado •La media del nivel de instrucción es de 2.30, es decir se acercan al nivel superior. • La asimetría es de -,687, es asimetría negativa • La instrucción menor es 1 y mayor es 3 • El percentil 20, indica que el 20% de los encuestados tiene un nivel de instrucción cerca al 1 (Primaria)
  • 39.
    Ejercicio 1 • Crearla siguiente base de datos de los pacientes ingresados al tratamiento considerando las siguientes variables: - Apellidos y Nombres - Sexo - Edad - Peso al ingreso - Peso1 - Peso2 - Peso3 • Ingresa los datos de 10 personas y genera: Frecuencias, grafico de barras, asimetría, desviación, máximo, mínimo y percentiles.
  • 40.
    Ejercicio 2 • Crearla siguiente base de datos sobre la aplicación de un Test Psicométrico. Las Variables son: • Nombre y apellido • Sexo • Edad • Item 1: Valores a,b,c,d y e • Item 2: Valores a,b,c,d y e. Igual hasta el item 5.
  • 41.
    Ejercicio 3 • Crearla siguiente base de datos de los postulantes considerando las siguientes variables: - Apellidos y Nombres - Sexo - Edad - Ocupación: Tiene 5 valores: Obrero, Empleado, Gerente, Independiente, Sin empleo - Lugar de Nacimiento: Tiene 3 valores: Lima, provincias o extranjero. - AFP: Valores Si o No