SlideShare una empresa de Scribd logo
1 de 33
Transform en SPSS
Martin Ordoñez
Ylenia Quintana
Transformar:
• Modificación y generación de nuevas variables.
Las funciones de este menú son temporales y
sólo están vigentes durante la sesión sin que
afecten al archivo original de datos. Si queremos
que sean permanentes debemos grabar los
cambios.
Calcular variable:
Se usa para calcular los valores de una variable basándose en
transformaciones numéricas de otras variables.
• Puede calcular valores para las variables numéricas o de cadena
(alfanuméricas).
• Puede crear nuevas variables o bien reemplazar los valores de
las variables existentes. Para las nuevas variables, también se
puede especificar el tipo y la etiqueta de variable.
• Puede calcular valores de forma selectiva para subconjuntos de
datos basándose en condiciones lógicas.
• Puede utilizar una gran variedad de funciones pre-
incorporadas, incluyendo funciones aritméticas, funciones
estadísticas, funciones de distribución y funciones de cadena.
Contar valores dentro de los casos:
• Este cuadro de diálogo crea una variable que,
para cada caso, cuenta las apariciones del mismo
valor, o valores, en una lista de variables. Por
ejemplo, un estudio podrá contener una lista de
revistas con las casillas de
verificación sí/no para indicar qué revistas lee
cada encuestado. Se podría contar el número de
respuestas sí de cada encuestado para crear una
nueva variable que contenga el número total de
revistas leídas.
Valores de cambio.
Cambiar valores crea nuevas variables que contienen los valores
de variables existentes de casos anteriores o posteriores.
• Nombre. Nombre de la nueva variable. Debe ser un nombre
que ya no existe en el conjunto de datos activo.
• Obtener el valor de un caso anterior (retardo).
Obtener el valor de un caso anterior en el conjunto de datos
activo. Por ejemplo, con el número predeterminado del valor
de casos 1, cada caso de la nueva variable tiene el valor de la
variable original del caso que la precede.
• Obtener el valor del caso posterior (adelanto).
Obtener el valor de un caso posterior en el conjunto de datos
activo. Por ejemplo, con el número predeterminado del valor
de casos 1, cada caso de la nueva variable tiene el valor de la
variable original del caso siguiente.
Número de casos que se cambiarán. Obtener el valor del caso nanterior o
siguiente, donde n es el valor especificado. El valor debe ser un entero no negativo.
• Si se activa el procesamiento de segmentación de archivos, el cambio se limita a
cada grupo de segmentación. Un valor de cambio no se puede obtener a partir
de un caso en un grupo de segmentación anterior o posterior.
• El estado del filtro se ignora.
• El valor de la variable de resultado está definido como valores perdidos del
sistema para el primer o último caso n del conjunto de datos o grupo de
segmentación, donde n es el valor especificado para Número de casos que se
cambiarán. Por ejemplo, si utiliza el método de retardo con un valor de 1,
definirá la variable de resultados como valor perdidos del sistema para el primer
caso del conjunto de datos (o el primer caso en cada grupo de segmentación).
• Se conservan los valores perdidos del usuario.
• La información del diccionario de la variable original, incluyendo etiquetas de
valor definidas y asignaciones de valores perdidos del usuario, se aplica a la
nueva variable. (Nota: los atributos de la variable personalizada no se incluyen).
• Se genera automáticamente una etiqueta de variable que describe la operación
de cambio que ha creado la variable.
Recodificar en las mismas variable.
• El cuadro de diálogo Recodificar en las mismas
variables le permite reasignar los valores de las
variables existentes o agrupar rangos de valores
existentes en nuevos valores. Por ejemplo,
podría agrupar los salarios en categorías que
sean rangos de salarios.
• Puede recodificar las variables numéricas y de
cadena. Si selecciona múltiples variables, todas
deben ser del mismo tipo. No se pueden
recodificar juntas las variables numéricas y de
cadena.
Recodificar en distintas variables
• El cuadro de diálogo Recodificar en distintas variables le
permite reasignar los valores de las variables existentes o
agrupar rangos de valores existentes en nuevos valores
para una variable nueva. Por ejemplo, podría agrupar los
salarios en una nueva variable que contenga categorías
de rangos de salarios.
• Puede recodificar las variables numéricas y de cadena.
• Puede recodificar variables numéricas en variables de
cadena y viceversa.
• Si selecciona múltiples variables, todas deben ser del
mismo tipo. No se pueden recodificar juntas las variables
numéricas y de cadena.
Recodificación automática
• El cuadro de diálogo Recodificación automática le permite convertir los valores
numéricos y de cadena en valores enteros consecutivos. Si los códigos de la
categoría no son secuenciales, las casillas vacías resultantes reducen el
rendimiento e incrementan los requisitos de memoria de muchos
procedimientos. Además, algunos procedimientos no pueden utilizar variables
de cadena y otros requieren valores enteros consecutivos para los niveles de los
factores.
• La nueva variable, o variables, creadas por la recodificación automática
conservan todas las etiquetas de variable y de valor definidas de la variable
antigua. Para los valores que no tienen una etiqueta de valor ya definida se
utiliza el valor original como etiqueta del valor recodificado. Una tabla muestra
los valores antiguos, los nuevos y las etiquetas de valor.
• Los valores de cadena se recodifican por orden alfabético, con las mayúsculas
antes que las minúsculas.
• Los valores perdidos se recodifican como valores perdidos mayores que
cualquier valor no perdido y conservando el orden. Por ejemplo, si la variable
original posee 10 valores no perdidos, el valor perdido mínimo se recodificará
como 11, y el valor 11 será un valor perdido para la nueva variable.
Agrupación Visual
• La agrupación visual está concebida para ayudarle en el
proceso de creación de nuevas variables basadas en la
agrupación de los valores contiguos de las variables
existentes para dar lugar a un número limitado de
categorías diferentes. Puede utilizar la agrupación visual
para:
• Crear variables categóricas a partir de variables de escala
continuas. Por ejemplo, puede utilizar una variable de
escala con los ingresos para crear una variable categórica
nueva que contenga intervalos de ingresos.
• Colapsar un número elevado de categorías ordinales en
un conjunto menor de categorías. Por ejemplo, es posible
colapsar una escala de evaluación de nueve categorías en
tres categorías que representen: bajo, medio y alto.
Intervalos óptimos
• El procedimiento Intervalos óptimos discretiza una o más variables de escala (a las que
denominaremos en lo sucesivo variables de entrada que se van a agrupar) mediante la
distribución de los valores de cada variable en intervalos. La formación de intervalos es
óptima en relación con una variable guía categórica que "supervisa" el proceso de
agrupación. Los intervalos se pueden utilizar en lugar de los valores de datos originales
para posteriores análisis.
Ejemplos. La reducción del número de valores distintos que puede tomar una variable
tiene varios usos, entre los que se incluyen:
• Requisitos de los datos de otros procedimientos. Las variables discretizadas pueden
tratarse como categóricas y utilizarse en procedimientos que requieren variables
categóricas. Por ejemplo, el procedimiento Tablas cruzadas requiere que todas las
variables sean categóricas.
• Privacidad de los datos. Utilizar en los informes los valores agrupados en vez de los
valores reales puede ayudar a proteger la privacidad de los orígenes de los datos. El
procedimiento Intervalos óptimos puede ayudarle a elegir los intervalos adecuados.
• Agilización del rendimiento. Algunos procedimientos son más eficientes cuando
trabajan con un número reducido de valores distintos. Por ejemplo, la velocidad de la
regresión logística multinomial puede incrementarse utilizando variables
discretizadas.
• Detección de la separación completa o quasi-completa de los datos.
Preparar datos para modelados
• La preparación de los datos para su análisis es uno de los
pasos más importantes en cualquier proyecto y,
tradicionalmente, uno de los que más tiempo requieren.
Preparación automática de datos (ADP) controla las tareas
automáticamente, analizando los datos e identificando
problemas, filtrando campos problemáticos o sin
posibilidades de ser útiles, derivando nuevos atributos
cuando sea necesario y mejorando el rendimiento
mediante técnicas de filtrado inteligente.
• Puede utilizar el algoritmo de una forma totalmente
automática, permitiendo seleccionar y aplicar
soluciones; o de forma interactiva, previendo los
cambios antes de que se realicen y aceptarlos o
rechazarlos según sea necesario.
• ADP permite hacer que sus datos estén listos para la
generación de modelos de forma rápida y fácil, sin
necesidad de tener conocimientos previos de los
conceptos previos implicados. Los modelos tienden
a crearse y puntuarse con mayor rapidez; además, el
uso de ADP mejora la solidez de los procesos de
modelado automatizados.
Asignar rango a casos
• El cuadro de diálogo Asignar rangos a los casos le permite crear nuevas
variables que contienen rangos, puntuaciones de Savage y normales, y los
valores de los percentiles para las variables numéricas.
• Los nombres de las nuevas variables y las etiquetas de variable descriptivas
se generan automáticamente en función del nombre de la variable original y
de las medidas seleccionadas. Una tabla de resumen presenta una lista de
las variables originales, las nuevas variables y las etiquetas de variable.
(Nota: los nombres de nuevas variables generados automáticamente se
limitan a una longitud máxima de 8 bytes).
Si lo desea, puede:
• Asignar los rangos a los casos en orden ascendente o descendente.
• Organizar las clasificaciones en subgrupos seleccionando una o más
variables de agrupación para la lista Por. Los rangos se calculan dentro de
cada grupo, y los grupos se definen mediante la combinación de los valores
de las variables de agrupación. Por ejemplo, si selecciona sexo y minoría
como variables de agrupación, los rangos se calcularán para cada
combinación de sexo y minoría.
Asistente fecha y hora
• El Asistente para fecha y hora simplifica ciertas
tareas comunes asociadas a las variables de
fecha y hora.
Crear serie temporal
• El cuadro de diálogo Crear serie temporal crea nuevas
variables basadas en funciones de variables de series
temporales numéricas existentes. Estos valores transformados
son de gran utilidad en muchos procedimientos de análisis de
series temporales.
• Los nombres por defecto de las nuevas variables se componen
de los seis primeros caracteres de las variables existentes
utilizadas para crearlas, seguidos por un carácter de
subrayado y un número secuencial. Por ejemplo, para la
variable precio, el nombre de la nueva variable sería precio_1.
Las nuevas variables conservarían cualquier etiqueta de valor
definida de las variables originales.
• Las funciones disponibles para crear variables de series
temporales incluyen las funciones de diferencias, medias
móviles, medianas móviles, retardo y adelanto
Remplazar valores perdidos
• Las observaciones perdidas pueden causar problemas en los análisis
y algunas medidas de series temporales no se pueden calcular si hay
valores perdidos en la serie. En ocasiones el valor para una
observación concreta no se conoce. Además, los datos perdidos
pueden ser el resultado de lo siguiente:
• Cada grado de diferenciación reduce la longitud de una serie en 1.
• Cada grado de diferenciación estacional reduce la longitud de una
serie en una estación.
• Si genera una serie nueva que contenga predicciones que
sobrepasen el final de la serie existente (al pulsar en el botón
Guardar y realizar las selecciones adecuadas), la serie original y la
serie residual generada incluirán datos perdidos para las
observaciones nuevas.
• Algunas transformaciones (por ejemplo, la transformación
logarítmica) generan datos perdidos para determinados valores de
la serie original.
• Los valores perdidos al principio o fin de una serie no
suponen un problema especial; sencillamente acortan la
longitud útil de la serie. Las discontinuidades que
aparecen en mitad de una serie
(datos incrustados perdidos) pueden ser un problema
mucho más grave. El alcance del problema depende del
procedimiento analítico que se utilice.
• El cuadro de diálogo Reemplazar valores perdidos crea
nuevas variables de series temporales a partir de
otras existentes, reemplazando los valores perdidos por
estimaciones calculadas mediante uno de los distintos
métodos posibles. Los nombres por defecto de las nuevas
variables se componen de los seis primeros caracteres de
las variables existentes utilizadas para crearlas, seguidos
por un carácter de subrayado y un número secuencial.
Por ejemplo, para la variable precio, el nombre de la
nueva variable sería precio_1. Las nuevas variables
conservarían cualquier etiqueta de valor definida de las
variables originales.
Generador de números aleatorios
• El cuadro de diálogo Generadores de números aleatorios le permite
seleccionar el generador de números aleatorios y establecer el valor
de secuencia de inicio de modo que pueda reproducir una secuencia
de números aleatorios.
• Generador activo. Hay dos generadores de números aleatorios
disponibles:
• Versión 12 compatible. El generador de números aleatorios utilizado
en la versión 12 y versiones anteriores. Utilice este generador de
números aleatorios si necesita reproducir los resultados
aleatorizados generados por versiones previas basadas en una
semilla de aleatorización especificada.
• Tornado de Mersenne. Un generador de números aleatorios nuevo
que es más fiable en los procesos de simulación. Utilice este
generador de números aleatorios si no es necesario reproducir
resultados aleatorizados correspondientes a SPSS 12 o anteriores.
• Inicialización del generador activo. La semilla de
aleatorización cambia cada vez que se genera un
número aleatorio para utilizarlo en las
transformaciones (como las funciones de
distribución aleatorias), el muestreo aleatorio o
la ponderación de los casos. Para replicar una
secuencia de números aleatorios, establezca el
valor de inicialización del punto de inicio antes
de cada análisis que utilice los números
aleatorios. El valor debe ser un entero positivo.
Transformar en spss

Más contenido relacionado

Similar a Transformar en spss

Semana 1 3 variables en bloques plsql
Semana 1 3 variables en bloques plsqlSemana 1 3 variables en bloques plsql
Semana 1 3 variables en bloques plsql
victdiazm
 
Transformar datos gabriela albuja
Transformar datos gabriela albujaTransformar datos gabriela albuja
Transformar datos gabriela albuja
gabrielaalbuja
 
Sql dinamico14042011
Sql dinamico14042011Sql dinamico14042011
Sql dinamico14042011
josecuartas
 

Similar a Transformar en spss (20)

Preparación de datos
Preparación de datosPreparación de datos
Preparación de datos
 
RecodificacióndevariablesensofwareSPSS.pptx
RecodificacióndevariablesensofwareSPSS.pptxRecodificacióndevariablesensofwareSPSS.pptx
RecodificacióndevariablesensofwareSPSS.pptx
 
SPSS 4
SPSS 4SPSS 4
SPSS 4
 
Definiciones basicas de spss
Definiciones basicas de spss Definiciones basicas de spss
Definiciones basicas de spss
 
Preparacion de datos 6
Preparacion de datos 6Preparacion de datos 6
Preparacion de datos 6
 
SPSS contenido básico
SPSS contenido básicoSPSS contenido básico
SPSS contenido básico
 
histograma - fundibeq.pdf
histograma - fundibeq.pdfhistograma - fundibeq.pdf
histograma - fundibeq.pdf
 
Semana 1 3 variables en bloques plsql
Semana 1 3 variables en bloques plsqlSemana 1 3 variables en bloques plsql
Semana 1 3 variables en bloques plsql
 
Transformar datos gabriela albuja
Transformar datos gabriela albujaTransformar datos gabriela albuja
Transformar datos gabriela albuja
 
Transformación de Datos en SPSS
Transformación de Datos en SPSSTransformación de Datos en SPSS
Transformación de Datos en SPSS
 
Expo 7
Expo 7Expo 7
Expo 7
 
Spss
SpssSpss
Spss
 
05transf
05transf05transf
05transf
 
Transformar en SPSS
Transformar en SPSSTransformar en SPSS
Transformar en SPSS
 
Aniuska programación
Aniuska programaciónAniuska programación
Aniuska programación
 
Manejo de datos primitivos
Manejo de datos primitivosManejo de datos primitivos
Manejo de datos primitivos
 
2 GRUPO- DIAPOSITIVA DE EXPOCICON.pptx
2 GRUPO- DIAPOSITIVA DE EXPOCICON.pptx2 GRUPO- DIAPOSITIVA DE EXPOCICON.pptx
2 GRUPO- DIAPOSITIVA DE EXPOCICON.pptx
 
Bases de Datos Masivas Corte I.pptx
Bases de Datos Masivas Corte I.pptxBases de Datos Masivas Corte I.pptx
Bases de Datos Masivas Corte I.pptx
 
Estructuras básicas
Estructuras básicas Estructuras básicas
Estructuras básicas
 
Sql dinamico14042011
Sql dinamico14042011Sql dinamico14042011
Sql dinamico14042011
 

Último

🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
EliaHernndez7
 
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdfNUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
UPTAIDELTACHIRA
 
Concepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptxConcepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptx
Fernando Solis
 
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptxRESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
pvtablets2023
 

Último (20)

🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
 
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdfNUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
 
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESOPrueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
 
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.doc
SESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.docSESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.doc
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.doc
 
Usos y desusos de la inteligencia artificial en revistas científicas
Usos y desusos de la inteligencia artificial en revistas científicasUsos y desusos de la inteligencia artificial en revistas científicas
Usos y desusos de la inteligencia artificial en revistas científicas
 
Concepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptxConcepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptx
 
Interpretación de cortes geológicos 2024
Interpretación de cortes geológicos 2024Interpretación de cortes geológicos 2024
Interpretación de cortes geológicos 2024
 
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICABIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
 
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptxRESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
 
Power Point E. S.: Los dos testigos.pptx
Power Point E. S.: Los dos testigos.pptxPower Point E. S.: Los dos testigos.pptx
Power Point E. S.: Los dos testigos.pptx
 
Power Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptxPower Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptx
 
Sesión de clase: Fe contra todo pronóstico
Sesión de clase: Fe contra todo pronósticoSesión de clase: Fe contra todo pronóstico
Sesión de clase: Fe contra todo pronóstico
 
semana 4 9NO Estudios sociales.pptxnnnn
semana 4  9NO Estudios sociales.pptxnnnnsemana 4  9NO Estudios sociales.pptxnnnn
semana 4 9NO Estudios sociales.pptxnnnn
 
Biografía de Charles Coulomb física .pdf
Biografía de Charles Coulomb física .pdfBiografía de Charles Coulomb física .pdf
Biografía de Charles Coulomb física .pdf
 
Supuestos_prácticos_funciones.docx
Supuestos_prácticos_funciones.docxSupuestos_prácticos_funciones.docx
Supuestos_prácticos_funciones.docx
 
La Sostenibilidad Corporativa. Administración Ambiental
La Sostenibilidad Corporativa. Administración AmbientalLa Sostenibilidad Corporativa. Administración Ambiental
La Sostenibilidad Corporativa. Administración Ambiental
 
Análisis de los Factores Externos de la Organización.
Análisis de los Factores Externos de la Organización.Análisis de los Factores Externos de la Organización.
Análisis de los Factores Externos de la Organización.
 
Posición astronómica y geográfica de Europa.pptx
Posición astronómica y geográfica de Europa.pptxPosición astronómica y geográfica de Europa.pptx
Posición astronómica y geográfica de Europa.pptx
 
Sesión de clase APC: Los dos testigos.pdf
Sesión de clase APC: Los dos testigos.pdfSesión de clase APC: Los dos testigos.pdf
Sesión de clase APC: Los dos testigos.pdf
 
ACRÓNIMO DE PARÍS PARA SU OLIMPIADA 2024. Por JAVIER SOLIS NOYOLA
ACRÓNIMO DE PARÍS PARA SU OLIMPIADA 2024. Por JAVIER SOLIS NOYOLAACRÓNIMO DE PARÍS PARA SU OLIMPIADA 2024. Por JAVIER SOLIS NOYOLA
ACRÓNIMO DE PARÍS PARA SU OLIMPIADA 2024. Por JAVIER SOLIS NOYOLA
 

Transformar en spss

  • 1. Transform en SPSS Martin Ordoñez Ylenia Quintana
  • 2. Transformar: • Modificación y generación de nuevas variables. Las funciones de este menú son temporales y sólo están vigentes durante la sesión sin que afecten al archivo original de datos. Si queremos que sean permanentes debemos grabar los cambios.
  • 3. Calcular variable: Se usa para calcular los valores de una variable basándose en transformaciones numéricas de otras variables. • Puede calcular valores para las variables numéricas o de cadena (alfanuméricas). • Puede crear nuevas variables o bien reemplazar los valores de las variables existentes. Para las nuevas variables, también se puede especificar el tipo y la etiqueta de variable. • Puede calcular valores de forma selectiva para subconjuntos de datos basándose en condiciones lógicas. • Puede utilizar una gran variedad de funciones pre- incorporadas, incluyendo funciones aritméticas, funciones estadísticas, funciones de distribución y funciones de cadena.
  • 4.
  • 5. Contar valores dentro de los casos: • Este cuadro de diálogo crea una variable que, para cada caso, cuenta las apariciones del mismo valor, o valores, en una lista de variables. Por ejemplo, un estudio podrá contener una lista de revistas con las casillas de verificación sí/no para indicar qué revistas lee cada encuestado. Se podría contar el número de respuestas sí de cada encuestado para crear una nueva variable que contenga el número total de revistas leídas.
  • 6.
  • 7. Valores de cambio. Cambiar valores crea nuevas variables que contienen los valores de variables existentes de casos anteriores o posteriores. • Nombre. Nombre de la nueva variable. Debe ser un nombre que ya no existe en el conjunto de datos activo. • Obtener el valor de un caso anterior (retardo). Obtener el valor de un caso anterior en el conjunto de datos activo. Por ejemplo, con el número predeterminado del valor de casos 1, cada caso de la nueva variable tiene el valor de la variable original del caso que la precede. • Obtener el valor del caso posterior (adelanto). Obtener el valor de un caso posterior en el conjunto de datos activo. Por ejemplo, con el número predeterminado del valor de casos 1, cada caso de la nueva variable tiene el valor de la variable original del caso siguiente.
  • 8. Número de casos que se cambiarán. Obtener el valor del caso nanterior o siguiente, donde n es el valor especificado. El valor debe ser un entero no negativo. • Si se activa el procesamiento de segmentación de archivos, el cambio se limita a cada grupo de segmentación. Un valor de cambio no se puede obtener a partir de un caso en un grupo de segmentación anterior o posterior. • El estado del filtro se ignora. • El valor de la variable de resultado está definido como valores perdidos del sistema para el primer o último caso n del conjunto de datos o grupo de segmentación, donde n es el valor especificado para Número de casos que se cambiarán. Por ejemplo, si utiliza el método de retardo con un valor de 1, definirá la variable de resultados como valor perdidos del sistema para el primer caso del conjunto de datos (o el primer caso en cada grupo de segmentación). • Se conservan los valores perdidos del usuario. • La información del diccionario de la variable original, incluyendo etiquetas de valor definidas y asignaciones de valores perdidos del usuario, se aplica a la nueva variable. (Nota: los atributos de la variable personalizada no se incluyen). • Se genera automáticamente una etiqueta de variable que describe la operación de cambio que ha creado la variable.
  • 9.
  • 10. Recodificar en las mismas variable. • El cuadro de diálogo Recodificar en las mismas variables le permite reasignar los valores de las variables existentes o agrupar rangos de valores existentes en nuevos valores. Por ejemplo, podría agrupar los salarios en categorías que sean rangos de salarios. • Puede recodificar las variables numéricas y de cadena. Si selecciona múltiples variables, todas deben ser del mismo tipo. No se pueden recodificar juntas las variables numéricas y de cadena.
  • 11.
  • 12. Recodificar en distintas variables • El cuadro de diálogo Recodificar en distintas variables le permite reasignar los valores de las variables existentes o agrupar rangos de valores existentes en nuevos valores para una variable nueva. Por ejemplo, podría agrupar los salarios en una nueva variable que contenga categorías de rangos de salarios. • Puede recodificar las variables numéricas y de cadena. • Puede recodificar variables numéricas en variables de cadena y viceversa. • Si selecciona múltiples variables, todas deben ser del mismo tipo. No se pueden recodificar juntas las variables numéricas y de cadena.
  • 13.
  • 14. Recodificación automática • El cuadro de diálogo Recodificación automática le permite convertir los valores numéricos y de cadena en valores enteros consecutivos. Si los códigos de la categoría no son secuenciales, las casillas vacías resultantes reducen el rendimiento e incrementan los requisitos de memoria de muchos procedimientos. Además, algunos procedimientos no pueden utilizar variables de cadena y otros requieren valores enteros consecutivos para los niveles de los factores. • La nueva variable, o variables, creadas por la recodificación automática conservan todas las etiquetas de variable y de valor definidas de la variable antigua. Para los valores que no tienen una etiqueta de valor ya definida se utiliza el valor original como etiqueta del valor recodificado. Una tabla muestra los valores antiguos, los nuevos y las etiquetas de valor. • Los valores de cadena se recodifican por orden alfabético, con las mayúsculas antes que las minúsculas. • Los valores perdidos se recodifican como valores perdidos mayores que cualquier valor no perdido y conservando el orden. Por ejemplo, si la variable original posee 10 valores no perdidos, el valor perdido mínimo se recodificará como 11, y el valor 11 será un valor perdido para la nueva variable.
  • 15.
  • 16. Agrupación Visual • La agrupación visual está concebida para ayudarle en el proceso de creación de nuevas variables basadas en la agrupación de los valores contiguos de las variables existentes para dar lugar a un número limitado de categorías diferentes. Puede utilizar la agrupación visual para: • Crear variables categóricas a partir de variables de escala continuas. Por ejemplo, puede utilizar una variable de escala con los ingresos para crear una variable categórica nueva que contenga intervalos de ingresos. • Colapsar un número elevado de categorías ordinales en un conjunto menor de categorías. Por ejemplo, es posible colapsar una escala de evaluación de nueve categorías en tres categorías que representen: bajo, medio y alto.
  • 17.
  • 18. Intervalos óptimos • El procedimiento Intervalos óptimos discretiza una o más variables de escala (a las que denominaremos en lo sucesivo variables de entrada que se van a agrupar) mediante la distribución de los valores de cada variable en intervalos. La formación de intervalos es óptima en relación con una variable guía categórica que "supervisa" el proceso de agrupación. Los intervalos se pueden utilizar en lugar de los valores de datos originales para posteriores análisis. Ejemplos. La reducción del número de valores distintos que puede tomar una variable tiene varios usos, entre los que se incluyen: • Requisitos de los datos de otros procedimientos. Las variables discretizadas pueden tratarse como categóricas y utilizarse en procedimientos que requieren variables categóricas. Por ejemplo, el procedimiento Tablas cruzadas requiere que todas las variables sean categóricas. • Privacidad de los datos. Utilizar en los informes los valores agrupados en vez de los valores reales puede ayudar a proteger la privacidad de los orígenes de los datos. El procedimiento Intervalos óptimos puede ayudarle a elegir los intervalos adecuados. • Agilización del rendimiento. Algunos procedimientos son más eficientes cuando trabajan con un número reducido de valores distintos. Por ejemplo, la velocidad de la regresión logística multinomial puede incrementarse utilizando variables discretizadas. • Detección de la separación completa o quasi-completa de los datos.
  • 19.
  • 20. Preparar datos para modelados • La preparación de los datos para su análisis es uno de los pasos más importantes en cualquier proyecto y, tradicionalmente, uno de los que más tiempo requieren. Preparación automática de datos (ADP) controla las tareas automáticamente, analizando los datos e identificando problemas, filtrando campos problemáticos o sin posibilidades de ser útiles, derivando nuevos atributos cuando sea necesario y mejorando el rendimiento mediante técnicas de filtrado inteligente.
  • 21. • Puede utilizar el algoritmo de una forma totalmente automática, permitiendo seleccionar y aplicar soluciones; o de forma interactiva, previendo los cambios antes de que se realicen y aceptarlos o rechazarlos según sea necesario. • ADP permite hacer que sus datos estén listos para la generación de modelos de forma rápida y fácil, sin necesidad de tener conocimientos previos de los conceptos previos implicados. Los modelos tienden a crearse y puntuarse con mayor rapidez; además, el uso de ADP mejora la solidez de los procesos de modelado automatizados.
  • 22. Asignar rango a casos • El cuadro de diálogo Asignar rangos a los casos le permite crear nuevas variables que contienen rangos, puntuaciones de Savage y normales, y los valores de los percentiles para las variables numéricas. • Los nombres de las nuevas variables y las etiquetas de variable descriptivas se generan automáticamente en función del nombre de la variable original y de las medidas seleccionadas. Una tabla de resumen presenta una lista de las variables originales, las nuevas variables y las etiquetas de variable. (Nota: los nombres de nuevas variables generados automáticamente se limitan a una longitud máxima de 8 bytes). Si lo desea, puede: • Asignar los rangos a los casos en orden ascendente o descendente. • Organizar las clasificaciones en subgrupos seleccionando una o más variables de agrupación para la lista Por. Los rangos se calculan dentro de cada grupo, y los grupos se definen mediante la combinación de los valores de las variables de agrupación. Por ejemplo, si selecciona sexo y minoría como variables de agrupación, los rangos se calcularán para cada combinación de sexo y minoría.
  • 23.
  • 24. Asistente fecha y hora • El Asistente para fecha y hora simplifica ciertas tareas comunes asociadas a las variables de fecha y hora.
  • 25.
  • 26. Crear serie temporal • El cuadro de diálogo Crear serie temporal crea nuevas variables basadas en funciones de variables de series temporales numéricas existentes. Estos valores transformados son de gran utilidad en muchos procedimientos de análisis de series temporales. • Los nombres por defecto de las nuevas variables se componen de los seis primeros caracteres de las variables existentes utilizadas para crearlas, seguidos por un carácter de subrayado y un número secuencial. Por ejemplo, para la variable precio, el nombre de la nueva variable sería precio_1. Las nuevas variables conservarían cualquier etiqueta de valor definida de las variables originales. • Las funciones disponibles para crear variables de series temporales incluyen las funciones de diferencias, medias móviles, medianas móviles, retardo y adelanto
  • 27.
  • 28. Remplazar valores perdidos • Las observaciones perdidas pueden causar problemas en los análisis y algunas medidas de series temporales no se pueden calcular si hay valores perdidos en la serie. En ocasiones el valor para una observación concreta no se conoce. Además, los datos perdidos pueden ser el resultado de lo siguiente: • Cada grado de diferenciación reduce la longitud de una serie en 1. • Cada grado de diferenciación estacional reduce la longitud de una serie en una estación. • Si genera una serie nueva que contenga predicciones que sobrepasen el final de la serie existente (al pulsar en el botón Guardar y realizar las selecciones adecuadas), la serie original y la serie residual generada incluirán datos perdidos para las observaciones nuevas. • Algunas transformaciones (por ejemplo, la transformación logarítmica) generan datos perdidos para determinados valores de la serie original.
  • 29. • Los valores perdidos al principio o fin de una serie no suponen un problema especial; sencillamente acortan la longitud útil de la serie. Las discontinuidades que aparecen en mitad de una serie (datos incrustados perdidos) pueden ser un problema mucho más grave. El alcance del problema depende del procedimiento analítico que se utilice. • El cuadro de diálogo Reemplazar valores perdidos crea nuevas variables de series temporales a partir de otras existentes, reemplazando los valores perdidos por estimaciones calculadas mediante uno de los distintos métodos posibles. Los nombres por defecto de las nuevas variables se componen de los seis primeros caracteres de las variables existentes utilizadas para crearlas, seguidos por un carácter de subrayado y un número secuencial. Por ejemplo, para la variable precio, el nombre de la nueva variable sería precio_1. Las nuevas variables conservarían cualquier etiqueta de valor definida de las variables originales.
  • 30.
  • 31. Generador de números aleatorios • El cuadro de diálogo Generadores de números aleatorios le permite seleccionar el generador de números aleatorios y establecer el valor de secuencia de inicio de modo que pueda reproducir una secuencia de números aleatorios. • Generador activo. Hay dos generadores de números aleatorios disponibles: • Versión 12 compatible. El generador de números aleatorios utilizado en la versión 12 y versiones anteriores. Utilice este generador de números aleatorios si necesita reproducir los resultados aleatorizados generados por versiones previas basadas en una semilla de aleatorización especificada. • Tornado de Mersenne. Un generador de números aleatorios nuevo que es más fiable en los procesos de simulación. Utilice este generador de números aleatorios si no es necesario reproducir resultados aleatorizados correspondientes a SPSS 12 o anteriores.
  • 32. • Inicialización del generador activo. La semilla de aleatorización cambia cada vez que se genera un número aleatorio para utilizarlo en las transformaciones (como las funciones de distribución aleatorias), el muestreo aleatorio o la ponderación de los casos. Para replicar una secuencia de números aleatorios, establezca el valor de inicialización del punto de inicio antes de cada análisis que utilice los números aleatorios. El valor debe ser un entero positivo.