Transformar en spss

Transform en SPSS
Martin Ordoñez
Ylenia Quintana

Transformar:
• Modificación y generación de nuevas variables.
Las funciones de este menú son temporales y
sólo están vigentes durante la sesión sin que
afecten al archivo original de datos. Si queremos
que sean permanentes debemos grabar los
cambios.

Calcular variable:
Se usa para calcular los valores de una variable basándose en
transformaciones numéricas de otras variables.
• Puede calcular valores para las variables numéricas o de cadena
(alfanuméricas).
• Puede crear nuevas variables o bien reemplazar los valores de
las variables existentes. Para las nuevas variables, también se
puede especificar el tipo y la etiqueta de variable.
• Puede calcular valores de forma selectiva para subconjuntos de
datos basándose en condiciones lógicas.
• Puede utilizar una gran variedad de funciones pre-
incorporadas, incluyendo funciones aritméticas, funciones
estadísticas, funciones de distribución y funciones de cadena.

Contar valores dentro de los casos:
• Este cuadro de diálogo crea una variable que,
para cada caso, cuenta las apariciones del mismo
valor, o valores, en una lista de variables. Por
ejemplo, un estudio podrá contener una lista de
revistas con las casillas de
verificación sí/no para indicar qué revistas lee
cada encuestado. Se podría contar el número de
respuestas sí de cada encuestado para crear una
nueva variable que contenga el número total de
revistas leídas.

Valores de cambio.
Cambiar valores crea nuevas variables que contienen los valores
de variables existentes de casos anteriores o posteriores.
• Nombre. Nombre de la nueva variable. Debe ser un nombre
que ya no existe en el conjunto de datos activo.
• Obtener el valor de un caso anterior (retardo).
Obtener el valor de un caso anterior en el conjunto de datos
activo. Por ejemplo, con el número predeterminado del valor
de casos 1, cada caso de la nueva variable tiene el valor de la
variable original del caso que la precede.
• Obtener el valor del caso posterior (adelanto).
Obtener el valor de un caso posterior en el conjunto de datos
activo. Por ejemplo, con el número predeterminado del valor
de casos 1, cada caso de la nueva variable tiene el valor de la
variable original del caso siguiente.

Número de casos que se cambiarán. Obtener el valor del caso nanterior o
siguiente, donde n es el valor especificado. El valor debe ser un entero no negativo.
• Si se activa el procesamiento de segmentación de archivos, el cambio se limita a
cada grupo de segmentación. Un valor de cambio no se puede obtener a partir
de un caso en un grupo de segmentación anterior o posterior.
• El estado del filtro se ignora.
• El valor de la variable de resultado está definido como valores perdidos del
sistema para el primer o último caso n del conjunto de datos o grupo de
segmentación, donde n es el valor especificado para Número de casos que se
cambiarán. Por ejemplo, si utiliza el método de retardo con un valor de 1,
definirá la variable de resultados como valor perdidos del sistema para el primer
caso del conjunto de datos (o el primer caso en cada grupo de segmentación).
• Se conservan los valores perdidos del usuario.
• La información del diccionario de la variable original, incluyendo etiquetas de
valor definidas y asignaciones de valores perdidos del usuario, se aplica a la
nueva variable. (Nota: los atributos de la variable personalizada no se incluyen).
• Se genera automáticamente una etiqueta de variable que describe la operación
de cambio que ha creado la variable.

Recodificar en las mismas variable.
• El cuadro de diálogo Recodificar en las mismas
variables le permite reasignar los valores de las
variables existentes o agrupar rangos de valores
existentes en nuevos valores. Por ejemplo,
podría agrupar los salarios en categorías que
sean rangos de salarios.
• Puede recodificar las variables numéricas y de
cadena. Si selecciona múltiples variables, todas
deben ser del mismo tipo. No se pueden
recodificar juntas las variables numéricas y de
cadena.

Recodificar en distintas variables
• El cuadro de diálogo Recodificar en distintas variables le
permite reasignar los valores de las variables existentes o
agrupar rangos de valores existentes en nuevos valores
para una variable nueva. Por ejemplo, podría agrupar los
salarios en una nueva variable que contenga categorías
de rangos de salarios.
• Puede recodificar las variables numéricas y de cadena.
• Puede recodificar variables numéricas en variables de
cadena y viceversa.
• Si selecciona múltiples variables, todas deben ser del
mismo tipo. No se pueden recodificar juntas las variables
numéricas y de cadena.

Recodificación automática
• El cuadro de diálogo Recodificación automática le permite convertir los valores
numéricos y de cadena en valores enteros consecutivos. Si los códigos de la
categoría no son secuenciales, las casillas vacías resultantes reducen el
rendimiento e incrementan los requisitos de memoria de muchos
procedimientos. Además, algunos procedimientos no pueden utilizar variables
de cadena y otros requieren valores enteros consecutivos para los niveles de los
factores.
• La nueva variable, o variables, creadas por la recodificación automática
conservan todas las etiquetas de variable y de valor definidas de la variable
antigua. Para los valores que no tienen una etiqueta de valor ya definida se
utiliza el valor original como etiqueta del valor recodificado. Una tabla muestra
los valores antiguos, los nuevos y las etiquetas de valor.
• Los valores de cadena se recodifican por orden alfabético, con las mayúsculas
antes que las minúsculas.
• Los valores perdidos se recodifican como valores perdidos mayores que
cualquier valor no perdido y conservando el orden. Por ejemplo, si la variable
original posee 10 valores no perdidos, el valor perdido mínimo se recodificará
como 11, y el valor 11 será un valor perdido para la nueva variable.

Agrupación Visual
• La agrupación visual está concebida para ayudarle en el
proceso de creación de nuevas variables basadas en la
agrupación de los valores contiguos de las variables
existentes para dar lugar a un número limitado de
categorías diferentes. Puede utilizar la agrupación visual
para:
• Crear variables categóricas a partir de variables de escala
continuas. Por ejemplo, puede utilizar una variable de
escala con los ingresos para crear una variable categórica
nueva que contenga intervalos de ingresos.
• Colapsar un número elevado de categorías ordinales en
un conjunto menor de categorías. Por ejemplo, es posible
colapsar una escala de evaluación de nueve categorías en
tres categorías que representen: bajo, medio y alto.

Intervalos óptimos
• El procedimiento Intervalos óptimos discretiza una o más variables de escala (a las que
denominaremos en lo sucesivo variables de entrada que se van a agrupar) mediante la
distribución de los valores de cada variable en intervalos. La formación de intervalos es
óptima en relación con una variable guía categórica que "supervisa" el proceso de
agrupación. Los intervalos se pueden utilizar en lugar de los valores de datos originales
para posteriores análisis.
Ejemplos. La reducción del número de valores distintos que puede tomar una variable
tiene varios usos, entre los que se incluyen:
• Requisitos de los datos de otros procedimientos. Las variables discretizadas pueden
tratarse como categóricas y utilizarse en procedimientos que requieren variables
categóricas. Por ejemplo, el procedimiento Tablas cruzadas requiere que todas las
variables sean categóricas.
• Privacidad de los datos. Utilizar en los informes los valores agrupados en vez de los
valores reales puede ayudar a proteger la privacidad de los orígenes de los datos. El
procedimiento Intervalos óptimos puede ayudarle a elegir los intervalos adecuados.
• Agilización del rendimiento. Algunos procedimientos son más eficientes cuando
trabajan con un número reducido de valores distintos. Por ejemplo, la velocidad de la
regresión logística multinomial puede incrementarse utilizando variables
discretizadas.
• Detección de la separación completa o quasi-completa de los datos.

Preparar datos para modelados
• La preparación de los datos para su análisis es uno de los
pasos más importantes en cualquier proyecto y,
tradicionalmente, uno de los que más tiempo requieren.
Preparación automática de datos (ADP) controla las tareas
automáticamente, analizando los datos e identificando
problemas, filtrando campos problemáticos o sin
posibilidades de ser útiles, derivando nuevos atributos
cuando sea necesario y mejorando el rendimiento
mediante técnicas de filtrado inteligente.

• Puede utilizar el algoritmo de una forma totalmente
automática, permitiendo seleccionar y aplicar
soluciones; o de forma interactiva, previendo los
cambios antes de que se realicen y aceptarlos o
rechazarlos según sea necesario.
• ADP permite hacer que sus datos estén listos para la
generación de modelos de forma rápida y fácil, sin
necesidad de tener conocimientos previos de los
conceptos previos implicados. Los modelos tienden
a crearse y puntuarse con mayor rapidez; además, el
uso de ADP mejora la solidez de los procesos de
modelado automatizados.

Asignar rango a casos
• El cuadro de diálogo Asignar rangos a los casos le permite crear nuevas
variables que contienen rangos, puntuaciones de Savage y normales, y los
valores de los percentiles para las variables numéricas.
• Los nombres de las nuevas variables y las etiquetas de variable descriptivas
se generan automáticamente en función del nombre de la variable original y
de las medidas seleccionadas. Una tabla de resumen presenta una lista de
las variables originales, las nuevas variables y las etiquetas de variable.
(Nota: los nombres de nuevas variables generados automáticamente se
limitan a una longitud máxima de 8 bytes).
Si lo desea, puede:
• Asignar los rangos a los casos en orden ascendente o descendente.
• Organizar las clasificaciones en subgrupos seleccionando una o más
variables de agrupación para la lista Por. Los rangos se calculan dentro de
cada grupo, y los grupos se definen mediante la combinación de los valores
de las variables de agrupación. Por ejemplo, si selecciona sexo y minoría
como variables de agrupación, los rangos se calcularán para cada
combinación de sexo y minoría.

Asistente fecha y hora
• El Asistente para fecha y hora simplifica ciertas
tareas comunes asociadas a las variables de
fecha y hora.

Crear serie temporal
• El cuadro de diálogo Crear serie temporal crea nuevas
variables basadas en funciones de variables de series
temporales numéricas existentes. Estos valores transformados
son de gran utilidad en muchos procedimientos de análisis de
series temporales.
• Los nombres por defecto de las nuevas variables se componen
de los seis primeros caracteres de las variables existentes
utilizadas para crearlas, seguidos por un carácter de
subrayado y un número secuencial. Por ejemplo, para la
variable precio, el nombre de la nueva variable sería precio_1.
Las nuevas variables conservarían cualquier etiqueta de valor
definida de las variables originales.
• Las funciones disponibles para crear variables de series
temporales incluyen las funciones de diferencias, medias
móviles, medianas móviles, retardo y adelanto

Remplazar valores perdidos
• Las observaciones perdidas pueden causar problemas en los análisis
y algunas medidas de series temporales no se pueden calcular si hay
valores perdidos en la serie. En ocasiones el valor para una
observación concreta no se conoce. Además, los datos perdidos
pueden ser el resultado de lo siguiente:
• Cada grado de diferenciación reduce la longitud de una serie en 1.
• Cada grado de diferenciación estacional reduce la longitud de una
serie en una estación.
• Si genera una serie nueva que contenga predicciones que
sobrepasen el final de la serie existente (al pulsar en el botón
Guardar y realizar las selecciones adecuadas), la serie original y la
serie residual generada incluirán datos perdidos para las
observaciones nuevas.
• Algunas transformaciones (por ejemplo, la transformación
logarítmica) generan datos perdidos para determinados valores de
la serie original.

• Los valores perdidos al principio o fin de una serie no
suponen un problema especial; sencillamente acortan la
longitud útil de la serie. Las discontinuidades que
aparecen en mitad de una serie
(datos incrustados perdidos) pueden ser un problema
mucho más grave. El alcance del problema depende del
procedimiento analítico que se utilice.
• El cuadro de diálogo Reemplazar valores perdidos crea
nuevas variables de series temporales a partir de
otras existentes, reemplazando los valores perdidos por
estimaciones calculadas mediante uno de los distintos
métodos posibles. Los nombres por defecto de las nuevas
variables se componen de los seis primeros caracteres de
las variables existentes utilizadas para crearlas, seguidos
por un carácter de subrayado y un número secuencial.
Por ejemplo, para la variable precio, el nombre de la
nueva variable sería precio_1. Las nuevas variables
conservarían cualquier etiqueta de valor definida de las
variables originales.

Generador de números aleatorios
• El cuadro de diálogo Generadores de números aleatorios le permite
seleccionar el generador de números aleatorios y establecer el valor
de secuencia de inicio de modo que pueda reproducir una secuencia
de números aleatorios.
• Generador activo. Hay dos generadores de números aleatorios
disponibles:
• Versión 12 compatible. El generador de números aleatorios utilizado
en la versión 12 y versiones anteriores. Utilice este generador de
números aleatorios si necesita reproducir los resultados
aleatorizados generados por versiones previas basadas en una
semilla de aleatorización especificada.
• Tornado de Mersenne. Un generador de números aleatorios nuevo
que es más fiable en los procesos de simulación. Utilice este
generador de números aleatorios si no es necesario reproducir
resultados aleatorizados correspondientes a SPSS 12 o anteriores.

• Inicialización del generador activo. La semilla de
aleatorización cambia cada vez que se genera un
número aleatorio para utilizarlo en las
transformaciones (como las funciones de
distribución aleatorias), el muestreo aleatorio o
la ponderación de los casos. Para replicar una
secuencia de números aleatorios, establezca el
valor de inicialización del punto de inicio antes
de cada análisis que utilice los números
aleatorios. El valor debe ser un entero positivo.

Transformar en spss

Recomendados

Recomendados

Más contenido relacionado

Similar a Transformar en spss

Similar a Transformar en spss (20)

Último

Último (20)

Transformar en spss