UNIVERSIDAD JUÁREZ AUTÓNOMA DE 
TABASCO 
DIVISIÓN ACADÉMICA DE EDUCACIÓN Y ARTES 
LIC. CIENCIAS DE LA EDUCACIÓN 
Asignatura: 
Herramientas informáticas de apoyo a la investigación 
cuantitativa. 
Tema: 
Preparación de los datos. 
Alumnas: 
Jessica del Carmen reyes García. 
Virginia Avalos Laines 
Karen Beatriz Pérez Domínguez
2.5 PREPARACIÓN DE LOS DATOS 
Cuando abra un archivo de datos o introduzca datos en 
el Editor de datos, podrá empezar a crear informes, 
gráficos y análisis sin ningún trabajo preliminar adicional. 
Sin embargo, hay algunas funciones de preparación 
adicional de los datos que pueden resultarle útiles, entre 
las que se incluyen: 
 Asignar propiedades de las variables que describan los 
datos y determinen cómo se deben tratar ciertos valores. 
Identificar los casos que pueden contener información 
duplicada y excluir dichos casos de los análisis o 
eliminarlos del archivo de datos. 
 Crear nuevas variables con algunas categorías 
distintas que representen rangos de valores de variables 
que tengan un mayor número de valores posibles.
PROPIEDADES DE VARIABLES 
Los datos introducidos en la 
Vista de datos del Editor de 
datos o leídos desde un 
formato de archivos externo 
(como una hoja de cálculo 
de Excel o un archivo de 
datos de texto) carecen de 
ciertas propiedades de 
variables que pueden 
resultar muy útiles, como: 
 Definición de etiquetas de 
valor descriptivas para 
códigos numéricos (por 
ejemplo, 0 = Hombre y 1 = 
Mujer). 
 Identificación de códigos 
de valores perdidos (por 
ejemplo, 99 = No procede). 
 Asignación del nivel de 
medida (nominal, ordinal o 
de escala).
TODAS ESTAS PROPIEDADES DE VARIABLES (Y OTRAS) SE PUEDEN 
ASIGNAR EN LA VISTA DE VARIABLES DEL EDITOR DE DATOS. TAMBIÉN 
HAY ALGUNAS UTILIDADES QUE LE PUEDEN OFRECER ASISTENCIA EN 
ESTE PROCESO 
 Definir propiedades de variables puede ayudarle a definir 
etiquetas de valor descriptivas y valores perdidos. Esto es 
especialmente útil para datos categóricos con códigos 
numéricos utilizados para valores de categorías. 
 Definir nivel de medición para desconocido identifica las 
variables (campos) que no tengan un nivel de medición 
definido y permite definir el nivel de medición de esas 
variables. Es importante para los procedimientos en los que el 
nivel de medición puede afectar a los resultados o determinar 
qué funciones estarán disponibles. 
 Copiar propiedades de datos ofrece la posibilidad de utilizar 
un archivo de datos con IBM® SPSS® Statistics como 
plantilla para definir las propiedades de variables y archivos 
en el archivo de datos actual. Esto es particularmente útil si 
utiliza frecuentemente archivos de datos con un formato 
externo que tenga un contenido similar, como puedan ser 
informes mensuales en formato Excel.
DEFINICIÓN DE PROPIEDADES DE VARIABLES 
Definir propiedades de variables está diseñado para 
ayudarle en el proceso de asignar atributos a variables, 
incluyendo la creación de etiquetas de valor descriptivas 
para variables categóricas (nominales u ordinales). 
Definir propiedades de variables: 
 Explora los datos reales y enumera todos valores de 
datos únicos para cada variable seleccionada. 
 Identifica valores sin etiquetas y ofrece una función de 
“etiquetas automáticas”. 
 Permite copiar etiquetas de valor definidas y otros 
atributos de otra variable en la variable seleccionada o 
de la variable seleccionada a varias variables 
adicionales.
PARA DEFINIR PROPIEDADES DE VARIABLES 
Elija en los menús: 
Datos > Definir propiedades de variables...
La Vista de variables contiene descripciones de las 
propiedades de cada variable del archivo de datos. En la Vista 
de variables: 
 Las filas son variables. 
 Las columnas son las características de las variables. 
PARA VISUALIZAR O DEFINIR LOS ATRIBUTOS DE 
LAS VARIABLES 
Desde la Vista de Variables, para definir variables nuevas, 
introduzca un nombre de variable en cualquier fila vacía y 
seleccione los atributos que desea definir o modificar. 
NOMBRES DE VARIABLE 
Para los nombres de variable se aplican las siguientes normas: 
 El nombre debe comenzar por una letra. 
 Los nombres de variable no pueden terminar en punto. 
 No se pueden utilizar espacios en blanco ni caracteres 
especiales. 
 Cada nombre de variable debe ser único; no se permiten 
duplicados.
TIPO DE VARIABLE 
La propiedad del tipo de variable especifica los tipos de 
datos de cada variable. Por defecto se asume que todas las 
variables nuevas son numéricas.
Los tipos de variable disponibles son los siguientes: 
 Numérico. Una variable cuyos valores son números, se muestran en 
formato numérico estándar. 
 Coma. Una variable numérica cuyos valores se muestran con comas 
que delimitan cada tres posiciones y con el punto como delimitador 
decimal. 
 Punto. Una variable numérica cuyos valores se muestran con puntos 
que delimitan cada tres posiciones y con la coma como delimitador 
decimal. 
 Notación científica. Una variable numérica cuyos valores se muestran 
con una E intercalada y un exponente con signo que representa una 
potencia de base diez. El Editor de datos acepta para estas variables 
valores numéricos con o sin el exponente. 
 Fecha. Una variable numérica cuyos valores se muestran en uno de los 
diferentes formatos de fecha-calendario u hora-reloj. Es necesario 
seleccionar un formato de la lista. Para introducir la fecha se pueden 
utilizar: barras, guiones, puntos, comas o espacios. 
 Dólar. Una variable numérica que se muestra con un signo dólar inicial 
($), comas que delimitan cada tres posiciones y un punto como 
delimitador decimal. Se pueden introducir valores de datos con o sin el 
signo dólar inicial.
 Moneda personalizada. Una variable numérica cuyos valores se 
muestran en uno de los formatos de moneda personalizados que se 
hayan definido previamente en la pestaña Moneda del cuadro de 
diálogo Opciones. 
 Cadena. Una variable cuyos valores no son numéricos y, por lo tanto, 
no se utilizan en los cálculos. Las mayúsculas y las minúsculas se 
consideran diferentes. Este tipo también se conoce como variable 
alfanumérica. 
ETIQUETAS DE VARIABLE 
Puede asignar etiquetas de variable descriptivas, pueden contener 
espacios y caracteres reservados que no se admiten en los nombres 
de variable. 
Etiquetas de valor (Valores) 
Puede asignar etiquetas de valor descriptivas a cada valor de una 
variable. Este proceso es especialmente útil si el archivo de datos 
utiliza códigos numéricos para representar categorías que no son 
numéricas (por ejemplo, códigos 1 y 2 para hombre y mujer).
Para especificar etiquetas de valor 
Pulse en el botón de la casilla Valores de la variable que se quiere 
definir. 
 Para cada valor, escriba el valor y una etiqueta. 
 Pulse en Añadir para introducir la etiqueta de valor. 
 Pulse en Aceptar.
Valores perdidos 
Valores perdidos define los valores de los datos definidos como 
perdidos por el usuario. Por ejemplo, es posible que quiera distinguir 
los datos perdidos porque un encuestado se niegue a responder. Los 
valores de datos que se especifican como perdidos por el usuario 
aparecen marcados para un tratamiento especial y se excluyen de la 
mayoría de los cálculos.
Para definir los valores perdidos 
 Introduzca los valores o el rango de valores que representen los datos 
perdidos. Se considera que son válidos todos los valores de cadena, 
incluidos los valores vacíos o nulos, a no ser que se definan explícitamente 
como perdidos. 
DEFINICIÓN DE ETIQUETAS DE VALOR Y OTRAS PROPIEDADES 
DE LAS VARIABLES 
El cuadro de diálogo principal Definir propiedades de variables proporciona la 
siguiente información para las variables exploradas: 
Lista de variables exploradas. Para cada variable explorada, aparecerá 
una marca de verificación en la columna Sin etiqueta (S/E) indicando que la 
variable contiene valores sin etiquetas de valor asignadas. 
Para ordenar la lista de variables para que aparezcan todas las variables con 
valores sin etiquetas en la parte superior de la lista: 
Pulse en el encabezado de columna Sin etiqueta debajo de la Lista de 
variables exploradas. 
También puede ordenarla por nombre de variable o nivel de medida pulsando 
en el encabezado de columna correspondiente debajo de la Lista de 
variables exploradas.
Etiqueta. Muestra las etiquetas de valor que ya se han 
definido. Puede añadir o cambiar las etiquetas de esta 
columna. 
Valor. Valores únicos para cada variable seleccionada. Esta lista 
de valores únicos se basa en el número de casos explorados
Recuento. Número de veces que aparece cada valor 
en los casos explorados. 
Perdidos. Valores definidos para representar valores 
perdidos. Puede cambiar la designación de la categoría 
de los valores perdidos pulsando en la casilla de 
verificación 
Cambiado. Indica que ha añadido o cambiado una 
etiqueta de valor.
Nivel de medida. 
Las etiquetas de valor son especialmente útiles 
para las variables categóricas (nominales u 
ordinales), 
Algunos procedimientos tratan a las variables 
categóricas y de escala de manera diferente, por 
lo que a veces es importante asignar el nivel de 
medida correcto. 
Sin embargo, por defecto, todas las nuevas 
variables numéricas se asignan al nivel de medida 
de escala. 
Por tanto, puede que muchas variables que son de 
hecho categóricas, aparezcan inicialmente como 
variables de escala 
. 
.
Nivel de medida Tipo de datos 
Numerico Cadena Fecha tiempo 
Escala 
Ordinal 
Nominal
Papel. Algunos cuadros de diálogo permiten preseleccionar variables para 
su análisis en función de papeles definidos 
. 
Copiar propiedades. Puede copiar las etiquetas de valor y otras 
propiedades de las variables de otra variable a la variable seleccionada en 
ese momento o desde la variable seleccionada en ese momento a una o 
varias otras variables. 
Valores sin etiquetas. Para crear automáticamente etiquetas para valores 
sin etiquetas, pulse en: Etiquetas automáticas
Etiqueta de variable y formato de presentación 
Puede cambiar de la etiqueta de variable descriptiva y el formato de presentación. 
• No puede cambiar el tipo fundamental de la variable (numérica o de cadena). 
• Para las variables de cadena, sólo puede cambiar la etiqueta de variable, no el 
formato de presentación. 
• Para las variables numéricas, puede cambiar el tipo numérico (como numérico, 
fecha, dólar o moneda personalizada), el ancho (número máximo de dígitos, 
incluyendo los indicadores decimales y/o de agrupación) y el número de posiciones 
decimales. 
• Para el formato de fecha numérica, puede seleccionar un formato de fecha 
específico (como dd-mm-aaaa, mm/dd/aa, aaaaddd) 
• Para formato numérico personalizado, puede seleccionar uno de los cinco formatos 
de moneda personalizados (de CCA a CCE). 
• Aparece un asterisco en la columna Valor si el ancho especificado es inferior al 
ancho de los valores explorados o los valores mostrados para etiquetas de valor 
definidas ya existentes o categorías de valores perdidos. 
• Aparece un período (.) si los valores explorados o los valores mostrados para 
etiquetas de valor definidas ya existentes o categorías de valores perdidos no son 
válidos para el tipo de formato de presentación seleccionado. Por ejemplo, un valor 
numérico interno inferior a 86.400 no es válido para una variable de formato de 
fecha.

Preparacion de datos 6

  • 1.
    UNIVERSIDAD JUÁREZ AUTÓNOMADE TABASCO DIVISIÓN ACADÉMICA DE EDUCACIÓN Y ARTES LIC. CIENCIAS DE LA EDUCACIÓN Asignatura: Herramientas informáticas de apoyo a la investigación cuantitativa. Tema: Preparación de los datos. Alumnas: Jessica del Carmen reyes García. Virginia Avalos Laines Karen Beatriz Pérez Domínguez
  • 2.
    2.5 PREPARACIÓN DELOS DATOS Cuando abra un archivo de datos o introduzca datos en el Editor de datos, podrá empezar a crear informes, gráficos y análisis sin ningún trabajo preliminar adicional. Sin embargo, hay algunas funciones de preparación adicional de los datos que pueden resultarle útiles, entre las que se incluyen:  Asignar propiedades de las variables que describan los datos y determinen cómo se deben tratar ciertos valores. Identificar los casos que pueden contener información duplicada y excluir dichos casos de los análisis o eliminarlos del archivo de datos.  Crear nuevas variables con algunas categorías distintas que representen rangos de valores de variables que tengan un mayor número de valores posibles.
  • 3.
    PROPIEDADES DE VARIABLES Los datos introducidos en la Vista de datos del Editor de datos o leídos desde un formato de archivos externo (como una hoja de cálculo de Excel o un archivo de datos de texto) carecen de ciertas propiedades de variables que pueden resultar muy útiles, como:  Definición de etiquetas de valor descriptivas para códigos numéricos (por ejemplo, 0 = Hombre y 1 = Mujer).  Identificación de códigos de valores perdidos (por ejemplo, 99 = No procede).  Asignación del nivel de medida (nominal, ordinal o de escala).
  • 4.
    TODAS ESTAS PROPIEDADESDE VARIABLES (Y OTRAS) SE PUEDEN ASIGNAR EN LA VISTA DE VARIABLES DEL EDITOR DE DATOS. TAMBIÉN HAY ALGUNAS UTILIDADES QUE LE PUEDEN OFRECER ASISTENCIA EN ESTE PROCESO  Definir propiedades de variables puede ayudarle a definir etiquetas de valor descriptivas y valores perdidos. Esto es especialmente útil para datos categóricos con códigos numéricos utilizados para valores de categorías.  Definir nivel de medición para desconocido identifica las variables (campos) que no tengan un nivel de medición definido y permite definir el nivel de medición de esas variables. Es importante para los procedimientos en los que el nivel de medición puede afectar a los resultados o determinar qué funciones estarán disponibles.  Copiar propiedades de datos ofrece la posibilidad de utilizar un archivo de datos con IBM® SPSS® Statistics como plantilla para definir las propiedades de variables y archivos en el archivo de datos actual. Esto es particularmente útil si utiliza frecuentemente archivos de datos con un formato externo que tenga un contenido similar, como puedan ser informes mensuales en formato Excel.
  • 5.
    DEFINICIÓN DE PROPIEDADESDE VARIABLES Definir propiedades de variables está diseñado para ayudarle en el proceso de asignar atributos a variables, incluyendo la creación de etiquetas de valor descriptivas para variables categóricas (nominales u ordinales). Definir propiedades de variables:  Explora los datos reales y enumera todos valores de datos únicos para cada variable seleccionada.  Identifica valores sin etiquetas y ofrece una función de “etiquetas automáticas”.  Permite copiar etiquetas de valor definidas y otros atributos de otra variable en la variable seleccionada o de la variable seleccionada a varias variables adicionales.
  • 6.
    PARA DEFINIR PROPIEDADESDE VARIABLES Elija en los menús: Datos > Definir propiedades de variables...
  • 7.
    La Vista devariables contiene descripciones de las propiedades de cada variable del archivo de datos. En la Vista de variables:  Las filas son variables.  Las columnas son las características de las variables. PARA VISUALIZAR O DEFINIR LOS ATRIBUTOS DE LAS VARIABLES Desde la Vista de Variables, para definir variables nuevas, introduzca un nombre de variable en cualquier fila vacía y seleccione los atributos que desea definir o modificar. NOMBRES DE VARIABLE Para los nombres de variable se aplican las siguientes normas:  El nombre debe comenzar por una letra.  Los nombres de variable no pueden terminar en punto.  No se pueden utilizar espacios en blanco ni caracteres especiales.  Cada nombre de variable debe ser único; no se permiten duplicados.
  • 8.
    TIPO DE VARIABLE La propiedad del tipo de variable especifica los tipos de datos de cada variable. Por defecto se asume que todas las variables nuevas son numéricas.
  • 9.
    Los tipos devariable disponibles son los siguientes:  Numérico. Una variable cuyos valores son números, se muestran en formato numérico estándar.  Coma. Una variable numérica cuyos valores se muestran con comas que delimitan cada tres posiciones y con el punto como delimitador decimal.  Punto. Una variable numérica cuyos valores se muestran con puntos que delimitan cada tres posiciones y con la coma como delimitador decimal.  Notación científica. Una variable numérica cuyos valores se muestran con una E intercalada y un exponente con signo que representa una potencia de base diez. El Editor de datos acepta para estas variables valores numéricos con o sin el exponente.  Fecha. Una variable numérica cuyos valores se muestran en uno de los diferentes formatos de fecha-calendario u hora-reloj. Es necesario seleccionar un formato de la lista. Para introducir la fecha se pueden utilizar: barras, guiones, puntos, comas o espacios.  Dólar. Una variable numérica que se muestra con un signo dólar inicial ($), comas que delimitan cada tres posiciones y un punto como delimitador decimal. Se pueden introducir valores de datos con o sin el signo dólar inicial.
  • 10.
     Moneda personalizada.Una variable numérica cuyos valores se muestran en uno de los formatos de moneda personalizados que se hayan definido previamente en la pestaña Moneda del cuadro de diálogo Opciones.  Cadena. Una variable cuyos valores no son numéricos y, por lo tanto, no se utilizan en los cálculos. Las mayúsculas y las minúsculas se consideran diferentes. Este tipo también se conoce como variable alfanumérica. ETIQUETAS DE VARIABLE Puede asignar etiquetas de variable descriptivas, pueden contener espacios y caracteres reservados que no se admiten en los nombres de variable. Etiquetas de valor (Valores) Puede asignar etiquetas de valor descriptivas a cada valor de una variable. Este proceso es especialmente útil si el archivo de datos utiliza códigos numéricos para representar categorías que no son numéricas (por ejemplo, códigos 1 y 2 para hombre y mujer).
  • 11.
    Para especificar etiquetasde valor Pulse en el botón de la casilla Valores de la variable que se quiere definir.  Para cada valor, escriba el valor y una etiqueta.  Pulse en Añadir para introducir la etiqueta de valor.  Pulse en Aceptar.
  • 12.
    Valores perdidos Valoresperdidos define los valores de los datos definidos como perdidos por el usuario. Por ejemplo, es posible que quiera distinguir los datos perdidos porque un encuestado se niegue a responder. Los valores de datos que se especifican como perdidos por el usuario aparecen marcados para un tratamiento especial y se excluyen de la mayoría de los cálculos.
  • 13.
    Para definir losvalores perdidos  Introduzca los valores o el rango de valores que representen los datos perdidos. Se considera que son válidos todos los valores de cadena, incluidos los valores vacíos o nulos, a no ser que se definan explícitamente como perdidos. DEFINICIÓN DE ETIQUETAS DE VALOR Y OTRAS PROPIEDADES DE LAS VARIABLES El cuadro de diálogo principal Definir propiedades de variables proporciona la siguiente información para las variables exploradas: Lista de variables exploradas. Para cada variable explorada, aparecerá una marca de verificación en la columna Sin etiqueta (S/E) indicando que la variable contiene valores sin etiquetas de valor asignadas. Para ordenar la lista de variables para que aparezcan todas las variables con valores sin etiquetas en la parte superior de la lista: Pulse en el encabezado de columna Sin etiqueta debajo de la Lista de variables exploradas. También puede ordenarla por nombre de variable o nivel de medida pulsando en el encabezado de columna correspondiente debajo de la Lista de variables exploradas.
  • 15.
    Etiqueta. Muestra lasetiquetas de valor que ya se han definido. Puede añadir o cambiar las etiquetas de esta columna. Valor. Valores únicos para cada variable seleccionada. Esta lista de valores únicos se basa en el número de casos explorados
  • 16.
    Recuento. Número deveces que aparece cada valor en los casos explorados. Perdidos. Valores definidos para representar valores perdidos. Puede cambiar la designación de la categoría de los valores perdidos pulsando en la casilla de verificación Cambiado. Indica que ha añadido o cambiado una etiqueta de valor.
  • 19.
    Nivel de medida. Las etiquetas de valor son especialmente útiles para las variables categóricas (nominales u ordinales), Algunos procedimientos tratan a las variables categóricas y de escala de manera diferente, por lo que a veces es importante asignar el nivel de medida correcto. Sin embargo, por defecto, todas las nuevas variables numéricas se asignan al nivel de medida de escala. Por tanto, puede que muchas variables que son de hecho categóricas, aparezcan inicialmente como variables de escala . .
  • 20.
    Nivel de medidaTipo de datos Numerico Cadena Fecha tiempo Escala Ordinal Nominal
  • 21.
    Papel. Algunos cuadrosde diálogo permiten preseleccionar variables para su análisis en función de papeles definidos . Copiar propiedades. Puede copiar las etiquetas de valor y otras propiedades de las variables de otra variable a la variable seleccionada en ese momento o desde la variable seleccionada en ese momento a una o varias otras variables. Valores sin etiquetas. Para crear automáticamente etiquetas para valores sin etiquetas, pulse en: Etiquetas automáticas
  • 22.
    Etiqueta de variabley formato de presentación Puede cambiar de la etiqueta de variable descriptiva y el formato de presentación. • No puede cambiar el tipo fundamental de la variable (numérica o de cadena). • Para las variables de cadena, sólo puede cambiar la etiqueta de variable, no el formato de presentación. • Para las variables numéricas, puede cambiar el tipo numérico (como numérico, fecha, dólar o moneda personalizada), el ancho (número máximo de dígitos, incluyendo los indicadores decimales y/o de agrupación) y el número de posiciones decimales. • Para el formato de fecha numérica, puede seleccionar un formato de fecha específico (como dd-mm-aaaa, mm/dd/aa, aaaaddd) • Para formato numérico personalizado, puede seleccionar uno de los cinco formatos de moneda personalizados (de CCA a CCE). • Aparece un asterisco en la columna Valor si el ancho especificado es inferior al ancho de los valores explorados o los valores mostrados para etiquetas de valor definidas ya existentes o categorías de valores perdidos. • Aparece un período (.) si los valores explorados o los valores mostrados para etiquetas de valor definidas ya existentes o categorías de valores perdidos no son válidos para el tipo de formato de presentación seleccionado. Por ejemplo, un valor numérico interno inferior a 86.400 no es válido para una variable de formato de fecha.