El documento describe los pasos del análisis de datos cuantitativos, incluyendo decidir el programa de análisis, explorar los datos, evaluar la confiabilidad de los instrumentos, analizar e interpretar los resultados mediante pruebas estadísticas. También describe técnicas como la organización de datos en matrices de tabulación, el análisis estadístico descriptivo para describir cada variable, y el análisis estadístico inferencial para probar hipótesis y estimar parámetros poblacionales.
2. ANÁLISIS DE LOS DATOS
CUANTITATIVOS
Decidir el programa de análisis de datos que se
utilizará
Explorar los datos obtenidos en la
recolección
Evaluar la confiabilidad, validez y
objetividad de los instrumentos de
medición utilizados
Analizar e interpretar mediante pruebas
estadísticas
Preparar los resultados para presentarlo
3. Qué son las técnicas de análisis de
datos?
Son herramientas útiles para organizar,
describir y analizar los datos recogidos
con los instrumentos de investigación.
El análisis de datos encierra dos
procedimientos:
-La organización de los datos.
-Análisis de los datos.
4. ¿Cómo se organizan los datos para su
posterior análisis?
Una vez recogidos los datos, necesitas
organizarlos, de decir, prepararlos para su
análisis posterior.
Los datos cuantitativos se organización en
una matriz de tabulación (hecha en Excel o
SPSS).
El análisis de los datos se efectúa sobre esta
matriz, la cual está guardada en un archivo y
contiene todos los datos recopilados.
Los datos cualitativos se organizan en
archivos de documento (hechos en Word u
otro semejante).
El análisis de datos se efectúa sobre estos
documentos.
5. La matriz de tabulación es
una tabla de doble entrada,
de filas por columnas que
contiene toda la información
obtenida mediante los
instrumentos cuantitativos.
Cada columna representa
un indicador de las
variables y cada fila
representa un sujeto de tu
muestra. Tendremos tantas
columnas como variables
tengas.
6. •Genero ( 1=masculino y 2 = femenino)
•Color de cabello ( 1=negro, 2=castaño, 3=pelirrojo,
4=rubio)
•Edad (por años)
Ejemplo de matriz de datos con dos variables
Caso Columna 1:
(Género)
Columna 2:
(color de pelo)
1 1 1
2 1 1
3 2 1
4 2 4
9. Existen diversos programas para analizar
datos, incluyen dos partes o segmentos: una
parte de definiciones de las variables, que a su
vez explican los datos (los elementos de la
codificación ítem por ítem), indicador por
indicador en casos propios de las ingenierías y
diversas disciplinas y la otra parte, la matriz de
datos.
11. Es un sistema amplio y flexible de análisis
estadístico y gestión de información que es
capaz de trabajar con datos procedentes de
distintos formatos generados, desde sencillos
gráficos de distribuciones y estadísticos
descriptivos hasta análisis estadísticos
complejos que nos permitirán descubrir
relaciones de dependencia e
interdependencia, establecer clasificaciones
de sujetos y variables, predecir
comportamientos.
Su aplicación fundamental está orientada al
análisis multivariante de datos
experimentales.
12. Implementa de forma organizada y ordenada la
base de datos.
Nos ayuda en la manipulación de los datos, y
implementa técnicas estadísticas para el
análisis de los datos.
Permite visualizar los datos y las variables con
los que vamos a trabajar. Recoge todos los
menús para trabajar con los datos y realizar los
análisis estadísticos.
SPSS LLEVA A CABO LAS TRES ETAPAS CLAVES PARA
LA REALIZACIÓN DEL ESTUDIO ESTADÍSTICO: -
13. es un programa de computadora diseñado para
ejecutar funciones estadísticas básicas y
avanzadas. Combina lo amigable del uso
de Microsoft Excel con la capacidad de ejecución
de análisis estadísticos.
El programa incorpora opciones vinculadas a las
principales técnicas de análisis estadístico (análisis
descriptivo, contrastes de hipótesis, regresión lineal
y no lineal, series temporales, análisis de tiempos
de fallo, control de calidad, análisis
factorial.), además de proporcionar un potente
entorno gráfico y de ofrecer total compatibilidad con
los editores de texto, hojas de cálculo y bases de
datos más usuales.
MINITAB
14. ESTADÍSTICA DESCRIPTIVA PARA
CADA VARIABLESe trata de describir datos, los valores o
puntuaciones obtenidas para cada
variable
Ejemplo: si aplicamos 112 niños el
cuestionario sobre los usos y las
graficaciones que la televisión tiene para
ellos ¿Cómo pueden describirse estos
dato? Esto se logra al describir la
distribución de las puntuaciones o
frecuencias de cada variable
15. QUE ES UNA DISTRIBUCIÓN DE FRECUENCIA
Es un conjunto de puntuación ordenada en
sus respectivas categorías
Ejemplo: en un estudio entre 200 personas
latinas que viven en EE.UU.se les pregunto
¿ Como prefiere que se refiera a usted en
cuanto a su origen étnico ? Las respuestas
fueron
16. Categoría Códigos ( valores) Frecuencia
Hispano
Latino
Latinoamericano
Americano
Otros
No respondieron
Total
1
2
3
4
5
6
52
88
6
22
20
12
200
17. ¿QUÉ OTROS ELEMENTOS CONTIENE UNA
DISTRIBUCIÓN DE FRECUENCIA?
LAS DISTRIBUCIONES DE FRECUENCIAS
PUEDEN COMPLETARSE AGREGADO LOS
PORCENTAJES DE CASOS EN CADA
CATEGORÍA LOS PORCENTAJES VALIDOS
Y LOS PORCENTAJES ACUMULADOS
(PORCENTAJES DE LO QUE SE VA
ACUMULANDO EN CADA CATEGORÍA
DESDE LA MAS BAJA HASTA LA MAS ALTA )
18. ¿CUÁLES SON LAS MEDIDAS DE TENDENCIA
CENTRAL ?
Son puntos en una distribución, los
valores medios o centrales de esta
y nos ayuda a ubicarla dentro de
la escala de medición
Las principales medidas de
tendencia son: moda, mediana y
media
19. Moda : Categoría o puntuación que se
presenta con mayor frecuencia
Mediana: es el valor que divide la
distribución por la mitad
Esto es la mitad de los casos por
debajo de la mediana y la otra mitad
se ubica por encima de la mediana
La median refleja la posición
intermedia de la distribución
20. Ejemplo:
24 31 35 38 43 45 50
57
La mediana es 38 porque deja cuatro
por encima y cuatro casos por
debajo parte a la distribución en dos
mitades en general para descubrir la
puntuación que constituye la
mediana de una distribución
simplemente se aplica la formula
N+1/2
21. Media: es la medida de tendencia
central mas utilizada y puede
definirse como el promedio aritmético
de una distribución
Carecen de sentido para variables
medidas en un nivel nominal u ordinal
su formula es :
X= X1+X2+X3+X4+X5/Numero de
casos
22. Medidas de la variabilidad
Son intervalos que indican la dispersión de los
datos en la escala de medición
Rango
indica la extensión total de los datos en la escala
Desviación estándar
Promedio de desviación de las puntuaciones con
respecto a la media que se expresa en las
unidades originales de medición de la distribución
23. La varianza
Se utiliza en análisis inferenciales
es la desviación estándar elevada al
cuadro y se simboliza S2 es un
concepto estadístico muy importante
ya que muchas de las pruebas
cuantitativas se fundamentan en
diversos métodos estadísticos
parten de la descomposición de la
varianza
24. ¿Cómo se interpretan las
medidas de tendencia central y
de la variabilidad?
se trata de describir nuestros datos
respecto a cada variable del
estudio interpretamos las medidas
de tendencia central y de
variabilidad en conjunto no
aisladamente.
25. ANALISIS ESTADISTICO INFERENCIAL
ESTADISTICA INFERENCIAL :
Se utiliza para probar hipótesis y estimar
parámetros.
PARA QUE ES UTIL LA ESTADISTICA
INFERENCIAL
El propósito de la investigación va mas allá de
describir las distribuciones de las variables .
Los datos casi siempre se recolectan de una
muestra y sus resultados estadísticos se
denominan estadígrafos , la media o desviación
estándar de la distribución de una muestra son
estadígrafos , a las estadísticas de la poblacion o
26. La inferencia de los parámetros se lleva a
cabo mediante técnicas estadísticas
apropiadas .
La estadística inferencial se utiliza para dos
procedimientos:
a) PROBAR HIPOTESIS
b) ESTIMAR PARAMETROS
27. EN QUE CONSISTE LA PRUEBA DE HIPÓTESIS :
Una hipótesis en el contexto de la estadística
inferencial es una proposición respecto a uno o
varios parámetros , y lo que el investigador
hace por medio de la prueba de hipótesis es
determinar si la hipótesis es congruente con los
datos obtenidos en la muestra.
Para entender lo que es la prueba de hipótesis en
la estadística inferencial es necesario revisar el
concepto de distribución muestral y nivel de
significancia.
28. QUE ES UNA DISTRIBUCION MUESTRAL
Una distribución muestral es un conjunto de
valores sobre una estadística calculada de
todas las muestras posibles de determinado
tamaño de una poblacion .
EJEMPLO
Supongamos que nuestro universo son los
automovilistas de una ciudad y queremos
averiguar cuanto tiempo pasan diariamente
manejando.
De este universo se puede obtener una muestra
representativa.
29. Vamos a suponer que el tamaño adecuado de
muestra es de 512 automóviles , del mismo
universo se podría obtener diferentes
muestras , cada una con 512 personas .
Teóricamente podríamos elegir al azar 1 , 2 , 3
muestras , en cada muestra obtendremos el
promedio que pasan los automóviles
manejando unos pueden estar mas tiempo al
volante .
Muy rara vez se obtiene la distribución
muestral (la distribución de las medidas de
todas las muestras posibles) . Es mas bien
el concepto teórico definido por la estadística
para los investigadores.
30. QUE ES EL NIVEL DE SIGNIFICANCIA
Es un nivel de la probabilidad de equivocarse y
que fija de manera a priori el investigador .
Para analizar nos basaremos en :
La probabilidad de que un evento ocurra oscila
entre cero (0) y uno (1) , donde cero significa la
imposibilidad de ocurrencia y uno la certeza de
que el fenómeno ocurra.
Al lanzar una moneda no cargada al aire , la
probabilidad de que salga cruz es de 0.50 y la
probabilidad de que la moneda caiga en cara es
de 0.50
31. ¿POR QUÉ ES IMPORTANTE OTRO CONCEPTO : EL
INTERVALO DE CONFIANZA
Se ha hablado de la distribución muestral por lo
que respecta a la prueba de hipótesis , pero
otro procedimiento de la estadística inferencial
es construir un intervalo donde se localiza un
parámetro.
Por ejemplo :
En lugar de pretender probar una hipótesis acerca
de la media poblacional , puede buscarse un
intervalo donde se ubique dicha media . Lo
anterior requiere un nivel de confianza , al igual
que en la prueba de hipótesis inferencial.
32. El nivel de confianza es al intervalo de confianza , lo
que el nivel de significancia es a la prueba de
hipótesis.
Es decir se trata de una probabilidad definida de que
un parámetro se va ubicar en un determinado
intervalo.
Se aplica la siguiente formula :
Intervalo de confianza : estadígrafo +
(puntuación z nivel de confianza) (desviación
estándar de la distribución muestral
correspondiente)
En la formula el estadígrafo es la estadística
calculada en la muestra , la puntuación z es 1.96
con un nivel de 0.95 y de 2.58 con un nivel de
0.99, en tanto que el error estándar depende del
estadígrafo.
33. EJEMPLO
De la media en el caso de la exposición
diaria a la televisión (fin de semana ) por
parte de los niños .
Media : 2.9 horas
S : 1.2 horas
Sx : 0.0679
(desviación estándar de la distribución muestral
de la media .)
Nivel de confianza : 0.95 (z: 1.96)
Intervalo de confianza : 2.9+ (1.96) (0.0679)
2.9+ (0.133)
34. Intervalo de confianza :
La media poblacion esta entre 2.767 y 3.033
horas , con 95 % de probabilidades de no
cometer error