1. Tema: Consultar los siguientes términos.
1. Análisis de datos
El análisis de datos es una técnica que permite la inspeccion, purifican y transforman de
datos, con la finalidad de destacar toda la información que sea de gran utilidad, a fin de
poder elaborar conclusiones que sirvan de apoyo en la toma de decisiones. El análisis de
datos se centra en la inferencia, el proceso de derivar una conclusión basándose solamente
en lo que conoce el investigador (Morillas Raya, 2016).
Ejemplo
Evolución del Precio del petróleo ecuatoriano en millones $
Figura 1
Fuente: BCE
Análisis de dato descriptivo del grafico
Se observa un crecimiento en el precio desde el 2009 hasta el 2013, en donde por motivos
de políticas externas el precio del petróleo comenzó a decaer y afecto la economía
nacional.
$133.50
$182.10
$116.20
$146.20
$193.70 $198.40
$195.30
$188.10
$99.40
$38.00 $46.82
$-
$50.00
$100.00
$150.00
$200.00
$250.00
2 0 0 7 2 0 0 8 2 0 0 9 2 0 1 0 2 0 1 1 2 0 1 2 2 0 1 3 2 0 1 4 2 0 1 5 2 0 1 6 2 0 1 7*
EVOLUCIÓN DEL PRECIO DEL PETROLEO ECUATORIANO
EN MILLONES $
2. 2. Análisis de factores
El Análisis Factores es una técnica de reducción de datos que sirve para encontrar grupos
homogéneos de variables a partir de un conjunto numeroso de variables. Parte del
supuesto de que en un conjunto de variables intercorrelacionadas. Dichas relaciones
recíprocas podrían deberse a la presencia de una o más variables (factores subyacentes)
relacionadas en grados diversos con aquéllas. El propósito del AF es identificar esos
factores o variables comunes, más generales que los datos mismos (De la fuente
Fernandez, 2011).
Ejemplo
Ilustración 1
Fuente: Video de YouTube
3. Análisis de varianza
Es un método para comparar dos o más medias, que es necesario porque cuando se quiere
comparar más de dos medias es incorrecto utilizar repetidamente el contraste basado en
la t de Student.
Ejemplo
Nombre Edad y1 y^2
José 25 -19,83 393,36
3. Rubén 35 -9,83 96,69
María 70 25,17 633,36
Pedro 69 24,17 584,03
Patricio 45 0,17 0,03
Renato 25 -19,83 393,36
Totales 269 0,00 2100,83
Tabla 1
Fuente: Elaboración propia
Media 269/6 44,83
Varianza 2100,83/6 350,14
4. Análisis multivariados
Es el conjunto de métodos estadísticos cuya finalidad es analizar simultáneamente
conjuntos de datos multivariantes en el sentido de que hay varias variables medidas para
cada individuo u objeto estudiado. Su razón de ser radica en un mejor entendimiento del
fenómeno objeto de estudio obteniendo información que los métodos estadísticos
univariantes y bivariantes son incapaces de conseguir (Salvador Figueras, 2000).
5. Categoría
Es cada uno de los grupos básicos en los que puede incluirse o clasificarse todo
conocimiento (Johnson, 1991) .
Ejemplo
Las jerarquías a instancias de una carrera, de una competición, de la posición social, o
de una profesión o la distinción que ostenta una persona y otros ejemplos más.
6. Chi cuadrada
Una prueba de chi-cuadrado es una prueba de hipótesis que compara la distribución
observada de los datos con una distribución esperada de los datos. Se recomienda utilizar
este análisis para probar qué tan bien una muestra de datos categóricos se ajusta a una
distribución teórica (Nieto Castro, 1996).
Ejemplo
4. Si el valor del chi-cuadrado calculado es menor o igual que el chi-cuadrado crítico
(valor que se encuentra en una tabla de valores críticos) entonces se acepta la hipótesis
nula, caso contrario no se la acepta.
Chi-critico 6.635
Chi-calculado 6.2482
Aquí se aceptaría el Ho
7. Codificación
El proceso de codificación se desarrolla teniendo como base la información recolectada
por medio de alguna técnica de recolección de información, por ello se toma como
elemento a analizar la información recabada y transformar los datos cualitativos en
cuantitativos con la asignación de un valor numérico (Niebles de las Salas, Oñoro Coneo,
& Oñoro Mártinez, 2007)
Ejemplo
Nombre de países Código del país
Ecuador 1
Colombia 2
Perú 3
Venezuela 4
Tabla 2
Fuente: Elaboración propia
8. Desviación estándar
Es una medida de dispersión, que nos indica cuánto pueden alejarse los valores respecto
al promedio (media), por lo tanto es útil para buscar probabilidades de que un evento
ocurra, o en el caso del mercado bursátil, determinar entre que rango de precios puede
moverse un determinado activo, y determinar que tipo de activos pueden ser mas volátiles
que otros (Quesada Ibarguen & Vergara Schmalbach, 2007).
Ejemplo
Nombre Edad y1 y^2
José 25 -19,83 393,36
5. Rubén 35 -9,83 96,69
María 70 25,17 633,36
Pedro 69 24,17 584,03
Patricio 45 0,17 0,03
Renato 25 -19,83 393,36
Totales 269 0,00 2100,83
Tabla 3
Fuente: Elaboración propia
Media 269/6 44,83
Varianza 2100,83/6 350,14
Desviación Estándar
raíz cuadrada
350,14 18,71
9. Distribución de frecuencias
Son tablas en que se dispone las modalidades de la variable por filas. En las columnas se
dispone el número de ocurrencias por cada valor, porcentajes, con la finalidad de las
agrupaciones en frecuencias es facilitar la obtención de la información que contienen los
datos.(Quesada Ibarguen & Vergara Schmalbach, 2007)
Ejemplo
25 35 25 35 25 70 70 17 45 45 69 45 69 45 69 35
35 70 35 70 69 70 70 69 45 69 45 69 45 69 45 68
Observaciones
Frecuencia
absoluta
Frecuencia
relativa
25 3 9%
35 5 16%
70 6 19%
69 9 28%
45 8 25%
17 1 3%
Total 32 100%
Tabla 4
6. Fuente: Elaboración propia
10. Formas de la prueba estadística
Una prueba estadística es una forma de evaluar la evidencia que los datos proporcionan
para probar una hipótesis. Esta hipótesis se denomina hipótesis nula, y suele denominarse
H0. Bajo H0, los datos se generan mediante procesos aleatorios (Johnson, 1991).
Pruebas paramétricas
Pruebas no paramétricas
Análisis de la varianza (anova)
Análisis de la covarianza (ancova)
Análisis de regresión
Análisis por protocolo
Ejemplo
Test de ruido blanco
Ilustración 2
Fuente. (Blacutt Mendoza , 2012)
Si prob < 0.05% se rechaza que la serie sea estacionaria; es no estacionaria
Ho: p>5% acepta estacionaria
H1: p<05% no estacionaria
11. Estadística inferencial
La inferencia estadística o estadística inferencial es una parte de la Estadística que
comprende los métodos y procedimientos para deducir propiedades de una población, a
partir de una pequeña parte de la misma (muestra). También permite comparar muestras
de diferentes poblaciones (Ecured, 2015).
Ejemplo
7. En cierta cadena de centros comerciales trabajan 150 personas en el departamento de
personal, 450 en el departamento de ventas, 200 en el departamento de contabilidad y 100
departamentos de atención al cliente. Con objeto de realizar una encuesta laboral, se
quiere seleccionar una muestra de 180 trabajadores.
180
=
X1
=
30
Personal
180
=
X2
=
40
contabilidad900 150 900 200
180
=
X3
=
90
ventas
180
=
X4
=
20
Atención al
cliente900
450
900
100
Tabla 5
Fuente: Elaboración propia
12. Gráficas
Es un tipo de representación de datos, generalmente numéricos, mediante recursos
gráficos, para que se manifieste visualmente la relación matemática o correlación
estadística que guardan entre sí. Las graficas resultantes revelan un patrón de
comportamiento de la variable en estudio (Quesada Ibarguen & Vergara Schmalbach,
2007).
Ejemplo
Evolución del Precio del petróleo ecuatoriano en millones $
Figura 2
Fuente: BCE
13. Intervalo de confianza
$133.50
$182.10
$116.20
$146.20
$193.70 $198.40
$195.30
$188.10
$99.40
$38.00 $46.82
$-
$50.00
$100.00
$150.00
$200.00
$250.00
2 0 0 7 2 0 0 8 2 0 0 9 2 0 1 0 2 0 1 1 2 0 1 2 2 0 1 3 2 0 1 4 2 0 1 5 2 0 1 6 2 0 1 7*
EVOLUCIÓN DEL PRECIO DEL PETROLEO ECUATORIANO
EN MILLONES $
8. Un intervalo de confianza es un rango de valores, derivado de los estadísticos de la
muestra, que posiblemente incluya el valor de un parámetro de población desconocido.
Debido a su naturaleza aleatoria, es poco probable que dos muestras de una población en
particular produzcan intervalos de confianza idénticos. Sin embargo, si usted repitiera
muchas veces su muestra, un determinado porcentaje de los intervalos de confianza
resultantes incluiría el parámetro de población desconocido (Téllez Montiel & Barón
López, 2004).
Ejemplo
Una encuesta eleciones politica podría indicar que el nivel de popularidad de un candidato
es de 55% con un margen de error de 5%.
55 -5=50 popularidad
55+5=60 popularidad
14. Media
Es la medida de posición central más utilizada, la más conocida y la más sencilla de
calcular, debido principalmente a que sus ecuaciones se prestan para el manejo
algebraico, lo cual la hace de gran utilidad. Su principal desventaja radica en su
sensibilidad al cambio de uno de sus valores o a los valores extremos demasiado grandes
o pequeños. La media se define como la suma de todos los valores observados, dividido
por el número total de observaciones (Hurtado Minotta, 2006).
Ejemplo
25 35 25 35 25 70 70 17 45 45 69 45 69 45 69 35
35 70 35 70 69 70 70 69 45 69 45 69 45 69 45 68
70 70 70 70 70 70 69 69 69 69 69 69 69 69 69 45
17 25 25 25 35 35 35 35 35 45 45 45 45 45 45 45
Por la ordenación de número se verifica que el 45 es la media
Tabla 6
Fuente: Elaboración propia
15. Mediana
9. Iidentificar el valor que se encuentra en el centro de los datos, es decir, nos permite
conocer el valor que se encuentra exactamente en la mitad del conjunto de datos después
que las observaciones se han ubicado en serie ordenada. Esta medida nos indica que la
mitad de los datos se encuentran por debajo de este valor y la otra mitad por encima del
mismo. Para determinar la posición de la mediana se utiliza la fórmula (Hurtado Minotta,
2006).
Ejemplo
25 35 25 35 25 70 70 17 45 45 69 45 69 45 69 35
35 70 35 70 69 70 70 69 45 69 45 69 45 69 45 68
Sumatoria total 1667 / 32 = 52.09
16. Moda
La moda de un conjunto de datos es el dato que más veces se repite, es decir, aquel que
tiene mayor frecuencia absoluta. Se denota por Mo. En caso de existir dos valores de la
variable que tengan la mayor frecuencia absoluta, habría dos modas. Si no se repite
ningún valor, no existe moda (Hurtado Minotta, 2006).
Ejemplo
25 35 25 35 25 70 70 17 45 45 69 45 69 45 69 35
35 70 35 70 69 70 70 69 45 69 45 69 45 69 45 68
Observaciones
Frecuencia
absoluta
Frecuencia
relativa
25 3 9%
35 5 16%
70 6 19%
69 9 28%
45 8 25%
17 1 3%
Total 32 100%
Tabla 7
10. Fuente: Elaboración propia
La de más repeticiones en la frecuencia es el 69 con 9.
17. Nivel de significación o significancia
El nivel de significancia (α) es la distancia de cada punto axial (denominado también
punto de estrella) desde el centro de un diseño central compuesto. junto con el número de
puntos centrales, determina si un diseño se puede dividir en bloques ortogonales y si es
rotativo (Blacutt Mendoza , 2012).
Ejemplo
Un investigador tiene cien muestras y este tiene la probabilidad de que en 5 muestras la
hipótesis alternativa esté errada. Es decir, el 5% mostraría el riesgo que corremos de
cometer un error, esa probabilidad de error, en este caso, del 5%, se conoce como el Nivel
de Significancia.
18. Rango de extensión total de los datos en escala
El Rango es el intervalo entre el valor máximo y el valor mínimo; por ello, comparte
unidades con los datos. Permite obtener una idea de la dispersión de los datos, cuanto
mayor es el rango, más dispersos están los datos de un conjunto (Orellana, 2001).
Ejemplo
20 15 16 29 32 22 41
Datos ordenados
Mínimo15 16 20 22 29 32 41 Máximo
(15-41) = 26 RANGO
Conclusiones
La realización de este trabajo autónomo me permitió recordar temas estadísticos que son
de suma importancia en una investigación, debido a que permite una rápida interpretación
de información una fácil clasificación de datos y a su vez corroborar que la investigación
este correctamente direccionada.
Referencias
Blacutt Mendoza , M. (2012). Estadística aplicada con SPSS. Módulo I.
11. De la fuente Fernandez, S. (2011). Analisis Factorial. UAM, 1-34.
Ecured. (2015). Ecured. Obtenido de Estadistica Inferencial:
https://www.ecured.cu/Estad%C3%ADstica_Inferencial
Hurtado Minotta, E. (2006). Estadística descriptiva y analítica.
Johnson, R. (1991). Estadistica Elemental. Mexico: Iberoamericá.
Morillas Raya, A. (2016). Introducción al análisis de datos difusos. Eumed, 1-64.
doi:84-689-9208-2
Niebles de las Salas, E., Oñoro Coneo, E., & Oñoro Mártinez, R. (2007). Procesos
desarrollados por gerentes sociales de ong´s exitosas en el ámbito de la gestión
del tercer sector en cartagena. Eumed, 10-12.
Nieto Castro, O. (1996). Curso Basico de Estadistica. Colombia.
Orellana, L. (2001). Estadistica Descriptiva.
Quesada Ibarguen, V., & Vergara Schmalbach, J. (2007). Estadistíca básica con
aplicaciones en Ms Excel. Eumed, 131-159.
Salvador Figueras, M. (2000). Introducción al Análisis Multivariante. UDZE, 1-7.
Téllez Montiel, & Barón López. (2004). Apuntes bioestadistica. UMA.