Este documento presenta una introducción a la estadística inferencial y su aplicación en el programa SPSS. Explica conceptos clave como población, muestra, estadísticas descriptivas, distribución de frecuencias absolutas y relativas. Luego detalla cómo calcular frecuencias absolutas, relativas y acumuladas en SPSS y cómo esto permite analizar y tomar decisiones sobre problemas relacionados con el comercio exterior.
1. Universidad Politécnica Estatal del Carchi
Comercio Internacional, Integración, Administración y
Economía Empresarial.
Escuela: Comercio Exterior y Negociación Comercial
Internacional
“Estadística Inferencial”
“MANUAL SPSS”
Msc. Jorge Pozo
Autor:
Ramírez Goyes Carla Damaris
Nivel: sexto Paralelo: “A”
Marzo-Agosto 2012
Tulcán-Ecuador
2.
3. INTRODUCCIÓN
Para mucha gente, estadística significa descripciones numéricas. Esto puede
verificarse fácilmente al escuchar, un domingo cualquiera, a un comentarista de
televisión narrar un juego de fútbol. Sin embargo, en términos más precisos, la
estadística es el estudio de los fenómenos aleatorios. En este sentido la ciencia
de la estadística tiene, virtualmente, un alcance ilimitado de aplicaciones en un
espectro tan amplio de disciplinas que van desde las ciencias y la ingeniería
hasta las leyes y la medicina. El aspecto más importante de la estadística es la
obtención de conclusiones basadas en los datos experimentales.
Este proceso se conoce como inferencia estadística. Si una conclusión dada
pertenece a un indicador económico importante o a una posible concentración
peligrosa de cierto contaminante, o bien, si se pretende establecer una relación
entre la incidencia de cáncer pulmonar y el fumar, es muy común que la
conclusión esté basada en la inferencia estadística.
Para comprender la naturaleza de la inferencia estadística, es necesario
entender las nociones de población y muestra. La población es la colección de
toda la posible información que caracteriza a un fenómeno. En estadística,
población es un concepto mucho más general del que tiene la acepción común
de esta palabra. En este sentido, una población es cualquier colección ya sea
de un número finito de mediciones o una colección grande, virtualmente infinita,
de datos acerca de algo de interés. Por otro lado, la muestra es un subconjunto
representativo seleccionado de una población. La palabra representativo es la
clave de esta idea. Una buena muestra es aquella que refleja las
características esenciales de la población de la cual se obtuvo. En estadística,
el objetivo de las técnicas de muestreo es asegurar que cada observación en la
población tiene una .oportunidad igual e independiente de ser incluida en la
muestra. Tales procesos de muestreo conducen a una muestra aleatoria. Las
observaciones de la muestra aleatoria se usan para calcular ciertas
características de la muestra denominadas estadísticas. Las estadísticas se
usan como base para hacer inferencias acerca de ciertas características de la
población, que reciben el nombre de parámetros. Así, muchas veces se analiza
la información que contiene una muestra aleatoria con el propósito principal de
4. hacer inferencias sobre la naturaleza de la población de la cual se obtuvo la
muestra.
En estadística la inferencia es inductiva porque se proyecta de lo específico
(muestra) hacia lo general (población). En un procedimiento de esta naturaleza
siempre existe la posibilidad de error. Nunca podrá tenerse el 100% de
seguridad sobre una proposición que se base en la inferencia estadística. Sin
embargo, lo que hace que la estadística sea una ciencia (separándola del arte
de adivinar la fortuna) es que, unida a cualquier proposición, existe una medida
de la confiabilidad de ésta. En estadística la confiabilidad se mide en términos
de probabilidad. En otras palabras, para cada inferencia estadística se
identifica la probabilidad de que la inferencia sea correcta.
Virtualmente cada área de la investigación científica seria puede beneficiarse
del análisis estadístico. Para quien formula las políticas económicas y para
quien asesora al presidente y a otros funcionarios públicos sobre
procedimientos económicos apropiados, la estadística ha demostrado ser una
herramienta valiosa. Las decisiones sobre las tasas tributarias, los programas
sociales, el gasto de defensa y muchos otros asuntos pueden hacerse de
manera inteligente tan sólo con la ayuda del análisis estadístico.
Los hombres y mujeres de negocios, en su eterna búsqueda de la rentabilidad,
consideran que la estadística es esencial en el proceso de toma de decisiones.
Los esfuerzos en control de calidad, minimización de costos, combinación de
productos e inventarios, y una gran cantidad de otros asuntos empresariales,
pueden manejarse efectivamente a través del uso de procedimientos
estadísticos comprobados.
Para quienes están en el área de la investigación de mercados, la estadística
es de gran ayuda en el momento de determinar qué tan probable es que un
producto nuevo sea exitoso. La estadística también es muy útil para evaluar las
oportunidades de inversión por parte de asesores financieros. Los contadores,
los jefes de personal, y los fabricantes encuentran oportunidades ilimitadas de
beneficiarse con el uso del análisis estadístico. Incluso un investigador en el
campo de la medicina, interesado en la efectividad de un nuevo medicamento,
considera la estadística una aliada imprescindible.
5. Tales aplicaciones y muchas otras se ilustran a lo largo de este texto. Se
mostrará cómo utilizar la estadística en el mejoramiento del desempeño laboral
y en muchos otros aspectos de la vida diaria.
En repetidas ocasiones se ha enfatizado la utilidad de la estadística y la amplia
variedad de problemas que puede resolver. Para ilustrar de manera más
completa esta amplia aplicabilidad, es necesario analizar las diversas funciones
de la estadística. La estadística es la ciencia que tiene que ver con la (1)
recolección, (2) organización, (3) presentación, (4) análisis, e (5) interpretación
de datos.
Aunque en todo estudio estadístico el primer paso es la recolección de datos,
es usual en un curso básico de estadística asumir que los datos ya han sido
recolectados y que ahora están disponibles. Por consiguiente, el trabajo
comienza con el esfuerzo por organizar y presentar estos datos de manera
significativa y descriptiva. Los datos deben colocarse en un orden lógico que
revele rápida y fácilmente el mensaje que contienen. Este procedimiento
constituye el proceso de la estadística. Luego de que los datos se han
organizado y se han presentado para su revisión, el estadístico debe
analizarlos e interpretarlos. Estos procedimientos se basan en la estadística
inferencial y constituyen un importante beneficio para el análisis estadístico,
mediante la ayuda en el proceso de toma de decisiones y solución de
problemas.
6. TEMA:Aplicación de Estadística inferencial y estadística descriptiva en el
programa SPSS
PROBLEMA:El escaso conocimiento de programas estadísticos nos ha
restringido aplicar nuestros conocimientos en dichos programas
OBJETIVOS
OBJETIVO GENERAL:
Aplicar los datos estadísticos en el programa SPSS que permita resolver
problemas relacionados al comercio exterior
OBJETIVO ESPECIFICO:
Investigarlaaplicación de los Estadísticos en el programa SPSSpara
resolver problemas de Comercio Exterior.
Conocer en su totalidad la aplicación de los Estadísticos en el programa
SPSS.
Analizar la aplicación de Estadísticos en el programa SPSSpara
resolver problemas de Comercio Exterior y realizar la respectiva toma de
decisiones.
7. JUSTIFICACION
Con esta investigación se quiere conocer los programas que hoy en la
actualidad permiten aplicar problemas y ejercicios que surgen en el comercio
exterior, en este caso queremos interpretar los diferentes estadísticos que
manejamos dentro de la estadística inferencial, utilizando el programa SPSS
17, el cual permite calcular resultados de una forma más rápida y precisa.
Con la aplicación de los estadísticos en este programa buscamos que la forma
para tomar y analizar resultados, sea más factible para la persona que requiere
de esta información.
En este proyecto esta detallado cada paso que se deberá tomar al momento de
calcular los diferentes estadísticos de manera que sea entendible y practico.
ESTADISTICA
La estadística es la ciencia formada por un conjunto de teorías y técnicas
cuantitativas, que tiene por objeto la organización, presentación, descripción,
resumen y comparación de conjuntos de datos numéricos, obtenidos de
poblaciones en su conjunto de individuos o fenómenos o bien de muestras que
representan las poblaciones estudiadas, así como el estudio de su variación,
propiedades, relaciones,comportamiento probabilístico de dichos datos y la
estimación, inferencia o generalización de los resultados obtenidos de
muestras, respecto a las poblaciones que aquéllas representan. La estadística
en la investigación científica, dada la necesidad de manejar y tratar en ellas
grandes cantidades, progresivamente crecientes, de
datos”.(http://www.AulaFacil.com)
Irma Nocedo de León et al (2001), anotan que “la estadística es la ciencia
encargada de suministrar las diferentes técnicas y procedimientos que permiten
desde organizar la recolección de datos hasta su elaboración, análisis e
interpretación. Abarca dos campos fundamentales la estadística descriptiva y la
estadística inferencial.(http://www.Wikipedia: Estadísticas.)
8. CLASIFICACIÓN DE LA ESTADÍSTICA
Dependiendo de cómo se analizan los datos, la Estadística se clasifica como:
ESTDISTICA DESCRIPTIVA
Estadística Descriptiva.- Rama de la estadística que trata sobre la descripción
y análisis estadístico de una población, que resume y presenta datos obtenidos
de la población o de una muestra, mediante métodos adecuados. Tiene como
objetivo caracterizar los datos, de manera gráfica o analítica, para resaltar las
propiedades de los elementos bajo estudio.(http://www.Wikipedia:
Estadísticas.).
FRECUENCIA:
Es el número de veces que se repite un dato.
Es el número de repeticiones que presenta una observación. Se
representa por ni.http://www.mitecnologico.com
Es el número de veces que aparece cualquier valor de la variable. Se
representa por fi. En algunos libros de texto nos la encontraremos
representada por ni.http://www.quequieredecir.
DISTRIBUCIÓN DE FRECUENCIAS ABSOLUTAS Y RELATIVAS
Las primeras tareas de la Estadística descriptiva son ordenar, clasificar y
resumir los datos obtenidos en la investigación de campo, para ello se
concentran en tablas de frecuencia y éstas pueden ser:
a) Absoluta.
b) Relativa.
c) Acumulada.
Con el análisis de las frecuencias podemos determinar la tendencia de la
variable en estudio que como ya se dijo, ésta puede ser nominal, ordinal o
cuantitativa y sus respectivas escalas de medición: nominal, ordinal o por
intervalos, respectivamente.
9. EJEMPLO: La maestra de orientación del Plantel 11 dio una conferencia al
grupo 603 sobre las características y bondades de las carreras de Ingeniería,
Química Metalúrgica y Actuaría. Al final de la conferencia pidió que llenaran un
cuestionario donde especificaron además de los datos personales, la carrera
de preferencia. Se obtuvieron los siguientes resultados:
I, A, M, Q, Q, M, A, I, M, Q, A, Q, I, Q, M,
Q, M, M, A, Q, I, Q, M, I, I, Q, M, M, A, I,
M, A, A, Q, I, M, Q, Q, A, M, A, Q, M, A, Q,
Tabla De Frecuencias:
Carrera que prefieren los alumnos del grupo 603 del Plantel 11 del Colegio de
Bachilleres.
Encuesta realizada por la maestra de orientación del Plantel 11, el 12 de
septiembre de 1993.
El número de columnas de una tabla es variable y depende de la
información que se quiera registrar.
En nuestro ejemplo podemos suprimir la columna 2 que representa el
conteo de la variable el cual se puede realizar en otras hojas de trabajo.
En la tercera columna se registra la frecuencia.
10. FRECUENCIA ABSOLUTA
En una muestra estadística, número de veces que aparece un determinado
carácter.http://nuestrosalud.com/ frecuencia-absoluta.html
El número de los miembros de una serie estadística, que es al intervalo
determinado de los significados de la cantidad variable dada casual; en
particular, el número de los casos con dado o los valores dados del elemento
durante todo el tiempo de las observaciones.
http://www.quequieredecir.org/frecuencia
FRECUENCIAS ABSOLUTAS
Simple (Ni) Acumulada (Ni)
Ni ni
n2 ni+n2
n3 ni+n2+n3
. .
. .
Nn n
FRECUENCIA RELATIVA:
Cociente entre la frecuencia absoluta y el número de casos de una
muestra.http://www.quequieredecir.org/frecuencia/
11. La frecuencia relativa es el cociente entre la frecuencia absoluta de un
determinado valor y el número total de
datos.http://www.mitecnologico.com/Main/FrecuenciaRelativa
FRECUENCIA RELATIVA
Simple Acumulada
hi=n1|n h1
h2=n2|n h1+h2
. .
. .
hn= nn/n h
FORMA DE CÁLCULO
EJEMPLO
La puntuación obtenida en un examen que se aplicó a 100 obreros de la fábrica
de vidrio el Fanal, es la que se muestra en la siguiente tabla de frecuencias: 46
Resultados del examen aplicado a 100 obreros de la fábrica de vidrio el
Fanal.
12. Investigación realizada por el jefe del departamento de capacitación de la
fábrica de vidrio el Fanal, el 5 de septiembre de 1993.
FRECUENCIA ACUMULADA
La frecuencia acumulada (Fi) es otra característica de la muestra que nos
permitirá determinar la posición de un caso particular que nos interese en
comparación con el total de los elementos.((Levin Richard & Rubin David,
1996:p.140).)
DEFINICIÓN:
Su definición matemática es:
Al calcular la frecuencia acumulada (F1) podemos determinar su frecuencia
relativa acumulada (Fr) en la forma ya explicada mediante la ecuación (1), esto
es: n
Regresemos al problema (11) de las llamadas telefónicas y calculemos la
frecuencia acumulada (f1) y la frecuencia relativa acumulada (Fr). Frecuencia
acumulada (Fi) de una clase es la que se obtiene sumando las frecuencias de
las clases anteriores con la frecuencia de ésta.
13. La frecuencia acumulada para la 4ta. Clase es F = 45; de este valor se infiere
que hasta esta clase corresponden 45 de las 60 observaciones realizadas.
También se infiere que a esta clase corresponden un número menor o igual a
43 llamadas telefónicas. La frecuencia relativa de esta clase es F = 0.75. Este
valor significa que hasta esta clase corresponde el 75% de todas las llamadas.
GRÁFICAS
Al representar en una gráfica la información concentrada en la tabla de
frecuencias, ésta es un recurso visual que nos permite tener una idea clara,
precisa, global y rápida acerca de las observaciones de una muestra o
población. Existen muchos tipos de gráficas en las que se pueden representar
la frecuencia absoluta (fi), relativa (fr) y acumulada (Fi) y con ellas podemos
estimar algunos valores con la simple observación.
HISTOGRAMA
Es uno de los medios expresada en % con mayor frecuencia, es una
representación gráfica de la distribución de frecuencias.
Se utilizan para representar tablas de frecuencias con datos agrupados en
intervalos. Si los intervalos son todos iguales, cada uno de ellos es la base de
14. un rectángulo cuya altura es proporcional a la frecuencia
correspondiente.http://www.monografias.com/ conceptos-de-estadistica.shtml
En estadística, un histograma es una representación gráfica de una variable en
forma de barras, donde la superficie de cada barra es proporcional a la
frecuencia de los valores representados. En el eje vertical se representan las
frecuencias, y en el eje horizontal los valores de las variables, normalmente
señalando las marcas de clase.http://es.wikipedia.org/wiki/Histograma
HISTOGRAMA Y POLÍGONO DE FRECUENCIAS.
El histograma es la forma más usual para analizar las características
observables de una variable continua.
(http://www.monografias.com/trabajos30/conceptos-de-estadistica/conceptos-de-estadistica.shtml)
Histograma es la representación gráfica en el plano coordenado de las
características concentradas en la tabla de frecuencias de una variable
continua.(http://www.monografia.com/estadistica)
Para trazar el histograma, la secuencia de operaciones es:
1. En los ejes coordenados del plano cartesiano representamos los datos de la
siguiente forma:
a) En el eje de las abscisas (horizontal) se representan las clases con sus
límites reales de clase y las marcas de clase (Mi) de cada intervalo.
b) En el eje de las ordenadas (vertical) representamos las frecuencias
absolutas en que ocurre la variable.
CORRELACIÓN LINEAL
El análisis de correlación se dirige sobre todo a medir la fuerza de una relación
entre variables. El coeficiente de correlación lineal, r, es la medida de la fuerza
de la relación lineal entre dos variables. La fortaleza de la relación se determina
mediante la magnitud del efecto que cualquier cambio en una variable ejerce
sobre la otra. (JOHNSON, 1990)
15. Si X o Y son las dos variables en cuestión, un diagrama de la dispersión
muestra la localización de los puntos (X,Y) sobre un sistema rectangular de
coordenadas. Si todos los puntos del diagrama de dispersión parecen estar en
una recta, como la figura 14(a) y 14(b) la correlación se llama lineal.(SPIEGEL,
1992)
REGRESIÓN LINEAL
Fases del modelo de regresión lineal
La recta de regresión y el coeficiente de correlación tienen sentido en tanto en
cuanto son instrumento para inferir la relación de las variables en la población.
El conocimiento exacto del coeficiente de correlación solo es posible si
analizamos la totalidad de la población. Sin embargo, a la hora de evaluarlo,
nos encontramos con el problema habitual de tener que inferirlo desde la
estimación que proporcionan los datos de una muestra.
La recta de regresión lineal y=a+bx, es una estimación de la recta de regresión
lineal de la población y=α+ßx. Los parámetros α y ß son evaluados a partir de
los datos de una muestra, y es fundamental tener unas garantías de que los
valores a y b estimados no difieren significativamente de los parámetros
poblacionales α y ß.
El proceso que se sigue en la construcción del modelo de regresión se
compone de tres fases o etapas. En la primera fase, se comprueba si la
relación entre las variables que componen el modelo está de acuerdo con la
propia forma del modelo.
La segunda fase consiste en la estimación de los parámetros de acuerdo con el
criterio elegido (en nuestro caso, el método de mínimos cuadrados).
La última fase es fundamental para el investigador, que debe comprobar si las
inferencias o pronósticos que se pueden hacer de la relación encontrada entre
las variables se ajustan a los datos.(VARGAS, 1995).
PRUEBA DE HIPÓTESIS
La prueba de hipótesis comienza con una suposición, llamada hipótesis, que
hacemos acerca de un parámetro de población. Después recolectamos datos
de muestra, producimos estadísticas muéstrales y usamos esta información
16. para decidir qué tan probable es que nuestro parámetro de población hipotético
sea correcto. Digamos que suponemos un cierto valor para una medida de
población, para probar validez de esa suposición recolectamos datos de
muestra y determinamos la diferencia entre el valor hipotético y el valor real de
la media de la muestra. Después juzgamos si la diferencia obtenida es
significativa o no. Mientras más pequeña sea la diferencia, mayor será la
probabilidad de que nuestro valor hipotético para la media sea correcto.
Mientras mayor sea la diferencia, más pequeña será la probabilidad.(LEVIN,
2010)
T DE STUDENT
En probabilidad y estadística, la distribución T -Student es una distribución de
probabilidad que surge del problema de estimar la media de una población
normalmente distribuida cuando el tamaño de la muestra es pequeño.
Una variable aleatoria se distribuye según el modelo de T -Student con n
grados de libertad.
Propiedades:
1. La gráfica de la función de densidad es en forma de campana.
2. Los datos están más dispersos que la curva normal estándar.
3. A medida que n aumenta, la gráfica se aproxima a la normal N(0,1).
4. La gráfica es muy parecida a la de la normal estándar diferenciándose
en que las colas de t están por encima de la normal, y el centro se
encuentra por debajo del de la normal.
5. Cuando los grados de libertad son altos, los valores de t coinciden con
los de la normal.
CHI- CUADRADO
Es un estadístico que sirve de base para una prueba no paramétrica
denominada prueba de chi cuadrado que se utiliza especialmente para
variables cualitativas, esto es, variables que carecen de unidad y por lo tanto
17. sus valores no pueden expresarse numéricamente. Los valores de estas
variables son categorías que solo sirven para clasificar los elementos del
universo del estudio. También puede utilizarse para variables cuantitativas,
transformándolas, previamente, en variables cualitativas ordinales.
El estadístico Chi- Cuadrado se define por:
En donde:
n=número de elementos de la muestra
n-1= números de grados de libertad.
=varianza de la muestra
= varianza de la población
VARIANZA
Cuando es necesario hacer comparaciones entre tres o más medias
muéstrales para determinar si provienen de poblaciones iguales utilizamos la
técnica de análisis de varianza. Esta técnica se realiza utilizando la distribución
de probabilidad F vista anteriormente. Para el uso de esta técnica es necesario
seguir los siguientes supuestos:
1) Las poblaciones siguen una Distribución de Probabilidad Normal
2) Las poblaciones tienen desviaciones estándar (σ) iguales
3) Las muestras se seleccionan de modo independiente
La técnica del análisis de varianza descompone la variación total en dos
componentes de variación llamados variación debida a los tratamientos y
variación aleatoria
18. SPSSstadistic
Es un programa estadístico informático muy usado en las ciencias sociales y
las empresas de investigación de mercado. Originalmente SPSS fue creado
como el acrónimo de StatisticalPackageforthe Social Sciences aunque también
se ha referido como "StatisticalProduct and ServiceSolutions" (Pardo, A., &
Ruiz, M.A., 2002, p. 3). Sin embargo, en la actualidad la parte SPSS del
nombre completo del software (IBM SPSS) no es acrónimo de nada.
Como programa estadístico es muy popular su uso debido a la capacidad de
trabajar con bases de datos de gran tamaño. En la versión 12 es de 2 millones
de registros y 250.000 variables. Además, de permitir la recodificación de las
variables y registros según las necesidades del usuario.
Actualmente, compite no sólo con software licenciados como lo son SAS,
MATLAB, Statistica, Stata, sino también con software de código abierto y libre,
de los cuales el más destacado es el Lenguaje R. Recientemente ha sido
desarrollado un paquete libre llamado PSPP, con una interfaz llamada PSPPire
que ha sido compilada para diversos sistemas operativos como Linux, además
de versiones para Windows y OS X. Este último paquete pretende ser un clon
de código abierto que emule todas las posibilidades del SPSS.
19. INSTALACIÓN DEL SPSS
PASOS PARA DESCARGAR EINSTALAR EL SPSS
1. Prender el computador
2. Descargar el programa SPSS
3. Entrar en la página 4 shared
4. Clic en archivos y poner el nombre del programa y buscar
20. 5. Clic en descargar spss 17
6. Clic en descargar archivo esperar algunos segundo
21. 7. Clic en descargar archivo
8. Asegurarse de no estar conectado a internet: durante la instalación el
programa
Para desconectar el acceso a la red hacer clic en Inicio
9. Panel de control
10. Doble clic en el icono para proceder a instalar esperar algunos segundo
22. 11. Conexiones de red.
12. Luego hacer clic con el botón secundario del mouse en el ícono de la
placa de red y hacer clic en "Desactivar".
13. ) Ir a la carpeta donde se ubica el archivo "SPSS17 Setup.exe" y hacer
doble clic en el mismo.
14. Se abrirá una ventana que muestra el progreso de la instalación.
23. 15. Se abre otra ventana. Seleccionar "Licencia de usuario individual" y
hacer clic en "Siguiente >". En la siguiente ventana hacer clic en "Acepto
los términos del contrato de licencia" y hacer clic en "Siguiente >". En la
ventana de "Información de última hora" hacer clic en "Siguiente >".
16. Se abre una nueva ventana
a) Completar los campos "Nombre de usuario" y "Organización" con los
datos que se desee.
b) Ir a la carpeta donde se ubica el archivo "keygen.exe" y hacer doble clic
en el mismo.
c) Atención: antes de continuar, tener en cuenta que los códigos mostrados
aquí pueden diferir de los que muestra el programa en su computadora
(se recomienda utilizar solamente los códigos mostrados en el programa
que se utiliza al instalar y no los mostrados aquí
17. Se abre una ventana para ingresar licencia y registro de SPSS. Hacer
clic en "Aceptar".
18. Se abre una nueva ventana.
a) Seleccionar "Conseguir una licencia para mi producto ahora".
19. Clic en siguiente
20. Introducir el código de autorización que está debajo del botón
"Generate" del keygen mencionado en 5b. Hacer clic en "Siguiente >".
Aparece una ventana que indica un error en la conexión a internet.
Hacer clic en "Siguiente >".
21. Clic en siguiente para que se instale el programa
22. Luego clic en inicio programas SPSS aparece una ventana que indica
las licencias de las que se dispone. Hacer clic en "Siguiente >".
23. Se abre una nueva ventana.
a) Seleccionar "Conseguir una licencia para mi producto ahora".
24. 24. Luego se introduce la licencia del producto
25. Clic en siguiente
26. Para pasar el idioma del programa a español
27. Abrir un archivo .sav o alguno de la carpeta Samples. En el menú "Edit"
hacer clic en el botón "Options..."
En la pestaña "General", en el área "Output", en la sección "Language" hacer
clic la lista desplegable (el triángulo que apunta hacia abajo) y hacer clic en
"Spanish".
Repetir el paso 19 en la sección "User Interface" y hacer clic en "OK".
28. Para reconectar el acceso a la red hacer clic en Inicio / Panel de control /
Conexiones de red. Luego hacer clic con el botón secundario del mouse
en el ícono de la placa de red y hacer clic en "Activar".
25. UTILIZACIÓN DEL SPSS
1.- Abrir el programa SPSS
2.- Menú inicio y clic en el icono que aparece del programa con el nombre de
SPSS.
3.- A continuación se desplegara la ventana SPSS, con un cuadro de dialogo,
hacer clic en la opción introducir datos y luego clic en aceptar.
26. 4. Ponemos la opción vista de variables y nos despliega la pantalla en donde
ponemos los nombres de las variables de la siguiente manera.
27. Tomando en cuenta que los decimales debe ir 0 para obtener datos exactos.
5. Ahora hacemos clic en la opción Vista de datos para ingresar los datos de la
información obtenida.
28. Podemos manifestar que si en casos de ingresar los datos de manera
desordenada, podemos en la opción Datos, después ordenar casos, donde se
nos despliega la siguiente pantalla.
29. 6. Aquí presionamos la flecha para que los datos se pasen y después Aceptar y
se nos ordenara los datos, mostrándonos la siguiente pantalla y ponemos
cerrar.
Y verificaremos que se encuentran ordenados.
7. Procedemos a tomar la opción de transformar, hacemos clic en Recodificar
distintas variables
30. En donde nos despliega la pantalla de igual manera pasamos los datos al lado
derecho haciendo clic en la flecha
8. Aquí llenamos lo datos como Nombre y Etiqueta
31. Y presionamos la opción Valores antiguos y nuevos
Aquí presionamos Rango y ponemos los intervalos desde ….. Hasta …. Para
que se pueda llenar con normalidad debemos poner el ancho de 20 siempre
que escojamos esta opción añadir y así con todos los intervalos y aceptar.
Y nos despliega la siguiente pantalla
32. Una vez obtenido estos intervalos pasamos a la opción Analizar en donde
hacemos clic en Datos Descriptivos, después en Frecuencias
De igual manera nos sale la pantalla para pasar los datos al lado derecho
33. Presionamos en la opción Estadísticos para determinar lo que son los cuartiles,
deciles, percentiles. Tomar en cuenta que en los deciles debemos de poner del
10 al 100 cualquier número en este caso el 70 y añadir.
También nos permite escoger las Medidas de Tendencia Central como: Media,
Mediana, Moda, de igual manera Medidas de dispersión, ahí presionamos lo
que es desviación típica, varianza, y rango.
35. Aquí presionamos en Histogramas y continuar
Una vez esto presionamos Aceptar y nos despliega la información que
deseamos.
36. Aquí podemos cambiar o modificar lo que deseamos en la letra y colores que
deseemos. Minimizamos o de tal forma guardamos el archivo. Aquí
terminaríamos con el proceso de determinación de lo que es la Estadifica
Descriptiva.
Ahora la realizaríamos de forma manual para comparar si los resultados son
los mismos.
37. ESTADÍSTICA INFERENCIAL
FRECUENCIA
Es el número de veces que se repite un dato.
FRECUENCIAS ABSOLUTAS
Simple (ni) Acumulada (Ni)
n1 n1
n2 n1+n2
n3 n1+n2+n3
N
FRECUENCIA RELATIVA
Simple Acumulada
h1 h1
h2 h1+h2
h3 h1+h2+h3
hn
HISTOGRAMA
Es uno de los medios con mayor frecuencia, es una representación grafica de
la distribución de frecuencias.
El eje vertical se ubica las frecuencias y en el eje (X) se representa los
intervalos de clase.
39. 2.- Determina el intervalo o clase con la fórmula sturges.
Cuando # <100
3.- Calculamos el recorrido (I)
4.- Se clasifican 7 intervalos de las 56 notas, calculamos el ancho o
amplitud con la letra (C)
Obtener el I1 de los valores aproximados.
Existe un exceso de 4.
70-66=4.
5.-
2 3-> máximo (+)
4 5
2 2-> mínimo (-)
Restamos -2 el valor mínimo y +2 el valor máximo.
a) 30-2=28
95+2=97
40. 6.- Se forma la tabla
INTERVALO O MARCA DE CONTEO FRECUENCIA
CLASE CLASE
28-38 33 II 2
38-48 43 IIIIIII 7
48-58 53 IIIIIII 7
58-68 63 IIIIIIIIIIIIII 14
68-78 73 IIIIIIIIIIIIIII 15
78-88 83 IIIIIIII 8
88-98 93 III 3
N=56
MEDIDAS DE TENDENCIA CENTRAL
Son las que se hallen en el centro de distribución de frecuencias. Permiten
calcular los valores promedio.
a) Medida aritmética
b) Mediana Md
c) Moda Mo
d) Media geométrica Mg
e) Media armónica Ma
1.- Media Aritmética
Cuando los datos no están agrupados.
41. Ejemplo:
17-23-25-30-34-38-43-54
Cuando los datos están agrupados
A= Marca de clase es el origen de trabajo.
n= Suma de frecuencia.
= Es la multiplicación de la frecuencia por la desviación unitaria.
C= Amplitud o intervalo.
INTERVALO MARCA DE U FRECUENCIA fu (u.f) Fi. Xi
CLASE Xi ABSOLUTA f
40->50 45 -2 5 -10 225
50->60 55 -1 12 -12 660
60->70 65 0 36 0 2340
70->80 75 1 22 22 1650
80->90 85 2 4 8 340
N=79 5215
42. 2.- Mediana
Es el punto que divide la distribución de los datos en dos partes iguales, sean
estos por la derecha o por la izquierda.
a) No Agrupados (Impar)
3, 8, 56, 14, 24, 31, 2, 7, 52 hay 9
Se los ordena en forma creciente o decreciente.
2, 3, 7, 8, 14, 24, 31, 52, 56
b)5, 9, 54, 22, 31, 2, 7, 51, 60.
Se los ordena en forma creciente o decreciente.
2, 5, 7, 9, 22, 31, 51, 54, 60.
Mediana es el numero 22 Me=22.
b) El parse escoge los 2 valores centrales y se los divide para 2.
16, 23, 34, 40, 44, 57, 88, 91.
36, 56, 87, 22, 15 90, 43, 33.
Ordenar; 15, 22, 33, 39, 43, 56, 87, 90
Md= (39+43)/2=41.
43. Cuando los datos son agrupados generalmente hay que elaborar una tabla de
frecuencias con los intervalos.
Ejemplo:
Nº INTERVALOS Fi Fi (Acu)
i=1 28 – 38 2 2
i=2 78 – 48 7 9
i=3 48 – 58 7 16
i=4 58 – 68 14 30
i=5 68 – 78 15 45
i=6 78 – 88 8 53
i=7 88 – 98 3 56
n=56
1.- Las frecuencias acumuladas presentan un ordenamiento de los 56
elementos de los que se distribuyen así:
1º Intervalo 1º-2º
2º Intervalo 3º-4º-5º-6º-7º-8º-9º
3º Intervalo 10º-11º-12º-13º-14º-15º-16º
4º Intervalo 17º-18º-19º-20º-21º-………..-30º
5º Intervalo 31º-32º-33º-34º-35º-………..-45º
6º Intervalo 45º-47º-48º-49º-50º-………..-53º
7º Intervalo 54º-55º-56º
2.- La determina la clase donde se encuentra la mediana, se hace la
división.
44. La mediana ocupa el 28º lugar, se busca en la tabla se encuentra en:
3.- Se aplica la fórmula.
Moda
Es un conjunto de datos, es el valor más repetido.
Datos no agrupados
1º Caso
Determinar la moda de los siguientes datos.
1, 1, 3, 4, 5, 5, 6, 8, 8, 8, 9, 9, 12
El valor que más se repite es el 8 en 3 veces Mo=8.
2º Caso
Un conjunto de datos que no tiene Mo.
14, 15, 18, 19, 20, 45, 59, 64.
Ningún dato se repite no tiene Moda.
3ºCaso
7, 8, 8, 8, 16, 16, 16, 20, 24, 24, 33, 56, 56, 78, 78.
Mo= 8; Mo=16 Caso Bimodal.
Datos Agrupados
1= Es el exceso de frecuencia de la clase modal con respecto a la clase
contigua anterior a ella.
2= Posterior a ella.
2= Amplitud del intervalo.
46. CÁLCULO DE CORRELACIÓN EN EL SPSS
Se calculara la relación que existe entre las exportaciones en toneladas con las
exportaciones en valor FOB.
1.- Hacer clic en análisis
2.- Elige la opción correlación en el menú que se despliega y luego escoge la
opción bivariadas.
3.- Mira el cuadro de dialogo con las dos variables propuestas.
47. 4.- Luego se procede a traspasar cada variable.
5.- Luego has click en aceptar y se desplegaran los datos y tablas optenidas a
traves de programa.
48. CÁLCULO DE REGRESIÓN EN EL SPSS
Se podrá calcula la ecuación para correlación donde la ecuación nos servirá
para hacer proyecciones al futuro.
1.- Clic en análisis, en el menú que se despliegaelige la opción regresión y
después la opción lineal,
49. 2.- En el cuadro que aparece se determinará la variable dependiente e
independiente, y colocarlas en el espacio que aparece en el cuadro de
dialogo.
3.- Despliega el cuadro de dialogo en la opción “estadísticos”
50. 4.- Elige las opciones de “estimaciones” y “intervalo de confianza”.
5.- Clic en continuar.
6.- Elige la opción “gráficos”
7.- Selecciona “histogramas” y “gráfico de prob. normal”, para obtener el cálculo
de la gráfica de los datos.
51. 8.- Has clic en aceptar si ya realizaste los pasos anteriores para obtener el
resultado de la Regresión.
9.- En la hoja siguiente observa el cálculo siguiente:
52.
53. 10.- Gráfica de dispersión.
CÁLCULO DE PRUEBA DE HIPÓTESIS EN EL SPSS
Calcularemos la relación existente entre las exportaciones en valor FOB y las
exportaciones en toneladas en donde determinamos la aprobación o rechazo
de la hipótesis nula o hipótesis alternativa
Pasos de una prueba de hipótesis
En la prueba de hipótesis que goza de aceptación general figuran siete pasos:
Formular la hipótesis nula HO,
De manera que pueda determinarse exactamente α, la probabilidad de
cometer un error tipo 1. (Esto equivale a determinar el parámetro de
población que interesa y proponer la validez de un valor para él) (Signo =)
Ho = las exportaciones en valor FOB son iguales a las exportaciones en
toneladas
54. Formular la hipótesis alternativa Ha
De manera que el rechazo de la hipótesis nula signifique aceptar la hipótesis
alternativa. (Signo > o <)
Al formular estas dos hipótesis, se determinan el parámetro y el valor
propuesto;
Ha = las exportaciones en valor FOB son diferentes a las exportaciones en
toneladas
2.- Determinar si la prueba es unilateral o bilateral
3.- Asumir el nivel de significación
4.- Determinar la distribución muestral que se usara en la prueba
5.- Elaborar el esquema de la prueba
6.- Calcular el estadístico de la prueba
7.- Tomar la decisión, para esto, se comparan el esquema de la parte 5, con el
estadístico del paso 6
Cálculo en SPSS
1.- Has clic en la opción análisis.
2.- Selecciona la opción “compara medias” y “prueba T para muestras
relacionadas”.
55. 3.- En el cuadro siguiente, aparecen las dos variables con las cuales se está
trabajando.
4.- Presiona el botón con la flecha para traspasar las variables al cuadro vacío.
5.- luego de haber insertado las variables, haz clic en opciones.
56. 6.- Haz clic en el cuadro de dialogo en las opciones excluir casos según
análisis.
7.- en el intervalo de confianza pon el porcentaje con el que vas a trabajar.
8.- Haz clic en aceptar para que se desplieguen los cálculos de regresión.
57. 9.- Observa los cálculos de regresión en la siguiente hoja del programa SPSS.
58. CÁLCULO DE CHI CUADRADO EN EL SPSS
Se ha realizado una encuesta a 17 persona vinculadas con el comercio exterior
acerca de acuerdo al nivel que tienen de ceptaciooon con la restriccion que
puso el gobierno a la importaciómn de celulares.
Ho= la dependencia que existe entre las empresas vinculadas con el comercio
exterior y el nivel de acuerdo sobre el porcentaje a la importacion de
celulares
Ha = no exite dependencia entre las empresas vinculadas con el comercio
exterior y el nivel de acuerdo sobre el porcentaje a la importacion de
celulares.
CALCULO EN EL SPSS DEL CHI CUADRADO
1. Ingresamos los datos al SPSS en este caso deben ser tablas de
contingencia para poder analizar.
2. Nos ubicamos en la barra de herramientas y damos clic en analizar,
estadísticos descriptivos y tablas de contingencia.
59. 3. Se nos desplegara un cuadro de dialogo en el cual aparecerán nuestras
variables.
4. Determinaremos que variable ira en las filas y que variable ira en las
columnas y las pasaremos con las flechas que tiene el cuadro de
dialogo.
60. 5. Damos clic en exacta para determinar el nivel de confianza.
6. Clic en continuar
7. Clic en estadísticos para colocar el estadístico chi cuadrado
8. Clic en continuar
61. 9. A continuación damos clic en casillas donde nos aparece otro cuadro de
dialogo y hacemos clic en observadas, esperadas y en porcentajes.
10. Clic en continuar y aceptar.
62. A continuación nos aparecerá otra hoja del SPSS donde nos mostrara los
resultados obtenidos y podremos observar si aceptamos la hipótesis nula o si la
rechazamos y aceptamos la hipótesis alternativa.
CÁLCULO DE LA VARIANZA EN EL SPSS
Podremos calcular el grado de dispersión que tienen los datos
1.- Se selecciona la opción analizar y escoge la opción frecuencias.
2.- En el cuadro de dialogo que aparece traslada las variable dependiente a la
derecha.
63. 3.- Haz clic en la opción “estadísticos”.
4.- En esta ventana haz clic en varianza y luego clic en continuar
65. CÁLCULO DE LA T STUDENT EN EL SPSS
Podemos calcular la aceptación o rechazo de una hipótesis siempre y cuando
la cantidad de datos no supere los 30 donde las exportaciones en valor FOB y
entoneladas de un año son las variables.
Ho = las exportaciones en valor FOB son iguales a las exportaciones en
toneladas
Ha = las exportaciones en valor FOB son diferentes a las exportaciones en
toneladas
1.- Elige la opción analizar, donde se despliega otra ventana y selecciona
prueba T para una muestra.
2.- En el cuadro de dialogo Traslada la variable hacia la ventana derecha.
3.- Haz clic en continuar.
67. EJERCICIOS DE MANERA MANUAL SIN LA APLICACIÓN DEL SPSS
ESTADÍSTICA INFERENCIAL
FRECUENCIA
Es el número de veces que se repite un dato.
FRECUENCIAS ABSOLUTAS
Simple (ni) Acumulada (Ni)
n1 n1
n2 n1+n2
n3 n1+n2+n3
N
FRECUENCIA RELATIVA
Simple Acumulada
h1 h1
h2 h1+h2
h3 h1+h2+h3
hn
69. 2.- Determina el intervalo o clase con la fórmula sturges.
Cuando # <100
3.- Calculamos el recorrido (I)
4.- Se clasifican 7 intervalos de las 56 notas, calculamos el ancho o
amplitud con la letra (C)
Obtener el I1 de los valores aproximados.
Existe un exceso de 4.
70-66=4.
5.-
2 3-> máximo (+)
4 5
2 2-> mínimo (-)
Restamos -2 el valor mínimo y +2 el valor máximo.
b) 30-2=28
95+2=97
70. 6.- Se forma la tabla
INTERVALO O MARCA DE CONTEO FRECUENCIA
CLASE CLASE
28-38 33 II 2
38-48 43 IIIIIII 7
48-58 53 IIIIIII 7
58-68 63 IIIIIIIIIIIIII 14
68-78 73 IIIIIIIIIIIIIII 15
78-88 83 IIIIIIII 8
88-98 93 III 3
N=56
Media Aritmética
Cuando los datos no están agrupados.
Ejemplo:
17-23-25-30-34-38-43-54
Cuando los datos están agrupados
A= Marca de clase es el origen de trabajo.
n= Suma de frecuencia.
= Es la multiplicación de la frecuencia por la desviación unitaria.
C= Amplitud o intervalo.
71. INTERVALO MARCA DE U FRECUENCIA fu (u.f) Fi. Xi
CLASE Xi ABSOLUTA f
40->50 45 -2 5 -10 225
50->60 55 -1 12 -12 660
60->70 65 0 36 0 2340
70->80 75 1 22 22 1650
80->90 85 2 4 8 340
N=79 5215
Mediana
Ejemplo:
Nº INTERVALOS Fi Fi (Acu)
i=1 28 – 38 2 2
i=2 78 – 48 7 9
i=3 48 – 58 7 16
i=4 58 – 68 14 30
i=5 68 – 78 15 45
72. i=6 78 – 88 8 53
i=7 88 – 98 3 56
n=56
Las frecuencias acumuladas presentan un ordenamiento de los 56
elementos de los que se distribuyen así:
1º Intervalo 1º-2º
2º Intervalo 3º-4º-5º-6º-7º-8º-9º
3º Intervalo 10º-11º-12º-13º-14º-15º-16º
4º Intervalo 17º-18º-19º-20º-21º-………..-30º
5º Intervalo 31º-32º-33º-34º-35º-………..-45º
6º Intervalo 45º-47º-48º-49º-50º-………..-53º
7º Intervalo 54º-55º-56º
2.- La determina la clase donde se encuentra la mediana, se hace la
división.
La mediana ocupa el 28º lugar, se busca en la tabla se encuentra en:
3.- Se aplica la fórmula.
Moda
DATOS NO AGRUPADOS
1º CASO
Determinar la moda de los siguientes datos.
73. 1, 1, 3, 4, 5, 5, 6, 8, 8, 8, 9, 9, 12
El valor que más se repite es el 8 en 3 veces Mo=8.
2º Caso
Un conjunto de datos que no tiene Mo.
14, 15, 18, 19, 20, 45, 59, 64.
Ningún dato se repite no tiene Moda.
3ºCaso
7, 8, 8, 8, 16, 16, 16, 20, 24, 24, 33, 56, 56, 78, 78.
Mo= 8; Mo=16 Caso Bimodal.
DATOS AGRUPADOS
1= Es el exceso de frecuencia de la clase modal con respecto a la clase
contigua anterior a ella.
2= Posterior a ella.
2= Amplitud del intervalo.
INTERVALO Fi
28-38 2
38-48 7
48-58 7
58-68 14
68-78 15
78-88 8
88-98 3
74.
75. CONCLUSIONES:
Como vemos la estadística encierra muchos problemas de la vida diaria,
en donde menos lo esperamos se pone en práctica. Hoy en día nos
encontramos con un mundo cada vez más globalizado y actualizado es
por ende que nosotros como futuros profesionales debemos de
capacitarnos y relacionarnos con nuevas tecnologías y nuevos métodos
de estudio para así tener una mejor experiencia y conocimiento en los
sistemas informáticos. Todo lo que hemos detallado en el presente
manual a cerca del SPSS nos permiten determinar las relaciones de las
variables poblacionales, sean estas cualitativas o cuantitativa, para las
cualitativas tenemos el Chi- cuadrado que permite determinar variables
que carecen de unidad.
También nos permiten determinar la situación de las variables en las
cuales existen problemas o desconocimiento de la realidad del entorno
en estudio, principalmente muestral, a medida que aplicamos los
estadísticos correctamente, los datos que nos arroja permitirá aclarar
dudas o lo que se desconoce de ciertos aspectos en el campo
empresarial, económico, financiero, social, educacional, en fin de
cualquier área que se desee investigar el comportamiento de las
variables ya sean cualitativas o cuantitativas y la posterior toma de
decisiones.
Los diferentes programas para la resolución e interpretación de variables
estadísticas principalmente el SPSS, nos permiten descubrir el
comportamiento de cada una de las variables, con las cuales nos
ayudara a la rápida resolución estadística para una posterior toma de
decisiones.
Es de gran importancia saber que en nuestras manos existen programas
que nos permiten analizar resultados de manera más eficaz y eficiente,
de nosotros depende aprender y capacitarnos más con la tecnología
actual.
76. RECOMENDACIONES:
De la manera como apliquemos los datos de cada ejercicio o dato
estadístico, dependerá el éxito del problema o la investigación que
pretendemos descubrir o resolver, es por eso que debemos dar a cada
variable su correspondiente estadístico y de seguro tomaremos la
decisión más acertada al interpretar para una buena toma de decisiones.
Emplear apropiadamente el software SPSS en la interpretación de
variables muestrales estadísticas mediante un histograma, para la
correcta toma de decisiones, y de seguro éxito en nuestro proyecto o
investigación que estamos dando resolución.
Es recomendable que todos y cada uno de los datos estén clasificados
entre las variables a determinar, ya sea por género, país, actividad, etc.
Esto ayudara al programa a desarrollarse con más facilidad y a obtener
los resultados más exactos de nuestra investigación.
81. Correlación Lineal:
Correlaciones de exportaciones
EXPORTACIO EXPORTACIO
NES FOB NES
TONELA
DAS
*
EXPORTACIONES FOB Correlación de Pearson 1 .317
Sig. (bilateral) .043
N 41 41
*
EXPORTACIONES Correlación de Pearson .317 1
TONELADAS
Sig. (bilateral) .043
N 41 41
*. La correlación es significante al nivel 0,05 (bilateral).
Regresión Lineal
Variables
Modelo Variables Variables Método
introducidas eliminadas
1 EXPORTACIONES . Introducir
a
FOB
a. Todas las variables solicitadas introducidas.
b. Variable dependiente: EXPORTACIONES TONELADAS
82. b
Resumen exportaciones
Model R R cuadrado R cuadrado Error tipo de la
o corregida estimació
n
a
1 .317 .101 .078 152421.164
a. Variables predictoras: (Constante), EXPORTACIONES FOB
b. Variable dependiente: EXPORTACIONES TONELADAS
b
ANOVA
Modelo Suma de gl Media F Sig.
cuadrado cuadrátic
s a
a
1 Regresión 1.014E11 1 1.014E11 4.366 .043
Residual 9.061E11 39 2.323E10
Total 1.007E12 40
a. Variables predictoras: (Constante), EXPORTACIONES FOB
b. Variable dependiente: EXPORTACIONES TONELADAS
a
Coeficientes
Modelo Coeficientes no estandarizados Coeficientes
tipificados
B Error típ. Beta t Sig.
1 (Constante) 2058480.667 106316.321 19.362 .000
EXPORTACIONES FOB .139 .066 .317 2.090 .043
a. Variable dependiente: EXPORTACIONES TONELADAS
83. a
Coeficientesexportaciones
Modelo Intervalo de confianza de 99,0%
para B
Límite inferior Límite superior
1 (Constante) 1770585.299 2346376.035
EXPORTACIONES FOB -.041 .318
a. Variable dependiente: EXPORTACIONES TONELADAS
84. a
Estadísticos sobre los desechos
Mínimo Máximo Media Desviación N
típica
Valor pronosticado 2169559.00 2352589.25 2274989.22 50356.849 41
Residual -292126.719 323109.656 .000 150503.841 41
Valor pronosticado tip. -2.094 1.541 .000 1.000 41
Residuo típ. -1.917 2.120 .000 .987 41
a. Variable dependiente: EXPORTACIONES TONELADAS
Gráficos
85. Prueba T
Estadísticos de muestras relacionadas
Media N Desviación típ. Error típ. de la
media
Par 1 EXPORTACIONES 2274989.22 41 158704.815 24785.528
TONELADAS
EXPORTACIONES FOB 1560876.00 41 363037.841 56696.985
Correlaciones de muestras relacionadas
N Correlación Sig.
86. Par 1 EXPORTACIONES 41 .317 .043
TONELADAS y
EXPORTACIONES
FOB
Prueba de muestras relacionadas
Diferencias relacionadas
Media Desviación típ. Error típ. de la
media
Par 1 EXPORTACIONES 714113.220 347017.015 54194.953
TONELADAS -
EXPORTACIONES
FOB
Prueba de muestras relacionadas
Diferencias relacionadas
99% Intervalo de confianza para
la diferencia
Inferior Superior
Par 1 EXPORTACIONES 567545.177 860681.262
TONELADAS -
EXPORTACIONES
FOB
Prueba de muestras relacionadas
t gl Sig. (bilateral)
87. Par 1 EXPORTACIONES 13.177 40 .000
TONELADAS -
EXPORTACIONES
FOB
Tablas de contingencia
Resumen del procesamiento de exportaciones
Casos
Válidos Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
EXPORTACIONES 41 95.3% 2 4.7% 43 100.0%
TONELADAS *
EXPORTACIONES
FOB
Pruebas de chi-cuadrado
Valor gl Sig. asintótica
(bilateral)
a
Chi-cuadrado de Pearson 1640.000 1600 .238
Razón de verosimilitudes 304.513 1600 1.000
Asociación lineal por lineal 4.027 1 .045
N de casos válidos 41
a. 1681 casillas (100,0%) tienen una frecuencia esperada inferior a 5. La
frecuencia mínima esperada es ,02.
88. Prueba para una muestra
Valor de prueba = 0
t gl Sig. (bilateral) Diferencia de
medias
EXPORTACIONES 45.908 11 .000 2279029.333
TONELADAS
EXPORTACIONES FOB 19.664 11 .000 1155254.083
Prueba para una muestra
Valor de prueba = 0
99% Intervalo de confianza para
la diferencia
Inferior Superior
EXPORTACIONES 2124847.90 2433210.77
TONELADAS
EXPORTACIONES FOB 972788.40 1337719.77
89. EJERCICIOS PROPUESTOS SOBRE DISTRIBUCIONES DE FRECUENCIAS
EJERCICIO No. 1
Se pesaron 53 personas obteniéndose los siguientes pesos en kilogramos:
45 50 50 62 60 52
80 63 65 64 47 67
72 70 73 49 54 60
64 61 79 52 62
40 64 61 65 81
69 60 60 70 43
87 43 59 46 57
54 77 60 53 68
58 80 54 64 61
60 90 51 75 59
Ejercicio No. 2
En el siguiente cuadro se presentan las alturas en cm, de 40 alumnos de un
colegio de educación secundaria. Construir una tabla de distribución de
frecuencias.
138 164 150 132
144 125 149 157
146 158 140 147
136 148 152 144
168 126 138 176
163 119 154 165
146 173 142 147
135 153 140 135
161 145 135 142
150 156 145 128
90. Ejercicio No. 3
En un colegio, 50 estudiantes han sido examinados por una prueba de
lenguaje. La escala es de o a 100. Las calificaciones individuales se presentan
en el siguiente cuadro.
60 85 65 84 57
71 35 35 74 68
80 61 55 59 45
41 55 69 67 76
94 98 73 65 89
33 52 77 65 74
81 50 64 47 54
41 91 73 53 77
91. MEDIDAS DE DISPERSIÓN
Ejemplo: 6, 10, 16, 22, 36, 48, 56.
Desviación media o variación media:
6, 10, 15, 22, 36, 35
Desviación estándar o desviación típica:
Es la más confiable de las medidas de dispersión.
Ejemplo:
3, 5, 7, 10, 13, 15
S
Para datos no agrupados existe otro método.
92. DATOS AGRUPADOS
Cuando los datos se encuentran agrupados formando distribuciones de
frecuencias se utiliza las siguientes fórmulas:
1)
2)
INTERVALOS
40-50 45 3 -17.5 306.25 918.75 -2 -6 12
50-60 55 5 -7.5 56.25 281.25 -1 -5 5
60-70 65 7 2.5 6.25 47.75 0 0 0
70-80 75 4 12.5 156.25 625 1 4 4
93. 80-90 85 1 22.5 506.25 506.25 2 2 4
=20 =2375 =-5 =25
Varianza:
Se la define como el cuadrado de la desviación estándar.
EJEMPLOS DE LA CAMPANA DE GAUSS
Calcular la probabilidad del evento.
P (0 Z 1.27)
P= 0.3980= 39.80%
Ejercicios propuestos
a) P (0 Z 3.45)
b) P (0 Z 0.8)
c) P (0 Z 0.06)
Calcular la probabilidad del evento
P (-2.8 Z 0)
P= 0.4974= 49.74%
94. Ejercicios propuestos
a) P (-3.6 Z 0)
b) P (-2.02 Z 0)
c) P (-1.4 Z 0)
Calcular la probabilidad del evento
P (1.02 Z 2.97)
1.02 y 2.96= A (0^2.97)- A (0^1.02)
= 0.4985 – 0.3461
= 0.1524
=15.24%
Ejercicios propuestos
a) P (0.5 Z 1.09)
b) P (2.04 Z 3.16)
c) P (1.84 Z 1.96)
Calcular la probabilidad del evento
P (-2.4 Z -0.85)
A (-2.4 ^ - 0.85)= A (-2.4^0) - A (-0.85^0)
= 0.4918-0.3023
= 0.1895= 18.95%
95. EJERCICIOS PROPUESTOS
Elabore la gráfica de dispersión y encuentre la ecuación lineal y determine qué
tipo relación es:
PRUEBA DE EXAMEN DE
ESTUDIANTES HONORABILIDA AUDICIÓN
D MENTAL
María 18 82
Olga 15 68
Susana 12 60
Aldo 9 32
Juan 3 18
María 18 18
Olga 15 32
Susana 12 60
Aldo 9 68
Juan 3 82
María 18 18
Olga 15 82
Susana 12 68
Aldo 9 60
Juan 3 32
96. COSTO Y PESO EN LIBRAS DE MANGOS
Bolsas Peso un libro x Costo en $ (Y)
2,25 0,75
A
3 1
B
C 3,75 1,25
D 4,50 1,50
E
5,25 1,75
F
6 2
EJERCICIO PROPUESTO
Calcular el r de Pearson.
COEFICIENTE
ESTUDIANTE PUNTAJE
INTELECTUAL
1 110 1
2 112 1.6
3 118 1.2
4 119 2.1
5 122 1.8
6 125 2.6
7 127 2
8 130 3.2
9 132 2.6
10 134 3
11 136 3.6
12 138
19 100-140 (1-4)
97. COEFICIENTE DE CORRELACIÓN DE RANGOS DE SPERMAN
Cuando una o más variables son solo de escala ordinal su fórmula matemática
es:
N= números de parejas de rango
Orden dado
Orden dado el
por el DI
Sujeto psicólogo Di ²
psicólogo R( xi) - (yi)
A(Raí)
B(Río)
6 5 1
1 1
5 3 2
2 4
7 4 3
3 9
10 8 2
4 02.25
2.5 1 1.5
5 12.25
2.5 6 3.5
6 1
9 10 1
7 4
1 2 1
8 4
11 9 2
9 9
4 7 3
10 9
8 11 3
12 0
12 12 0
100. alumnos Y X
María 49 55
Olga 46 50
Susana 45 53
Aldo 42 35
Juan 39 48
Lourdes 37 46
Cesar 20 27
Jon 15 32
EJEMPLOS
Alumnos X Y x² y² Xy Di²
Di
María 49 55 2401 3025 2695 0 0
Olga 46 50 2116 2500 2300 -1 1
Susana 45 53 2025 2809 2385 1 1
Aldo 42 35 1764 1225 1470 -2 4
Juan 39 48 1521 2304 1872 1 1
Lourdes 37 46 1369 2116 1702 1 1
Cesar 20 24 400 576 480 -1 1
Jon 15 32 225 1024 480 1 1
Σx=293 Σy=343 Σx²=11821 Σy²=15579 Σxy=1338 ΣDi²=10
101. Los profesores son clasificados por los alumnos del V y VI curso y obtuvimos
los siguientes resultados.
V Ciclo VI ciclo
Profesor
X Y
J 49 48
K 47 45
L 42 22
R 39 22
F 37 40
Z 32 40
102. V Ciclo Vi ciclo
Profesor Rango y D D2
X Y
0
J 1 1 0 0
K 2 2 1 0 6.25
L 3 5 2 -2.5 2.25
R 4 6 5.5 -1.5 2.25
F 5 3 3.5 1.5 6.25
Z 6 4 3.5 2.5
D2=17
Su magnitud no es muy fuerte ni débil
Altura del padre Altura del hijo
1 3 178 3 3
3+4.3
2 5 154 8 8
5.5
3 2 180 2 2
1
4 1 184 1 1
4.3
5 5 166 5 6
4.3
6 5 166 6 6
4
7 4 166 7 6
5.5
8 2 175 4 4
104. x
4
3
2
1
y
110 120 130 140
Una psicóloga del desarrollo está interesada si es posible utiliza alturas de los
jóvenes para producir en un posible estatura en la edad adulta y ella reúne las
siguientes datos de la tabla.
a) Trace la grafica
b) Obtener la línea de regresión por mínimo cuadrados
c) En base a estos datos aquí esta estatura podría producir para una
persona de 20 años si a los 3 años de edad tiene una altura de 42
pulgadas.
Individuo Altura la Altura a la
edad de 3 edad de 20 Xy X2
años años y
pulgadas pulgada
1 30 59 1770 900
2 30 63 1890 900
3 32 62 1984 1024
4 33 67 2211 1059
5 34 65 2210 1156
106. x
50
40
30
20
10
y
5 10 15 20 25 30 35 40 45 50 55 60
EJEMPLO
Para evaluar el nivel mental de los ingresantes de la Universidad se
estandarizo la habilidad mental encontrándose un C.I. (coeficiente intelectual)
promedio de 101,2 con una desviación estándar de 13,8. Aplicada de la prueba
a una muestra de 60 ingresantes de esta universidad se calculó que el C.I.
promedio es de 106,4 con una desviación estándar de 16,4. ¿El nivel mental de
los ingresantes es superior al término medio?
Variable de estudio: La habilidad mental de los X estudiantes.
µ = rendimiento mental promedio de los ingresantes.
X = rendimiento promedio de la muestra.
Solución:
1) Ho: µ= 101,2
Ha: µ > 101,2
2) Prueba unilateral de acuerdo a Ha.
3) Realizar la prueba de los niveles de significación de 5% y 1%.
107. 4) Se admite que la variable aleatoria de la prueba es la media de los
coeficientes de inteligencia Xi.
5) Como n > 30 podemos usar una distribución normal de probabilidades
para calcular los valores críticos y elaborar el esquema grafico de la
prueba 99%.
6) Calculo estadístico de la prueba.
7) Toma de decisiones:
A los niveles de significancia de 0,05 ^ 0,01 observamos que el estadístico Z=
2,92 se ubica en la zona de rechazo, esta significancia que la prueba es muy
significativa luego rechazamos la Ho: µ= 101,2 y no rechazamos que el nivel
mental de los ingresantes es superior al término medio.
108. PRUEBA DE Ji- CUADRADO O
EJEMPLO:
De la siguiente Tabla de valores determinar la X2
LA CANTIDAD DE TARJETAS VENDIDAS
JUGADOR TARGETAS VENDIDAS ESPERADO
1 13 20
2 33 20
3 14 20
4 7 20
5 36 20
6 17 20
120 120
1) Ho : No existe diferencia entre la experiencia local y nacional.
Ha: Si existe diferencia entre la experiencia local y nacional.
2) Es una campana Unilateral.
3) Nivel de significancia x= 0.05 nivel de confianza 95%
4) Como n= 400 se puede utilizar la X2 para cualquier valor de datos.
109. 5) GRÁFICO
Z.R
Z.A
gl= K-1
2
x = 11,070
gl= 6-1
gl= 5
6) Calculo de la X2
X2 =
X2 = 34.40
7) Como X2 en la zona de rechazo se acepta ha y se rechaza la Ho
110. TABLAS DE CONTINGENCIA
EJEMPLO :
Se desea hacer una investigación de la liberación de una persona de la cárcel
para mejorar la vida civil, si regresa a su ciudad natal y si va a vivir a otra parte
¿si existe relación entre el ajuste a la vida civil y el lugar de residencia después
de la liberación?
Sitio de Excelente Bueno Regular Insatisfactorio Total
residencia
Cuidad de 27 35 33 25 120
origen
Otra ciudad 13 15 27 25 80
40 50 60 50 200/200
1. Ho.- No existe una relación entre el ajuste a la vida civil y el lugar de
residencia después de la liberación.
Ha.-Si existe una relación entre el ajuste a la vida civil y el lugar de
residencia.
2. Se trata de una campana unilateral
3. x=0,001 (Nivel de significancia)
Nivel de confianza 99%
4.-n = 200 se puede utilizar la CHI2
5.-GRÁFICO
111. gl =(F-19 ) (C-1)
gl =(2-1) (4-1)
x²=11,345
6.-CALCULO DEL X²
=
REGULAR SATISFACTORIO
EXCELENTE BUENO
TOTAL
fo- fe fo - fe fo - fe fo - fe fo - fe
CIUDAD DE
27 - 24 35 - 30 33 - 36 25 - 30 120 - 120
ORIGEN
OTRA
13 - 16 15 - 20 27 - 24 25 - 20 80 - 80
CUIDAD
40 40 50 50 60 60 50
50 200 200
SON IGUALES
X²= (27-24)2 / 24 + (36-30)2 / 30 + (33-36)2 /36 + (25-30) 2 / 30 + (13 -16) 2 /16
+ (15 -20)2 /20+ (27-24)2 /24 + (25-20)2 /20
X² = 5,729
7.-El valor calculado de ji cuadrado se encuentra a la izquierda de 11,345 es
aceptada la Ho en 0,01 no existe una relación a la vida civil donde resida el
prisionero después de haber alcanzado la libertad.
EJEMPLO
1. Ho.- El suero no tiene efecto, y la recuperación es independiente del
uso del suero.
Ha.- que el suero es el que permite la recuperación del paciente.
2. Es cola unilateral
112. 3. 0,05 (N. significancia.)
Nivel de confianza 95%
4. n =200 personas se puede utilizar la ji cuadrado para cualquier valor de
datos-
5. GRÁFICO
gl =(F-1 ) (C-1)
gl =(2-1) (2-1)
x²=3,84
6. Calculo de x²
X2= (75 - 70)2 / 70 + (65 - 70)2 / 70 + (25-30)2 /30 + (35-30) 2 / 30 = 2,38
FRECUENCIAS OBSERVADAS
CURADOS NO CURADOS TOTAL
GRUPO A USANDO 75 25 100
SUERO
GRUPO B SIN SUERO 65 35 100
TOTAL 140 60 200
113. FRECUENCIAS ESPERADAS (DE Ho)
CURADOS NO CURADOS TOTAL
GRUPO A USANDO 70 30 100
SUERO
GRUPO B SIN SUERO 70 30 100
TOTAL 140 60 200
7. Ho aceptamos, concluyendo que el suero no tiene efecto, que la
recuperación es independiente
Fe =(80 – 40) / 200 = 16
Fe= FRECUENCIA ESPERADA = (total del renglón) (total columna) / gran total
Fe =(100 – 140) / 200 = 7
Fe =(100 – 60) / 200 = 30
Bibliografía
http://www.AulaFacil.com. (s.f.).
http://Levin Richard & Rubin David, 1996:p.140). (s.f.).
hhttp://www.monografia.com/estadistica. (s.f.).