1. CONCEPTOS BÁSICOS DE ESTADÍSTICA
DESCRIPTIVA
(SLIDESHARE)
República Bolivariana de Venezuela
Ministerio del Poder Popular Para la Educación Superior
Universidad Yacambú
Vicerrectorado de Estudios a Distancia
Facultad de Humanidades
Carrera: Psicología
Curso: Estadística Descriptiva. (TIE-0653)
Estudiante:
Lila Romero
C.I. V-14.280.978
Sección: ED03D0V 2017-2
Docente: Prof. María Felipe C.
2. Introducción
Desde hace siglos, la aplicación de registros e instrumentos para estudiar una
determinada población han sido utilizados por diversas naciones, tales como: roma, Egipto,
china, entre otros. De allí viene el origen de la estadística, la cual antes de ser una ciencia fue
implementada por jefes de gobierno para llevar los registros de datos numéricos, de la
población de los nacimientos, y las disfunciones ocurridas en uno o varios años.
También es aplicada diariamente por estudiantes universitarios, que al realizar trabajos,
encuestas, entrevistas etc., hacen también el uso de ella.
Hoy en día, la estadística es una ciencia que se encarga de estudiar una determinada
población por medio de la recolección, recopilación e interpretación de datos. Del mismo
modo, es considerada una técnica especial apta para e estudio cuantitativo de los fenómenos
de masa o colectivo.
3. Definición de Estadística:
La estadística es comúnmente considerada como una
colección de hechos numéricos expresados en términos de
una relación sumisa, y que han sido recopilados a partir de
otros datos numéricos.
Definen la estadística como un valor resumido,
calculado, como base en una muestra de observaciones que
generalmente, aunque no por necesidad, se considera como
una estimación de parámetro de determinada población; es
decir, una función de valores de muestra.
La estadística es una técnica especial apta para el
estudio cuantitativo de los fenómenos de masa o colectivo,
cuya mediación requiere una masa de observaciones de
otros fenómenos más simples llamados individuales o
particulares.
Esta ciencia tiene disímiles aplicaciones y a través de
ella se pueden expresar, mediante indicadores, aspectos de
4. Objetivo de la estadística:
La estadística como ciencia se encarga de recopilar, e
interpretar datos que en el futuro servirán para proyectar
posibles problemáticas futuras, consiguiendo según estos
datos, la solución más viable y rápida.
El objetivo básico de la estadística es hacer inferencia
acerca de una población con base a la información
contenida en una muestra, ¿qué significa esto?
Inferir significa inducir una cosa de otra, llevar
consigo, conducir a un resultado.
Es decir se pretende establecer inferencia acerca de
una población, entendiendo a la población como un
conjunto de individuos, organismos o entes inanimados de
los cuales queremos conocer alguna o algunas
características para que nos ayuden a tomar una decisión
u obtener alguna conclusión de suma importancia, y nada
sabemos sobre la distribución, existencia, ubicación, valor
de esta o estas características que nos interesa saber.
5. La estadística aplicada puede ser dividida en dos ramas:
Estadística descriptiva (refiere a los métodos de recolección,
descripción, visualización y resumen de los datos, que
pueden ser presentados en forma numérica o gráfica)
inferencia estadística (la generación de los modelos y
predicciones relacionadas a los fenómenos estudiados,
teniendo en cuenta el aspecto aleatorio y la incertidumbre
en las observaciones).
Además de la estadística aplicada, también existe una
disciplina denominada estadística matemática, que abarca
las bases teóricas de la materia. Al hablar de esta rama
científica tampoco podemos pasar por alto el hecho de que
en España existe lo que se conoce como Instituto Nacional
de Estadística (INE). Un organismo este de gran valor pues se
encarga de acometer una serie de funciones esenciales para
el Estado. En concreto, y según le tiene atribuida la
legislación vigente, tiene como misión el realizar, por
ejemplo, los distintos censos demográficos y económicos.
6. POBLACIÓN - es el conjunto total de individuos,
objetos o medidas que poseen algunas
características comunes observables en un lugar y
en un momento determinado. Cuando se vaya a
llevar a cabo alguna investigación debe de tenerse
en cuenta algunas características esenciales al
seleccionarse la población bajo estudio.
MUESTRA - la muestra es un subconjunto fielmente
representativo de la población.
Hay diferentes tipos de muestreo. El tipo de muestra
que se seleccione dependerá de la calidad y cuán
representativo se quiera sea el estudio de la
población.
7. Estadísticas descriptivas e inferencia:
La estadística descriptiva, que se dedica a los métodos
de recolección, descripción, visualización y resumen de
datos originados a partir de los fenómenos en estudio. Los
datos pueden ser resumidos numérica o gráficamente.
Ejemplos básicos de descriptores numéricos son la media y
la desviación estándar. Resúmenes gráficos incluyen varios
tipos de figuras y gráficos.
La inferencia estadística, que se dedica a la generación
de los modelos, inferencias y predicciones asociadas a los
fenómenos en cuestión teniendo en cuenta lo aleatorio e
incertidumbre en las observaciones. Se usa para modelar
patrones en los datos y extraer inferencias acerca de la
población de estudio.
Estas inferencias pueden tomar la forma de respuestas
a preguntas si/no (prueba de hipótesis), estimaciones de
características numéricas (estimación), pronósticos de
futuras observaciones, descripciones de asociación
(correlación) o modelamiento de relaciones entre variables
8. Variable y tipos:
Al conjunto de los distintos valores numéricos que adopta un carácter cuantitativo se llama variable
estadística.
Variables cualitativas:
Son las variables que expresan distintas cualidades, características o modalidad. Cada modalidad que se
presenta se denomina atributo o categoría y la medición consiste en una clasificación de dichos
atributos. Las variables cualitativas pueden ser ordinales y nominales.
Las variables cualitativas pueden ser dicotómicas cuando sólo pueden tomar dos valores posibles como
sí y no, hombre y mujer o son politómicas cuando pueden adquirir tres o más valores.
Dentro de ellas podemos distinguir:
Variable cualitativa ordinal: La variable puede tomar distintos valores ordenados siguiendo una escala
establecida, aunque no es necesario que el intervalo entre mediciones sea uniforme, por ejemplo, leve,
moderado, grave
Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a un criterio de orden
como por ejemplo los colores o el lugar de residencia.
Variables cuantitativas:
Son las variables que se expresan mediante cantidades numéricas. Las variables cuantitativas además
pueden ser:
Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala de valores que
puede tomar. Estas separaciones o interrupciones indican la ausencia de valores entre los distintos
valores específicos que la variable pueda asumir. Un ejemplo es el número de hijos.
9. Según la influencia que asignemos a unas variables sobre otras,
podrán ser:
Variables independientes: Son las que el investigador escoge para
establecer agrupaciones en el estudio, clasificando intrínsecamente
a los casos del mismo. Un tipo especial son las variables de
confusión, que modifican al resto de las variables independientes y
que de no tenerse en cuenta adecuadamente pueden alterar los
resultados por medio de un sesgo.
Variables dependientes: Son las variables de respuesta que se
observan en el estudio y que podrían estar influenciadas por los
valores de las variables independientes.
10. Escala de medición:
Una escala es un patrón convencional de medición, y básicamente consiste en un instrumento capaz de
representar con gran fidelidad verbal, gráfica o simbólicamente el estado de una variable.
La medición de las variables puede realizarse por medio de cuatro escalas de medición. Dos de las
escalas miden variables categóricas y las otras dos miden variables numéricas.
Los niveles de medición son las escalas nominal, ordinal, de intervalo y de razón. Se utilizan para ayudar
en la clasificación de las variables, el diseño de las preguntas para medir variables, e incluso indican el
tipo de análisis estadístico apropiado para el tratamiento de los datos.
a) Medición Nominal.
En este nivel de medición se establecen categorías distintivas que no implican un orden específico.
Por ejemplo, si la unidad de análisis es un grupo de personas, para clasificarlas se puede establecer la
categoría sexo con dos niveles, masculino (M) y femenino (F), los respondientes solo tienen que señalar
su género, no se requiere de un orden real.
Así, si se asignan números a estos niveles solo sirven para identificación y puede ser indistinto: 1=M, 2=F
o bien, se pueden invertir los números sin que afecte la medición: 1=F y 2=M. En resumen en la escala
nominal se asignan números a eventos con el propósito de identificarlos. No existe ningún referente
cuantitativo. Sirve para nombrar las unidades de análisis en una investigación y es utilizada en cárceles,
escuelas, deportes, etc. La relación lógica que se expresa es: A B (A es diferente de B).
b) Medición Ordinal.
Se establecen categorías con dos o mas niveles que implican un orden inherente entre si. La escala de
medición ordinal es cuantitativa porque permite ordenar a los eventos en función de la mayor o menor
posesión de un atributo o característica.
Por ejemplo, en las instituciones escolares de nivel básico suelen formar por estatura a los estudiantes, se
desarrolla un orden cuantitativo pero no suministra medidas de los sujetos. La relación lógica que
11. Las formas más comunes de variables ordinales son ítems (reactivos) actitudnales estableciendo
una serie de niveles que expresan una actitud de acuerdo o desacuerdo con respecto a algún
referente.
Por ejemplo, ante el ítem: La economía mexicana debe dolarizarse, el respondiente puede
marcar su respuesta de acuerdo a las siguientes alternativas:
___ Totalmente de acuerdo
___ De acuerdo
___ Indiferente
___ En desacuerdo
___ Totalmente en desacuerdo
Las anteriores alternativas de respuesta pueden codificarse con números que van del uno al
cinco que sugieren un orden preestablecido pero no implican una distancia entre un número y
otro. Las escalas de actitudes son ordinales pero son tratadas como variables continuas
12. c) Medición de Intervalo.
La medición de intervalo posee las
características de la medición nominal y
ordinal. Establece la distancia entre una
medida y otra. La escala de intervalo se aplica
a variables continuas pero carece de un punto
cero absoluto.
El ejemplo mas representativo de este tipo
de medición es un termómetro, cuando
registra cero grados centígrados de
temperatura indica el nivel de congelación del
agua y cuando registra 100 grados centígrados
indica el nivel de ebullición, el punto cero es
arbitrario no real, lo que significa que en este
punto no hay ausencia de temperatura.
Una persona que en un examen de
matemáticas que obtiene una puntuación de
cero no significa que carezca de
conocimientos, el punto cero es arbitrario por
13. d) Medición de Razón.
Una escala de medición de razón incluye
las características de los tres anteriores
niveles de medición anteriores (nominal,
ordinal e intervalo).
Determina la distancia exacta entre los
intervalos de una categoría. Adicionalmente
tiene un punto cero absoluto, es decir, en el
punto cero no existe la característica o
atributo que se mide. Las variables de
ingreso, edad, número de hijos, etc. son
ejemplos de este tipo de escala. El nivel de
medición de razón se aplica tanto a variables
continuas como discretas.
14. Organización de datos
Siendo el dato el material que se debe
procesar, es decir, la materia prima de la
estadística, el primer paso es entonces la
recolección de datos, para lo cual se
emplean diferentes técnicas, como la
entrevista personal, el cuestionario, la
observación, etc.
El segundo paso es la organización y
ordenamiento de los datos, lo que se hace a
través de tablas, las cuales pueden ser por
medio de una distribución de frecuencias
simples o una distribución de frecuencias
con intervalos, en ambos casos agrupando
todos aquellos que corresponden a una
mismo dato nominal o variable y
15. Las distribuciones de frecuencias son tablas
en que se dispone las modalidades de la
variable por filas. En las columnas se
dispone el número de ocurrencias por cada
valor, porcentajes, etc. La finalidad de las
agrupaciones en frecuencias es facilitar la
obtención de la información que contienen
los datos.
Ejemplo:
Quieren conocer si un grupo de individuos
está a favor o en contra de la exhibición de
imágenes violentas por televisión, para lo
cual han recogido los siguientes datos:
LA FRECUENCIA es el número de veces que aparece
cada variable o dato nominal.
16. DISTRIBUCIÓN DE FRECUENCIAS POR INTERVALOS
Los datos recolectados pueden también organizarse por intervalos. Por
ejemplo, al realizar un censo en una ciudad, podría interesar cuántas
personas tienen 0, 1 ó 2 hijos, cuántas 3, 4 ó 5 hijos, cuántas 6, 7 u 8 hijos,
etc.
Cada intervalo se llama también clase. El ancho de clase o longitud del
intervalo es la resta de el límite superior menos el límite inferior de cada
clase o intervalo. Así, en el ejemplo anterior, el intervalo de 0 a 2 hijos tiene
un ancho de 2 - 0 = 2.
No debe confundirse el ancho de la clase con el número de datos
nominales que contiene el intervalo. Cuando se trabaja con variables
discretas, el ancho de clase o longitud del intervalo es la resta de el límite
superior menos el límite inferior de cada clase o intervalo, mientras que el
número de datos es la resta de el límite superior menos el límite inferior de
cada clase o intervalo más 1.
Por ejemplo, si se elabora una tabla para analizar cuántas personas
tienen 0, 1 ó 2 hijos, cuántas 3, 4 ó 5 hijos, cuántas 6, 7 u 8 hijos, etc.,
17. Los intervalos de clase se emplean si
las variables toman un número grande de valores o
la variable es continua.
Se agrupan los valores en intervalos que tengan
la misma amplitud denominados clases. A
cada clase se le asigna su frecuencia
correspondiente.
18. REPRESENTACIÓN GRÁFICA DE DATOS
Las tablas estadísticas representan
toda la información de modo esquemático
y están preparadas para los cálculos
posteriores. Los gráficos estadísticos nos
transmiten esa información de modo más
expresivo, nos van a permitir, con un sólo
golpe de vista, entender de que se nos
habla, observar sus caracteícticas más
importantes, incluso sacar alguna
conclusión sobre el comportamiento de la
muestra donde se esta realizando el
estudio.
Los gráficos estadísticos son muy
útiles para comparar distintas tablas de
frecuencia.
Los gráficos estadísticos más usuales son:
19. DIAGRAMA DE BARRAS.
Se utiliza para la representación de variables cuantitativas discretas, cada valor de
la variable se representa por un punto sobre el eje OX y sobre él se dibuja una barra
de longitud igual o proporcinal a su frecuencia absoluta. Si la frecuencia absoluta
que se utiliza es la acumulativa, el diagrama de barras que se obtiene es: diagrama
de barras acumulativo
20. HISTOGRAMA.
Se utiliza para la representación de variables
cuantitativas continuas, cada intervalo se representa
sobre el eje OX , este será la base del rectángulo
que se dibuja sobre él con altura igual o
proporcional a su frecuencia absoluta. Como los
intervalos son consecutivos, los rectángulos quedan
adosados. Si se utilizarán rectángulos de amplitud
diferente, el área del rectángulo es la que tendría
que ser proporcional a la frecuencia absoluta
correspondiente a ese intervalo. Histograma
acumulativo, si se utiliza la frecuencia absoluta
acumulativa.
21. POLÍGONO DE FRECUENCIAS.
Se utilizan para variables estadísticas cuantitativas,
discretas o continuas.
Para una variable discreta, el polígono de
frecuencias se obtiene uniendo por una poligonal,
los extremos superiores de las barras.
Para una variable continua, el poligono de fecuencias
se obtiene uniendo por una poligonal los puntos
medios de la base superior de los poligonos del
histograma.
Las escalas utilizadas para representar los polígonos
de frecuencias influyen mucho por el impacto visual
de los mismos.
22. DIAGRAMA DE SECTORES.
Se utiliza para todo tipo de variable estadística,
cuantitativa o cualitativa. Consiste en dibujar
sectores sobre un círculo, siendo la amplitud de los
sectores proporcional a su frecuencia absoluta, cada
sector se rellena con un color diferente.
El cálculo de la amplitud en grados sexagesimales
del sector correspondiente se realiza así: ángulo =
frecuencia relativa*360
Ejemplo 2.- Hemos preguntado a 20 personas por el
número medio de días que practican deporte a la
semana y hemos obtenido las siguientes respuestas:
23. Un gráfico circular o gráfica circular, también
llamado "gráfico de pastel", "gráfico de tarta",
"gráfico de torta" o "gráfica de 360 grados", es un
recurso estadístico que se utiliza para representar
porcentajes y proporciones. El número de elementos
comparados dentro de una gráfica circular suele ser
de más de cuatro.
El gráfico circular más temprano conocido se
atribuye generalmente al escocés William Playfair, en
la obra Statistical Breviary de 1801.1 2
Gráfico de la población de
hablantes del idioma ingles
24. REFERENCIAS BIBLIOGRÁFICAS
Estadistica. Julián Pérez Porto y María Merino. Publicado: 2008
Definicion de estadística Consultado 10 de junio 2017. Disponible en:
(http://definicion.de/estadistica/)
Grafico Circular. Consultado 10 de junio 2017. Disponible en:
https://es.wikipedia.org/wiki/Gr%C3%A1fico_circular
Graficos estadísticos . Consultado 11 de junio 2017. Disponible en:
http://recursostic.educacion.es/descartes/web/materiales_didacticos/Estadistica_3eso
/graficos_estadisticos_mgc.html