1. UNIVERSIDAD NACIONAL DE JUJUY
FACULTAD DE INGENIERÍA
Carrera: Ingeniería INFORMÁTICA e INDUSTRIAL.
Docentes:
● Esp. Doc. Sup. Ing. Octavio Daniel CORO
● Esp. Ing. Rita del Carmen MARTIARENA
Integrantes del grupo:
● Cortez Araceli Victoria
● Fuentes Florencia Brisa
● Jara Fanny Raquel
OBSERVACIONES:
2. ¿Qué es la ESTADÍSTICA?
Cuando hablamos de estadística en general pensamos en dos palabras para
describirla. Normalmente se piensa en alguien elaborando estadística, preguntándole a una
persona por una serie de datos como su peso, edad, altura, estado civil, si trabaja o está
desempleado etc. Luego ese alguien trabaja con los datos tras serie de operaciones y se
nos habla de la media o la varianza de los datos. También pensamos en Estadística cuando
se tratan los datos y se obtienen conclusiones, y oímos cosas como «a la vista de los
resultados de los experimentos se puede concluir que no hay evidencia empírica para
afirmar que tal producto es perjudicial para la salud». El significado de Estadística es Ciencia
del Estado, y proviene del término alemán Statistik.
Es Ciencia del Estado porque en sus orígenes la estadística se utilizaba
exclusivamente con fines estatales, en el sentido de que los gobiernos de las distintas
naciones tenían la necesidad de conocer las características de su población para gestionar
el pago de impuestos, el reclutamiento de soldados, el reparto de tierras o bienes, la
prestación de servicios públicos etc. Esta necesidad llevó a los gobernantes a establecer
sistemas para recoger y procesar de alguna manera la información obtenida, es decir, a
hacer estadísticas sobre la población. Los primeros estudios estadísticos que se hacían eran
los censos, que son estudios descriptivos sobre todos los integrantes de una población. La
elaboración de censos comenzó en la Edad Antigua, y sigue dándose en nuestros días. La
Historia ofrece gran cantidad de ejemplos de actividad estadística.
En antiguas civilizaciones como Babilonia, Egipto, China, Roma etc. era normal que
se elaborarán recuentos de la población. La estadística aparece incluso en los textos
sagrados de varias religiones. Matemáticos como Pascal y Fermat sentaron las bases de la
Teoría de la Probabilidad, utilizada para estudiar fenómenos aleatorios que luego comenzó
a aplicarse a sucesos demográficos y económicos, puesto que muchos de ellos se
comportan como fenómenos aleatorios, dando indicios de la Estadística Inferencial. En la
Edad Contemporánea la estadística continúa desarrollándose y cada vez más deprisa.
El desarrollo del Muestreo y la Inferencia estadística hacen posible el estudio de la
población a través de solo una parte de ella , lo que facilita y reduce los procesos de
recolección y procesamiento de los datos. Una de los primeros en aplicar de forma rigurosa
estas nuevas técnicas estadísticas a las ciencias sociales fue Adolphe Quételet, con la
intención de descubrir las leyes naturales que regían ciertos sucesos sociales y
demográficos como la tasa de criminalidad o de nupcialidad etc. de una región. En el siglo
XIX y XX la Teoría de la Probabilidad y la Estadística continúan en desarrollo. Destacan
entre otros los trabajos de Andréi Markov, Aleksandr Liapunov y Pafnuti Chebyshev en el
campo de la Probabilidad, y los trabajos de Irving Fisher y John Tukey en el campo de la
Estadística.
Hoy en día, en la práctica totalidad de los países se crean oficinas de estadística y
otros órganos similares que se encargan de elaborar las estadísticas oficiales del país, por
ejemplo estadísticas sobre la tasa de paro, índices de precios, actividad económica ,
estadísticas sobre sanidad y educación, turismo, población etc. La oficina de estadística de
España es el INE, y además hay otros organismos que también se encargan de elaborar
estadísticas nacionales. Podemos definir a la Estadística como la disciplina científica que
comprende una serie de métodos y procedimientos que permite obtener, organizar, tabular
y analizar conjunto de datos cuantitativos y cualitativos con la finalidad de obtener
explicaciones e inferencias en base al cálculo de probabilidades. Es la «Ciencia de los
Datos» y su principal objetivo es describir «la población del estudio» en base a la
comprensión de los hechos a partir de la información disponible.
3. ESTADÍSTICA DESCRIPTIVA
Parte de la estadística que se encarga de reunir y organizar datos científicos
para analizarlos, con el objetivo de presentar la información estudiada de un
determinado acontecimiento. En simples palabras, muestra de forma
informativa datos relevantes. Describe la realidad.
La información se colecta en forma de muestra o agrupaciones de
observaciones. Y las muestras se reúnen de poblaciones que son
agrupaciones de TODOS los elementos individuales de un tipo específico. Tales
números ofrecen un sentido del centro de ubicación de los datos, de la
variabilidad en los datos y de la naturaleza de la distribución de observaciones
de la muestra.
Los datos reunidos se clasifican en variables:
TIPOS DE
VARIABLES
CUALITATIVAS O
CATEGÓRICAS
caracteristicas
DICOTÓMICAS
dos categorias
ORDINAL
orden en las
categorias
NOMINAL
presencia o
ausencia de la
carcteristica
CUANTITATIVAS
o NUMÉRICAS
numeros
DISCRETA
valores
finitos
CONTINUA
recta real
Solo se puede
tomar dos
valores posibles
Presentan un
orden
determinado No existe orden
de clasificación
Cuando se
toman valores
aislados
Numero infinito
entre dos valores
cualesquiera.
Ej: peso
INTERVALO:
El 0 no
representa
ausencia. ej.
temperatura
RAZÓN: tienen
un punto de cero
absoluto el 0
representa
ausencia de la
caracteristica.
Ej. Peso ( kg )
Para facilitar la obtención de la información que
contienen los datos se realiza distribución de
frecuencias. Las distribuciones de frecuencias son
tablas en las que se ordena la variable por filas y en las
columnas se va obteniendo las respectivas frecuencias
relativas que es el número de repetición por cada valor,
porcentajes, etc.
4. Ordenación en forma de tabla de los datos estadísticos.
• Frecuencia Absoluta (fi): número de veces que aparece determinado valor en
un conjunto de datos.
• Frecuencia Relativa (fi/n): es el cociente entre la frecuencia absoluta y el
número total de datos. Proporción de veces que un valor particular sucede en
un conjunto de datos.
• Frecuencia acumulada (Fi): es la suma de las frecuencias absolutas de los
valores inferiores o iguales.
Basados en esta información se puede representar gráficamente la misma. Consiguen
presentar la información al usuario o lector de manera clara y precisa, facilitando la
comparación y la comprensión de la evolución de distintas variables.
Para variables cualitativas:
VARIABLES
CUALITATIVAS
GRAFICAS DE
BARRAS
HORIZONTALES
GRAFICAS DE
TORTA
GRAFICAS DE
PUNTOS
𝑿𝒊 𝒇𝒊 𝒇𝒊
𝒏
𝒇𝒊
𝒏
∗ 𝟏𝟎𝟎
𝑭
VARIABLE
ej. temperatura
(C°)
FRECUENCIA
ABSOLUTA
FRECUENCIA
RELATIVA
FRECUENCIA
RELATIVA
PORCENTUAL
FRECUENCIA
ACUMULADA
28 9 0,30 30 30
30 4 0,14 14 44
31 8 0,26 26 70
32 6 0,20 20 90
33 3 0,10 10 100
TOTAL n= 30 1 100
TABLA DE FRECUENCIA
5. Para variables cuantitativas:
Estadística INFERENCIAL
Es la parte de la estadística que estudia las regularidades de los datos
recogidos para la elaboración de conclusiones futuras, permitiendo una toma de
decisiones con mayor efectividad. Su utilidad es probabilística que es la
probabilidad de acertar eligiendo una opción u otra permite hacer deducciones sobre
una totalidad, basándose en información numérica de la muestra. Su estudio también
VARIABLES
CUANTITATIVAS
HISTOGRAMA
OJIVA
POLIGONOS
TENDENCIA
CENTRAL
Media: es el promedio
de un conjunto de n
mediciones. Es afectado
por valores extremos
Mediana: valor que se
encuentra en el centro de
un lote ordenado.
Moda: Categoría o valor
que se presenta con más
frecuencia en la muestra
Rango Medio: Es el promedio
de las observaciones mayor y
menor de un conjunto de
datos.
6. pretende determinar si es posible generalizar el estudio en base a unos datos
realizados a toda la población contemplando la aleatoriedad de observaciones.
Este método se encarga de interpretar, hacer proyecciones y comparaciones
de los datos más allá de la estadística descriptiva mediante recopilar y organizar datos
presentando de forma informativa, evaluar la adecuación de la población, realizar
pruebas de hipótesis que permite decidir si dos muestras son estadísticamente
diferentes, pruebas de estimación puntual (o intervalos de confianza), pruebas
paramétrica o variables estadísticas (media, diferencias, proporciones, etc) permite
estimar valores de una población a través de una muestra; y no paramétrica
(coeficiente de contingencia), el diseño experimental, la inferencia bayesiana, entre
otros; con el objetivo de tomar decisiones y realizar predicciones aproximadas a un
posible resultado final.
Algunos ejemplos donde se aplica son: en ciencias experimentales, en
economía empresarial, en sondeos de tendencia de votos, análisis de mercado,
epidemiología médica y en el campo industriales quienes la utilizan para el control de
calidad. Un ejemplo claro es antes de una elección importante, diversas
encuestadoras sondean la opinión pública a través de internet o forma presencial para
recabar datos relevantes y luego, teniendo en cuenta la muestra analizada y
desglosada, inferir tendencias: quien tiene más populismo, quien va segundo, etc.
La estadística inferencial posee de desventajas y riesgo de error medible en términos
de probabilidad debido a la generalización a otros sujetos ya que cuando se trabaja
con muestras pequeñas es menos representativa a una población en especifica, sus
resultados dependen de las característica únicas de las muestras tomada y también
existe una mayor probabilidad de error debido al investigador o la influencia de sujetos.
Características:
● Rama de la estadística.
● Expresa la información recopilada por medio de datos.
● También conocida como estadística inductiva.
● Utiliza información recolectada por medio de estudios aplicados a la muestra.
● Estudia y analiza datos de una población a partir de una muestra.
● Utiliza distintas hipótesis para la obtención de resultados.
● Estimación de parámetros o variables estadísticas.
● Toma decisiones y realiza predicciones.
● Menos representativa a una población específica.
● Los resultados dependen únicamente de las características de la muestra.
● Mayor probabilidad de error debido al investigador e influencias.
Estadística Inferencial
MÉTODO
7. 1) Plantear problema: se define con precisión la población, la característica a
estudiar, las variables, etc.
2) Elaborar un modelo: modelo teórico de comportamiento de la variable de
estudio.
.
6) Contraste de hipótesis: permiten simplificar el modelo matemático bajo análisis.
LA ESTADÍSTICA DESCRIPTIVA E INFERENCIAL
DIFERENCIAS Y SIMILITUDES:
3) Extracción de la muestra: pequeña parte de la población.
4) Tratamiento de los datos: Los métodos de esta etapa están definidos por la
Estadística Descriptiva.
5) Estimación de parámetros: predicción sobre cuáles podrían ser los parámetros
de la población.
8. La estadística juega un papel muy importante en nuestras vidas, ya que actualmente
ésta se ha convertido en un método muy efectivo para describir con mucha precisión
los valores de datos económicos, políticos, sociales, psicológicos, biológicos y físicos,
además, sirve como herramienta para relacionar y analizar dichos datos. El trabajo del
experto estadístico ha evolucionado mucho, ya no consiste sólo en reunir y tabular los
datos, sino sobre todo en el proceso de interpretación de esa información, ahora tiene
un papel mucho más importante del que tenía en años pasados.
En conclusión como la estadística descriptiva es únicamente una descripción
de los datos, no asume que éstos tengan alguna propiedad más allá de las que se
pueden describir con la información contenida en los datos de la forma más sencilla y
presentable posible obteniendo así los parámetros que distinguen las características
de un conjunto de datos. En cambio, la inferencial asume que los datos se rigen bajo
un fenómeno aleatorio subyacente que es el que hace que tomen un valor u otro. Es
por esto por lo que los datos pasarían a denominarse variables aleatorias. Al existir
ESTADÍSTICA
DESCRITIVA
Está formada por
procedimientos
empleados para resumir y
describir las
características
importantes de un
conjunto de mediciones.
Propiedades principales
que describen un conjunto
de Datos numéricos:
Tendencia Central
Dispersión
Forma
Sin embargo ante todas las diferencias que
pudiesen existir entre la estadítica Descriptiva
e Inferencial, hay algo que tiene en común y
es que: AMBAS TRABAJAN SOBRE UNA
MUESTRA EXTRAIDA DE UNA POBLACION,
cuyos objetivos son "Analizar los datos", con
las herramientas que cada una ofrece.
ESTADÍSTICA
INFERENCIAL
Está formada por
procedimientos empleados
para hacer inferencias
acerca de características
poblacionales, a partir de
la información contenica
en una muestra.
Objetivo: Hacer
inferencias (sacar
conclusiones, hacer
predicciones) acerca de
una población a partir de
información contenida en
una muestra.
9. incertidumbre, se puede igualmente describir el producto de procesos investigativos en
educación se generan gran cantidad de datos. En este sentido, la estadística
inferencial provee herramientas que hizo posible el análisis sistemático y eficiente de
la de una muestra de la población que se quiere estudiar. Su análisis representa un
reto para los investigadores.población de la que sale esa muestra, pero debemos
entonces asumir un cierto error derivado de la naturaleza probabilística de los datos.
Ejercicio 21:
se obtuvieron las pulsaciones de 22 fumadores y de 22 no fumadores:
FUMADORES
52 52 60 60 60 60 63 63 66 67 68
69 71 72 73 75 78 80 82 83 88 90
NO FUMADORES
97 88 67 83 77 66 60 78 69 55 70
47 55 67 75 76 60 84 40 64 72 72
a) Define correctamente las variables. Indique si los datos son cualitativos o
cuantitativos. Para cada muestra haga los siguiente:
La variable son las pulsaciones de 22 fumadores y de 22 no fumadores. es una
variable cuantitativa discreta y de escala de razón.
b) Construya en un mismo gráfico ambos polígonos de frecuencia. interprete la
forma de la distribución de las pulsaciones en cada polígono (para ello
compare y cite conclusiones).
GRAFICO
10. En conclusión los fumadores son los que tienen una mayor frecuencia cardiaca normal
ya que lo normal oscila entre 60 y 100 latidos por minutos. En cambio los no
fumadores, son los que más presenta entre las dos muestra, que están por debajo de
los 60 (rpm)son personas que poseen bradicardia (frecuencia cardiaca lenta) y
pueden ser a causa de un defecto hereditario, enfermedades o medicamentos para el
corazon, proceso natural de envejecimiento, obstrucción cardiaca, entre otras.
c) En un mismo gráfico construya ambos box-plots.
d) Compare en una línea de puntos. ¿Qué medida descriptiva utiliza para su
respuesta?:
● la mitad de las personas tiene un número de pulsaciones menor o igual
a …72……………….., y la otra mitad mayor que ese valor.
● el 25% de las personas tiene un número de pulsaciones menor o igual a
………63……………, y el 75% de las personas, mayor a ese valor.
● el 75% de las personas tiene un número de pulsaciones menor o igual a
………80……………, y el 25% de las personas mayor a ese valor.
● Mínimo número de pulsaciones registradas: ……40…………….
¿Cuántas personas registran este mínimo? ……1…………….
● Máximo número de pulsaciones registradas: ………97………….
¿Cuántas personas registran este máximo?………1………….
● ¿En que rango de valores varían las pulsaciones de los 22 fumadores?
………………….