SlideShare una empresa de Scribd logo
1 de 34
IESTP FRANCISCO DE PAULA GONZÁLES VIGIL
CONTABILIDAD
ESTADISTICA GENERAL
“Trabajo encargado”
Presentados por:
08 de octubre de 2017
TACNA – PERÚ
2017
2
ÍNDICE
INTRODUCCIÓN.............................................................................................. 4
MARCO TEÓRICO ........................................................................................... 6
CAPÍTULO I: CARACTERÍSTICAS DE LOS CONJUNTOS DE DATOS.... 6
CAPÍTULO II: TIPOS DE DATOS................................................................... 8
2.1. Datos categóricos o cualitativos .............................................................. 8
2.1.1. Dos categorías (DICOTÓMICOS)................................................... 8
2.1.2. Más de dos categorías....................................................................... 9
2.2. Datos numéricos .................................................................................... 10
2.2.1. Discretos. ........................................................................................ 10
2.2.2. Continuos........................................................................................ 10
2.3. Otro tipo de datos .................................................................................. 11
2.3.1. Porcentajes...................................................................................... 11
2.3.2. Escalas analógicas visuales ............................................................ 11
2.3.3. Scores ............................................................................................. 12
2.3.4. Datos censurados ............................................................................ 13
CAPÍTULO III: GRÁFICOS ........................................................................... 15
3.1. Presentación de datos categóricos ......................................................... 15
3.1.1. Tabla de frecuencia......................................................................... 15
3.1.2. Gráfico de barras ............................................................................ 16
3.1.3. Gráfico de tortas ............................................................................. 17
3.2. Histograma ............................................................................................ 18
3
3.2.1. Tabla de frecuencia para datos numéricos...................................... 18
3.2.2. Construcción del histograma .......................................................... 19
3.2.3. Polígono de frecuencias.................................................................. 21
3.2.4. Distribución muestral y poblacional............................................... 22
DESARROLLO................................................................................................ 24
CONCLUSIONES............................................................................................ 33
REFERENCIAS ............................................................................................... 34
4
INTRODUCCIÓN
El presente trabajo se refiere al tema de la Estadística, que se puede definir como
la ciencia cuyo objetivo es reunir información para facilitar al hombre, el estudio de datos
masivos de individuos, grupos, series de hechos, etc. y deducir de ello gracias al análisis
de estos datos significados precisos o previsiones para el futuro.
También se refiere a la importancia, métodos e importancia de la estadística ya
que está relacionada con el estudio de proceso cuyo resultado es más o menos
imprescindible y con la finalidad de obtener conclusiones para tomar decisiones
razonables de acuerdo con tales observaciones
La Estadística se ocupa de los métodos científicos para recolectar, organizar,
resumir, presentar y analizar datos, así como de sacar conclusiones válidas y tomar
decisiones con base en este análisis, así también realizar predicciones a cerca del conjunto
del cual se han seleccionado dichos datos. El empleo cuidadoso de los métodos
estadísticos permite obtener información precisa de los datos.
¿Qué es la estadística?
ESTADÍSTICA es el arte de realizar inferencias y sacar conclusiones a partir de
datos imperfectos. Los datos son generalmente imperfectos en el sentido que aun cuando
posean información útil no nos cuentan la historia completa. Es necesario contar con
métodos que nos permitan extraer información a partir de los datos observados para
comprender mejor las situaciones que los mismos representan. Algunas técnicas de
análisis de datos son sorprendentemente simples de aprender y usar más allá del hecho
que la teoría matemática que las sustentan puede ser muy compleja. Todos, aún los
estadísticos, tenemos problemas al enfrentarnos con listados de datos. Existen muchos
métodos estadísticos cuyo propósito es ayudarnos a poner de manifiesto las características
sobresalientes e interesantes de nuestros datos que pueden ser usados en casi todas las
5
áreas del conocimiento. Los métodos estadísticos pueden y deberían ser usados en todas
las etapas de una investigación, desde el comienzo hasta el final. Existe el convencimiento
de que la estadística trata con el ANÁLISIS DE DATOS (quizás porque esta es la
contribución más visible de la estadística), pero este punto de vista excluye aspectos
vitales relacionados con el DISEÑO DE LAS INVESTIGACIONES. Es importante
tomar conciencia que la elección del método de análisis para un problema, se basa tanto
en el tipo de datos disponibles como en la forma en que fueron recolectados.
Áreas de la estadística
Describiremos brevemente cada una de las áreas en que puede dividirse la
estadística:
 Diseño: Planeamiento y desarrollo de investigaciones.
 Descripción: Resumen y exploración de datos.
 Inferencia: Hacer predicciones o generalizaciones acerca de características
de una población en base a la información de una muestra de la población.
6
MARCO TEÓRICO
En este apartado presentaremos los distintos tipos de datos o variables que
podemos encontrar en una investigación e comentaremos algunas estrategias para el
manejo de datos.
CARACTERÍSTICAS DE LOS CONJUNTOS DE DATOS
En lo que sigue denominaremos:
 Unidad de análisis o de observación al objeto bajo estudio. El mismo puede ser
una persona, una familia, un país, una región, una institución o en general,
cualquier objeto.
 Variable a cualquier característica de la unidad de observación que interese
registrar, la que en el momento de ser registrada puede ser transformada en un
número.
 Valor de una variable, observación o medición, al número que describe a la
característica de interés en una unidad de observación particular.
 CASO o REGISTRO al conjunto de mediciones realizadas sobre una unidad de
observación.
Consideremos el siguiente ejemplo:
Sexo, lugar nacimiento, edad, presión arterial sistólica son variables que
describen a una persona, su sexo, su lugar de nacimiento, su edad, etc. son los valores que
estas variables toman para esta persona. Cuando se diseña una investigación, se intenta
estudiar de qué modo una o más variables (variables independientes) afectan a una o más
variables de interés (variables dependientes). Por ejemplo, en un experimento, el
7
investigador impone a los sujetos condiciones (variable independiente) y estudia el efecto
de la misma sobre una característica del sujeto (aparición de una cierta característica,
modificación de una condición, etc.). Un paso importante al comenzar a manejar un
conjunto de datos es identificar cuántas variables se han registrado y cómo fueron
registradas esas variables, lo que permitirá definir la estrategia de análisis. En el ejemplo
anterior algunas de las variables son números y otras son letras que indican categorías. A
continuación, se presenta una clasificación de los distintos tipos de datos que podemos
encontrar. Debe notarse que distintos autores usan distintos criterios para clasificar datos
por lo que presentaremos aquí un criterio que resulta útil desde el punto de vista de
seleccionar el método de análisis estadístico más apropiado para los mismos.
8
TIPOS DE DATOS
2.1. Datos categóricos o cualitativos
Las variables categóricas resultan de registrar la presencia de un atributo. Las
categorías de una variable cualitativa deben ser definidas claramente durante la etapa de
diseño de la investigación y deben ser mutuamente excluyentes y exhaustivas. Esto
significa que cada unidad de observación debe ser clasificada sin ambigüedad en una y
solo una de las categorías posibles y que existe una categoría para clasificar a todo
individuo.
En este sentido, es importante contemplar todas las posibilidades cuando se
construyen variables categóricas, incluyendo una categoría tal como No sabe / No
contesta, o No registrado u Otras, que asegura que todos los individuos observados serán
clasificados con el criterio que define la variable.
Los datos categóricos se clasifican en dicotómicos, nominales y ordinales.
2.1.1. Dos categorías (DICOTÓMICOS)
El individuo o la unidad de observación puede ser asignada a solo una de dos
categorías. En general, se trata de presencia - ausencia del atributo y es ventajoso asignar
código 0 a la ausencia y 1 a la presencia.
Ejemplos:
 varón – mujer
 embarazada - no embarazada
 fumador - no fumador
 hipertenso – normotenso
Debe notarse que los ejemplos primero y segundo definitivamente cubren todas las
categorías, mientras que tercero y cuarto son simplificaciones de categorías más
complejas. En el tercero no está claro donde se asignan los ex-fumadores, en tanto que en
9
el cuarto fue necesario establecer un criterio de corte para armar una variable categórica
a partir de una variable numérica.
2.1.2. Más de dos categorías
Categorías nominales ⇒ No existe orden obvio entre las categorías.
Ejemplos: país de origen, estado civil, diagnóstico.
Categorías ordinales ⇒ Existe un orden natural entre las categorías.
Ejemplos:
1) Tabaquismo: No fuma / ex-fumador / fuma ≤ 10 cigarrillos diarios / fuma > 10
cigarrillos diarios
2) Severidad de la patología: Ausente / leve / moderado / severo.
Aun cuando los datos ordinales puedan ser codificados como números como en
el caso de estadios de cáncer de mama de I a IV, no podemos decir que una paciente en
el estadio IV tiene un pronóstico dos veces más grave que una paciente en estadio II, ni
que la diferencia entre estadio I y II es la misma que entre estadio III y IV. En cambio,
cuando se considera la edad de una persona, 40 años es el doble de 20 y una diferencia de
1 año es la misma a través de todo el rango de valores.
Por esta razón, debemos ser cuidadosos al tratar variables cualitativas,
especialmente cuando se han codificado numéricamente, ya que no pueden ser analizadas
como números, sino que deben ser analizados como categorías. Es incorrecto presentar,
por ejemplo, el estadio promedio de cáncer en un grupo de pacientes.
En la práctica clínica se usan escalas para definir grados de un síntoma o de una
enfermedad, tales como 0, +, ++, +++. Es importante definir operativamente este tipo de
variables y estudiar su confiabilidad de modo de asegurar que dos observadores puestos
frente al mismo paciente, lo clasificarán en la misma categoría.
10
2.2. Datos numéricos
Una variable es numérica cuando el resultado de la observación o medición es
un número. Se clasifican en:
2.2.1. Discretos.
La variable sólo puede tomar un cierto conjunto de valores posibles. En general,
aparecen por conteo.
Ejemplo: número de miembros del hogar, número de intervenciones quirúrgicas, número
de casos notificados de una cierta patología.
2.2.2. Continuos.
Generalmente son el resultado de una medición que se expresa en unidades. Las
mediciones pueden tomar teóricamente un conjunto infinito de valores posibles dentro de
un rango. En la práctica los valores posibles de la variable están limitados por la precisión
del método de medición o por el modo de registro. Ejemplos: altura, peso, pH, nivel de
colesterol en sangre.
La distinción entre datos discretos y continuos es importante para decidir qué método de
análisis estadístico utilizar, ya que hay métodos que suponen que los datos son continuos.
Consideremos, por ejemplo, la variable edad. Edad es continua, pero si se la registra en
años resulta ser discreta. En estudios con adultos, en que la edad va de 20 a 70 años, por
ejemplo, no hay problemas en tratarla como continua, ya que el número de valores
posibles es muy grande. Pero en el caso de niños en edad preescolar, si la edad se registra
en años debe tratarse como discreta, en tanto que si se la registra en meses puede tratarse
como continua.
Del mismo modo, la variable número de pulsaciones/min. es una variable
discreta, pero se la trata como continúa debido al gran número de valores posibles. Los
datos numéricos (discretos o continuos) pueden ser transformados en categóricos y ser
11
tratados como tales. Aunque esto es correcto no necesariamente es eficiente y siempre es
preferible registrar el valor numérico de la medición, ya que esto permite:
 Analizar la variable como numérica ⇒ Análisis estadístico más simple y más
potente.
 Armar nuevas categorías usando criterios diferentes.
Sólo en casos especiales es preferible registrar datos numéricos como
categóricos, por ejemplo, cuando se sabe que la medición es poco precisa (número de
cigarrillos diarios, número de tazas de café en una semana).
2.3. Otro tipo de datos
2.3.1. Porcentajes
Los porcentajes son el resultado de tomar el cociente entre dos cantidades.
Ejemplos: reducción porcentual de la presión arterial luego de la aplicación de una droga,
o peso corporal relativo (peso observado/peso deseable). En el primer caso las cantidades
que forman el cociente se miden simultáneamente, en tanto que en el segundo caso el
denominador es un valor estándar preexistente.
Aunque los porcentajes pueden pensarse como variables continuas pueden
causar problemas en el análisis, especialmente cuando pueden tomar valores mayores y
menores que 100% (ejemplo: de peso corporal relativo) o cuando pueden dar valores
negativos (ejemplo: reducción porcentual de la PA. En este último caso, un paciente con
PAS en 150 mm Hg con un 20% de aumento en la PAS llegará a 180 mmHg, pero una
posterior disminución del 20% lo llevará a 144 mm Hg). Se debe tener cuidado al analizar
estos datos.
2.3.2. Escalas analógicas visuales
Cuando se necesita que una persona indique el grado de alguna característica no
medible, tal como satisfacción, dolor, bienestar, agrado, acuerdo, etc. una técnica que
12
permite obtener categorías ordinales es la escala analógica visual. Se presenta al
encuestado una línea recta (generalmente de 10 cm.) cuyos extremos indican estados
extremos y se les pide que marquen una posición en la recta que represente la percepción
de su estado.
Ejemplo. Interesa estimar grado de satisfacción con un tratamiento, se puede usar la
siguiente escala.
Estas escalas son muy útiles para valorar cambios en el mismo individuo. Aun
cuando un puntaje de 3.7 no dice nada en sí mismo, una reducción de 2 puntos en un
paciente si nos da información. Debe tenerse cuidado al tratar este tipo de datos ya que, a
diferencia de los datos numéricos, aun cuando se registren como números la escala
subyacente no necesariamente es la misma para dos sujetos distintos.
2.3.3. Scores
Los scores son indicadores de la condición de un individuo basados en la
observación de varias variables, generalmente categóricas. En clínica los scores se
construyen en base a síntomas y signos, asignándole a cada uno de ellos un puntaje y
calculando un puntaje total o score, que es un indicador de la condición del paciente.
Un ejemplo es el score Apgar usado como indicador de pronóstico en el recién nacido.
El recién nacido es evaluado en los minutos 0 y 5 de vida. Cada signo recibe un
puntaje de 0 a 2, los cuales se suman y el score resultante es un número entre 0 a 10. Se
13
considera que un score ≥ 7 es de buen pronóstico, y que un Apgar ≤ 3 es de muy mal
pronóstico.
No es de interés aquí discutir la validez de este particular score, pero
remarcaremos tres características que son comunes a este tipo de scores:
 en la evaluación de cada signo está presente cierto nivel de subjetividad
 al transformar las categorías en números, estamos valorando las diferencias entre
0 y 1 y entre 1 y 2 como equivalentes
 los cinco signos son igualmente importantes en la construcción del score.
Los scores deberían tratarse en el análisis tal como se los trata en la práctica, como
criterios para definir categorías ordinales y no como variables numéricas.
2.3.4. Datos censurados
Una observación censurada es aquella que no pudo ser medirla exactamente,
pero que se sabe que está más allá de un cierto límite, es decir, conocemos una cota
inferior o superior para el dato.
Ejemplos.
 Cuando se miden elementos traza, el nivel del elemento en la muestra puede ser
menor que el límite de detección de la técnica. Este es un dato con censura
izquierda ya que no se conoce el verdadero valor, pero si se conoce una cota
superior.
 Estudios de seguimiento en los que interesa el tiempo de supervivencia. En los
pacientes que se mantienen vivos finalizar el estudio, se desconoce el tiempo real
de supervivencia, pero se sabe que éste es mayor que el tiempo de permanencia
en el estudio. El tiempo de supervivencia está censurado a derecha, sólo
conocemos una cota inferior para el mismo.
14
 Un estudio de seguimiento en que interesa estudiar el tiempo transcurrido hasta la
recidiva de una patología. En aquellos sujetos que se pierden del estudio (por
abandono, por muerte por otras causas o por cualquier otra razón) pero que
sabemos que estuvieron libres de la patología mientras permanecieron en el
estudio (hasta el último control), el dato de tiempo transcurrido hasta la recidiva
está censurado a derecha.
¿Por qué es importante identificar el tipo de datos?
Porque el tipo de datos DETERMINA el método de análisis apropiado y válido
y cada método de análisis estadístico es específico para un cierto tipo de datos. La
distinción más importante es entre datos numéricos y categóricos.
15
GRÁFICOS
La estadística descriptiva o análisis exploratorio de datos ofrece modos de
presentar y evaluar las características principales de los datos a través de tablas, gráficos
y medidas resúmenes. En este capítulo presentaremos formas simples de resumir y
representar gráficamente conjuntos de datos.
El objetivo de construir gráficos es poder apreciar los datos como un todo e
identificar sus características sobresalientes. El tipo de gráfico a seleccionar depende del
tipo de variable que nos interese representar por esa razón distinguiremos en la
presentación gráficos para variables categóricas y para variables numéricas.
3.1. Presentación de datos categóricos
3.1.1. Tabla de frecuencia
El modo más simple de presentar datos categóricos es por medio de una tabla de
frecuencias. Esta tabla indica el número de unidades de análisis que caen en cada una de
las clases de la variable cualitativa. Consideremos los casos de meningitis notificados
durante el año 2000 al SI.NA.VE (Argentina) clasificados según tipo de meningitis.
Tabla 1: Notificacionesde meningitisen la Argentina,año 2000. Fuente:SI.NA.V.E.
La primer y segunda columna de la Tabla 1 muestran las categorías de la variable
(tipo de meningitis y la sigla correspondiente), la tercera columna presenta el número de
casos de meningitis de cada tipo notificados, es decir la frecuencia o frecuencia absoluta,
en tanto que la última columna presenta la frecuencia relativa o el porcentaje de casos
16
notificados de cada tipo de meningitis. Por ejemplo, la frecuencia relativa de la categoría
BSA se calcula del siguiente modo:
La representación gráfica de una distribución de frecuencias puede realizarse a
través de un gráfico de barras o de un gráfico de tortas. A continuación, presentamos
ambos métodos.
3.1.2. Gráfico de barras
Este gráfico es útil para representar datos categóricos nominales u ordinales. A
cada categoría o clase de la variable se le asocia una barra cuya altura representa la
frecuencia o la frecuencia relativa de esa clase. Las barras difieren sólo en altura, no en
ancho. La escala en el eje horizontal es arbitraria y en general, las barras se dibujan
equiespaciadas, por esta razón este tipo de gráfico sólo debe usarse para variables
categóricas.
Es importante que el eje vertical comience en cero, de modo que no se exageren
diferencias entre clases. En un gráfico de barras, así como en cualquier tipo de gráfico se
debe indicar el número total de datos ya que el gráfico sólo muestra porcentajes o
frecuencias relativas y la fuente de la que se obtuvieron los mismos.
Figura 1: Notificaciones de meningitis en la Argentina. Año 2000. Fuente: SINAVE
Cuando se desea comparar dos o más distribuciones cualitativas, el modo más
sencillo de representación es el gráfico de barras combinadas. En la Figura 2 se presentan
17
las distribuciones de casos notificados de meningitis en Argentina para los años 1999 y
2000.
Figura 2: Notificaciones de meningitis en la Argentina. 1999 y 2000. Fuente: SINAVE.
3.1.3. Gráfico de tortas
En este gráfico, ampliamente utilizado, se representa la frecuencia relativa de
cada categoría como una porción de un círculo, en la que el ángulo se corresponde con la
frecuencia relativa correspondiente. Como en todo gráfico es importante indicar el
número total de sujetos.
Esta representación gráfica es muy simple y permite comparar la distribución de
una variable categórica en 2 o más grupos.
Las Figura 3 muestra los datos sobre meningitis presentados en la Figura 2.
Figura 3:Notificaciones de meningitis en la Argentina. 1999 y 2000. Fuente: SINAVE.
18
3.2. Histograma
El histograma es el más conocido de los gráficos para resumir un conjunto de
datos numéricos y pretende responder a las mismas preguntas que un gráfico de tallo-
hojas. Una virtud del gráfico de tallo-hojas es que retiene los valores de las observaciones,
sin embargo, esta característica puede ser una desventaja para gran cantidad de datos.
Construir manualmente un histograma es más laborioso que construir un gráfico de tallo
hojas, pero la mayoría de los paquetes estadísticos producen histogramas. Para construir
un histograma es necesario previamente construir una tabla de frecuencias.
3.2.1. Tabla de frecuencia para datos numéricos.
A partir de una variable numérica es posible construir una distribución de
frecuencias clasificando los datos en clases o categorías definidas por el investigador. Las
clases o intervalos de clase de una tabla de frecuencias deben ser mutuamente excluyentes
y exhaustivas, es decir, cada dato debe caer en una y sólo una clase y todos los datos
deben tener una clase a la cual pertenecen.
¿Cómo construimos una tabla de frecuencias?
 Se divide el rango total de los datos en clases o intervalos, los que no
necesariamente deben tener la misma longitud.
 Se cuenta el número de observaciones que cae en cada clase y se determina la
frecuencia en cada clase.
 Se calculan las frecuencias relativas, frecuencias acumuladas y frecuencias
acumuladas relativas para cada intervalo.
Notación:
 frecuencia ⇒ fi = número de casos que cae en el intervalo i-ésimo
 frecuencia relativa porcentual ⇒ fri = (fi / n)⋅100 = porcentaje de casos en
el intervalo i-ésimo
19
 frecuencia acumulada ⇒ fai = f1 + f2 + ... + fi = suma de las frecuencias
desde la primera categoría hasta la categoría i-ésima.
 frecuencia acumulada relativa porcentual ⇒ fari = (fai / n) ⋅100 = suma de
las frecuencias relativas desde la primera categoría hasta la categoría i-
ésima.
La Tabla 2 muestra la tabla de frecuencias para los datos de tasas de neumonía cada 1000
habitantes presentados en la Tabla 1 (Año 2000, Argentina, Fuente: SINAVE). Se
definieron intervalos de longitud igual a 1.
Tabla 2:Distribución de frecuencias. Tasas de notificación de neumonías por provincia, Argentina 2000.
3.2.2. Construcción del histograma
3.2.2.1. Intervalos de clase todos de la misma longitud.
Se trazan dos ejes de coordenadas rectangulares. En el eje horizontal se
representan los valores de la variable y en el eje vertical una medida de frecuencia
(frecuencia absoluta, frecuencia relativa o frecuencia relativa porcentual). Indicamos en
el eje horizontal los límites de los intervalos de clase. Asociamos a cada clase una
columna cuya base cubre el intervalo de clase y cuya altura indica cuantos datos “caen”
se une intervalo a través de la frecuencia o la frecuencia relativa de la clase. El gráfico se
20
construye sin dejar espacio horizontal entre categorías, a menos que una clase esté vacía
(es decir tenga altura cero).
La Figura 4 presenta dos histogramas para los datos de tasas de neumonía de la Tabla 2.
El primero se construyó con intervalos de longitud unitaria, mientras que el segundo con
intervalos de longitud dos.
Figura 4: Histogramas para los datosde tasas de neumonía notificadas por las provincia,Argentina,año
2000.
¿Qué características observamos en los gráficos anteriores?
 La distribución es asimétrica, con mayor concentración de datos en tasas bajas y
algunas provincias con tasas altas.
 Se observan cuatro provincias con tasas de notificación de casos de neumonía más
altas que el resto. Ellas son San Luis, Formosa, La Pampa y Chaco. Tal vez
podríamos pensar en dos agrupamientos.
 En el histograma de la izquierda observamos un único pico (o moda) pero en el
de la derecha aparenta haber dos. Es importante remarcar que características del
gráfico que no se mantienen al modificar levemente la definición de los intervalos
de clase pueden ser consideradas como artificiales.
El propósito de un histograma es mostrar la forma de la distribución de los datos, por lo
que debemos estar atentos a los aspectos visuales de la representación. Como hemos
21
observado en el ejemplo, la forma del histograma depende del número de intervalos de
clase que seleccionemos.
¿Cuántas clases usar?
Existen distintas fórmulas que permiten calcular el número máximo de clases
apropiado para un conjunto de datos, en base al rango de datos y al número de datos. La
decisión, tal como ocurre en el gráfico de tallo-hojas, es una solución de compromiso. En
general entre 6 y 15 clases resulta ser una buena elección. Muchos intervalos harán que
caigan muy pocas observaciones en cada clase, por lo que las alturas de las barras variarán
irregularmente. Muy pocas clases producen una gráfica más regular, pero demasiado
agrupamiento puede hacer que se pierdan las características principales.
¿Cómo describimos la forma de una distribución?
Los histogramas siguientes representan distintas formas posibles para la
distribución de los datos. Los dos primeros muestran distribuciones aproximadamente
simétricas, mientras que los dos últimos muestran distribuciones claramente asimétricas.
3.2.3. Polígono de frecuencias
El polígono de frecuencias es similar al histograma en muchos aspectos, pero
pretende dar una imagen aproximada de la “curva” definida por la distribución de la
variable. Para construirlo se usan los mismos ejes que en el histograma. Se indica en la
escala horizontal el punto medio de cada intervalo y en la escala vertical la escala
densidad para ese intervalo, esto define pares (x, y) en el gráfico que se unen con tramos
de líneas rectas. Se marcan además los puntos medios del intervalo que precede al primero
y del que sigue al último.
22
Figura 5: Polígono de frecuencias. Notificaciones de casos de rubéola. Argentina, 2000.
Figura 6: Tasas de rubéola cada 1000 habitantes. Argentina, 2000. Fuente: SINAVE
3.2.4. Distribución muestral y poblacional.
Las distribuciones de frecuencia y los histogramas de una variable se aplican
tanto a datos de una muestra como a datos de toda la población. En el primer caso
hablamos de distribución muestral y en el segundo caso de distribución poblacional. En
algún sentido la distribución muestral es una fotografía borrosa de la distribución
poblacional. A medida que el tamaño de muestra aumenta la proporción de casos que cae
en cada intervalo se parece más y más a la proporción poblacional. La fotografía se torna
más y más definida y la distribución muestral luce similar a la distribución poblacional.
Si la población contiene una gran cantidad de unidades de observación y la
variable es continua es posible elegir intervalos tan delgados como deseemos para
construir el histograma y además hacer crecer el tamaño de muestra indefinidamente. En
23
este caso, la forma del histograma se aproximará a una curva suave denomina distribución
de la variable en la población.
Figura 7: Histogramas para variables continuas.
La Figura 7 muestra dos histogramas, el primero basado en una muestra de
tamaño 100 y el segundo basado en una muestra de tamaño 1000, y una curva suave que
representa la distribución poblacional. Aun cuando la variable sea discreta, una curva
suave suele ser una buena aproximación para la distribución poblacional, especialmente
cuando el número de valores posibles de la variable es grande. Comentaremos a
continuación y a modo de cierre del tema de estadística descriptiva algunos problemas
que aparecen al interpretar gráficos.
24
DESARROLLO
1. EJERICIO.
Una compañía fabrica 15 productos básicos. La compañía consume registros del número
de cada producto por mes, a fin de examinar los niveles relativos de producción. Los
registros de productos fabricados en el último mes fueron.
9897 10052 10028 9722 9908
10125 7896 9356 10234 6789
a) Construir una distribución de frecuencias con k=4 intervalos de clase de igual
longitud.
i Intervalo Xi Conteo fi Fi hi Hi hi% Hi%
1 [6789-8289] 7539 III 3 3 0.20 0.20 20.00 20.00
2 [8289-9789] 9039 IIIII 5 8 0.33 0.53 33.33 53.33
3 [9789-11289] 10539 IIIIII 6 14 0.40 0.93 40.00 93.33
4 [11289-12789] 10239 I 1 15 0.07 1.00 6.67 100.00
15 100.00
Datos:
n=15, k=4, R=12789-6789=6000
A=R/K, 6000/4=1500
Procedimientos:
hi=fi/n
h1=0.20 F1=f1=3 H1=h1=0.20
h2=0.33 F2=F1+f2=8 H2=H1+h2=0.53
hi%=hi*100% Hi%=Hi*100%
h1%=0.20*100=20% H1%=0.20*100%=20%
h2%=0.33*100=33.33% H2%=0.53*100%=53.33%
b) Analiza las ubicaciones de los datos según las frecuencias relativas
c) ¿Qué nivel de producción sobrepaso el 75% de sus productos al mes?
25
2. EJERCICIO
La siguiente tabla muestra el número de jóvenes que obtuvieron los puntajes señalados
en una prueba de ingreso.
i Puntaje fi
1 [10-15> 10
2 [15-20> 15
3 [20-25> 28
4 [25-30> 20
5 [30-35> 17
Donde A es el porcentaje de jóvenes con puntaje mayor a 20. B es el porcentaje de jóvenes
con puntaje mayor a 15. Halle A-B
i Puntaje fi Fi hi Hi hi% Hi%
1 [10-15> 10 10 0.1111 0.1111 11.11 11.11
2 [15-20> 15 25 0.1667 0.2778 16.67 27.78
3 [20-25> 28 53 0.3111 0.5889 31.11 58.89
4 [25-30> 20 73 0.2222 0.8111 22.22 81.11
5 [30-35> 17 90 0.1889 1.0000 18.89 100.00
90 1.00
Datos:
n=90
Procedimientos:
hi=fi/n
h1=0.1111 F1=f1=10 H1=h1=0.1111
h2=0.1667 F2=F1+f2=25 H2=H1+h2=0.2778
hi%=hi*100% Hi%=Hi*100%
h1%=0.11*100=11.11% H1%=0.1111*100%=11.11%
h2%=0.33*100=16.67% H2%=0.2778*100%=27.78%
A=72.22%, B=11.11%
72.22% - 11.11% = 61.11%
26
3. EJERCICIO
Completar el siguiente cuadro correspondiente a las edades de los asistentes a la
FERITAC.
i variable fi Fi hi Hi hi% Hi%
1 10-19 0.10
2 20-29 0.20
3 30-39 40
4 40-49 10
5 50-59 0.05
6 60-69 100
a) Completar la tabla e indique su procedimiento.
i variable fi Fi hi Hi hi% Hi%
1 10-19 10 10 0.10 0.10 10 10
2 20-29 20 30 0.20 0.30 20 30
3 30-39 10 40 0.10 0.40 10 40
4 40-49 10 50 0.10 0.50 10 50
5 50-59 5 55 0.05 0.55 5 55
6 60-69 45 100 0.45 1.00 45 100
100 1.00
Datos:
H1=h1=0.10 F6=100=n h1=f1/100 => 0.10*100=f1 => f1=10; F1=10
h2=0.20 => h2=f2/100 =>f2=20; F2=F1+f2=10+20=30;
F3=40; F3=F2+f3 => 40=30+f3 => f3=10
b) ¿Cuál es la variable y que tipo?
La variable es cuantitativa y de tipo continua y su variable es la edad
c) ¿Cuántos asistentes tienen más de 29 años?
70 Asistentes
d) ¿Qué porcentaje del total de asistentes poseen menos de 49 años?
El 50%
27
e) realice sus gráficos correspondientes.
Histograma
Gráfico Poligonal
0
5
10
15
20
25
30
35
40
45
1 2 3 4 5 6
total
total
0
5
10
15
20
25
30
35
40
45
50
0 10 20 30 40 50 60 70 80
Total
Edades
28
4. EJERCICIO
Los siguientes datos son velocidades (en Km/h) de 30 carros que pasaron por un punto
de control de velocidades. Clasificar estos datos convenientes. Hallar las tablas de
frecuencias. Graficar el histograma y el polígono de frecuencias correspondiente.
60 30 38 60 45 20
35 20 40 54 38 35
40 10 46 60 49 38
30 55 45 105 29 49
80 40 28 15 82 72
i I Xi fi Fi hi Hi hi% Hi%
1 10-26 18 4 4 0.1333 0.1333 13.33 13.33
2 26-42 34 12 16 0.4000 0.5333 40.00 53.33
3 42-58 50 7 23 0.2333 0.7667 23.33 76.67
4 58-74 66 4 27 0.1333 0.9000 13.33 90.00
5 74-90 82 2 29 0.0667 0.9667 6.67 96.67
6 90-106 98 1 30 0.0333 1.0000 3.33 100.00
30 1.00
Histograma
0
2
4
6
8
10
12
14
1 2 3 4 5 6
Cantidad
Velocidades
29
Grafico Poligonal
5. EJERCICIO
Los siguientes datos constituyen las vidas útiles en horas de una encuesta aleatoria de 50
bombillas de luz de 100 watts.
a) Construya una distribución de frecuencias con ancho de clase iguales.
i I Xi fi Fi hi Hi hi% Hi%
1 620-696 658 4 4 0.0667 0.0667 6.67 6.67
2 696-772 734 10 14 0.1667 0.2333 16.67 23.33
3 772-848 810 16 30 0.2667 0.5000 26.67 50.00
4 848-924 886 20 50 0.3333 0.8333 33.33 83.33
5 924-1000 962 4 54 0.0667 0.9000 6.67 90.00
6 1000-1076 1038 6 60 0.1000 1.0000 10.00 100.00
60 1.00
R=1076-620=456
K=1+3.32*log(60)=6,92
A=R/K= 456/6=76
0
2
4
6
8
10
12
14
18 34 50 66 82 98
Cantidades
Velocidades
30
b) Trácese el polígono de frecuencias sobre un Histograma de intervalos de clases vs
Frecuencias relativas.
Histograma
Grafica Poligonal
0
5
10
15
20
25
1 2 3 4 5 6
CantidaddeBombillas
Vidas en Horas
0
5
10
15
20
25
658 734 810 886 962 1038
Cantidaddebombillas
Promedio de vidas en Horas
31
6. EJERCICIO
A un seminario de informática, asistieron 540 profesionales, de los cuales: 10 son
ingenieros, 150 son médicos, 108 son abogados, 60 son profesores y el resto son
profesionales de otras especialidades.
a) construir la adecuada tabla de distribución de frecuencia.
i I fi Fi hi Hi hi% Hi% G°
1 Ingenieros 180 180 0.3333 0.3333 33.33 33.33 120
2 Médicos 150 330 0.2778 0.6111 27.78 61.11 100
3 Abogados 108 438 0.2000 0.8111 20.00 81.11 72
4 Profesores 60 498 0.1111 0.9222 11.11 92.22 40
5 Otros 42 540 0.0778 1.0000 7.78 100.00 28
540 1.00
b) Porcentaje de profesores
Son 11%
c) diagrama de barras
Histograma
0
20
40
60
80
100
120
140
160
180
200
1 2 3 4 5
TotalAsistentes
Profesiones
32
Grafica poligonal
120
100
72
40
28
1 2 3 4 5
33
CONCLUSIONES
 Los conceptos antes mencionados han sido analizados e investigados de tal
manera de hacer más fácil su comprensión y entendimientos ya que la estadística
es la ciencia que trata de entender, organizar y tomar decisiones que estén de
acuerdo con los análisis efectuados.
 Es recomendable tomar en cuenta que la estadística es muy importante en la vida
social y laboral del hombre ya que generaliza información.
 Es una herramienta indispensable para la toma de decisiones.
 También es ampliamente empleada para mostrar los aspectos cuantitativos de una
situación
34
REFERENCIAS
Celestino , G. (1998 ). Estadística descriptiva y probabilidades. Lima.
Fernández chavesta, J., & Fernández chavesta, J. (s.f.). Estadística aplicada I. Lima.

Más contenido relacionado

La actualidad más candente

Probabilidad y estadistica
Probabilidad y estadisticaProbabilidad y estadistica
Probabilidad y estadisticaElmono Manuinas
 
La estadistica conceptos basicos
La estadistica conceptos basicos La estadistica conceptos basicos
La estadistica conceptos basicos nirce
 
Modulo de estadistica i
Modulo de estadistica iModulo de estadistica i
Modulo de estadistica iVihu DEC
 
Curso bioestadistica medicina sesion 1
Curso bioestadistica  medicina  sesion 1Curso bioestadistica  medicina  sesion 1
Curso bioestadistica medicina sesion 1Eduardo Sandoval
 
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)Luisa Santa María
 
Naturaleza de la estadistica1
Naturaleza de la estadistica1Naturaleza de la estadistica1
Naturaleza de la estadistica1ecruzo
 
Estadística (2)
Estadística (2)Estadística (2)
Estadística (2)Danielac12
 
Ayuda fase inter_1
Ayuda fase inter_1Ayuda fase inter_1
Ayuda fase inter_1a386399
 
Introduccion a la bioestadistica
Introduccion a la bioestadisticaIntroduccion a la bioestadistica
Introduccion a la bioestadisticaGabriel Liuba
 
Estadistica para la investigación (sesión 10)
Estadistica para la investigación (sesión 10)Estadistica para la investigación (sesión 10)
Estadistica para la investigación (sesión 10)Zarlenin docente
 
Trabajo colaborativo momento 2 (1)
Trabajo colaborativo momento 2 (1)Trabajo colaborativo momento 2 (1)
Trabajo colaborativo momento 2 (1)Erica Avila Caicedo
 
Estadistica descriptiva fase inicial momento 1
Estadistica descriptiva fase inicial momento 1Estadistica descriptiva fase inicial momento 1
Estadistica descriptiva fase inicial momento 1Nathalia Sandoval
 
Estadística y medidas de tendencia central internet
Estadística y medidas de tendencia central internetEstadística y medidas de tendencia central internet
Estadística y medidas de tendencia central internetkyopilar
 
Estadística descriptiva
Estadística descriptivaEstadística descriptiva
Estadística descriptivaRogers Rojo
 
Probabilidadyestadistica(2 7-13)
Probabilidadyestadistica(2 7-13)Probabilidadyestadistica(2 7-13)
Probabilidadyestadistica(2 7-13)Luisa Chirinos Soto
 
Informe de pronosticos
Informe de pronosticosInforme de pronosticos
Informe de pronosticosNelson Salinas
 
El uso de la estadística para resolver problemas relacionados con la salud y ...
El uso de la estadística para resolver problemas relacionados con la salud y ...El uso de la estadística para resolver problemas relacionados con la salud y ...
El uso de la estadística para resolver problemas relacionados con la salud y ...eileen.rodz
 
MODULO INFERENCIA ESTADISTICA
MODULO INFERENCIA ESTADISTICAMODULO INFERENCIA ESTADISTICA
MODULO INFERENCIA ESTADISTICASamuel Jose
 

La actualidad más candente (20)

Probabilidad y estadistica
Probabilidad y estadisticaProbabilidad y estadistica
Probabilidad y estadistica
 
Estadistica Unam
Estadistica UnamEstadistica Unam
Estadistica Unam
 
La estadistica conceptos basicos
La estadistica conceptos basicos La estadistica conceptos basicos
La estadistica conceptos basicos
 
Modulo de estadistica i
Modulo de estadistica iModulo de estadistica i
Modulo de estadistica i
 
Curso bioestadistica medicina sesion 1
Curso bioestadistica  medicina  sesion 1Curso bioestadistica  medicina  sesion 1
Curso bioestadistica medicina sesion 1
 
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
 
Naturaleza de la estadistica1
Naturaleza de la estadistica1Naturaleza de la estadistica1
Naturaleza de la estadistica1
 
Estadística (2)
Estadística (2)Estadística (2)
Estadística (2)
 
Ayuda fase inter_1
Ayuda fase inter_1Ayuda fase inter_1
Ayuda fase inter_1
 
Estadistica
EstadisticaEstadistica
Estadistica
 
Introduccion a la bioestadistica
Introduccion a la bioestadisticaIntroduccion a la bioestadistica
Introduccion a la bioestadistica
 
Estadistica para la investigación (sesión 10)
Estadistica para la investigación (sesión 10)Estadistica para la investigación (sesión 10)
Estadistica para la investigación (sesión 10)
 
Trabajo colaborativo momento 2 (1)
Trabajo colaborativo momento 2 (1)Trabajo colaborativo momento 2 (1)
Trabajo colaborativo momento 2 (1)
 
Estadistica descriptiva fase inicial momento 1
Estadistica descriptiva fase inicial momento 1Estadistica descriptiva fase inicial momento 1
Estadistica descriptiva fase inicial momento 1
 
Estadística y medidas de tendencia central internet
Estadística y medidas de tendencia central internetEstadística y medidas de tendencia central internet
Estadística y medidas de tendencia central internet
 
Estadística descriptiva
Estadística descriptivaEstadística descriptiva
Estadística descriptiva
 
Probabilidadyestadistica(2 7-13)
Probabilidadyestadistica(2 7-13)Probabilidadyestadistica(2 7-13)
Probabilidadyestadistica(2 7-13)
 
Informe de pronosticos
Informe de pronosticosInforme de pronosticos
Informe de pronosticos
 
El uso de la estadística para resolver problemas relacionados con la salud y ...
El uso de la estadística para resolver problemas relacionados con la salud y ...El uso de la estadística para resolver problemas relacionados con la salud y ...
El uso de la estadística para resolver problemas relacionados con la salud y ...
 
MODULO INFERENCIA ESTADISTICA
MODULO INFERENCIA ESTADISTICAMODULO INFERENCIA ESTADISTICA
MODULO INFERENCIA ESTADISTICA
 

Similar a Trabajo

1. Est Des 1.1 y 1.2 Fundamentos_1 (1).docx
1. Est Des 1.1 y 1.2 Fundamentos_1 (1).docx1. Est Des 1.1 y 1.2 Fundamentos_1 (1).docx
1. Est Des 1.1 y 1.2 Fundamentos_1 (1).docxMartha García
 
ESTRUCTURAS BÁSICAS DE PROGRAMACIÓN
ESTRUCTURAS BÁSICAS DE PROGRAMACIÓN ESTRUCTURAS BÁSICAS DE PROGRAMACIÓN
ESTRUCTURAS BÁSICAS DE PROGRAMACIÓN MelanyHerrera9
 
ESTRUCTURAS BÁSICAS DE PROGRAMACIÓN
ESTRUCTURAS BÁSICAS DE PROGRAMACIÓNESTRUCTURAS BÁSICAS DE PROGRAMACIÓN
ESTRUCTURAS BÁSICAS DE PROGRAMACIÓNsofiaurbano1
 
Estructuras básicas de programación
Estructuras básicas de programaciónEstructuras básicas de programación
Estructuras básicas de programaciónpilarrestrepo2
 
Trabajo de tecnologia finalizado
Trabajo de tecnologia finalizadoTrabajo de tecnologia finalizado
Trabajo de tecnologia finalizadoangelamyg
 
Trabajo de tecnologia
Trabajo de tecnologia Trabajo de tecnologia
Trabajo de tecnologia Melian2027
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docxBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docxJuancamiloZuiga4
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docxBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docxhellendiaz12
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docxBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docxhellendiaz12
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdfBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdfIsabellaLugo3
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdfBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdfElizabethPereaCastil
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docxBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docxhellendiaz12
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdfBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdfXcpBoy
 
Conceptos basicos de programacion y metodos estadisticos 11-4
Conceptos basicos de programacion y metodos estadisticos 11-4Conceptos basicos de programacion y metodos estadisticos 11-4
Conceptos basicos de programacion y metodos estadisticos 11-4HannaGravenhorst2
 
Organizacion de datos
Organizacion de datosOrganizacion de datos
Organizacion de datosJesusCM7
 
Estadistica 2
Estadistica 2Estadistica 2
Estadistica 2Mago016
 

Similar a Trabajo (20)

1. Est Des 1.1 y 1.2 Fundamentos_1 (1).docx
1. Est Des 1.1 y 1.2 Fundamentos_1 (1).docx1. Est Des 1.1 y 1.2 Fundamentos_1 (1).docx
1. Est Des 1.1 y 1.2 Fundamentos_1 (1).docx
 
ESTRUCTURAS BÁSICAS DE PROGRAMACIÓN
ESTRUCTURAS BÁSICAS DE PROGRAMACIÓN ESTRUCTURAS BÁSICAS DE PROGRAMACIÓN
ESTRUCTURAS BÁSICAS DE PROGRAMACIÓN
 
ESTRUCTURAS BÁSICAS DE PROGRAMACIÓN
ESTRUCTURAS BÁSICAS DE PROGRAMACIÓNESTRUCTURAS BÁSICAS DE PROGRAMACIÓN
ESTRUCTURAS BÁSICAS DE PROGRAMACIÓN
 
Estructuras básicas de programación
Estructuras básicas de programaciónEstructuras básicas de programación
Estructuras básicas de programación
 
Trabajo de tecnologia finalizado
Trabajo de tecnologia finalizadoTrabajo de tecnologia finalizado
Trabajo de tecnologia finalizado
 
Trabajo de tecnologia (1)
Trabajo de tecnologia (1)Trabajo de tecnologia (1)
Trabajo de tecnologia (1)
 
Trabajo de tecnologia (1)
Trabajo de tecnologia (1)Trabajo de tecnologia (1)
Trabajo de tecnologia (1)
 
Trabajo de tecnologia
Trabajo de tecnologia Trabajo de tecnologia
Trabajo de tecnologia
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docxBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docxBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docxBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdfBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdfBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docxBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdfBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
 
Conceptos basicos de programacion y metodos estadisticos 11-4
Conceptos basicos de programacion y metodos estadisticos 11-4Conceptos basicos de programacion y metodos estadisticos 11-4
Conceptos basicos de programacion y metodos estadisticos 11-4
 
Organizacion de datos
Organizacion de datosOrganizacion de datos
Organizacion de datos
 
Estadistica 2
Estadistica 2Estadistica 2
Estadistica 2
 
Capitulo i
Capitulo iCapitulo i
Capitulo i
 
Capitulo 1
Capitulo 1Capitulo 1
Capitulo 1
 

Último

Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudirTriptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudirluis809799
 
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfJC Díaz Herrera
 
Técnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalTécnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalIngrid459352
 
Partes y elementos de una iglesia básicos
Partes y elementos de una iglesia básicosPartes y elementos de una iglesia básicos
Partes y elementos de una iglesia básicosMarycarmenNuez4
 
Data Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosData Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosssuser948499
 
Posiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfPosiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfJC Díaz Herrera
 
Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaJoellyAlejandraRodrg
 
triptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciatriptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciaferg6120
 
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfLos artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfJC Díaz Herrera
 
Familias más ricas de países de AL en inicio de su hegemonía (2024).pdf
Familias más ricas de países de AL en inicio de su hegemonía (2024).pdfFamilias más ricas de países de AL en inicio de su hegemonía (2024).pdf
Familias más ricas de países de AL en inicio de su hegemonía (2024).pdfJC Díaz Herrera
 
Las familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfLas familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfJC Díaz Herrera
 
Posiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdfPosiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdfJC Díaz Herrera
 
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICACNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICAYOSHELINSARAIMAMANIS2
 
Evolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfEvolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfJC Díaz Herrera
 
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfReservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfJC Díaz Herrera
 
Posiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfPosiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfJC Díaz Herrera
 
PIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos añosPIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos añosEstefaniaRojas54
 
Tipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxTipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxMiguelPerz4
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticJamithGarcia1
 
PANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitecturaPANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitecturaRosaHurtado26
 

Último (20)

Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudirTriptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
 
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
 
Técnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalTécnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dental
 
Partes y elementos de una iglesia básicos
Partes y elementos de una iglesia básicosPartes y elementos de una iglesia básicos
Partes y elementos de una iglesia básicos
 
Data Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosData Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datos
 
Posiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfPosiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdf
 
Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problema
 
triptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciatriptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescencia
 
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfLos artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
 
Familias más ricas de países de AL en inicio de su hegemonía (2024).pdf
Familias más ricas de países de AL en inicio de su hegemonía (2024).pdfFamilias más ricas de países de AL en inicio de su hegemonía (2024).pdf
Familias más ricas de países de AL en inicio de su hegemonía (2024).pdf
 
Las familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfLas familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdf
 
Posiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdfPosiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdf
 
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICACNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
 
Evolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfEvolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdf
 
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfReservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
 
Posiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfPosiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdf
 
PIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos añosPIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos años
 
Tipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxTipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptx
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
 
PANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitecturaPANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitectura
 

Trabajo

  • 1. IESTP FRANCISCO DE PAULA GONZÁLES VIGIL CONTABILIDAD ESTADISTICA GENERAL “Trabajo encargado” Presentados por: 08 de octubre de 2017 TACNA – PERÚ 2017
  • 2. 2 ÍNDICE INTRODUCCIÓN.............................................................................................. 4 MARCO TEÓRICO ........................................................................................... 6 CAPÍTULO I: CARACTERÍSTICAS DE LOS CONJUNTOS DE DATOS.... 6 CAPÍTULO II: TIPOS DE DATOS................................................................... 8 2.1. Datos categóricos o cualitativos .............................................................. 8 2.1.1. Dos categorías (DICOTÓMICOS)................................................... 8 2.1.2. Más de dos categorías....................................................................... 9 2.2. Datos numéricos .................................................................................... 10 2.2.1. Discretos. ........................................................................................ 10 2.2.2. Continuos........................................................................................ 10 2.3. Otro tipo de datos .................................................................................. 11 2.3.1. Porcentajes...................................................................................... 11 2.3.2. Escalas analógicas visuales ............................................................ 11 2.3.3. Scores ............................................................................................. 12 2.3.4. Datos censurados ............................................................................ 13 CAPÍTULO III: GRÁFICOS ........................................................................... 15 3.1. Presentación de datos categóricos ......................................................... 15 3.1.1. Tabla de frecuencia......................................................................... 15 3.1.2. Gráfico de barras ............................................................................ 16 3.1.3. Gráfico de tortas ............................................................................. 17 3.2. Histograma ............................................................................................ 18
  • 3. 3 3.2.1. Tabla de frecuencia para datos numéricos...................................... 18 3.2.2. Construcción del histograma .......................................................... 19 3.2.3. Polígono de frecuencias.................................................................. 21 3.2.4. Distribución muestral y poblacional............................................... 22 DESARROLLO................................................................................................ 24 CONCLUSIONES............................................................................................ 33 REFERENCIAS ............................................................................................... 34
  • 4. 4 INTRODUCCIÓN El presente trabajo se refiere al tema de la Estadística, que se puede definir como la ciencia cuyo objetivo es reunir información para facilitar al hombre, el estudio de datos masivos de individuos, grupos, series de hechos, etc. y deducir de ello gracias al análisis de estos datos significados precisos o previsiones para el futuro. También se refiere a la importancia, métodos e importancia de la estadística ya que está relacionada con el estudio de proceso cuyo resultado es más o menos imprescindible y con la finalidad de obtener conclusiones para tomar decisiones razonables de acuerdo con tales observaciones La Estadística se ocupa de los métodos científicos para recolectar, organizar, resumir, presentar y analizar datos, así como de sacar conclusiones válidas y tomar decisiones con base en este análisis, así también realizar predicciones a cerca del conjunto del cual se han seleccionado dichos datos. El empleo cuidadoso de los métodos estadísticos permite obtener información precisa de los datos. ¿Qué es la estadística? ESTADÍSTICA es el arte de realizar inferencias y sacar conclusiones a partir de datos imperfectos. Los datos son generalmente imperfectos en el sentido que aun cuando posean información útil no nos cuentan la historia completa. Es necesario contar con métodos que nos permitan extraer información a partir de los datos observados para comprender mejor las situaciones que los mismos representan. Algunas técnicas de análisis de datos son sorprendentemente simples de aprender y usar más allá del hecho que la teoría matemática que las sustentan puede ser muy compleja. Todos, aún los estadísticos, tenemos problemas al enfrentarnos con listados de datos. Existen muchos métodos estadísticos cuyo propósito es ayudarnos a poner de manifiesto las características sobresalientes e interesantes de nuestros datos que pueden ser usados en casi todas las
  • 5. 5 áreas del conocimiento. Los métodos estadísticos pueden y deberían ser usados en todas las etapas de una investigación, desde el comienzo hasta el final. Existe el convencimiento de que la estadística trata con el ANÁLISIS DE DATOS (quizás porque esta es la contribución más visible de la estadística), pero este punto de vista excluye aspectos vitales relacionados con el DISEÑO DE LAS INVESTIGACIONES. Es importante tomar conciencia que la elección del método de análisis para un problema, se basa tanto en el tipo de datos disponibles como en la forma en que fueron recolectados. Áreas de la estadística Describiremos brevemente cada una de las áreas en que puede dividirse la estadística:  Diseño: Planeamiento y desarrollo de investigaciones.  Descripción: Resumen y exploración de datos.  Inferencia: Hacer predicciones o generalizaciones acerca de características de una población en base a la información de una muestra de la población.
  • 6. 6 MARCO TEÓRICO En este apartado presentaremos los distintos tipos de datos o variables que podemos encontrar en una investigación e comentaremos algunas estrategias para el manejo de datos. CARACTERÍSTICAS DE LOS CONJUNTOS DE DATOS En lo que sigue denominaremos:  Unidad de análisis o de observación al objeto bajo estudio. El mismo puede ser una persona, una familia, un país, una región, una institución o en general, cualquier objeto.  Variable a cualquier característica de la unidad de observación que interese registrar, la que en el momento de ser registrada puede ser transformada en un número.  Valor de una variable, observación o medición, al número que describe a la característica de interés en una unidad de observación particular.  CASO o REGISTRO al conjunto de mediciones realizadas sobre una unidad de observación. Consideremos el siguiente ejemplo: Sexo, lugar nacimiento, edad, presión arterial sistólica son variables que describen a una persona, su sexo, su lugar de nacimiento, su edad, etc. son los valores que estas variables toman para esta persona. Cuando se diseña una investigación, se intenta estudiar de qué modo una o más variables (variables independientes) afectan a una o más variables de interés (variables dependientes). Por ejemplo, en un experimento, el
  • 7. 7 investigador impone a los sujetos condiciones (variable independiente) y estudia el efecto de la misma sobre una característica del sujeto (aparición de una cierta característica, modificación de una condición, etc.). Un paso importante al comenzar a manejar un conjunto de datos es identificar cuántas variables se han registrado y cómo fueron registradas esas variables, lo que permitirá definir la estrategia de análisis. En el ejemplo anterior algunas de las variables son números y otras son letras que indican categorías. A continuación, se presenta una clasificación de los distintos tipos de datos que podemos encontrar. Debe notarse que distintos autores usan distintos criterios para clasificar datos por lo que presentaremos aquí un criterio que resulta útil desde el punto de vista de seleccionar el método de análisis estadístico más apropiado para los mismos.
  • 8. 8 TIPOS DE DATOS 2.1. Datos categóricos o cualitativos Las variables categóricas resultan de registrar la presencia de un atributo. Las categorías de una variable cualitativa deben ser definidas claramente durante la etapa de diseño de la investigación y deben ser mutuamente excluyentes y exhaustivas. Esto significa que cada unidad de observación debe ser clasificada sin ambigüedad en una y solo una de las categorías posibles y que existe una categoría para clasificar a todo individuo. En este sentido, es importante contemplar todas las posibilidades cuando se construyen variables categóricas, incluyendo una categoría tal como No sabe / No contesta, o No registrado u Otras, que asegura que todos los individuos observados serán clasificados con el criterio que define la variable. Los datos categóricos se clasifican en dicotómicos, nominales y ordinales. 2.1.1. Dos categorías (DICOTÓMICOS) El individuo o la unidad de observación puede ser asignada a solo una de dos categorías. En general, se trata de presencia - ausencia del atributo y es ventajoso asignar código 0 a la ausencia y 1 a la presencia. Ejemplos:  varón – mujer  embarazada - no embarazada  fumador - no fumador  hipertenso – normotenso Debe notarse que los ejemplos primero y segundo definitivamente cubren todas las categorías, mientras que tercero y cuarto son simplificaciones de categorías más complejas. En el tercero no está claro donde se asignan los ex-fumadores, en tanto que en
  • 9. 9 el cuarto fue necesario establecer un criterio de corte para armar una variable categórica a partir de una variable numérica. 2.1.2. Más de dos categorías Categorías nominales ⇒ No existe orden obvio entre las categorías. Ejemplos: país de origen, estado civil, diagnóstico. Categorías ordinales ⇒ Existe un orden natural entre las categorías. Ejemplos: 1) Tabaquismo: No fuma / ex-fumador / fuma ≤ 10 cigarrillos diarios / fuma > 10 cigarrillos diarios 2) Severidad de la patología: Ausente / leve / moderado / severo. Aun cuando los datos ordinales puedan ser codificados como números como en el caso de estadios de cáncer de mama de I a IV, no podemos decir que una paciente en el estadio IV tiene un pronóstico dos veces más grave que una paciente en estadio II, ni que la diferencia entre estadio I y II es la misma que entre estadio III y IV. En cambio, cuando se considera la edad de una persona, 40 años es el doble de 20 y una diferencia de 1 año es la misma a través de todo el rango de valores. Por esta razón, debemos ser cuidadosos al tratar variables cualitativas, especialmente cuando se han codificado numéricamente, ya que no pueden ser analizadas como números, sino que deben ser analizados como categorías. Es incorrecto presentar, por ejemplo, el estadio promedio de cáncer en un grupo de pacientes. En la práctica clínica se usan escalas para definir grados de un síntoma o de una enfermedad, tales como 0, +, ++, +++. Es importante definir operativamente este tipo de variables y estudiar su confiabilidad de modo de asegurar que dos observadores puestos frente al mismo paciente, lo clasificarán en la misma categoría.
  • 10. 10 2.2. Datos numéricos Una variable es numérica cuando el resultado de la observación o medición es un número. Se clasifican en: 2.2.1. Discretos. La variable sólo puede tomar un cierto conjunto de valores posibles. En general, aparecen por conteo. Ejemplo: número de miembros del hogar, número de intervenciones quirúrgicas, número de casos notificados de una cierta patología. 2.2.2. Continuos. Generalmente son el resultado de una medición que se expresa en unidades. Las mediciones pueden tomar teóricamente un conjunto infinito de valores posibles dentro de un rango. En la práctica los valores posibles de la variable están limitados por la precisión del método de medición o por el modo de registro. Ejemplos: altura, peso, pH, nivel de colesterol en sangre. La distinción entre datos discretos y continuos es importante para decidir qué método de análisis estadístico utilizar, ya que hay métodos que suponen que los datos son continuos. Consideremos, por ejemplo, la variable edad. Edad es continua, pero si se la registra en años resulta ser discreta. En estudios con adultos, en que la edad va de 20 a 70 años, por ejemplo, no hay problemas en tratarla como continua, ya que el número de valores posibles es muy grande. Pero en el caso de niños en edad preescolar, si la edad se registra en años debe tratarse como discreta, en tanto que si se la registra en meses puede tratarse como continua. Del mismo modo, la variable número de pulsaciones/min. es una variable discreta, pero se la trata como continúa debido al gran número de valores posibles. Los datos numéricos (discretos o continuos) pueden ser transformados en categóricos y ser
  • 11. 11 tratados como tales. Aunque esto es correcto no necesariamente es eficiente y siempre es preferible registrar el valor numérico de la medición, ya que esto permite:  Analizar la variable como numérica ⇒ Análisis estadístico más simple y más potente.  Armar nuevas categorías usando criterios diferentes. Sólo en casos especiales es preferible registrar datos numéricos como categóricos, por ejemplo, cuando se sabe que la medición es poco precisa (número de cigarrillos diarios, número de tazas de café en una semana). 2.3. Otro tipo de datos 2.3.1. Porcentajes Los porcentajes son el resultado de tomar el cociente entre dos cantidades. Ejemplos: reducción porcentual de la presión arterial luego de la aplicación de una droga, o peso corporal relativo (peso observado/peso deseable). En el primer caso las cantidades que forman el cociente se miden simultáneamente, en tanto que en el segundo caso el denominador es un valor estándar preexistente. Aunque los porcentajes pueden pensarse como variables continuas pueden causar problemas en el análisis, especialmente cuando pueden tomar valores mayores y menores que 100% (ejemplo: de peso corporal relativo) o cuando pueden dar valores negativos (ejemplo: reducción porcentual de la PA. En este último caso, un paciente con PAS en 150 mm Hg con un 20% de aumento en la PAS llegará a 180 mmHg, pero una posterior disminución del 20% lo llevará a 144 mm Hg). Se debe tener cuidado al analizar estos datos. 2.3.2. Escalas analógicas visuales Cuando se necesita que una persona indique el grado de alguna característica no medible, tal como satisfacción, dolor, bienestar, agrado, acuerdo, etc. una técnica que
  • 12. 12 permite obtener categorías ordinales es la escala analógica visual. Se presenta al encuestado una línea recta (generalmente de 10 cm.) cuyos extremos indican estados extremos y se les pide que marquen una posición en la recta que represente la percepción de su estado. Ejemplo. Interesa estimar grado de satisfacción con un tratamiento, se puede usar la siguiente escala. Estas escalas son muy útiles para valorar cambios en el mismo individuo. Aun cuando un puntaje de 3.7 no dice nada en sí mismo, una reducción de 2 puntos en un paciente si nos da información. Debe tenerse cuidado al tratar este tipo de datos ya que, a diferencia de los datos numéricos, aun cuando se registren como números la escala subyacente no necesariamente es la misma para dos sujetos distintos. 2.3.3. Scores Los scores son indicadores de la condición de un individuo basados en la observación de varias variables, generalmente categóricas. En clínica los scores se construyen en base a síntomas y signos, asignándole a cada uno de ellos un puntaje y calculando un puntaje total o score, que es un indicador de la condición del paciente. Un ejemplo es el score Apgar usado como indicador de pronóstico en el recién nacido. El recién nacido es evaluado en los minutos 0 y 5 de vida. Cada signo recibe un puntaje de 0 a 2, los cuales se suman y el score resultante es un número entre 0 a 10. Se
  • 13. 13 considera que un score ≥ 7 es de buen pronóstico, y que un Apgar ≤ 3 es de muy mal pronóstico. No es de interés aquí discutir la validez de este particular score, pero remarcaremos tres características que son comunes a este tipo de scores:  en la evaluación de cada signo está presente cierto nivel de subjetividad  al transformar las categorías en números, estamos valorando las diferencias entre 0 y 1 y entre 1 y 2 como equivalentes  los cinco signos son igualmente importantes en la construcción del score. Los scores deberían tratarse en el análisis tal como se los trata en la práctica, como criterios para definir categorías ordinales y no como variables numéricas. 2.3.4. Datos censurados Una observación censurada es aquella que no pudo ser medirla exactamente, pero que se sabe que está más allá de un cierto límite, es decir, conocemos una cota inferior o superior para el dato. Ejemplos.  Cuando se miden elementos traza, el nivel del elemento en la muestra puede ser menor que el límite de detección de la técnica. Este es un dato con censura izquierda ya que no se conoce el verdadero valor, pero si se conoce una cota superior.  Estudios de seguimiento en los que interesa el tiempo de supervivencia. En los pacientes que se mantienen vivos finalizar el estudio, se desconoce el tiempo real de supervivencia, pero se sabe que éste es mayor que el tiempo de permanencia en el estudio. El tiempo de supervivencia está censurado a derecha, sólo conocemos una cota inferior para el mismo.
  • 14. 14  Un estudio de seguimiento en que interesa estudiar el tiempo transcurrido hasta la recidiva de una patología. En aquellos sujetos que se pierden del estudio (por abandono, por muerte por otras causas o por cualquier otra razón) pero que sabemos que estuvieron libres de la patología mientras permanecieron en el estudio (hasta el último control), el dato de tiempo transcurrido hasta la recidiva está censurado a derecha. ¿Por qué es importante identificar el tipo de datos? Porque el tipo de datos DETERMINA el método de análisis apropiado y válido y cada método de análisis estadístico es específico para un cierto tipo de datos. La distinción más importante es entre datos numéricos y categóricos.
  • 15. 15 GRÁFICOS La estadística descriptiva o análisis exploratorio de datos ofrece modos de presentar y evaluar las características principales de los datos a través de tablas, gráficos y medidas resúmenes. En este capítulo presentaremos formas simples de resumir y representar gráficamente conjuntos de datos. El objetivo de construir gráficos es poder apreciar los datos como un todo e identificar sus características sobresalientes. El tipo de gráfico a seleccionar depende del tipo de variable que nos interese representar por esa razón distinguiremos en la presentación gráficos para variables categóricas y para variables numéricas. 3.1. Presentación de datos categóricos 3.1.1. Tabla de frecuencia El modo más simple de presentar datos categóricos es por medio de una tabla de frecuencias. Esta tabla indica el número de unidades de análisis que caen en cada una de las clases de la variable cualitativa. Consideremos los casos de meningitis notificados durante el año 2000 al SI.NA.VE (Argentina) clasificados según tipo de meningitis. Tabla 1: Notificacionesde meningitisen la Argentina,año 2000. Fuente:SI.NA.V.E. La primer y segunda columna de la Tabla 1 muestran las categorías de la variable (tipo de meningitis y la sigla correspondiente), la tercera columna presenta el número de casos de meningitis de cada tipo notificados, es decir la frecuencia o frecuencia absoluta, en tanto que la última columna presenta la frecuencia relativa o el porcentaje de casos
  • 16. 16 notificados de cada tipo de meningitis. Por ejemplo, la frecuencia relativa de la categoría BSA se calcula del siguiente modo: La representación gráfica de una distribución de frecuencias puede realizarse a través de un gráfico de barras o de un gráfico de tortas. A continuación, presentamos ambos métodos. 3.1.2. Gráfico de barras Este gráfico es útil para representar datos categóricos nominales u ordinales. A cada categoría o clase de la variable se le asocia una barra cuya altura representa la frecuencia o la frecuencia relativa de esa clase. Las barras difieren sólo en altura, no en ancho. La escala en el eje horizontal es arbitraria y en general, las barras se dibujan equiespaciadas, por esta razón este tipo de gráfico sólo debe usarse para variables categóricas. Es importante que el eje vertical comience en cero, de modo que no se exageren diferencias entre clases. En un gráfico de barras, así como en cualquier tipo de gráfico se debe indicar el número total de datos ya que el gráfico sólo muestra porcentajes o frecuencias relativas y la fuente de la que se obtuvieron los mismos. Figura 1: Notificaciones de meningitis en la Argentina. Año 2000. Fuente: SINAVE Cuando se desea comparar dos o más distribuciones cualitativas, el modo más sencillo de representación es el gráfico de barras combinadas. En la Figura 2 se presentan
  • 17. 17 las distribuciones de casos notificados de meningitis en Argentina para los años 1999 y 2000. Figura 2: Notificaciones de meningitis en la Argentina. 1999 y 2000. Fuente: SINAVE. 3.1.3. Gráfico de tortas En este gráfico, ampliamente utilizado, se representa la frecuencia relativa de cada categoría como una porción de un círculo, en la que el ángulo se corresponde con la frecuencia relativa correspondiente. Como en todo gráfico es importante indicar el número total de sujetos. Esta representación gráfica es muy simple y permite comparar la distribución de una variable categórica en 2 o más grupos. Las Figura 3 muestra los datos sobre meningitis presentados en la Figura 2. Figura 3:Notificaciones de meningitis en la Argentina. 1999 y 2000. Fuente: SINAVE.
  • 18. 18 3.2. Histograma El histograma es el más conocido de los gráficos para resumir un conjunto de datos numéricos y pretende responder a las mismas preguntas que un gráfico de tallo- hojas. Una virtud del gráfico de tallo-hojas es que retiene los valores de las observaciones, sin embargo, esta característica puede ser una desventaja para gran cantidad de datos. Construir manualmente un histograma es más laborioso que construir un gráfico de tallo hojas, pero la mayoría de los paquetes estadísticos producen histogramas. Para construir un histograma es necesario previamente construir una tabla de frecuencias. 3.2.1. Tabla de frecuencia para datos numéricos. A partir de una variable numérica es posible construir una distribución de frecuencias clasificando los datos en clases o categorías definidas por el investigador. Las clases o intervalos de clase de una tabla de frecuencias deben ser mutuamente excluyentes y exhaustivas, es decir, cada dato debe caer en una y sólo una clase y todos los datos deben tener una clase a la cual pertenecen. ¿Cómo construimos una tabla de frecuencias?  Se divide el rango total de los datos en clases o intervalos, los que no necesariamente deben tener la misma longitud.  Se cuenta el número de observaciones que cae en cada clase y se determina la frecuencia en cada clase.  Se calculan las frecuencias relativas, frecuencias acumuladas y frecuencias acumuladas relativas para cada intervalo. Notación:  frecuencia ⇒ fi = número de casos que cae en el intervalo i-ésimo  frecuencia relativa porcentual ⇒ fri = (fi / n)⋅100 = porcentaje de casos en el intervalo i-ésimo
  • 19. 19  frecuencia acumulada ⇒ fai = f1 + f2 + ... + fi = suma de las frecuencias desde la primera categoría hasta la categoría i-ésima.  frecuencia acumulada relativa porcentual ⇒ fari = (fai / n) ⋅100 = suma de las frecuencias relativas desde la primera categoría hasta la categoría i- ésima. La Tabla 2 muestra la tabla de frecuencias para los datos de tasas de neumonía cada 1000 habitantes presentados en la Tabla 1 (Año 2000, Argentina, Fuente: SINAVE). Se definieron intervalos de longitud igual a 1. Tabla 2:Distribución de frecuencias. Tasas de notificación de neumonías por provincia, Argentina 2000. 3.2.2. Construcción del histograma 3.2.2.1. Intervalos de clase todos de la misma longitud. Se trazan dos ejes de coordenadas rectangulares. En el eje horizontal se representan los valores de la variable y en el eje vertical una medida de frecuencia (frecuencia absoluta, frecuencia relativa o frecuencia relativa porcentual). Indicamos en el eje horizontal los límites de los intervalos de clase. Asociamos a cada clase una columna cuya base cubre el intervalo de clase y cuya altura indica cuantos datos “caen” se une intervalo a través de la frecuencia o la frecuencia relativa de la clase. El gráfico se
  • 20. 20 construye sin dejar espacio horizontal entre categorías, a menos que una clase esté vacía (es decir tenga altura cero). La Figura 4 presenta dos histogramas para los datos de tasas de neumonía de la Tabla 2. El primero se construyó con intervalos de longitud unitaria, mientras que el segundo con intervalos de longitud dos. Figura 4: Histogramas para los datosde tasas de neumonía notificadas por las provincia,Argentina,año 2000. ¿Qué características observamos en los gráficos anteriores?  La distribución es asimétrica, con mayor concentración de datos en tasas bajas y algunas provincias con tasas altas.  Se observan cuatro provincias con tasas de notificación de casos de neumonía más altas que el resto. Ellas son San Luis, Formosa, La Pampa y Chaco. Tal vez podríamos pensar en dos agrupamientos.  En el histograma de la izquierda observamos un único pico (o moda) pero en el de la derecha aparenta haber dos. Es importante remarcar que características del gráfico que no se mantienen al modificar levemente la definición de los intervalos de clase pueden ser consideradas como artificiales. El propósito de un histograma es mostrar la forma de la distribución de los datos, por lo que debemos estar atentos a los aspectos visuales de la representación. Como hemos
  • 21. 21 observado en el ejemplo, la forma del histograma depende del número de intervalos de clase que seleccionemos. ¿Cuántas clases usar? Existen distintas fórmulas que permiten calcular el número máximo de clases apropiado para un conjunto de datos, en base al rango de datos y al número de datos. La decisión, tal como ocurre en el gráfico de tallo-hojas, es una solución de compromiso. En general entre 6 y 15 clases resulta ser una buena elección. Muchos intervalos harán que caigan muy pocas observaciones en cada clase, por lo que las alturas de las barras variarán irregularmente. Muy pocas clases producen una gráfica más regular, pero demasiado agrupamiento puede hacer que se pierdan las características principales. ¿Cómo describimos la forma de una distribución? Los histogramas siguientes representan distintas formas posibles para la distribución de los datos. Los dos primeros muestran distribuciones aproximadamente simétricas, mientras que los dos últimos muestran distribuciones claramente asimétricas. 3.2.3. Polígono de frecuencias El polígono de frecuencias es similar al histograma en muchos aspectos, pero pretende dar una imagen aproximada de la “curva” definida por la distribución de la variable. Para construirlo se usan los mismos ejes que en el histograma. Se indica en la escala horizontal el punto medio de cada intervalo y en la escala vertical la escala densidad para ese intervalo, esto define pares (x, y) en el gráfico que se unen con tramos de líneas rectas. Se marcan además los puntos medios del intervalo que precede al primero y del que sigue al último.
  • 22. 22 Figura 5: Polígono de frecuencias. Notificaciones de casos de rubéola. Argentina, 2000. Figura 6: Tasas de rubéola cada 1000 habitantes. Argentina, 2000. Fuente: SINAVE 3.2.4. Distribución muestral y poblacional. Las distribuciones de frecuencia y los histogramas de una variable se aplican tanto a datos de una muestra como a datos de toda la población. En el primer caso hablamos de distribución muestral y en el segundo caso de distribución poblacional. En algún sentido la distribución muestral es una fotografía borrosa de la distribución poblacional. A medida que el tamaño de muestra aumenta la proporción de casos que cae en cada intervalo se parece más y más a la proporción poblacional. La fotografía se torna más y más definida y la distribución muestral luce similar a la distribución poblacional. Si la población contiene una gran cantidad de unidades de observación y la variable es continua es posible elegir intervalos tan delgados como deseemos para construir el histograma y además hacer crecer el tamaño de muestra indefinidamente. En
  • 23. 23 este caso, la forma del histograma se aproximará a una curva suave denomina distribución de la variable en la población. Figura 7: Histogramas para variables continuas. La Figura 7 muestra dos histogramas, el primero basado en una muestra de tamaño 100 y el segundo basado en una muestra de tamaño 1000, y una curva suave que representa la distribución poblacional. Aun cuando la variable sea discreta, una curva suave suele ser una buena aproximación para la distribución poblacional, especialmente cuando el número de valores posibles de la variable es grande. Comentaremos a continuación y a modo de cierre del tema de estadística descriptiva algunos problemas que aparecen al interpretar gráficos.
  • 24. 24 DESARROLLO 1. EJERICIO. Una compañía fabrica 15 productos básicos. La compañía consume registros del número de cada producto por mes, a fin de examinar los niveles relativos de producción. Los registros de productos fabricados en el último mes fueron. 9897 10052 10028 9722 9908 10125 7896 9356 10234 6789 a) Construir una distribución de frecuencias con k=4 intervalos de clase de igual longitud. i Intervalo Xi Conteo fi Fi hi Hi hi% Hi% 1 [6789-8289] 7539 III 3 3 0.20 0.20 20.00 20.00 2 [8289-9789] 9039 IIIII 5 8 0.33 0.53 33.33 53.33 3 [9789-11289] 10539 IIIIII 6 14 0.40 0.93 40.00 93.33 4 [11289-12789] 10239 I 1 15 0.07 1.00 6.67 100.00 15 100.00 Datos: n=15, k=4, R=12789-6789=6000 A=R/K, 6000/4=1500 Procedimientos: hi=fi/n h1=0.20 F1=f1=3 H1=h1=0.20 h2=0.33 F2=F1+f2=8 H2=H1+h2=0.53 hi%=hi*100% Hi%=Hi*100% h1%=0.20*100=20% H1%=0.20*100%=20% h2%=0.33*100=33.33% H2%=0.53*100%=53.33% b) Analiza las ubicaciones de los datos según las frecuencias relativas c) ¿Qué nivel de producción sobrepaso el 75% de sus productos al mes?
  • 25. 25 2. EJERCICIO La siguiente tabla muestra el número de jóvenes que obtuvieron los puntajes señalados en una prueba de ingreso. i Puntaje fi 1 [10-15> 10 2 [15-20> 15 3 [20-25> 28 4 [25-30> 20 5 [30-35> 17 Donde A es el porcentaje de jóvenes con puntaje mayor a 20. B es el porcentaje de jóvenes con puntaje mayor a 15. Halle A-B i Puntaje fi Fi hi Hi hi% Hi% 1 [10-15> 10 10 0.1111 0.1111 11.11 11.11 2 [15-20> 15 25 0.1667 0.2778 16.67 27.78 3 [20-25> 28 53 0.3111 0.5889 31.11 58.89 4 [25-30> 20 73 0.2222 0.8111 22.22 81.11 5 [30-35> 17 90 0.1889 1.0000 18.89 100.00 90 1.00 Datos: n=90 Procedimientos: hi=fi/n h1=0.1111 F1=f1=10 H1=h1=0.1111 h2=0.1667 F2=F1+f2=25 H2=H1+h2=0.2778 hi%=hi*100% Hi%=Hi*100% h1%=0.11*100=11.11% H1%=0.1111*100%=11.11% h2%=0.33*100=16.67% H2%=0.2778*100%=27.78% A=72.22%, B=11.11% 72.22% - 11.11% = 61.11%
  • 26. 26 3. EJERCICIO Completar el siguiente cuadro correspondiente a las edades de los asistentes a la FERITAC. i variable fi Fi hi Hi hi% Hi% 1 10-19 0.10 2 20-29 0.20 3 30-39 40 4 40-49 10 5 50-59 0.05 6 60-69 100 a) Completar la tabla e indique su procedimiento. i variable fi Fi hi Hi hi% Hi% 1 10-19 10 10 0.10 0.10 10 10 2 20-29 20 30 0.20 0.30 20 30 3 30-39 10 40 0.10 0.40 10 40 4 40-49 10 50 0.10 0.50 10 50 5 50-59 5 55 0.05 0.55 5 55 6 60-69 45 100 0.45 1.00 45 100 100 1.00 Datos: H1=h1=0.10 F6=100=n h1=f1/100 => 0.10*100=f1 => f1=10; F1=10 h2=0.20 => h2=f2/100 =>f2=20; F2=F1+f2=10+20=30; F3=40; F3=F2+f3 => 40=30+f3 => f3=10 b) ¿Cuál es la variable y que tipo? La variable es cuantitativa y de tipo continua y su variable es la edad c) ¿Cuántos asistentes tienen más de 29 años? 70 Asistentes d) ¿Qué porcentaje del total de asistentes poseen menos de 49 años? El 50%
  • 27. 27 e) realice sus gráficos correspondientes. Histograma Gráfico Poligonal 0 5 10 15 20 25 30 35 40 45 1 2 3 4 5 6 total total 0 5 10 15 20 25 30 35 40 45 50 0 10 20 30 40 50 60 70 80 Total Edades
  • 28. 28 4. EJERCICIO Los siguientes datos son velocidades (en Km/h) de 30 carros que pasaron por un punto de control de velocidades. Clasificar estos datos convenientes. Hallar las tablas de frecuencias. Graficar el histograma y el polígono de frecuencias correspondiente. 60 30 38 60 45 20 35 20 40 54 38 35 40 10 46 60 49 38 30 55 45 105 29 49 80 40 28 15 82 72 i I Xi fi Fi hi Hi hi% Hi% 1 10-26 18 4 4 0.1333 0.1333 13.33 13.33 2 26-42 34 12 16 0.4000 0.5333 40.00 53.33 3 42-58 50 7 23 0.2333 0.7667 23.33 76.67 4 58-74 66 4 27 0.1333 0.9000 13.33 90.00 5 74-90 82 2 29 0.0667 0.9667 6.67 96.67 6 90-106 98 1 30 0.0333 1.0000 3.33 100.00 30 1.00 Histograma 0 2 4 6 8 10 12 14 1 2 3 4 5 6 Cantidad Velocidades
  • 29. 29 Grafico Poligonal 5. EJERCICIO Los siguientes datos constituyen las vidas útiles en horas de una encuesta aleatoria de 50 bombillas de luz de 100 watts. a) Construya una distribución de frecuencias con ancho de clase iguales. i I Xi fi Fi hi Hi hi% Hi% 1 620-696 658 4 4 0.0667 0.0667 6.67 6.67 2 696-772 734 10 14 0.1667 0.2333 16.67 23.33 3 772-848 810 16 30 0.2667 0.5000 26.67 50.00 4 848-924 886 20 50 0.3333 0.8333 33.33 83.33 5 924-1000 962 4 54 0.0667 0.9000 6.67 90.00 6 1000-1076 1038 6 60 0.1000 1.0000 10.00 100.00 60 1.00 R=1076-620=456 K=1+3.32*log(60)=6,92 A=R/K= 456/6=76 0 2 4 6 8 10 12 14 18 34 50 66 82 98 Cantidades Velocidades
  • 30. 30 b) Trácese el polígono de frecuencias sobre un Histograma de intervalos de clases vs Frecuencias relativas. Histograma Grafica Poligonal 0 5 10 15 20 25 1 2 3 4 5 6 CantidaddeBombillas Vidas en Horas 0 5 10 15 20 25 658 734 810 886 962 1038 Cantidaddebombillas Promedio de vidas en Horas
  • 31. 31 6. EJERCICIO A un seminario de informática, asistieron 540 profesionales, de los cuales: 10 son ingenieros, 150 son médicos, 108 son abogados, 60 son profesores y el resto son profesionales de otras especialidades. a) construir la adecuada tabla de distribución de frecuencia. i I fi Fi hi Hi hi% Hi% G° 1 Ingenieros 180 180 0.3333 0.3333 33.33 33.33 120 2 Médicos 150 330 0.2778 0.6111 27.78 61.11 100 3 Abogados 108 438 0.2000 0.8111 20.00 81.11 72 4 Profesores 60 498 0.1111 0.9222 11.11 92.22 40 5 Otros 42 540 0.0778 1.0000 7.78 100.00 28 540 1.00 b) Porcentaje de profesores Son 11% c) diagrama de barras Histograma 0 20 40 60 80 100 120 140 160 180 200 1 2 3 4 5 TotalAsistentes Profesiones
  • 33. 33 CONCLUSIONES  Los conceptos antes mencionados han sido analizados e investigados de tal manera de hacer más fácil su comprensión y entendimientos ya que la estadística es la ciencia que trata de entender, organizar y tomar decisiones que estén de acuerdo con los análisis efectuados.  Es recomendable tomar en cuenta que la estadística es muy importante en la vida social y laboral del hombre ya que generaliza información.  Es una herramienta indispensable para la toma de decisiones.  También es ampliamente empleada para mostrar los aspectos cuantitativos de una situación
  • 34. 34 REFERENCIAS Celestino , G. (1998 ). Estadística descriptiva y probabilidades. Lima. Fernández chavesta, J., & Fernández chavesta, J. (s.f.). Estadística aplicada I. Lima.