BIOESTADISTICA
INTRODUCCION
Historia
Proviene del griego y significa ciencia del Estado
Origen de la ciencia estuvo ligado a la actividad del gobierno o del
poder político
En sus comienzos tenía como función registrar características o
acontecimientos de interés para los gobernantes de un territorio
concreto
Muchas teorías, principalmente de carácter biológico como las de
Mendel o Darwin tuvieron bases estadísticas.
Mayoría de métodos modernos se desarrollaron desde mediados
del siglo XIX y principios del XX (Pearson, Student, Fisher…),
principalmente para uso en biología, agricultura y genética
Actualmente y conjuntamente con el computador se convierte en
un instrumento de análisis poderoso para todo tipo de investigación
¿Ramas de la estadística?
La Estadística es la ciencia, con base matemática,
referente a la recolección, análisis e interpretación de
datos, que busca explicar condiciones regulares en
fenómenos de tipo aleatorio.
•Sistematización, recogida, ordenación y presentación
de los datos referentes a un fenómeno que presenta
variabilidad o incertidumbre para su estudio metódico, con
objeto de
deducir las leyes que rigen esos fenómenos,
•y poder de esa forma hacer previsiones sobre los
mismos, tomar decisiones u obtener conclusiones.
Descriptiva
Probabilidad
Inferencia
Áreas de Aplicación de la Estadística
• El uso de la Estadística es muy amplio. Resulta difícil
nombrar un área en la cual no se emplee.
• Los métodos estadísticos han encontrado aplicación
en:
– Gobierno
– Negocios
– Ciencias Sociales
– Ingeniería
– Ciencias Física y Naturales
– Control de Calidad
– Procesos de Manufactura
– Muchos otros campos de la actividad intelectual.
Esquema de las etapas de un
estudio estadístico
AREA DE INTERES DATOS
Tema de Investigación
-Antecedentes Previos
-Objetivos
-Preguntas de Investigación
-Posibles Hipótesis
-Unidad de Análisis
-Población
-Variables
ORGANIZAR Y RESUMIR
ESTADÍSTICA DESCRIPTIVA
(Tablas, Gráficos, Medidas
Descriptivas, etc.)
INTERPRETACIÓN
INFERENCIA ESTADÍSTICA
¿Población o Muestra?
CONCLUSIONES
Población
Muestra
Probabilidad
INFORMACIÓN
Operaciones Matemáticas
CONCEPTOS FUNDAMENTALES
POBLACION MUESTRA
INDIVIDUOS
Aporta información
VARIABLES
(características medible)
DATO (Valor uni,
bi o multi
variado):
NÚMERO
PALABRA
SIMBOLO
Parámetro Estadístico
CONCEPTOS FUNDAMENTALES: Población
Finita
incluye una cantidad limitada
contable de observaciones,
individuos o medidas. Siempre
que sea posible alcanzar
(contar) el número total de todas
las posibles mediciones, se
considera como finita la
población.
Infinita
incluye un gran conjunto de
observaciones o mediciones que
no pueden alcanzarse por
conteo. Al menos,
hipotéticamente, no existe límite
en cuanto al número de
observaciones que el
experimento puede generar.
Conjunto definido de TODOS los INDIVIDUOS (personas,
animales, objetos, plantas u organismos), de donde se observa
cierta característica. Se representa con la letra N.
CONCEPTOS FUNDAMENTALES: Muestra
Probabilístico
Todas las unidades de la población tienen
alguna probabilidad de ser seleccionadas.
Los elementos de la población se identifican
a través de un listado de elementos,
denominado marco muestral.
Para obtener una muestra se requiere de
datos previos acerca de la población.
Tipos:
Aleatorio simple
Sistemático
Estratificado
Conglomerado
Por etapas (combinado)
No probabilístico
Suponen un procedimiento de selección
informal y un poco arbitrario.
La elección de los elementos no depende de
la probabilidad, sino de causas relacionadas
con las características del investigador
Tipos:
Sujetos voluntarios
Expertos
Sujetos tipos
Por cuotas
Bola de nieve
Subconjunto de una población, que intenta reflejar las características de la
población lo mejor posible. Se representa con la letra n. Se genera a través de
algún tipo de muestreo
TIPOS DE VARIABLES
Variables Cuantitativas
Variable: Corresponde a la característica de la Unidad de Análisis, pueden ser clasificadas según
su naturaleza y el carácter de la escala en que son medidas.
Tipos de escala
Intervalo o Razón
DISCRETA
Variables Cualitativas
CONTINUA
Toma valores enteros
Ejemplos: Número de Hijos, Número de
enfermeras, Número de asignaturas
aprobadas en un semestre, etc.
Toma cualquier valor dentro de un intervalo
Ejemplos: Peso (escala de Razón); Estatura (escala de
Razón); Temperatura (Escala de Intervalo), etc.
Escala de Razón: Tiene un cero absoluto, el cambio de unidad de medida no
afecta la descripción de la variable. Escala Intervalo: Tiene un cero arbitrario y
al cambiar de unidad de medida cambia la descripción de la variable.
Unidad de Medida: Gramos o Kilos para la variable Peso; Grados C o F para Temperatura
ORDINALNOMINAL
Característica o cualidad
cuyas categorías no tienen
un orden preestablecido.
Ejemplos: Sexo, Deporte
Favorito, etc.
Característica o cualidad cuyas
categorías tienen un orden
preestablecido.
Ejemplos: Calificación (S, N, A);
Grado de Interés por un tema, etc.
CONCEPTOS FUNDAMENTALES: Variable
Tipos de
escala
POBLACIÓN CONTINUO DISCRETO NOMINAL ORDINAL
Ratas de
Laboratorio
Peso
edad
Número de
crías por rata
Color: negro,
blanco, gris
Calidad del
nido:
excelente,
bueno,
regular, malo
Automóviles Peso
longitud
Número de
defectos
Colores Tamaño
Algunas poblaciones pueden proporcionar
los cuatro tipos de datos
Fuentes de información
Registros rutinarios: Registro diario de las actividades u
operaciones de una organización.
Encuesta: Recopilar los datos mediante el uso de
cuestionarios o entrevistas.
Experimento: Procedimiento utilizado en la investigación
científica para obtener información que permita conocer el
comportamiento de algún proceso.
Investigación Documental: Procedimiento para obtener datos
mediante la consulta de información ya escrita y concentrada
en documentos que se localicen en libros o revistas en
bibliotecas, hemerotecas, o en centros virtuales.
Fuentes externas: Informes publicados o bancos de datos
PRESENTACION GRAFICA
0
1
2
3
4
5
6
7
Hombre Mujer
Las dos exponen ordenadamente la información recogida en una
muestra.
Los gráficos tienen que dar una visión general y no una imagen
detallada de un conjunto de datos.
Las presentaciones detalladas se reservan para las tablas.
Una tabla, gráfico o expresión matemática da las probabilidades que
una variable aleatoria tomaría dependiendo de los valores en que esta
clasificada, a esto se le llama distribución de la variable aleatoria.
Género Frec.
Hombre 4
Mujer 6
Las tablas estadísticas o de frecuencias y las representaciones gráficas son
dos maneras equivalentes de presentar la información.
FORMAS DE PRESENTACION DE LA
INFORMACION
Textual
Introduce las cifras o datos dentro del texto. Es
muy usada en artículos de periódicos o revistas y en
informes.
Semitabular También es muy usada en informes y revistas o
periódicos. En este caso, los datos o cifras se
presentan separados del texto, después de dar una
breve explicación sobre el tema.
Tabular
Cuadro No 1
TITULO
(nota introductoria)
Columna Matriz Encabezados
Columna Matriz Cuerpo Cuerpo
Nota al pie
FUENTE:
¿Qué son los datos?,
¿cuándo y dónde se
recolectaron, cómo y
bajo que criterios de
clasificación
http://www.contraloria.gob.pa/IN
EC/Publicaciones/Default.aspx
Tabla de Frecuencias: Tipo I
Cuando hay pocas observaciones e
inexistencia de valores repetidos, no se
precisan tablas. Solo hay que anotarlas
de manera ordenada en filas o
columnas, por ejemplo si tenemos una
las edades de 10 individuos que se han
atendido en el día:
42, 28, 27, 61, 31, 23, 50, 34, 32, 37
Tabla de Frecuencias: Tipo II
Cuando el tamaño de la población y/o
muestra es grande y el recorrido de la
variable es pequeño, hay valores de la
variable que se repiten Por ejemplo, si
en una encuesta comunitaria
preguntamos por el número de
integrantes del hogar obtendremos la
siguiente tabla:
Podemos observar que la variable
toma valores comprendidos entre 1
y 4, por lo que precisaremos una
tabla en la que resumamos estos
datos quedando la siguiente tabla:
Número de integrantes del hogar
Distribución de frecuencias
simples del número de
integrantes del hogar
Integrantes
del hogar
Número de
hogares
1 16
2 20
3 9
4 5
Total 50
2 1 2 2 1 2 4 2 1 1
2 3 2 1 1 1 3 4 2 2
2 2 1 2 1 1 1 3 2 2
3 2 3 1 2 4 2 1 4 1
1 3 4 3 2 2 2 1 3 3
Tabla de Frecuencias: Tipo III
Cuando el tamaño de la población y/o muestra y el
recorrido de la variable son grandes, será necesario
agrupar en intervalos los valores de la
variable. Ejemplo. Los datos representan los niveles
de una sustancia en sangre que se tomaron a 34
pacientes de una planta industrial, obteniéndose los
siguientes datos:
La variable estadística tiene un recorrido = max – min
= 16.5 – 7.8 = 8.7, por lo que sí queremos hacer una
tabla con estos datos tendremos que tomar intervalos.
Si se dispone de n datos muestrales, se suele usar la
regla de “Sturges”:
k = [3.3 * log n] + 1
Ejemplo: Para n = 34, usar:
k = [3, 3 · log 34] + 1 = [3. 3 * 1.5] + 1 = 4.9 + 1 = 6
clases
Amplitud = 8.7/ 6 = 1.45. Por lo que tomaremos
intervalos de amplitud 1.5
Con estas recomendaciones tendremos la siguiente
tabla:
Pacientes Nivel Pacientes Nivel
1 10,6 18 12,4
2 12,5 19 9,1
3 11,1 20 7,8
4 9,2 21 11,3
5 11,5 22 12,3
6 9,9 23 9,7
7 11,9 24 12,0
8 11,6 25 11,8
9 14,9 26 12,7
10 12,5 27 11,4
11 12,5 28 9,3
12 12,3 29 8,6
13 12,2 30 8,5
14 10,8 31 10,1
15 16,5 32 12,4
16 15,0 33 11,1
17 10,3 34 10,2
Clases Número de
pacientes
7.5 - 9.0 3
9.1 - 10.6 9
10.7 - 12.2 10
12.3 - 13.8 9
13.9 - 15.4 2
15.5 - 17.0 1
Total 34
NOTACIONES PARA REPRESENTAR
INTERVALOS
Tabla de Frecuencias
Para descubrir como se “reparten” los datos entre las clases,
consideraremos las frecuencias (que representan el número de
repeticiones de un dato u observación).. Los datos cuantitativos discretos
se organizan en tablas, llamadas Tablas de Distribución de
Frecuencias. tipos de frecuencias:
a)frecuencias absolutas: es el número de veces que aparece dicho
valor de la variable y se representa por fi.
b)frecuencias relativas: es el cociente entre la frecuencia absoluta y el
tamaño de la muestra. La denotaremos por fri
c) frecuencias absoluta acumulada: es el número de veces que ha
aparecido en la muestra un valor menor o igual que el de la variable y lo
representaremos por fa, se puede acumular, en la tabla estadística) en
orden ascendente (fa↑) o descendente (fa↓)
d) frecuencia relativa acumulada: al igual que en el caso anterior se
calcula como el cociente entre la frecuencia absoluta acumulada dividido
por el tamaño de la muestra (N) y la denotaremos por fra.
Tabla de Frecuencias
Consideremos el ejemplo de los niveles de cierta sustancia que presentaban en
sangre los 34 pacientes de una planta. La Tabla de Distribución de Frecuencia
será:
Niveles de
una
sustancia
en sangre
Frecuencia
absoluta Frecuencia
absoluta
acumulada
Frecuencia
relativa Frecuencia
relativa
acumulada
7.5 - 9.0 3 3 0.09 0.09
9.1 - 10.6 9 12 0.26 0.35
10.7 - 12.2 10 22 0.29 0.65
12.3 - 13.8 9 31 0.26 0.91
13.9 - 15.4 2 33 0.06 0.97
15.5 - 17.0 1 34 0.03 1.00
Total 34 1.00
Frecuencia / Total
Suma parcial de
las frecuencias
relativas
Suma de las
Frecuencias absolutas La suma debe ser 1
Suma parcial de las
frecuencias
Este valor
siempre es 1
+
+
Ejemplo 1
•¿Cuántos viviendas tienen
menos de 2 personas?
–frec. Viv. sin cuartos
+
frec. Viv. con 1 cuarto
= 419 + 255
= 674 viviendas
•¿Qué porcentaje de viviendas
tiene 6 personas o menos?
–97,3%
•¿Qué número de personas es
tal que al menos el 50% de
las viviendas tiene una
cantidad inferior o igual a ese
valor?
–2 personas
Número de
personas
Frecuencia
absoluta
Frecuencia
relativa
Frecuencia
relativa
acumulada
0 419 27,8 27,8
1 255 16,9 44,7
2 375 24,9 69,5
3 215 14,2 83,8
4 127 8,4 92,2
5 54 3,6 95,8
6 24 1,6 97,3
7 23 1,5 98,9
ocho + 17 1,1 100,0
Total 1509 100,0
Número de Personas por vivienda
>50%
Representaciones Gráficas
1. La información contenida en las tablas de frecuencias resulta
más accesible y fácil de interpretar si se representan por medio
de gráficos estadísticos.
2. Son de los medios más conocidos para la presentación y
análisis de la información estadística
3. Permiten una visión clara, rápida y atractiva, de manera que es
posible:
a. Explorar los datos.
b. Visualizar la forma de la distribución de los datos
c. Observar patrones o tendencias.
d. Agrupar información por factores.
e. Observar relaciones
f. Comparar distribuciones
g. Comparar medidas estadísticas
4. Debe constar de un sistema de coordenadas, escala, título de
escala, título, fuente y leyenda
5. No existen reglas estrictas para su elaboración
GRÁFICOS. Diagrama de barras
Se usa fundamentalmente para representar distribuciones de frecuencias
de una variable cualitativa o cuantitativa discreta ( o sea, no agrupada en
intervalos) y, ocasionalmente, en la representación de series cronológicas
o históricas. Uno de los ejes sirve para inscribir las frecuencias, ya sean
absolutas o relativas (%), y el otro para la escala de clasificación utilizada.
La orientación del gráfico puede ser: Vertical o Horizontal, pueden ser
comparativos o bi direccionales (Pirámides de población).
Se suelen usar para:
Comparar magnitudes de varias categorías.
Ver la evolución en el tiempo de una magnitud concreta
Está formado por rectángulos, cuyas bases corresponden con los intervalos de clase y sus áreas
son iguales o proporcionales a sus frecuencias. Este gráfico se usa para representar una
distribución de frecuencias de una variable cuantitativa continua. Habitualmente se representa la
frecuencia observada en el eje Y, y en el eje X la variable (los intervalos o las marcas de clase que
son los puntos medios de cada intervalo). No existe separación entre las barras
GRÁFICOS. Histograma
Construcción de un histograma
Paso 1.Determinar el rango de los datos. Rango es igual al dato mayor menos el dato menor.
Paso 2. Obtener todos los números de clases, existen varios criterios para determinar el número
de clases (o barras) -por ejemplo la regla de Sturgess-. Sin embargo ninguno de ellos es exacto.
Algunos autores recomiendan de cinco a quince clases, dependiendo de cómo estén los datos y
cuántos sean. Un criterio usado frecuentemente es que el número de clases debe ser
aproximadamente a la raíz cuadrada del número de datos. Por ejemplo, la raíz cuadrada de 30 (
número de artículos) es mayor que cinco, por lo que se seleccionan seis clases.
Paso 3. Establecer la longitud de clase: es igual al rango dividido por el número de clases.
Paso 4. Construir los intervalos de clases: Los intervalos resultan de dividir el rango de los datos
en relación al resultado del PASO 2 en intervalos iguales.
Paso 5. Graficar el histograma: En caso de que las clases sean todas de la misma amplitud, se
hace un gráfico de barras, las bases de las barras son los intervalos de clases y altura son la
frecuencia de las clases. Si se unen los puntos medios de la base superior de los rectángulos se
obtiene el polígono de frecuencias.
Es una línea poligonal que une los vértices superiores de las barras de un diagrama
de barras, o los puntos medios de las bases superiores de los rectángulos de un
histograma. Se utiliza, al igual que el histograma, para representar distribuciones de
frecuencias de variables cuantitativas continuas, pero como no se utilizan barras en
su confección sino segmentos de recta, de ahí el nombre de polígono. Habitualmente
se usa cuando se quiere mostrar en el mismo gráfico más de una distribución.
GRÁFICOS. Polígono de frecuencia
Es un polígono de frecuencia acumuladas, es decir, que en ella
se permite ver cuántas observaciones se encuentran por
encima o debajo de ciertos valores, en lugar de solo exhibir los
números asignados a cada intervalo. La ojiva apropiada para
información que presente frecuencias mayores que el dato que
se está comparando tendrá una pendiente negativa (hacia
abajo y a la derecha) y en cambio la que se asigna a valores
menores, tendrá una pendiente positiva.
GRÁFICOS. Ojiva
Se usa, fundamentalmente, para representar distribuciones de frecuencias relativas
(%) de una variable cualitativa o cuantitativa discreta. En este gráfico se hace
corresponder la medida del ángulo de cada sector con la frecuencia correspondiente a
la clase en cuestión. Si los 360º del círculo representan el 100 % de los datos
clasificados, a cada 1% le corresponderán 3,6º. Luego, para obtener el tamaño del
ángulo para un sector dado bastaría con multiplicar el por ciento correspondiente por
3,6º (por simple regla de tres).
GRÁFICOS. Diagrama de sectores o gráfico
circular
Son útiles cuando las categorías son pocas. Si el gráfico tuviera muchas variables,
no aportaría casi información y sería prácticamente incomprensible
Es un gráfico que usa puntos conectados por líneas para mostrar cómo
cambia el valor de algo (mientras pasa el tiempo o mientras algo más pasa).
Mayormente se utiliza para representar series de datos que han sido
recolectados en un tiempo específico. Los datos se representan en una
gráfica en intervalos de tiempo y se dibuja una línea conectando los puntos
resultantes.
GRÁFICOS. Gráfico de líneas
Los pictogramas son gráficos similares a los gráficos de barras, pero
empleando un dibujo en una determinada escala para expresar la unidad de
medida de los datos. Se utiliza un dibujo relacionado con el tema, para
representar cierta cantidad de frecuencias. Este tipo de gráfica atrae la
atención por los dibujos, pero la desventaja es que se lee en forma
aproximada.
GRÁFICOS. Pictogramas
Gráfico de Tallo y Hoja
Es un diagrama de gran utilidad para representar un conjunto de datos cuantitativos, este tipo de
representación presenta similitudes con el histograma (sólo que conserva la información) en
cuanto que proporciona información del recorrido de la distribución de datos en estudio, muestra
la ubicación de la mayor concentración de mediciones y revela la presencia o ausencia de
simetría.
¿Cómo construir el diagrama de tallo y hojas?
1. Señalar el título.
2. Se debe dividir cada medición en dos partes, la primera se llama tallo y la segundahojas.
3. El tallo se forma con uno o más dígitos iniciales de la medición, y las hojas se forman con
uno o más de los dígitos restantes.
4. La cantidad de tallos preferiblemente deben ser mayores o iguales a 5 y menores o iguales
a 20.
Los tallos forman una columna ordenada de menor a mayor del lado izquierdo del diagrama.
Registrar las hojas por cada observación junto al valor correspondiente del tallo.
5. Indicar fuente.
Recomendaciones:
 No es aconsejable en informes anuales o en algún tipo de medios de difusión para un
público en general
 Muchos de los procedimientos estadísticos que se desarrollan suponen que la variable
independiente estudiada posea al menos una distribución aproximadamente normal, por lo
que este gráfico dan una idea de la localización de los datos y de la forma de la distribución
 funciona bien para los conjuntos de datos que no tienen una dispersión muy grande.
Gráfico de Tallo y Hoja. Ejemplo
Ej.: 50, 57, 59, 60, 65, 66, 67, 68, 69, 69, 70, 70, 71, 71, 72, 72, 73, 74, 74, 75,
76, 77, 77, 78, 78, 79, 79, 79, 80, 80, 81, 82, 83, 83, 83, 84, 84, 84, 85, 86, 90,
91, 92, 93, 93, 94, 95, 97, 101, 102
5 : 079
6 : 0567899
7 : 001122344567788999
8 : 001233344456
9 : 01233457
10 : 12
En este ejemplo el “Tallo y Hoja” es asimétrico a la
izquierda, no tiene mucha variabilidad ni “datos perdidos o
alejados”.
Ramas Hojas
DIAGRAMA DE PARETO
Es una representación gráfica que permite realizar un análisis causal a fin de
localizar el problema principal y las causas más importante de éste (ventas, costos,
seguridad, etc.). También se conoce como “Diagrama ABC” o “Diagrama 20-80”.
Su fundamento parte de considerar que un pequeño porcentaje de las causas, el
20%, producen la mayoría de los efectos, el 80%. Se trataría pues de identificar ese
pequeño porcentaje de causas “vitales” para actuar prioritariamente sobre él.
Pasos en su construcción:
1. Identificar el problema o mejora que se quiere realizar
2. Identificar los factores que están incidiendo en el problema
3. Definir el periodo de recolección (días, semanas, meses)
4. Recolectar y ordenar los datos
5. Calcular los porcentajes para cada factor
6. Calcular los porcentajes acumulados
7. Identificar los ejes. En el eje horizontal se anotan los factores de izquierda a
derecha , en orden decreciente en cuanto a su frecuencia. El eje vertical izquierdo
se gradúa de forma tal que sirva para mostrar el numero de datos observados (la
frecuencia de cada factor), el eje vertical derecho mostrara el porcentaje relativo
acumulado.
8. Trazar las barras
9. Decidir los factores a considerar
DIAGRAMA DE PARETO. Ejemplo
Supongan que se esta analizando las causas de las complicaciones de la cirugía
torácica pues se desea disminuir la incidencia. Se registran 100 complicaciones
que presentaron 75 pacientes.
Tipo de
complicación
Número % % Acum
Fuga aérea 37 37.0 37.0
Fibrilación
auricular
25 25.0 62.0
Insuficiencia
respiratoria
12 12.0 74.0
Neumonía 6 6.0 80.0
Complicaciones
cardiovasculares
6 6.0 86.0
Hemotoráx 3 3.0 89.0
Empiema 3 3.0 92.0
Otras
complicaciones
8 8.0 100.0
Total 100
El gráfico muestra de manera muy gráfica que al focalizar solucionar las primeras
tres causas de morbilidad, se cubriría el 74% de las complicaciones observadas.
Podría empezarse por cada una a la vez y ver de qué manera se puede reducir su
incidencia.
Niveles de Medición y Procedimientos
Estadísticos

Bioestadistica introduccion

  • 1.
  • 2.
    Historia Proviene del griegoy significa ciencia del Estado Origen de la ciencia estuvo ligado a la actividad del gobierno o del poder político En sus comienzos tenía como función registrar características o acontecimientos de interés para los gobernantes de un territorio concreto Muchas teorías, principalmente de carácter biológico como las de Mendel o Darwin tuvieron bases estadísticas. Mayoría de métodos modernos se desarrollaron desde mediados del siglo XIX y principios del XX (Pearson, Student, Fisher…), principalmente para uso en biología, agricultura y genética Actualmente y conjuntamente con el computador se convierte en un instrumento de análisis poderoso para todo tipo de investigación
  • 3.
    ¿Ramas de laestadística? La Estadística es la ciencia, con base matemática, referente a la recolección, análisis e interpretación de datos, que busca explicar condiciones regulares en fenómenos de tipo aleatorio. •Sistematización, recogida, ordenación y presentación de los datos referentes a un fenómeno que presenta variabilidad o incertidumbre para su estudio metódico, con objeto de deducir las leyes que rigen esos fenómenos, •y poder de esa forma hacer previsiones sobre los mismos, tomar decisiones u obtener conclusiones. Descriptiva Probabilidad Inferencia
  • 4.
    Áreas de Aplicaciónde la Estadística • El uso de la Estadística es muy amplio. Resulta difícil nombrar un área en la cual no se emplee. • Los métodos estadísticos han encontrado aplicación en: – Gobierno – Negocios – Ciencias Sociales – Ingeniería – Ciencias Física y Naturales – Control de Calidad – Procesos de Manufactura – Muchos otros campos de la actividad intelectual.
  • 5.
    Esquema de lasetapas de un estudio estadístico AREA DE INTERES DATOS Tema de Investigación -Antecedentes Previos -Objetivos -Preguntas de Investigación -Posibles Hipótesis -Unidad de Análisis -Población -Variables ORGANIZAR Y RESUMIR ESTADÍSTICA DESCRIPTIVA (Tablas, Gráficos, Medidas Descriptivas, etc.) INTERPRETACIÓN INFERENCIA ESTADÍSTICA ¿Población o Muestra? CONCLUSIONES Población Muestra Probabilidad INFORMACIÓN
  • 6.
  • 7.
    CONCEPTOS FUNDAMENTALES POBLACION MUESTRA INDIVIDUOS Aportainformación VARIABLES (características medible) DATO (Valor uni, bi o multi variado): NÚMERO PALABRA SIMBOLO Parámetro Estadístico
  • 8.
    CONCEPTOS FUNDAMENTALES: Población Finita incluyeuna cantidad limitada contable de observaciones, individuos o medidas. Siempre que sea posible alcanzar (contar) el número total de todas las posibles mediciones, se considera como finita la población. Infinita incluye un gran conjunto de observaciones o mediciones que no pueden alcanzarse por conteo. Al menos, hipotéticamente, no existe límite en cuanto al número de observaciones que el experimento puede generar. Conjunto definido de TODOS los INDIVIDUOS (personas, animales, objetos, plantas u organismos), de donde se observa cierta característica. Se representa con la letra N.
  • 9.
    CONCEPTOS FUNDAMENTALES: Muestra Probabilístico Todaslas unidades de la población tienen alguna probabilidad de ser seleccionadas. Los elementos de la población se identifican a través de un listado de elementos, denominado marco muestral. Para obtener una muestra se requiere de datos previos acerca de la población. Tipos: Aleatorio simple Sistemático Estratificado Conglomerado Por etapas (combinado) No probabilístico Suponen un procedimiento de selección informal y un poco arbitrario. La elección de los elementos no depende de la probabilidad, sino de causas relacionadas con las características del investigador Tipos: Sujetos voluntarios Expertos Sujetos tipos Por cuotas Bola de nieve Subconjunto de una población, que intenta reflejar las características de la población lo mejor posible. Se representa con la letra n. Se genera a través de algún tipo de muestreo
  • 10.
    TIPOS DE VARIABLES VariablesCuantitativas Variable: Corresponde a la característica de la Unidad de Análisis, pueden ser clasificadas según su naturaleza y el carácter de la escala en que son medidas. Tipos de escala Intervalo o Razón DISCRETA Variables Cualitativas CONTINUA Toma valores enteros Ejemplos: Número de Hijos, Número de enfermeras, Número de asignaturas aprobadas en un semestre, etc. Toma cualquier valor dentro de un intervalo Ejemplos: Peso (escala de Razón); Estatura (escala de Razón); Temperatura (Escala de Intervalo), etc. Escala de Razón: Tiene un cero absoluto, el cambio de unidad de medida no afecta la descripción de la variable. Escala Intervalo: Tiene un cero arbitrario y al cambiar de unidad de medida cambia la descripción de la variable. Unidad de Medida: Gramos o Kilos para la variable Peso; Grados C o F para Temperatura ORDINALNOMINAL Característica o cualidad cuyas categorías no tienen un orden preestablecido. Ejemplos: Sexo, Deporte Favorito, etc. Característica o cualidad cuyas categorías tienen un orden preestablecido. Ejemplos: Calificación (S, N, A); Grado de Interés por un tema, etc. CONCEPTOS FUNDAMENTALES: Variable Tipos de escala
  • 11.
    POBLACIÓN CONTINUO DISCRETONOMINAL ORDINAL Ratas de Laboratorio Peso edad Número de crías por rata Color: negro, blanco, gris Calidad del nido: excelente, bueno, regular, malo Automóviles Peso longitud Número de defectos Colores Tamaño Algunas poblaciones pueden proporcionar los cuatro tipos de datos
  • 12.
    Fuentes de información Registrosrutinarios: Registro diario de las actividades u operaciones de una organización. Encuesta: Recopilar los datos mediante el uso de cuestionarios o entrevistas. Experimento: Procedimiento utilizado en la investigación científica para obtener información que permita conocer el comportamiento de algún proceso. Investigación Documental: Procedimiento para obtener datos mediante la consulta de información ya escrita y concentrada en documentos que se localicen en libros o revistas en bibliotecas, hemerotecas, o en centros virtuales. Fuentes externas: Informes publicados o bancos de datos
  • 13.
    PRESENTACION GRAFICA 0 1 2 3 4 5 6 7 Hombre Mujer Lasdos exponen ordenadamente la información recogida en una muestra. Los gráficos tienen que dar una visión general y no una imagen detallada de un conjunto de datos. Las presentaciones detalladas se reservan para las tablas. Una tabla, gráfico o expresión matemática da las probabilidades que una variable aleatoria tomaría dependiendo de los valores en que esta clasificada, a esto se le llama distribución de la variable aleatoria. Género Frec. Hombre 4 Mujer 6 Las tablas estadísticas o de frecuencias y las representaciones gráficas son dos maneras equivalentes de presentar la información.
  • 14.
    FORMAS DE PRESENTACIONDE LA INFORMACION Textual Introduce las cifras o datos dentro del texto. Es muy usada en artículos de periódicos o revistas y en informes. Semitabular También es muy usada en informes y revistas o periódicos. En este caso, los datos o cifras se presentan separados del texto, después de dar una breve explicación sobre el tema. Tabular Cuadro No 1 TITULO (nota introductoria) Columna Matriz Encabezados Columna Matriz Cuerpo Cuerpo Nota al pie FUENTE: ¿Qué son los datos?, ¿cuándo y dónde se recolectaron, cómo y bajo que criterios de clasificación
  • 15.
  • 16.
    Tabla de Frecuencias:Tipo I Cuando hay pocas observaciones e inexistencia de valores repetidos, no se precisan tablas. Solo hay que anotarlas de manera ordenada en filas o columnas, por ejemplo si tenemos una las edades de 10 individuos que se han atendido en el día: 42, 28, 27, 61, 31, 23, 50, 34, 32, 37
  • 17.
    Tabla de Frecuencias:Tipo II Cuando el tamaño de la población y/o muestra es grande y el recorrido de la variable es pequeño, hay valores de la variable que se repiten Por ejemplo, si en una encuesta comunitaria preguntamos por el número de integrantes del hogar obtendremos la siguiente tabla: Podemos observar que la variable toma valores comprendidos entre 1 y 4, por lo que precisaremos una tabla en la que resumamos estos datos quedando la siguiente tabla: Número de integrantes del hogar Distribución de frecuencias simples del número de integrantes del hogar Integrantes del hogar Número de hogares 1 16 2 20 3 9 4 5 Total 50 2 1 2 2 1 2 4 2 1 1 2 3 2 1 1 1 3 4 2 2 2 2 1 2 1 1 1 3 2 2 3 2 3 1 2 4 2 1 4 1 1 3 4 3 2 2 2 1 3 3
  • 18.
    Tabla de Frecuencias:Tipo III Cuando el tamaño de la población y/o muestra y el recorrido de la variable son grandes, será necesario agrupar en intervalos los valores de la variable. Ejemplo. Los datos representan los niveles de una sustancia en sangre que se tomaron a 34 pacientes de una planta industrial, obteniéndose los siguientes datos: La variable estadística tiene un recorrido = max – min = 16.5 – 7.8 = 8.7, por lo que sí queremos hacer una tabla con estos datos tendremos que tomar intervalos. Si se dispone de n datos muestrales, se suele usar la regla de “Sturges”: k = [3.3 * log n] + 1 Ejemplo: Para n = 34, usar: k = [3, 3 · log 34] + 1 = [3. 3 * 1.5] + 1 = 4.9 + 1 = 6 clases Amplitud = 8.7/ 6 = 1.45. Por lo que tomaremos intervalos de amplitud 1.5 Con estas recomendaciones tendremos la siguiente tabla: Pacientes Nivel Pacientes Nivel 1 10,6 18 12,4 2 12,5 19 9,1 3 11,1 20 7,8 4 9,2 21 11,3 5 11,5 22 12,3 6 9,9 23 9,7 7 11,9 24 12,0 8 11,6 25 11,8 9 14,9 26 12,7 10 12,5 27 11,4 11 12,5 28 9,3 12 12,3 29 8,6 13 12,2 30 8,5 14 10,8 31 10,1 15 16,5 32 12,4 16 15,0 33 11,1 17 10,3 34 10,2 Clases Número de pacientes 7.5 - 9.0 3 9.1 - 10.6 9 10.7 - 12.2 10 12.3 - 13.8 9 13.9 - 15.4 2 15.5 - 17.0 1 Total 34
  • 19.
  • 20.
    Tabla de Frecuencias Paradescubrir como se “reparten” los datos entre las clases, consideraremos las frecuencias (que representan el número de repeticiones de un dato u observación).. Los datos cuantitativos discretos se organizan en tablas, llamadas Tablas de Distribución de Frecuencias. tipos de frecuencias: a)frecuencias absolutas: es el número de veces que aparece dicho valor de la variable y se representa por fi. b)frecuencias relativas: es el cociente entre la frecuencia absoluta y el tamaño de la muestra. La denotaremos por fri c) frecuencias absoluta acumulada: es el número de veces que ha aparecido en la muestra un valor menor o igual que el de la variable y lo representaremos por fa, se puede acumular, en la tabla estadística) en orden ascendente (fa↑) o descendente (fa↓) d) frecuencia relativa acumulada: al igual que en el caso anterior se calcula como el cociente entre la frecuencia absoluta acumulada dividido por el tamaño de la muestra (N) y la denotaremos por fra.
  • 21.
    Tabla de Frecuencias Consideremosel ejemplo de los niveles de cierta sustancia que presentaban en sangre los 34 pacientes de una planta. La Tabla de Distribución de Frecuencia será: Niveles de una sustancia en sangre Frecuencia absoluta Frecuencia absoluta acumulada Frecuencia relativa Frecuencia relativa acumulada 7.5 - 9.0 3 3 0.09 0.09 9.1 - 10.6 9 12 0.26 0.35 10.7 - 12.2 10 22 0.29 0.65 12.3 - 13.8 9 31 0.26 0.91 13.9 - 15.4 2 33 0.06 0.97 15.5 - 17.0 1 34 0.03 1.00 Total 34 1.00 Frecuencia / Total Suma parcial de las frecuencias relativas Suma de las Frecuencias absolutas La suma debe ser 1 Suma parcial de las frecuencias Este valor siempre es 1 + +
  • 22.
    Ejemplo 1 •¿Cuántos viviendastienen menos de 2 personas? –frec. Viv. sin cuartos + frec. Viv. con 1 cuarto = 419 + 255 = 674 viviendas •¿Qué porcentaje de viviendas tiene 6 personas o menos? –97,3% •¿Qué número de personas es tal que al menos el 50% de las viviendas tiene una cantidad inferior o igual a ese valor? –2 personas Número de personas Frecuencia absoluta Frecuencia relativa Frecuencia relativa acumulada 0 419 27,8 27,8 1 255 16,9 44,7 2 375 24,9 69,5 3 215 14,2 83,8 4 127 8,4 92,2 5 54 3,6 95,8 6 24 1,6 97,3 7 23 1,5 98,9 ocho + 17 1,1 100,0 Total 1509 100,0 Número de Personas por vivienda >50%
  • 23.
    Representaciones Gráficas 1. Lainformación contenida en las tablas de frecuencias resulta más accesible y fácil de interpretar si se representan por medio de gráficos estadísticos. 2. Son de los medios más conocidos para la presentación y análisis de la información estadística 3. Permiten una visión clara, rápida y atractiva, de manera que es posible: a. Explorar los datos. b. Visualizar la forma de la distribución de los datos c. Observar patrones o tendencias. d. Agrupar información por factores. e. Observar relaciones f. Comparar distribuciones g. Comparar medidas estadísticas 4. Debe constar de un sistema de coordenadas, escala, título de escala, título, fuente y leyenda 5. No existen reglas estrictas para su elaboración
  • 24.
    GRÁFICOS. Diagrama debarras Se usa fundamentalmente para representar distribuciones de frecuencias de una variable cualitativa o cuantitativa discreta ( o sea, no agrupada en intervalos) y, ocasionalmente, en la representación de series cronológicas o históricas. Uno de los ejes sirve para inscribir las frecuencias, ya sean absolutas o relativas (%), y el otro para la escala de clasificación utilizada. La orientación del gráfico puede ser: Vertical o Horizontal, pueden ser comparativos o bi direccionales (Pirámides de población). Se suelen usar para: Comparar magnitudes de varias categorías. Ver la evolución en el tiempo de una magnitud concreta
  • 25.
    Está formado porrectángulos, cuyas bases corresponden con los intervalos de clase y sus áreas son iguales o proporcionales a sus frecuencias. Este gráfico se usa para representar una distribución de frecuencias de una variable cuantitativa continua. Habitualmente se representa la frecuencia observada en el eje Y, y en el eje X la variable (los intervalos o las marcas de clase que son los puntos medios de cada intervalo). No existe separación entre las barras GRÁFICOS. Histograma Construcción de un histograma Paso 1.Determinar el rango de los datos. Rango es igual al dato mayor menos el dato menor. Paso 2. Obtener todos los números de clases, existen varios criterios para determinar el número de clases (o barras) -por ejemplo la regla de Sturgess-. Sin embargo ninguno de ellos es exacto. Algunos autores recomiendan de cinco a quince clases, dependiendo de cómo estén los datos y cuántos sean. Un criterio usado frecuentemente es que el número de clases debe ser aproximadamente a la raíz cuadrada del número de datos. Por ejemplo, la raíz cuadrada de 30 ( número de artículos) es mayor que cinco, por lo que se seleccionan seis clases. Paso 3. Establecer la longitud de clase: es igual al rango dividido por el número de clases. Paso 4. Construir los intervalos de clases: Los intervalos resultan de dividir el rango de los datos en relación al resultado del PASO 2 en intervalos iguales. Paso 5. Graficar el histograma: En caso de que las clases sean todas de la misma amplitud, se hace un gráfico de barras, las bases de las barras son los intervalos de clases y altura son la frecuencia de las clases. Si se unen los puntos medios de la base superior de los rectángulos se obtiene el polígono de frecuencias.
  • 26.
    Es una líneapoligonal que une los vértices superiores de las barras de un diagrama de barras, o los puntos medios de las bases superiores de los rectángulos de un histograma. Se utiliza, al igual que el histograma, para representar distribuciones de frecuencias de variables cuantitativas continuas, pero como no se utilizan barras en su confección sino segmentos de recta, de ahí el nombre de polígono. Habitualmente se usa cuando se quiere mostrar en el mismo gráfico más de una distribución. GRÁFICOS. Polígono de frecuencia
  • 27.
    Es un polígonode frecuencia acumuladas, es decir, que en ella se permite ver cuántas observaciones se encuentran por encima o debajo de ciertos valores, en lugar de solo exhibir los números asignados a cada intervalo. La ojiva apropiada para información que presente frecuencias mayores que el dato que se está comparando tendrá una pendiente negativa (hacia abajo y a la derecha) y en cambio la que se asigna a valores menores, tendrá una pendiente positiva. GRÁFICOS. Ojiva
  • 28.
    Se usa, fundamentalmente,para representar distribuciones de frecuencias relativas (%) de una variable cualitativa o cuantitativa discreta. En este gráfico se hace corresponder la medida del ángulo de cada sector con la frecuencia correspondiente a la clase en cuestión. Si los 360º del círculo representan el 100 % de los datos clasificados, a cada 1% le corresponderán 3,6º. Luego, para obtener el tamaño del ángulo para un sector dado bastaría con multiplicar el por ciento correspondiente por 3,6º (por simple regla de tres). GRÁFICOS. Diagrama de sectores o gráfico circular Son útiles cuando las categorías son pocas. Si el gráfico tuviera muchas variables, no aportaría casi información y sería prácticamente incomprensible
  • 29.
    Es un gráficoque usa puntos conectados por líneas para mostrar cómo cambia el valor de algo (mientras pasa el tiempo o mientras algo más pasa). Mayormente se utiliza para representar series de datos que han sido recolectados en un tiempo específico. Los datos se representan en una gráfica en intervalos de tiempo y se dibuja una línea conectando los puntos resultantes. GRÁFICOS. Gráfico de líneas
  • 30.
    Los pictogramas songráficos similares a los gráficos de barras, pero empleando un dibujo en una determinada escala para expresar la unidad de medida de los datos. Se utiliza un dibujo relacionado con el tema, para representar cierta cantidad de frecuencias. Este tipo de gráfica atrae la atención por los dibujos, pero la desventaja es que se lee en forma aproximada. GRÁFICOS. Pictogramas
  • 31.
    Gráfico de Talloy Hoja Es un diagrama de gran utilidad para representar un conjunto de datos cuantitativos, este tipo de representación presenta similitudes con el histograma (sólo que conserva la información) en cuanto que proporciona información del recorrido de la distribución de datos en estudio, muestra la ubicación de la mayor concentración de mediciones y revela la presencia o ausencia de simetría. ¿Cómo construir el diagrama de tallo y hojas? 1. Señalar el título. 2. Se debe dividir cada medición en dos partes, la primera se llama tallo y la segundahojas. 3. El tallo se forma con uno o más dígitos iniciales de la medición, y las hojas se forman con uno o más de los dígitos restantes. 4. La cantidad de tallos preferiblemente deben ser mayores o iguales a 5 y menores o iguales a 20. Los tallos forman una columna ordenada de menor a mayor del lado izquierdo del diagrama. Registrar las hojas por cada observación junto al valor correspondiente del tallo. 5. Indicar fuente. Recomendaciones:  No es aconsejable en informes anuales o en algún tipo de medios de difusión para un público en general  Muchos de los procedimientos estadísticos que se desarrollan suponen que la variable independiente estudiada posea al menos una distribución aproximadamente normal, por lo que este gráfico dan una idea de la localización de los datos y de la forma de la distribución  funciona bien para los conjuntos de datos que no tienen una dispersión muy grande.
  • 32.
    Gráfico de Talloy Hoja. Ejemplo Ej.: 50, 57, 59, 60, 65, 66, 67, 68, 69, 69, 70, 70, 71, 71, 72, 72, 73, 74, 74, 75, 76, 77, 77, 78, 78, 79, 79, 79, 80, 80, 81, 82, 83, 83, 83, 84, 84, 84, 85, 86, 90, 91, 92, 93, 93, 94, 95, 97, 101, 102 5 : 079 6 : 0567899 7 : 001122344567788999 8 : 001233344456 9 : 01233457 10 : 12 En este ejemplo el “Tallo y Hoja” es asimétrico a la izquierda, no tiene mucha variabilidad ni “datos perdidos o alejados”. Ramas Hojas
  • 33.
    DIAGRAMA DE PARETO Esuna representación gráfica que permite realizar un análisis causal a fin de localizar el problema principal y las causas más importante de éste (ventas, costos, seguridad, etc.). También se conoce como “Diagrama ABC” o “Diagrama 20-80”. Su fundamento parte de considerar que un pequeño porcentaje de las causas, el 20%, producen la mayoría de los efectos, el 80%. Se trataría pues de identificar ese pequeño porcentaje de causas “vitales” para actuar prioritariamente sobre él. Pasos en su construcción: 1. Identificar el problema o mejora que se quiere realizar 2. Identificar los factores que están incidiendo en el problema 3. Definir el periodo de recolección (días, semanas, meses) 4. Recolectar y ordenar los datos 5. Calcular los porcentajes para cada factor 6. Calcular los porcentajes acumulados 7. Identificar los ejes. En el eje horizontal se anotan los factores de izquierda a derecha , en orden decreciente en cuanto a su frecuencia. El eje vertical izquierdo se gradúa de forma tal que sirva para mostrar el numero de datos observados (la frecuencia de cada factor), el eje vertical derecho mostrara el porcentaje relativo acumulado. 8. Trazar las barras 9. Decidir los factores a considerar
  • 34.
    DIAGRAMA DE PARETO.Ejemplo Supongan que se esta analizando las causas de las complicaciones de la cirugía torácica pues se desea disminuir la incidencia. Se registran 100 complicaciones que presentaron 75 pacientes. Tipo de complicación Número % % Acum Fuga aérea 37 37.0 37.0 Fibrilación auricular 25 25.0 62.0 Insuficiencia respiratoria 12 12.0 74.0 Neumonía 6 6.0 80.0 Complicaciones cardiovasculares 6 6.0 86.0 Hemotoráx 3 3.0 89.0 Empiema 3 3.0 92.0 Otras complicaciones 8 8.0 100.0 Total 100 El gráfico muestra de manera muy gráfica que al focalizar solucionar las primeras tres causas de morbilidad, se cubriría el 74% de las complicaciones observadas. Podría empezarse por cada una a la vez y ver de qué manera se puede reducir su incidencia.
  • 35.
    Niveles de Medicióny Procedimientos Estadísticos