ESTADÍSTICA SANDRA JIMENA JÁCOME VELASCO Fisioterapeuta Esp. Docencia universitaria Esp. Epidemiología general Candidato Mg. Educación superior [email_address]
QUE ES ESTADÍSTICA La estadística es un método científico de operar con los datos e interpretarlos.
Arte de decisión frente a una incertidumbre
AREAS DE APLICACIÓN Es aplicable a cualquier campo en el cual se hacen observaciones Gobierno:  economía, inventarios, censos
Salud
Seguros
Juegos del azar
Comercio
Industria
Educación
TIPOS DE ESTADÍSTICA ESTADÍSTICA DESCRIPTIVA O DEDUCTIVA: Método para obtener conclusiones de un conjunto de datos tomados de un colectivo o de una muestra, sin generalizarlos al colectivo
ESTADÍSTICA INFERENCIAL O INDUCTIVA O INFERENCIA ESTADÍSTICA: Método y conjunto de técnicas que buscan obtener información sobre un colectivo mediante un procedimiento metódico de los datos tomados de una muestra perteneciente al colectivo
CONCEPTOS CLAVES Población o universo o colectivo: conjunto de elementos, medidas, individuos u objetos que tienen una característica común
Parámetro: medida que describe una población
Estadística: medida que describe una muestra
Datos: medidas, valores o características susceptibles de ser observados y contados
Variables
VARIABLES Característica que puede tener diferentes valores en los distintos elementos o individuos de un conjunto.  Se clasifican según
TIPO: Cuantitativa o cualitativa
CLASE: Discreta o continua
ESCALA: Nominal, Ordinal, De intervalo, de razón
UNIDAD 1: DISTRIBUCIONES DE FRECUENCIA
DISTRIBUCIONES DE FRECUENCIA Definición
Elementos para la construcción de tablas  de frecuencia
Elaboración de tablas de frecuencia
Graficas de la distribución de frecuencia
Histogramas
Definición: distribución de frecuencia Representación estructurada en forma de tabla, de toda la información que se ha recogido sobre la variable que se estudia
Elementos Para La Construcción De Tablas  De Frecuencia X= valores que puede tomar una variable
n= número de veces que se repite cada valor
F= % porcentaje que la repetición da cada valor supone sobre el total
Elaboración de tablas de Frecuencia Variable (valor) Frecuencia absoluta Frecuencia relativa simple acumulada simple acumulada X1 n1 n1 f1=n1/n f1 X2 n2 n1+n2 f2=n2/n f1+f2 total n Sumatoria n ( Σ n) 100 Sumatoria f ( Σ f)
Ejemplo: medida de altura de grupo de niños Estudiante estatura Estudiante estatura Estudiante Estatura Pedro 1,25 Erica 1,23 Esteban 1,21 Juan 1,28 Lorena 1,26 Jaime 1,29 Martha 1,27 Patricia 1,30 Amparo 1,26 Lucy 1,21 Jimena 1,21 Camilo 1,22 Eduardo 1,22 Olga 1,28 Manuel 1,28 Pablo 1,29 Rosa 1,30 Esther 1,27 Santiago 1,30 Rodrigo 1,22 Mariela 1,26 David 1,24 Alejando 1,25 Mauricio 1,23 Jose 1,27 Miguel 1,20 Jairo 1,22 Stella 1,29 Edith 1,28 Orlando 1,21
Al construir una tabla de frec. De la anterior variable quedaría Variable (valor)2 Frecuencia absoluta Frecuencia relativa Simple Acumulada Simple Acumulada 1,20 1 1 3,3% 3,3% 1,21 4 5 13,3% 16,6% 1,22 4 9 13,3% 30% 1,23 2 11 6,6% 36,6% 1,24 1 12 3,3% 40% 1,25 2 14 6,6% 46,6% 1,26 3 17 10% 56,6% 1,27 3 20 10% 66,6% 1,28 4 24 13,3% 80% 1,29 3 27 10% 90% 1,30 3 30 10% 100% Total 30 30 100% 100%
Graficas de la distribución de frecuencia El objetivo de los gráficos es facilitar la lectura e interpretación de los resultados de una variable.
Se elaboran según el tipo de variable y la población a la cual va dirigida
Loa tipos de gráficos mas frecuencia utilizados son: gráficos de línea, gráficos de barra, pictogramas, tortas o diagramas de pastel o circulares e histogramas.
Ejemplos de gráficos G. De barras Histograma G. De Circular, pastel, torta G. De línea
Pictograma Vivienda por ciudades en 2007
=1000000
Bogotá
Popayán
Cali
Uso – elección tipo de gráfico *Los pictogramas son gráficos de dibujos utilizados para comparaciones que impacten visualmente, llamando la atención del público en general
G. circulares: para distribuciones porcentuales, con variables cuyos valores asignados (posibles respuestas) no superan cuatro opciones (Ej: M-F, Alto-medio-bajo)
G. de barra: para presentar valores de variables cualitativas o cuantitativas discretas con valores asignados de tres o mas posibilidades (Ej: estrato 1, 2, 3, ,4, 5, 6)
Histogramas: para presentar valores de variables cuantitativas continuas con valores asignados de dos o mas posibilidades (Ej: talla, peso)
G. de línea: para presentar series de datos acumulativos (Ej ventas, producción) o datos instantáneos (Ej: tº, inventarios)
UNIDAD 2: MEDIDAS DE TENDENCIA CENTRAL
MEDIDAS DE TENDENCIA CENTRAL También llamadas medidas de posición central.  Permiten conocer algunas características de una serie de datos.
La tendencia central se refiere al punto medio de una distribución
Son: La media aritmética, la mediana, la moda, media geométrica y media armónica
La Media Aritmética También conocida como promedio X
Equivale a la suma de sus valores dividido por su número
N=número de observaciones
X=valor de cada observación
X=media aritmética, media o X barra X = Σ X N
Ventajas y desventajas de la media Es la medida de tendencia central mas estable, fluctúa menos que la moda o la mediana
Es útil para establecer comparaciones entre los grupos, aunque en algunas ocasiones no es la mas indicada
Media geométrica Es la raíz índice N del producto de N términos
Md geométrica =  N  X1X2…XN
Es útil en el cálculo de tasas de crecimiento.
Ej: 2,4,6,12,18
Mdgeométrica=  5  (2)(4)(6)(12)(18) =
Media armónica H Es el recíproco de la media aritmética, de los recíprocos de los números de la serie 1  +  1  …… 1  1 =   X1  X2  Xn  H  N Ej.  Un Fisioterapeuta recupera un paciente en 6 días y otro en 8 días.  El rendimiento representativo del rendimiento de los dos Ft. Es  1  +  1 1  =  6  8  =  1 =  7   = H   2   H  48
La mediana (Md o Mdn) Valor que divide una distribución de datos ordenados en dos mitades, deja por arriba un número de términos igual al que deja por debajo  Es el término del medio del conjunto de datos.  Punto de un escala numérica por arriba y por abajo del cual se encuentran el 50% de los datos.
No toma en cuenta los valores cuantitativos de los puntajes individuales, ni se ve afectada por los valores extremos
Md= N+1 2
Cálculo de mediana a partir de datos no agrupados: en primer lugar es necesario organizarlos ya sea de manera ascendente o descendente.  Si el conjunto de datos contiene un número par de elementos, el de en medio es la mediana.  Si hay un número par de observaciones la mediana es el promedio de los dos elementos de en medio
Ej: 7,8,8,10,12,19,23 Med=10
3,4,4, 5,16 ,19,25,30 Med= (5+16)/2 =
Ventajas y desventajas de la mediana Los valores extremos no afectan a la mediana tan intensamente como a la media
La mediana es fácil de entender y se pude calcular  partir de cualquier tipo de datos, incluso para valores cualitativos.
Es necesario organizar los datos previamente, lo que implica consumo de tiempo
Moda Valor numérico mas frecuente en una distribución.  Es la mas sencilla de las medidas de tendencia central, no se calcula, se determina mediante una inspección de una distribución de frecuencias
Ventajas y desventajas de la moda Es rápido y sencillo de obtener
Es inestable, tiende a fluctuar ampliamente de una muestra a otra aunque provenga de la misma población
Se utiliza poco, excepto para la descripción de valores típicos en mediciones de escala nominal
Curva de un distribución de frecuencias y las medidas de tendencia central Media Mediana Mediana Moda Punto de equilibrio.  Semejante a un centro de gravedad Divide el área bajo la curva en dos partes iguales Es el pico de la curva o mayor ordenada
Simetría En una distribución simétrica las tres medidas de tendencia central son idénticas.  Si la distribución se torna asimétrica, la moda sigue igual, pero la mediana y la media se corren en dirección de la asimetría.
La asimetría es positiva hacia la derecha y negativa hacia la izquierda
En la asimetría positiva, la mediana aumenta por el mayor número de frecuencias hacia la derecha, y la media aumenta mas
En las asimetrías negativas ocurre lo contrario
S UNIDAD 3: MEDIDAS DE DISPERSIÓN
DEFINICIÓN Información que permite apreciar la dispersión de los valores alrededor de las medidas de tendencia central
Grado en que los resultados se desvían uno de otro
CUALES SON RANGO
CUARTIL
DECIL

Estadistica Univariada

  • 1.
    ESTADÍSTICA SANDRA JIMENAJÁCOME VELASCO Fisioterapeuta Esp. Docencia universitaria Esp. Epidemiología general Candidato Mg. Educación superior [email_address]
  • 2.
    QUE ES ESTADÍSTICALa estadística es un método científico de operar con los datos e interpretarlos.
  • 3.
    Arte de decisiónfrente a una incertidumbre
  • 4.
    AREAS DE APLICACIÓNEs aplicable a cualquier campo en el cual se hacen observaciones Gobierno: economía, inventarios, censos
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.
    TIPOS DE ESTADÍSTICAESTADÍSTICA DESCRIPTIVA O DEDUCTIVA: Método para obtener conclusiones de un conjunto de datos tomados de un colectivo o de una muestra, sin generalizarlos al colectivo
  • 12.
    ESTADÍSTICA INFERENCIAL OINDUCTIVA O INFERENCIA ESTADÍSTICA: Método y conjunto de técnicas que buscan obtener información sobre un colectivo mediante un procedimiento metódico de los datos tomados de una muestra perteneciente al colectivo
  • 13.
    CONCEPTOS CLAVES Poblacióno universo o colectivo: conjunto de elementos, medidas, individuos u objetos que tienen una característica común
  • 14.
    Parámetro: medida quedescribe una población
  • 15.
    Estadística: medida quedescribe una muestra
  • 16.
    Datos: medidas, valoreso características susceptibles de ser observados y contados
  • 17.
  • 18.
    VARIABLES Característica quepuede tener diferentes valores en los distintos elementos o individuos de un conjunto. Se clasifican según
  • 19.
  • 20.
  • 21.
    ESCALA: Nominal, Ordinal,De intervalo, de razón
  • 22.
  • 23.
  • 24.
    Elementos para laconstrucción de tablas de frecuencia
  • 25.
  • 26.
    Graficas de ladistribución de frecuencia
  • 27.
  • 28.
    Definición: distribución defrecuencia Representación estructurada en forma de tabla, de toda la información que se ha recogido sobre la variable que se estudia
  • 29.
    Elementos Para LaConstrucción De Tablas De Frecuencia X= valores que puede tomar una variable
  • 30.
    n= número deveces que se repite cada valor
  • 31.
    F= % porcentajeque la repetición da cada valor supone sobre el total
  • 32.
    Elaboración de tablasde Frecuencia Variable (valor) Frecuencia absoluta Frecuencia relativa simple acumulada simple acumulada X1 n1 n1 f1=n1/n f1 X2 n2 n1+n2 f2=n2/n f1+f2 total n Sumatoria n ( Σ n) 100 Sumatoria f ( Σ f)
  • 33.
    Ejemplo: medida dealtura de grupo de niños Estudiante estatura Estudiante estatura Estudiante Estatura Pedro 1,25 Erica 1,23 Esteban 1,21 Juan 1,28 Lorena 1,26 Jaime 1,29 Martha 1,27 Patricia 1,30 Amparo 1,26 Lucy 1,21 Jimena 1,21 Camilo 1,22 Eduardo 1,22 Olga 1,28 Manuel 1,28 Pablo 1,29 Rosa 1,30 Esther 1,27 Santiago 1,30 Rodrigo 1,22 Mariela 1,26 David 1,24 Alejando 1,25 Mauricio 1,23 Jose 1,27 Miguel 1,20 Jairo 1,22 Stella 1,29 Edith 1,28 Orlando 1,21
  • 34.
    Al construir unatabla de frec. De la anterior variable quedaría Variable (valor)2 Frecuencia absoluta Frecuencia relativa Simple Acumulada Simple Acumulada 1,20 1 1 3,3% 3,3% 1,21 4 5 13,3% 16,6% 1,22 4 9 13,3% 30% 1,23 2 11 6,6% 36,6% 1,24 1 12 3,3% 40% 1,25 2 14 6,6% 46,6% 1,26 3 17 10% 56,6% 1,27 3 20 10% 66,6% 1,28 4 24 13,3% 80% 1,29 3 27 10% 90% 1,30 3 30 10% 100% Total 30 30 100% 100%
  • 35.
    Graficas de ladistribución de frecuencia El objetivo de los gráficos es facilitar la lectura e interpretación de los resultados de una variable.
  • 36.
    Se elaboran segúnel tipo de variable y la población a la cual va dirigida
  • 37.
    Loa tipos degráficos mas frecuencia utilizados son: gráficos de línea, gráficos de barra, pictogramas, tortas o diagramas de pastel o circulares e histogramas.
  • 38.
    Ejemplos de gráficosG. De barras Histograma G. De Circular, pastel, torta G. De línea
  • 39.
    Pictograma Vivienda porciudades en 2007
  • 40.
  • 41.
  • 42.
  • 43.
  • 44.
    Uso – eleccióntipo de gráfico *Los pictogramas son gráficos de dibujos utilizados para comparaciones que impacten visualmente, llamando la atención del público en general
  • 45.
    G. circulares: paradistribuciones porcentuales, con variables cuyos valores asignados (posibles respuestas) no superan cuatro opciones (Ej: M-F, Alto-medio-bajo)
  • 46.
    G. de barra:para presentar valores de variables cualitativas o cuantitativas discretas con valores asignados de tres o mas posibilidades (Ej: estrato 1, 2, 3, ,4, 5, 6)
  • 47.
    Histogramas: para presentarvalores de variables cuantitativas continuas con valores asignados de dos o mas posibilidades (Ej: talla, peso)
  • 48.
    G. de línea:para presentar series de datos acumulativos (Ej ventas, producción) o datos instantáneos (Ej: tº, inventarios)
  • 49.
    UNIDAD 2: MEDIDASDE TENDENCIA CENTRAL
  • 50.
    MEDIDAS DE TENDENCIACENTRAL También llamadas medidas de posición central. Permiten conocer algunas características de una serie de datos.
  • 51.
    La tendencia centralse refiere al punto medio de una distribución
  • 52.
    Son: La mediaaritmética, la mediana, la moda, media geométrica y media armónica
  • 53.
    La Media AritméticaTambién conocida como promedio X
  • 54.
    Equivale a lasuma de sus valores dividido por su número
  • 55.
  • 56.
    X=valor de cadaobservación
  • 57.
    X=media aritmética, mediao X barra X = Σ X N
  • 58.
    Ventajas y desventajasde la media Es la medida de tendencia central mas estable, fluctúa menos que la moda o la mediana
  • 59.
    Es útil paraestablecer comparaciones entre los grupos, aunque en algunas ocasiones no es la mas indicada
  • 60.
    Media geométrica Esla raíz índice N del producto de N términos
  • 61.
    Md geométrica = N X1X2…XN
  • 62.
    Es útil enel cálculo de tasas de crecimiento.
  • 63.
  • 64.
    Mdgeométrica= 5 (2)(4)(6)(12)(18) =
  • 65.
    Media armónica HEs el recíproco de la media aritmética, de los recíprocos de los números de la serie 1 + 1 …… 1 1 = X1 X2 Xn H N Ej. Un Fisioterapeuta recupera un paciente en 6 días y otro en 8 días. El rendimiento representativo del rendimiento de los dos Ft. Es 1 + 1 1 = 6 8 = 1 = 7 = H 2 H 48
  • 66.
    La mediana (Mdo Mdn) Valor que divide una distribución de datos ordenados en dos mitades, deja por arriba un número de términos igual al que deja por debajo Es el término del medio del conjunto de datos. Punto de un escala numérica por arriba y por abajo del cual se encuentran el 50% de los datos.
  • 67.
    No toma encuenta los valores cuantitativos de los puntajes individuales, ni se ve afectada por los valores extremos
  • 68.
  • 69.
    Cálculo de medianaa partir de datos no agrupados: en primer lugar es necesario organizarlos ya sea de manera ascendente o descendente. Si el conjunto de datos contiene un número par de elementos, el de en medio es la mediana. Si hay un número par de observaciones la mediana es el promedio de los dos elementos de en medio
  • 70.
  • 71.
    3,4,4, 5,16 ,19,25,30Med= (5+16)/2 =
  • 72.
    Ventajas y desventajasde la mediana Los valores extremos no afectan a la mediana tan intensamente como a la media
  • 73.
    La mediana esfácil de entender y se pude calcular partir de cualquier tipo de datos, incluso para valores cualitativos.
  • 74.
    Es necesario organizarlos datos previamente, lo que implica consumo de tiempo
  • 75.
    Moda Valor numéricomas frecuente en una distribución. Es la mas sencilla de las medidas de tendencia central, no se calcula, se determina mediante una inspección de una distribución de frecuencias
  • 76.
    Ventajas y desventajasde la moda Es rápido y sencillo de obtener
  • 77.
    Es inestable, tiendea fluctuar ampliamente de una muestra a otra aunque provenga de la misma población
  • 78.
    Se utiliza poco,excepto para la descripción de valores típicos en mediciones de escala nominal
  • 79.
    Curva de undistribución de frecuencias y las medidas de tendencia central Media Mediana Mediana Moda Punto de equilibrio. Semejante a un centro de gravedad Divide el área bajo la curva en dos partes iguales Es el pico de la curva o mayor ordenada
  • 80.
    Simetría En unadistribución simétrica las tres medidas de tendencia central son idénticas. Si la distribución se torna asimétrica, la moda sigue igual, pero la mediana y la media se corren en dirección de la asimetría.
  • 81.
    La asimetría espositiva hacia la derecha y negativa hacia la izquierda
  • 82.
    En la asimetríapositiva, la mediana aumenta por el mayor número de frecuencias hacia la derecha, y la media aumenta mas
  • 83.
    En las asimetríasnegativas ocurre lo contrario
  • 84.
    S UNIDAD 3:MEDIDAS DE DISPERSIÓN
  • 85.
    DEFINICIÓN Información quepermite apreciar la dispersión de los valores alrededor de las medidas de tendencia central
  • 86.
    Grado en quelos resultados se desvían uno de otro
  • 87.
  • 88.
  • 89.