1. MODULO I: HISTORIA, NOCION DE ESTADISTICA Y SU
UTILIZACION PARA LA INVESTIGACION
UN POCO DE HISTORIA
El uso de herramientas cuantitativas para el tratamiento de datos, tiene origen en épocas
remotas. Se tiene información de hace más 3000 años antes de Cristo, donde las antiguas civilizaciones,
como la Egipcia, aplicaron continuamente censos que ayudaban a la organización del estado y la
construcción de las pirámides.
El antiguo testamento nos sugiere que Moisés ordenó un “Censo” a la población Israelita para
identificar los miembros de las familias. En la antigua Grecia y el Imperio Romano, era común la
aplicación de censos para la planificación de impuestos y la prestación del servicio militar.
La palabra estadística deriva del latín moderno statisticum collegium (“consejo de estado”), del
latín antiguo status (“posición”, “forma de gobierno”), de la palabra italiana moderna statista
(“estadista”, “político”) y del italiano antiguo stato (“estado”). En 1749, el alemán, Gottfried Achenwall
(1719-1792) usa el término Statistik en su libro titulado “Staatswissenschaft der vornehmen
Europäischen Reiche und Republiken”, quien originalmente designó la palabra estadística para el análisis
de los datos de un gobierno, definiéndola como la “Ciencia del Estado”. A Gottfried Achenwall se le
conoce como el “Padre de la Estadística”.
La primera persona que introdujo el término estadística en Inglaterra fue Sir John Sinclair
(1754-1835) con su trabajo “Statistical Account of Scotland” (1791-,1799) trabajo compilado en 21
volúmenes. El autor explica en su libro, que la palabra estadística la adoptó gracias al estudio de
investigaciones realizadas en Alemania, como una palabra novedosa que llamaría la atención de los
ingleses; a diferencia, de que en Alemania la estadística se usa como instrumento para medir la
fortaleza de un estado, mientras que Sinclair, la emplearía como generadora de información interna
para encontrar falencias y proponer mejoras en el país. A este trabajo le siguieron dos publicaciones: la
segunda edición elaborada entre 1834 y 1845; la tercera edición comienza después de la segunda guerra
mundial comprendiendo los periodos entre 1951 y 1992.1
El registro de nacimientos y defunciones comenzó en Inglaterra a principios del siglo XVI, y en
1662 apareció el primer estudio estadístico notable de población, titulado Observations on the London
Bills of Mortality (Comentarios sobre las partidas de defunción en Londres). Un estudio similar sobre la
tasa de mortalidad en la ciudad de Breslau, en Alemania, realizado en 1691, fue utilizado por el
astrónomo inglés Edmund Halley como base para la primera tabla de mortalidad
2. A comienzos del siglo XIX, la palabra estadística adopta un significado más generalizado hacia
la recolección y clasificación de cualquier tipo de datos cuantitativos. William Playfair (1759-1823)
expone su idea de que los gráficos permiten una comunicación más eficiente que las tablas de
frecuencia. Es considerado como el inventor de los gráficos lineales, de barras y de sectores. Playfair
publicó el libro titulado “The Commercial and Political Atlas” (1786) el cual contiene 43 gráficos de
series de tiempo y por primera vez, es usado un gráfico de barras. En 1801 utiliza el primer gráfico de
sectores en su obra “Playfair’s Statistical Breviary”.
También en este siglo, con la generalización del método científico para estudiar todos los
fenómenos de las ciencias naturales y sociales, los investigadores aceptaron la necesidad de reducir la
información a valores numéricos para evitar la ambigüedad de las descripciones verbales.
Sir Francis Galton (1822-1911) creó el concepto estadístico de regresión y correlación, y fue el
primero en aplicar métodos estadísticos para estudiar las diferencias humanas basadas en el uso de
cuestionarios y entrevistas para recolectar los datos. Herman Hollerith (1860-1929) fue un estadístico
estadounidense quien desarrollo la primera máquina tabuladora basada en tarjetas perforadas y
mecanismos eléctrico-mecánicos para el tratamiento rápido de millones de datos. Su máquina fue usada
en el censo de 1890 en estados unidos que redujo la tabulación de los datos de 7 años (censo de 1880) a
2.5 años. En nuestros días, la estadística se ha convertido en un método efectivo para describir con
exactitud los valores de datos económicos, políticos, sociales, psicológicos, biológicos y físicos, y sirve
como herramienta para relacionar y analizar dichos datos. El trabajo del experto estadístico no
consiste ya sólo en reunir y tabular los datos, sino sobre todo en el proceso de interpretación de esa
información.
El desarrollo de la teoría de la probabilidad ha aumentado el alcance de las aplicaciones de la
estadística. Muchos conjuntos de datos se pueden aproximar, con gran exactitud, utilizando
determinadas distribuciones probabilísticas; los resultados de éstas se pueden utilizar para analizar
datos estadísticos. La probabilidad es útil para comprobar la fiabilidad de las inferencias estadísticas y
para predecir el tipo y la cantidad de datos necesarios en un determinado estudio estadístico.
DEFINICION DE ESTADISTICA
Como vimos en el apartado anterior, la estadística a variado su significado a través del tiempo,
pasando de ser una herramienta usada solo para la administración de los gobiernos, a una ciencia con un
sin fin de aplicaciones en diferentes disciplinas
La estadística admite varias definiciones entre las que podemos citar
"El estudio, recuento y comparación de cifras para observar o analizar los procesos de
cualquier conjunto de hechos".
“El estudio de los métodos y procedimientos para recoger, clasificar, resumir y analizar
datos y para hacer inferencias científicas partiendo de tales datos".
Una ciencia básica cuyo objetivo principal es el procesamiento y análisis de grandes
volúmenes de datos, resumiéndolos en tablas, gráficos e indicadores estadísticos, que
permiten la fácil compresión de las características concernientes al fenómeno
estudiado.
Un área de la matemática aplicada orientada a la recolección e interpretación de datos
cuantitativos y al uso de la teoría de la probabilidad para calcular los parámetros de una
población.
3. UTILIDAD DE LA ESTADISTICA
Quizá uno se puede preguntar por que razón es importante la estadística. Hay varios motivos por
los cuales se debe conocer y manejar la estadística:
COMO HERRAMIENTA DE TRABAJO: La estadística es de una utilidad inmediata y
practica.
Ayuda a que el trabajo diario y repetitivo se efectúe con más rapidez y eficacia.
Ayuda a los profesores en la determinación de calificaciones y en la realización de test.
Ayuda a interpretar sus datos y observaciones.
En las ciencias del comportamiento, la estadística se ha convertido en una parte
imprescindible del trabajo.
En todos estos campos, la eficacia y la facilidad de operación exige un conocimiento de
los métodos estadísticos básicos
EN LA SOLUCION DE PROBLEMAS:
La investigación se lleva a menudo según una escala limitada, no para comprobar la
teoría, sino para revisar alguna información vital para la solución de un problema
practico. Es frecuente que surjan preguntas como estas.
¿Cuáles son los alumnos que más rápido corren?
¿El método de entrenamiento aplicado a este grupo, es mejor o peor que el que
emplee para con otro?
¿Existe alguna relación entre las variables obtenidas con un grupo y otro?
Evidentemente, las respuestas se obtienen aplicando los métodos estadísticos a los
datos observados
EN LA INVESTIGACION TEORICA:
Las ciencias del comportamiento han alcanzado, hoy en día un alto grado de elaboración,
se han hecho más cuantitativas. El desarrollo de teorías es útil para organizar la
información disponible. Las teorías predicen lo que se espera observar en circunstancias
determinadas. Los medios con que se comprueban las teorías de las ciencias de la
educación, psicología, sociología y economía son en gran parte estadísticos.
COMPRESION Y UTILIZACION DE LA INVESTIGACION:
Un profesional competente, además de su especialidad, tiene que estar al corriente de
los avances técnicos. Debe comprender los informes de la investigación aplicada y
teórica. En las ciencias del comportamiento, esto exige que conozca el significado de
ciertos términos estadísticos, y cuando se puede emplear un método particular.
Desgraciadamente, no toda investigación es una buena investigación y el peso de la
evaluación cae, finalmente en el lector. Las estadísticas pueden ser mal empleadas o mal
interpretadas, pero para aquellos que la entiende, les dicen la verdad o no le dicen nada
SATISFACCION PERSONAL:
Muchos estudiantes creen o piensan que el hecho de recoger y analizar datos es tarea
poco grata. Pero con los datos obtenidos encontramos que solucionamos un problema o
nos demás cuenta que el método aplicado al entrenamiento de un deportista fue
acertado; estaremos en presencia de un logro personal, con solo haber utilizado a la
estadística como herramienta para obtener la información que queríamos saber
4. CLASIFICACION DE LA ESTADISTICA
La estadística se puede dividir en 2 categorías, la "estadística inferencial o inductiva" y la
"estadística descriptiva o deductiva"
Inferencial o inductiva tiene por objeto establecer previsiones o conclusiones sobre una
población basándose en los resultados obtenidos de una muestra
Descriptiva o deductiva, tiene por objeto recoger, recopilar, y calcular de valores
estadísticos que representan al conjunto de datos. Pueden representarse dentro de su
organización en tablas y gráficos. La estadística descriptiva sirve como método para
organizar datos y poner de manifiesto sus características esenciales con el propósito de
llegar a conclusiones.
DEFINICIONES DE TERMINOS ESTADISTICOS:
Población: es el conjunto de elementos, individuos o entes, sujetos a estudio y de los cuales
se desea obtener un resultado.
Las personas o cosas que forman parte de la población se denominan elementos. En sentido
estadístico un elemento puede ser algo con existencia real, como un automóvil o una casa, o algo más
abstracto como la temperatura, un voto, o un intervalo de tiempo. A su vez, cada elemento de la
población tiene una serie de características que pueden ser objeto del estudio estadístico. Así por
ejemplo si consideramos como elemento a una persona, podemos distinguir en ella los
siguientes caracteres: Sexo, Edad, Nivel de estudios, Profesión, Peso, Altura, Color de pelo, Etc.
A partir de este concepto, se desprende que de cada elemento de la población podremos estudiar
uno o más aspectos, cualidades o caracteres.
La población puede ser según su tamaño de dos tipos:
Población finita: Cuando el número de elementos que la forman es finito, por ejemplo el
número de alumnos de una escuela o la cantidad de jugadores de un club de básquet de
distintas categorías.
Población infinita: Cuando el número de elementos que la forman es infinito, o tan grande
que pudiesen considerarse infinitos... Como por ejemplo si se realizase un estudio sobre los
productos que hay en el mercado. Hay tantos y de tantas calidades que esta población podría
considerarse infinita.
Ahora bien, normalmente en un estudio estadístico, no se puede trabajar con todos los elementos
de la población sino que se realiza sobre un subconjunto de la misma. Este subconjunto se llama muestra
Muestra: Es un subconjunto de una población. Una muestra es representativa cuando los
elementos son seleccionados de tal forma que pongan de manifiesto las características de
una población. Su característica más importante es la representatividad. La selección de los
elementos que conforman una muestra pueden ser realizados de forma probabilística o
aleatoria (al azar), o no
5. Las poblaciones son grupos definidos arbitrariamente y engloban a las muestras. Ejemplo:
Si se censan escuelas, cada escuela es un individuo y el conjunto de escuelas en la población
Si se recopilan datos de cualquier test en una escuela, cada división o curso es un
instrumento y la escuela toda es la población
Las muestras son partes de la población. Una de las aplicaciones más importantes de la
estadística es hacer inferencia acerca de grupos muy grandes basándose en la información obtenida de
pequeños grupos. En otras palabras, se trata de conocer la población a partir de los datos de una o más
muestras.
Distinguimos dos tipos fundamentales de muestreo:
Muestreo probabilístico (aleatorio): En este tipo de muestreo, todos los individuos de la
población pueden formar parte de la muestra, tienen probabilidad positiva de formar parte
de la muestra. Por lo tanto es el tipo de muestreo que deberemos utilizar en nuestras
investigaciones, por ser el riguroso y científico.
Muestreo no probabilístico (no aleatorio): En este tipo de muestreo, puede haber clara
influencia de la persona o personas que seleccionan la muestra o simplemente se realiza
atendiendo a razones de comodidad. Salvo en situaciones muy concretas en la que los errores
cometidos no son grandes, debido a la homogeneidad de la población, en general no es un tipo
de muestreo riguroso y científico, dado que no todos los elementos de la población pueden
formar parte de la muestra. Por ejemplo, si hacemos una encuesta telefónica por la mañana,
las personas que no tienen teléfono o que están trabajando, no podrán formar parte de la
muestra.
Métodos de muestreo probabilísticas
Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de
equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de ser
elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de
tamaño n tienen la misma probabilidad de ser elegidas. Sólo estos métodos de muestreo
probabilísticos nos aseguran la representatividad de la muestra extraída y son, por tanto, los más
recomendables. Dentro de los métodos de muestreo probabilísticos encontramos los siguientes tipos:
Muestreo aleatorio simple: Todos los individuos tienen la misma probabilidad de ser
seleccionados. La selección de la muestra puede realizarse a través de cualquier mecanismo
probabilístico en el que todos los elementos tengan las mismas opciones de salir. El
procedimiento empleado es el siguiente:
1º. Se asigna un número a cada individuo de la población
2º. A través de algún medio mecánico (bolitas dentro de una bolsa, tablas de números
aleatorios, números aleatorios generados con una calculadora o computadora, etc.) se
eligen tantos sujetos como sea necesario para completar el tamaño de muestra
requerido.
Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica cuando la
población que estamos manejando es muy grande.
6. En este ejemplo se seleccionaron al azar 7 individuos de una población de 20
Muestreo aleatorio sistemático: Este procedimiento exige, como el anterior, numerar todos los
elementos de la población, pero en lugar de extraer n números aleatorios sólo se extrae uno. Se
parte de ese número aleatorio i , que es un número elegido al azar, y los elementos que integran
la muestra son los que ocupan los lugares 2 3 1i ; ( i k ); ( i k ),( i k ) : i ( n )k . Es decir se
toman los individuos de k en k , siendo k el resultado de dividir el tamaño de la población entre
el tamaño de la muestra
N
k
n
. El número i que empleamos como punto de partida será un
número al azar entre 1 yk .
60
60 15 4 2
15
N n k i
El riesgo se este tipo de muestreo está en los casos en que se dan periodicidades en la población
ya que al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una
homogeneidad que no se da en la población. Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5 últimos mujeres, si empleamos un
muestreo aleatorio sistemático con k=10 siempre seleccionaríamos o sólo hombres o sólo mujeres, no
podría haber una representación de los dos sexos.
Ejemplo: Tenemos 60 alumnos y queremos tomar 15 de ellos en una muestra.
60
4
25
k .
Aleatoriamente utilizamos el número 2i . Entonces comenzando del 2° alumno, vamos extrayendo de
a 4 aleatoriamente.
7. Muestreo aleatorio estratificado: Trata de obviar las dificultades que presentan los
anteriores ya que simplifican los procesos y suelen reducir el error muestral para un tamaño
dado de la muestra. Consiste en considerar categorías típicas diferentes entre sí (estratos)
que poseen gran homogeneidad respecto a alguna característica (se puede estratificar, por
ejemplo, según la profesión, el municipio de residencia, el sexo, el estado civil, etc.). Lo que se
pretende con este tipo de muestreo es asegurarse de que todos los estratos de interés
estarán representados adecuadamente en la muestra. Cada estrato funciona
independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el
estratificado para elegir los elementos concretos que formarán parte de la muestra. En
ocasiones las dificultades que plantean son demasiado grandes, pues exige un conocimiento
detallado de la población. (tamaño geográfico, sexos, edades,...). Se divide la población en
clases o estratos y se escoge, aleatoriamente, un número de individuos de cada
estrato proporcional al número de componentes de cada estrato.
Ejemplo: En una escuela primaria hay 600 alumnos entre el segundo y tercer ciclo. Queremos
tomar una muestra de 20 alumnos. Sabemos que hay 200 alumnos en cuarto grado, 150 en quinto, 150
en sexto y 100 en séptimo. Procedemos entonces de esta manera
1
1
20 20 200
6 6 7 4
600 200 600
x *
x . alumnos de to grado
2
2
20 20 150
5 5
600 150 600
x *
x alumnos de to grado
3
3
20 20 150
5 6
600 150 600
x *
x alumnos de to grado
4
4
20 20 100
3 3 3 4
600 100 600
x *
x . alumnos de to grado
Una vez que tengo la cantidad, puedo aplicar cualquiera de las dos técnicas anteriormente
descriptas para seleccionar la cantidad de alumnos determinados
Es frecuente que cuando se realiza un estudio que interese estudiar una serie de subpoblaciones
(estratos) en la población, siendo importante que en la muestra haya representación de todos y cada
uno de los estratos considerados. El muestreo aleatorio simple no nos garantiza que tal cosa ocurra.
Para evitar esto, se saca una muestra de cada uno de los estratos.
Hay dos conceptos básicos:
Estratificación: El criterio a seguir en la formación de los estratos será formarlos de tal
manera que haya la máxima homogeneidad en relación a la variable a estudio dentro de cada
estrato y la máxima heterogeneidad entre los estratos.
Afijación: Reparto del tamaño de la muestra en los diferentes estratos o subpoblaciones.
Existen varios criterios de afijación entre las que se destaca:
Afijación igual: Todos los estratos tienen el mismo número de elementos en la
muestra.
Afijación proporcional: Cada estrato tiene un número de elementos en la muestra
proporcional a su tamaño.
8. Afijación Óptima: Se tiene en cuenta la previsible dispersión de los resultados, de
modo que se considera la proporción y la desviación típica. Tiene poca aplicación ya que
no se suele conocer la desviación.
Ejemplo: Supongamos que estamos interesados en estudiar el grado de aceptación que la
implantación de la reforma educativa ha tenido entre los padres de una determinada provincia. A tal
efecto seleccionamos una muestra de 600 sujetos. Conocemos por los datos del ministerio que de los
10000 niños escolarizados en las edades que nos interesan, 6000 acuden a colegios públicos, 3000 a
colegios privados y 1000 a colegios privados de gestión pública. Como estamos interesados que en
nuestra muestra estén representados todos los tipos de colegio, realizamos un muestreo estratificado
empleando como variable de estratificación el tipo de escuela.
Si empleamos una afijación simple elegiríamos 200 niños de cada tipo de centro, pero ¿esta bien
la proporción? ¿Están todos los colegios representados de la misma manera?
En este caso parece más razonable utilizar una afijación proporcional pues hay bastante
diferencia en el tamaño de los estratos. Por consiguiente, calculamos que proporción supone cada uno de
los estratos respecto de la población para poder reflejarlo en la muestra.
Colegios públicos:
6000
0 60
10000
. Colegios privados
3000
0 30
10000
.
Colegios privados de gestión pública
1000
010
10000
.
Para conocer el tamaño de cada estrato en la muestra no tenemos más que multiplicar esa
proporción por el tamaño muestral.
Colegios públicos: 0 60 600 360. * padres
Colegios privados: 0 30 600 180. * padres
Colegios privados de gestión pública: 010 600 60. * padres
Muestreo aleatorio por conglomerados: Los métodos presentados hasta ahora están pensados
para seleccionar directamente los elementos de la población, es decir, que las unidades
muéstrales son los elementos de la población. En el muestreo por conglomerados la unidad
muestral es un grupo de elementos de la población que forman una unidad, a la que llamamos
conglomerado. El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto
numero de conglomerados (el necesario para alcanzar el tamaño muestral establecido) y en
investigar después todos los elementos pertenecientes a los conglomerados elegidos.
Ejemplo: En una investigación en la que se trata de conocer el grado de satisfacción laboral de
los profesores de los institutos de formación docente, necesitamos una muestra de 700 sujetos. Ante
la dificultad de acceder individualmente a estos sujetos se decide hacer una muestra por
conglomerados. Sabiendo que el número de profesores por instituto es aproximadamente de 35, los
pasos a seguir serían los siguientes:
1. Recoger un listado de todos los institutos de formación docente.
2. Asignar un número a cada uno de ellos.
3. Elegir por muestreo aleatorio simple o sistemático los 20 institutos (700/35=20) que
nos proporcionarán los 700 profesores que necesitamos.
9. TIPOS CARACTERÍSTICAS VENTAJAS INCONVENIENTES
Aleatoriosimple
Se selecciona una muestra
de tamaño n de una
población de N unidades,
cada elemento tiene una
probabilidad de inclusión
igual y conocida de n/N.
Sencillo y de fácil
comprensión.
Cálculo rápido de medias y
varianzas.
Se basa en la teoría
estadística, y por tanto
existen paquetes
Informáticos para
analizar los datos
Requiere que se posea de
antemano un listado
completo de toda la
población.
Cuando se trabaja con
muestras pequeñas es
posible que no
represente a la Población
adecuadamente.
Sistemático
Conseguir un listado de
los N elementos de la
población
Determinar tamaño
muestral n.
Definir un intervalo k=
N/n.
Elegir un número
aleatorio, r, entre 1 y k
(r= arranque aleatorio).
Seleccionar los elementos
de la lista.
Fácil de aplicar.
No siempre es necesario
tener un listado de toda
la población.
Cuando la población está
ordenada siguiendo una
tendencia conocida,
asegura una cobertura de
unidades de todos los
tipos
Si la constante de
muestreo está asociada
con el fenómeno de
interés, las estimaciones
obtenidas a partir de la
muestra pueden
contener sesgo de
selección
Estratificado
.
En ciertas ocasiones
resultará conveniente
estratificar la muestra
según ciertas variables de
interés.
Por eso debemos conocer
la composición
estratificada de la
población objetivo a
hacer un muestreo.
Una vez calculado el
tamaño muestral
apropiado, este se
reparte de manera
proporcional entre los
distintos estratos
definidos en la población
usando una simple regla
de tres.
Tiende a asegurar que la
muestra represente
adecuadamente a la
población en función de
unas variables
seleccionadas.
Se obtienen estimaciones
más precisa
Su objetivo es conseguir
una muestra lo más
semejante posible a la
población en lo que a las
variables estratificadotas
se refiere.
Se ha de conocer la
distribución en la
población de las
variables utilizadas para
la estratificación.
Conglomerados
Se realizan varias fases
de muestreo sucesivas La
necesidad de listados de
las unidades de una etapa
se limita a aquellas
unidades de muestreo
seleccionadas en la etapa
anterior.
Es muy eficiente cuando la
población es muy grande y
dispersa.
No es preciso tener un
listado de toda la
población, sólo de las
unidades primarias de
muestreo.
El error estándar es
mayor que en el
muestreo aleatorio
simple o estratificado. El
cálculo del error
estándar es complejo
Comparación entre distintos Tipos de Muestreo Probabilística
10. OTRAS DEFINICIONES ESTADISTICAS
Tamaño muestral: Es el número de elementos u observaciones que se recolecciona de la
muestra.
Dato: Cada uno de los individuos, cosas, entes abstractos que integran una población o
universo determinado. Dicho de otra forma, cada valor observado de la variable.
Estadístico: Cualquier característica medible calculada sobre una muestra o población.
Variable: es cada una de las características o cualidades que poseen los individuos de
una población
Las variables se pueden dividir en variable cualitativa y variable cuantitativa
La variable cualitativa es aquellas que no aparecen en forma numérica, sino como categorías o
atributos (sexo, profesión, color de ojos) Podemos distinguir dos tipos:
Variable cualitativa nominal: Solo permite la clasificación, no se puede establecer
ningún tipo de orden. Ejemplos
Nacionalidad: Argentino, Uruguayo, Español
Sexo: Femenino, Masculino
Estadio Civil: Casado, Divorciado, Separado, Soltero
Variable cualitativa ordinal: Hay una clasificación con cierto orden natural. Hay
diferencia de grado o nivel, presentan modalidades no numéricas en la s que existen un
orden. Por ejemplo:
Puesto conseguido en una prueba: 1° 2° 3°
Medalla obtenida. Oro, Plata, Bronce
La variable cuantitativa es la que se expresa mediante un número, por tanto se pueden
realizar operaciones aritméticas con ella. Podemos distinguir dos tipos:
Variable cuantitativa discreta: Es aquella que toma valores aislados, es decir
no admite valores intermedios entre dos valores específicos. Ejemplos
El número de hermanos: 2, 1, 0, 1, 3
La cantidad de pelotas encestadas por partido en un torneo de básquet: 30, 35,
38, 32
La cantidad de abdominales realizado durante un minuto, por un grupo de alumnos:
42, 43, 45, 51
Variable cuantitativa continua: Es aquella que puede tomar valores comprendidos
entre dos números. Por ejemplo:
La estatura de los alumnos: 1.73, 1.82, 1.77, 1.69, 1.75. (En la práctica medimos la
altura con dos decimales, pero también se podría dar con tres decimales.
Los metros recorridos en 40 segundos por un grupo de atletas. 230, 245, 287,
241
Potencia de miembros inferiores expresados en KGM/SEG de un grupo de
jugadores de voleibol 46.3 48.2 52.9 55.1 58.4
11. QUE SE PUEDE HACER CON LA ESTADISTICA
Todos los docentes recogen a diario gran número de datos deferentes. Muchos de ellos
proceden de instrumentos de medición validos. El conocimiento de la estadística es imprescindible en la
interpretación y análisis de dichos datos. ¿Qué se puede hacer con esos datos?
Se pueden calcular las medias aritméticas o promedios. La media proporciona una ubicación
del comportamiento característico del grupo
Se pueden calcular la dispersión de datos _(Desvíos) en torno a un dato central
Se pueden preparar gráficas, tablas o figuras para describir claramente la naturaleza del
grupo o de los grupos
Es posible determinar relación de una variable con otra. Estos estadígrafos se llaman
coeficientes de correlación y su utilidad es enorme. Por ejemplo para hallar las relaciones
entre los resultados de un test de velocidad y los tiempos empleados en una carrera de 100
metros.
A partir de las mediciones en una muestra de individuos, se pueden obtener deducciones
acerca de la población de la que procede dicha muestra
Se puede determinar la fiabilidad de los instrumentos de medición o la validez de las
mediciones.
Se pueden comparar los comportamientos o actuaciones de dos grupos. Supongamos que un
una escuela se esta ensayando un nuevo sistema de entrenamiento. Se eligen dos grupos; a
uno se le enseña durante un determinado tiempo con el sistema tradicional o utilizado
anteriormente y al otro con el nuevo. Se toman luego los resultados y se extraen
conclusiones, etc., etc.,
EL METODO ESTADISTICO
El proceso de aplicación de la estadística implica una serie de pasos
1. Selección y determinación de la población o muestra
Se debe además seleccionar las características contenidas que se desean estudiar. En el
caso de que se desee tomar una muestra, es necesario determinar el tamaño de la misma y
el tipo de muestreo a realizar (probabilístico o no probabilístico).
2. Recuento, relevamiento y compilación de datos
La etapa inicial consiste en la recolección de datos, generalmente muy numerosos, referidos
a la situación que se investiga. Estos datos brindan información sobre las características de
los individuos pertenecientes a la población objeto de estudio. La obtención de los datos
puede ser realizada mediante la observación directa de los elementos, la aplicación de
encuestas y entrevistas, y la realización de experimentos.
3. Tabulacion y agrupamiento de datos
Los datos recogidos son convenientemente ordenados, clasificados y tabulados; es decir
dispuestos en tablas que facilitan la lectura.
12. 4. Medición de datos
En esta etapa comienza la elaboración matemática y medición de los datos. El análisis se
complementa con la obtención de indicadores estadísticos como las medidas: de tendencia
central, dispersión, posición y forma. Se observa que los datos tienden a centrarse en torno
a ciertos valores llamados parámetros o medida de posición (Promedio, Mediana, Modo,
Etc.,)
5. Elaboración de gráficos
A partir de la medición de datos se establecen gráficos al respecto que permiten una
interpretación simple y rápida de los hechos y por otra parte pueden conducir a la elección
de los métodos mas adecuados para el análisis de datos.
6. Inferencia estadística. Predicción
Después de la medición de datos la Teoría de la Probabilidad acude en ayuda de la
Estadística. Se deducen las llamadas leyes de inferencia que permiten predecir el
comportamiento futuro de la población investigada
7. Elaboración de conclusiones.
Se construye el informe final.
Desarrollo de los pasos
PASO 1 Selección y determinación de la población o muestra
Trataremos de definir los conceptos básicos necesarios para calcular una muestra
representativa sobre el total de una población, considerando como tal al conjunto de individuos de los
que se quiere obtener una información. Por ejemplo, si deseamos conocer la opinión general de un total
de alumnos, podríamos preguntarles a todos y sacar la media aritmética u otros parámetros, pero para
aquellos casos en los que este número de alumnos es muy elevado, la estadística nos permite tomar sólo
una muestra de forma aleatoria. De este modo, preguntando únicamente a los alumnos resultantes de la
muestra, los porcentajes medios que obtendremos de sus respuestas serán los mismos que si
preguntásemos al total de la población. El error que se comete debido al hecho de que se obtienen
conclusiones del total de una población a partir del análisis de sólo una parte de ella, se denomina error
de muestreo.
Obtener una muestra adecuada significa lograr una versión simplificada de la población, que
reproduzca de algún modo sus rasgos básicos.
Cálculo del tamaño muestral.
Cada estudio tiene un tamaño muestral idóneo, que permite comprobar lo que se pretende con la
seguridad y precisión fijadas por el investigador. Esta seguridad y precisión dependerán del rango de
posibles respuestas (necesitaremos una muestra más pequeña si las opciones son si o no, que si por el
contrario la opción es elegir entre 1 y 10). Así mismo, también influirá si el estudio se realiza sobre una
población finita o infinita. Las formulas son las siguientes
Población Finita
2
2 2
1
Z * N * p* q
n
e * N Z * p* q
Población infinita
2
2
Z * p* q
n
e
13. A continuación se explica cada uno de los parámetros indicados en la formula
n Tamaño de la muestra
N Tamaño de la población si se conoce (Población finita)
Z Valor correspondiente a la distribución de Gauss. Para el 95% de confianza, Z=1.96, para el
99% de confianza 2.57. (Estos valores provienen de las tablas de la distribución normal Z)Se explicara
luego cuando se desarrolle curvaturas y desvío estándar)
p Probabilidad de éxito o proporción esperada. Esta idea se puede obtener revisando la
literatura, por estudio pilotos previos. Asumamos que puede ser próxima al 5%. En caso de no tener
dicha información utilizaremos el valor p = 0.5 (50%).
q Probabilidad de fracaso 1 p
e Precisión (error máximo admisible en términos de proporción)
Ejemplo 1: ¿A cuántos estudiantes tendríamos que censar para conocer la preferencia de una
ropa deportiva de mercado, si se conoce que el número de estudiantes que pueden estar interesados en
usar esa ropa es de 1.500?
Proporción esperada = asumamos que puede ser próxima al 5%; si no tuviese ninguna idea de dicha
proporción utilizaríamos el valor p = 0.5 (50%) que maximiza el tamaño muestral.
1500N 1 96Z . 0 05p . . 1 0 05 0 95q . . 3 0 03e % .
2
2 2
1 96 1500 0 05 0 95
178 71 179
0 03 1500 1 1 96 0 05 0 95
. * * . * .
n .
. * . * . * .
Se requeriría encuestar a no menos de 179 estudiantes para poder tener una seguridad del 95%
Ejemplo 2 ¿Cómo hubiera cambiando el ejemplo anterior, si se desconoce la proporción esperada?
Si se desconoce la proporción esperada, se tendría que utilizar el criterio conservador (p = q =
0.5), lo cual maximiza el tamaño de muestra de la siguiente manera:
2
2 2
1 96 1500 0 5 0 5
623 7 624
0 03 1500 1 1 96 0 5 0 5
. * * . * .
n .
. * . * . * .
Se requeriría encuestar a no menos de 624 estudiantes
Ejemplo 3 ¿A cuántos estudiantes tendríamos que censar para conocer la preferencia de una ropa
deportiva de mercado, si se desconoce la población total y no tenemos idea de la proporción esperada?
1 96Z . 0 5p . . 1 0 5 0 5q . . 3 0 03e % .
2
2
1 96 0 5 0 5
1067
0 03
. * . * .
n
.
14. COMO TRABAJAR CON DATOS ORDENADOS Y AGRUPADOS
En la estadística se utilizan varias medidas que van dando el comportamiento del grupo. Cuando
uno procesa los datos puede ser que trabaje con estos ORDENADOS o bien se los AGRUPA. Esto
depende de la cantidad de datos que manejemos. Un consejo es de trabajar con datos agrupados a
partir de una cantidad considerable de datos (por ejemplo más de cincuenta datos), ya que facilita el
procesamiento de los mismos.
Las Tablas con datos ordenados se caracterizan por manejar un conjunto pequeño de posibles
resultados de una variable dentro de la muestra o población. Por lo general, su uso tiende al manejo de
datos cualitativos o variables cuantitativas discretas.
Ejemplo: Tabla de datos ordenados
Determinamos un test de lanzamiento al aro de básquet frente a este y sobre el borde de la
línea de triple y anotamos la cantidad de encestadas sobre diez lanzamiento posibles. Luego
establecemos una escala conceptual sobre la siguiente cantidad de emboques. 0-1-2 MALO.
3-4 REGULAR, 5-6 BUENO, 7-8 MUY BUENO y 9-10 EXCELENTE: Los resultados de 10
jugadores fueron los siguientes
Jugador Aciertos Clasificación
A 7 Bueno
B 6 Bueno
C 8 Muy bueno
D 6 Bueno
E 10 Excelente
F 4 Regular
G 6 Bueno
H 6 Bueno
I 1 Malo
J 7 Muy bueno
k 8 Muy bueno
L 5 Regular
En presencia de estos puntajes, confeccionamos una nueva tabla
Como podemos observar, el numero de resultados que puede alcanzar la variable Clasificación son
pocos (solo cinco posibilidades), por lo cual identificaremos la tabla de frecuencia resultante como una
tabla de datos ordenados
La estadística considera otros tipos de frecuencias auxiliares
La forma más simple de agrupar datos consiste en indicar el número de veces que figura cada
valor de la variable estudiada. Ese numero de veces que la variable toma un determinado valor se llama
frecuencia.
Clasificación Frecuencia
Malo 1
Regular 2
Bueno 5
Muy bueno 3
Excelente 1
15. ¿Cómo construir una tabla de frecuencias?
El número de intervalos, k, a utilizar no está determinado de forma fija y por tanto tomaremos
un k que nos permita trabajar cómodamente y ver bien la estructura de los datos; Como referencia
nosotros tomaremos una de los siguientes valores aproximados:
Donde n es la cantidad de datos que tengo registrados
Por ejemplo si el número de observaciones que tenemos es , un buen criterio es agrupar
las observaciones intervalos. Sin embargo si tenemos , será más
razonable elegir intervalos,
que
1º. Determinamos el Rango, que es igual a R dato max dato min
2º. Determinamos la amplitud de intervalo (limites entre el menor valor y mayor valor que va a
tener cada intervalo)
R
i
k
3º. Con estos datos construimos la tabla correspondiente
Ejemplo: Tenemos 46 (cuarenta y seis) datos correspondiente a una prueba de salto en largo
317 324 329 331 337 338 340 344 344 345 345 347 350 351 352
352 352 354 354 355 358 359 360 360 361 361 361 361 365 365
366 367 368 368 371 373 375 379 380 382 382 387 391 394 398
406
Como n no es muy grande elegimos , tomamos 7 intervalos
406 317 89R
89
12 71 13
7
i , Se recomienda que la amplitud sea impar.
Una vez calculado los valores procedemos a confeccionar la tabla
X f fa PM
317- 329 3 3 323
330-342 4 7 336
343-355 13 20 349
356-368 14 34 362
369-381 5 39 375
382-394 5 44 388
395-407 2 46 403
16. Si sumamos sucesivamente cada frecuencia nos encontramos con la frecuencia acumulada, cuyo
numero final nos da como resultado la totalidad de alumnos que participaron de la muestra al que
llamaremos con la letra n . El agrupamiento de datos se hace a través de intervalos de clase o
simplemente intervalos