Este documento describe los pasos para organizar y analizar datos estadísticos. Explica cómo definir objetivos, variables e instrumentos de medición. Luego, detalla métodos para organizar los datos de manera estructurada o no estructurada, incluyendo tablas de frecuencias simples o por intervalos. Finalmente, cubre cálculos como frecuencias acumuladas y porcentajes para resumir y comunicar tendencias en los datos.
Elaborado por: Mario Alejandro Gonzalez
C.I: 23.733.626
Estudiante del Politécnico Santiago Mariño - Extensión Barcelona.
Cátedra: Estadística I
Profesor: Pedro Beltran
Elaborado por: Mario Alejandro Gonzalez
C.I: 23.733.626
Estudiante del Politécnico Santiago Mariño - Extensión Barcelona.
Cátedra: Estadística I
Profesor: Pedro Beltran
Estadística teórica: Se ocupa de los aspectos formales y normativos
Estadística aplicada: Constituye la aplicación a un campo concreto. Ha tenido distintos nombres, entre ellos “Análisis de Datos”
La investigación en Psicología
S.XVII: El método científico se convierte en la fuente de conocimiento más utilizada. La Psicología utiliza el método científico para acercarse a su objeto de estudio: La conducta
El método científico
Definición: Consiste en dar razón sistemática, empírica y experimental de los fenómenos. Características
Sistemático: Tiene etapas definidas (sigue un sistema)
Replicable: Los datos obtenidos pueden ser utilizados por otro investigador
Estadística teórica: Se ocupa de los aspectos formales y normativos
Estadística aplicada: Constituye la aplicación a un campo concreto. Ha tenido distintos nombres, entre ellos “Análisis de Datos”
La investigación en Psicología
S.XVII: El método científico se convierte en la fuente de conocimiento más utilizada. La Psicología utiliza el método científico para acercarse a su objeto de estudio: La conducta
El método científico
Definición: Consiste en dar razón sistemática, empírica y experimental de los fenómenos. Características
Sistemático: Tiene etapas definidas (sigue un sistema)
Replicable: Los datos obtenidos pueden ser utilizados por otro investigador
Por ejemplo un caso extremo de estudio que involucra a la estadística es la realización de un censo, a pesar de la ayuda de procedimientos complejos diseñados para tal fin, constituye siempre una tarea gigantesca resumir y describir las enormes cantidades de datos que se generan de los proyectos de investigación. Usando los principios más elementales de la estadística descriptiva, es posible describir las características de los datos con bastante claridad y precisión, de modo que las tendencias o generalidades se puedan descubrir más rápidamente y comunicar con mayor facilidad. Primero, es menester clarificar que dependiendo del nivel de medición de la variable se posibilitará su organización.
organizacion de datos
Siendo el dato el material que se debe procesar, es decir, la materia prima de la estadística, el primer paso es entonces la recolección de datos, para lo cual se emplean diferentes técnicas, como la entrevista personal, el cuestionario, la observación, etc. El segundo paso es la organización y ordenamiento de los datos, lo que se hace a través de tablas, las cuales pueden ser por medio de una distribución de frecuencias simples o una distribución de frecuencias con intervalos, en ambos casos agrupando todos aquellos que corresponden a una mismo dato nominal o variable y expresando en una columna el número de veces que aparece esa variable.
LA FRECUENCIA es el número de veces que aparece cada variable o dato nominal.
Convocatoria de becas de Caja Ingenieros 2024 para cursar el Máster oficial de Ingeniería de Telecomunicacion o el Máster oficial de Ingeniería Informática de la UOC
Expo sobre los tipos de transistores, su polaridad, y sus respectivas configu...LUISDAMIANSAMARRONCA
a polarización fija es una técnica de polarización simple y económica, adecuada para aplicaciones donde la estabilidad del punto de operación no es crítica. Sin embargo, debido a su alta sensibilidad a las variaciones de
𝛽
β y temperatura, su uso en aplicaciones prácticas suele ser limitado. Para mayor estabilidad, se prefieren configuraciones como la polarización con divisor de tensión o la polarización por retroalimentación.
Sistema de disposición sanitarias – UBS composteras 2 PARTE.pptx
Maria jose presentacion
1. República Bolivariana de Venezuela
Ministerio de Poder Popular para la Educación Universitaria
Instituto Universitario Politécnico “Santiago Mariño”
Barcelona-Anzoátegui
Ingeniería Civil
ORGANIZACIÓN DE LOS DATOS
Profesor Bachiller
Beltrán Pedro Lara María José
CI: 28462078
Noviembre, 2019
2. INTRODUCCIÓN
La estadística con frecuencia se realiza con la intención de llegar a
establecer conclusiones o a obtener resultados, esto demanda muchas
veces estudiar centenares, miles o aun cifras más altas de cosas,
objetos, personas o grupos. Por ejemplo un caso extremo de estudio
que involucra a la estadística es la realización de un censo, a pesar de
la ayuda de procedimientos complejos diseñados para tal fin,
constituye siempre una tarea gigantesca resumir y describir las
enormes cantidades de datos que se generan de los proyectos de
investigación.
3. DESARROLLO
La obtención de datos para el análisis estadístico es un proceso integral que
incluye las siguientes etapas típicas:
4. 1- Definición de los objetivos del estudio observacional o
experimento.
Por ejemplo, el cálculo del ingreso promedio familiar en los estudiantes de la
preparatoria, o la comparación de la efectividad de un medicamento que se
ha utilizado normalmente frente a otro producto nuevo.
5. 2-Definición de la variable y la población de interés.
Este aspecto tiene que ver con los alcances del estudio. Por ejemplo, el sueldo
del jefe de familia del estudiante, o el tiempo de recuperación de los pacientes
de una cierta enfermedad y de un centro hospitalario específico a los cuales se
aplican los medicamentos.
6. 3-Definición de los métodos para la obtención y medición de los
datos.
Por ejemplo, un cuestionario, una indagación en los centros de trabajo, o vía
telefónica, o el seguimiento de una bitácora médica. También incluye, en su
caso, la decisión de la obtención de un censo o la determinación del tamaño
de la muestra.
7. 4-Determinación de las técnicas descriptivas o de inferencia que
sean las apropiadas para el análisis de los datos.
Una vez que se obtienen los datos para un estudio estadístico, el primer paso
es realizar una crítica y organización de los datos para su posterior
tratamiento. En general, este proceso implica una elaboración de listas o su
recuento y agrupación en frecuencias simples, que se conoce con el nombre
de conteo. De manera similar a como se realiza el conteo de los votos para
una elección. En los tiempos actuales, con la herramienta de la computadora,
estos procesos pueden ser ciertamente tediosos en algunos casos, pero
siempre resultará un procedimiento muy simple.
8. Tipos de Organización de los datos.
1- Organización no estructurada
Utiliza información no estructurada contenida en libros, artículos informes.
Es tan grande la variedad de información que es muy difícil saber qué es lo que
nos va interesar en el caso de una búsqueda y sería imposible determinar un
campo por cada tema.
9. 2- Organización estructurada
Utiliza información estructurada o datos definidos (facturas, recibos de
clientes, etc.).
El diseño de una buena base de datos deberá reconocer con método y
exactitud los datos que se van a utilizar, antes de su implementación.
10. Esta organizada mediante campos.
Tipos de Organización (II)
Tratamiento de datos formateados (organizados).
Sistemas orientados a proceso. Sistemas orientados a datos. Sistema de
Gestión de Datos Relacionales.
Tratamiento de datos no formateados (No organizados)
Documentos.
Sistemas de Recuperación de Información Sistemas de Gestión de Bases
de Datos Documentales.
11. OPERACIONES CON ORGAIZACION DE DATOS
La información es un activo fundamental para las empresas e
instituciones, y Widefense provee servicios orientados al respaldo de
información clave.
Actualmente, el universo de datos disponible puede dificultar la toma de
decisiones en una organización, principalmente, por el exceso de
información existente, su diversidad y lo cambiante de ella.
“Vivimos frente a una avalancha de información originada, por ejemplo,
por la música digital, imágenes médicas, fotografías digitales, redes
eléctricas inteligentes, video vigilancia, redes sociales, televisión digital y
sensores para teléfonos, entre otros factores”
12. Operaciones con organización de datos (II)
Una de nuestras soluciones está orientada al respaldo basado en el uso de la
nube. Esta solución permite administrar los respaldos y la recuperación de la
información de manera sencilla, ágil y rápida. Ideal para empresas que están
llevando sus servicios a la nube tecnológica. La principal ventaja de este
servicio es que genera importantes ahorros para los clientes, ya que dada su
naturaleza no implica incurrir en gastos de hardware.
Otra alternativa es mantener la información siempre en el sitio del cliente. De
esta manera, posibilita el respaldo de un mayor volumen de información, en
pequeños lapsos de tiempo y necesitando un menor espacio de
almacenamiento en el servidor, gracias a la de-duplicación en el origen de los
datos. Mediante ella es posible respaldar equipos de escritorio y notebooks,
máquinas virtuales, oficinas remotas, sistemas de almacenamiento compartido
y aplicaciones empresariales.
13. EJEMPLOS DE CADA ORGANIZACIÓN DE DATOS LA FRECUENCIA
Es el número de veces que aparece cada variable o dato nominal.
Por ejemplo, se desea hacer una tabla que muestre las calificaciones en
Matemáticas de un grupo escolar. Se ve que hubieron dos alumnos que sacaron 10
de calificación, siete estudiantes sacaron 9, etc.; se dice entonces que la frecuencia
del dato nominal 10 es de dos; la frecuencia de la variable 9 es siete, etc Una
distribución de frecuencias es el resultado de organizar los datos recolectados en
grupos, mostrando la frecuencia de cada uno. Esta puede ser simple o por
intervalos.
14. DISTRIBUCIÓN DE FRECUENCIAS SIMPLE
Organizar los datos recolectados, ya sea de menor a mayor o viceversa, de
manera que se muestre la frecuencia de cada uno de ellos, es hacer una
distribución de frecuencias simple.
El primer paso es localizar el dato menor y el dato mayor dentro del conjunto
de datos recolectados aún en desorden, en el caso que los datos sean de
carácter numérico. Una vez conseguido lo anterior, en una primera columna
se escriben todos los números que van desde el menor hasta el mayor,
incluidos éstos. Luego, se cuenta cuántas veces aparece el primer valor
nominal, para lo cual se aconseja ir marcando con una línea ( / ) cada vez
que se cuente uno.
El proceso debe repetirse para cada variable. Finalmente se cuentan el
número de marcas que se hayan registrado para cada valor nominal y se
procede a construir la tabla definitiva.
15. Ejemplo:
Ordenar y construir una tabla de frecuencias simple del siguiente conjunto
de datos recolectados. 24 20 32 32 29 21 21 22 33 30 27 26 23 24 20 25
26 32 28 22 29 29 33 35 31 28 32 35 33 32 27 21 33 29 25 24.
Solución: Primer paso: Se localizan los números más chico y más grande:
son el 20 y el 35.
Segundo paso: Se hace una lista completa de números desde el 20 hasta
el 35: 20 24 28 32 21 25 29 33 22 26 30 34 23 27 31 35
Tercer paso: Se cuenta cuántos datos nominales 20 aparecen y por cada
uno que aparezca se pone una “rayita” ( / ). Se hace lo mismo para cada
valor: 20 // 24 /// 28 // 32 ///// 21 /// 25 // 29 //// 33 //// 22 // 26 // 30 / 34 23 /
27 // 31 / 35 // A manera de comprobación, para tener la seguridad de que
no se escapó alguno o no se contaron de más, la suma de todas las
“rayitas” ( / ) debe ser igual al número de datos nominales del conjunto
inicial. En este caso existen 36 datos nominales y 36 “rayitas”, lo que
significa que el conteo fue correcto.
16. Cuarto paso: Se elabora la tabla definitiva. En una tabla son
indispensables • Los encabezados de columna, • las líneas horizontales
que delimitan la tabla por la parte superior y por la parte inferior, • la línea
horizontal que delimita por su paste inferior a los encabezados y • las
líneas verticales que delimitan las columnas
17. DISTRIBUCIÓN DE FRECUENCIAS POR INTERVALOS
Los datos recolectados pueden también organizarse por intervalos. Por
ejemplo, al realizar un censo en una ciudad, podría interesar cuántas
personas tienen 0, 1 ó 2 hijos, cuántas 3, 4 ó 5 hijos, cuántas 6, 7 u 8 hijos,
etc. Cada intervalo se llama también clase. El ancho de clase o longitud del
intervalo es la resta de el límite superior menos el límite inferior de cada clase
o intervalo. Así, en el ejemplo anterior, el intervalo de 0 a 2 hijos tiene un
ancho de 2 - 0 = 2. No debe confundirse el ancho de la clase con el número
de datos nominales que contiene el intervalo. Cuando se trabaja con variables
discretas, el ancho de clase o longitud del intervalo es la resta de el límite
superior menos el límite inferior de cada clase o intervalo, mientras que el
número de datos es la resta de el límite superior menos el límite inferior de
cada clase o intervalo más 1. Por ejemplo, si se elabora una tabla para
analizar cuántas personas tienen 0, 1 ó 2 hijos, cuántas 3, 4 ó 5 hijos, cuántas
6, 7 u 8 hijos, etc.,
18. El ancho de clase sería mientras que el núm 20 2 − = ero de datos que
contenga el intervalo sería de 201 3 −+= . Da lo mismo hacerlo con cualquier
renglón. Cuando se trabaja con variables continuas, el ancho de clase o
longitud del intervalo es, igual que antes, la resta de el límite superior menos
el límite inferior de cada clase o intervalo, mientras que el número de datos
posibles que pudiera contener el intervalo no es posible conocerlos porque
caben todos los valores intermedios. Por ejemplo, si se elabora una tabla para
analizar cuántas personas pesan de 20kilos a 30 kilos, cuántas de 30 kilos a
40 kilos, etc.
El ancho de clase sería 30 20 10 − = mientras que el número de datos que
contenga el intervalo no es posible determinarlo, ya que pueden darse pesos
como 21.4, o bien 24.76, etc. Da lo mismo hacerlo con cualquier renglón. Aquí
se presenta el conflicto de que si una persona pesa 40 kg. ¿en qué fila debe
contarse, en la segunda o en la tercera, porque en ambas está el valor de 40?
Lo anterior se suele resolver incluyendo un extremo sí y el otro no en cada
fila. Simbólicamente significaría que de esta manera el valor 40 ya no está
incluido en la segunda fila y sí en la tercera. A la organización de los datos
recolectados en tablas por intervalos se le llama distribución de frecuencias
por intervalos. La característica más importante es que el ancho de cada
clase o longitud del intervalo debe ser el mismo para cada intervalo.
19. FRECUENCIAS ACUMULADAS
Muchas veces resulta de gran utilidad tener información sobre la frecuencia
que a partir del inicio de la tabla se tiene hasta cierto dato nominal
determinado. A lo anterior de se le conoce con el nombre de frecuencias
acumuladas (fa) y se añade en una columna en la misma tabla. Ejemplo 1:
En los datos del ejemplo de la página 128, sus frecuencias acumuladas
son: PORCENTAJESY
PORCENTAJES ACUMULADOSO
tras dos informaciones muy útiles dentro de la etapa de organización de
datos es calcular el porcentaje de cada variable conforme a su frecuencia,
lo mismo que su porcentaje acumulado, ya sea en una distribución de
frecuencias simple o por intervalos. Para calcular el porcentaje basta hacer
una regla de tres, en donde el 100% es el número N de datos recolectados,
o sea el total de las frecuencias, esto es N = F 100 %
20. donde: n = número total de datos recolectados o frecuencia total f =
frecuencia particular del dato nominal del que se desea saber su
porcentaje % = porcentaje correspondiente al dato nominal de frecuencia
f. O bien, despejando, se obtiene que %=100% N
21. CONCLUSIÓN
Usando los principios más elementales de la estadística descriptiva, es
posible describir las características de los datos con bastante claridad y
precisión, de modo que las tendencias o generalidades se puedan descubrir
más rápidamente y comunicar con mayor facilidad. Primero, es menester
clarificar que dependiendo del nivel de medición de la variable se posibilitará
su organización.