Estrategias para Recopilar, Organizar e Interpretar Datos
1. Estrategias, Fuentes y Herramientas para
Recopilar, Organizar, Interpretar y Usar los
Datos
Prof. Eva L. López Díaz
2 de diciembre de 2016
Conferencia Datos DEPR
Centro de Convenciones
San Juan de Puerto Rico
2. Presentaremos conceptos que le permita al educador ampliar sus conocimientos
sobre los datos: su clasificación, procesos de recopilación, acceso a bases de
datos, interpretación, manejo, y organización, con el apoyo de la tecnología.
Describimos en forma simple, ejemplos, herramientas y procesos, para acceder y
trabajar efectivamente con datos, que están al alcance de todos. También
incluimos brevemente datos relevantes de la Educación a en Línea en Puerto,
Estados Unidos y el Mundo, para conocer un poco más sobre el alcance de esta
modalidad educativa.
3. Incluye los Siguientes Temas:
Perspectivas en el uso de
los datos
Diferencia entre datos e
información
Clasificación de los datos
Fuentes de datos
Herramientas de
recopilación de datos
Procesamiento de datos
Datos de Educación en
Línea
En Puerto Rico
En Estados Unidos
En Otros Países
5. Ejemplo
Escribí en mi Facebook cuando preparaba esta
presentación:
Mini encuesta para algo de mi Trabajo.
¿Qué piensas si escuchas la palabra datos?
Los que contestan son amigos y familiares,
todos muy queridos. Muchos son maestros
como yo. Quizás alguno esté hoy presente.
Todos, tienen una idea clara de lo que es un
dato …
7. Comentarios Sobre el Video de Datos del Cuerpo Humano
358 comentarios
Comentarios
Paco De la Rosa No sé qué es peor, la información errónea o que la gente no
investigue y se crea todo
😒
El ojo humano ve a una resolución de 576 megapixeles
Me gusta · Responder · 97 · 15 de octubre a las 11:42
22 respuestas
Irving Jonathan Soto Montes No es la superficie pulmonar comparable con una cancha de
tennis,,,,lo correcto es decir,,,,dentro de los pulmones tenemos tantos ALVEOLOS que si los
acomodamos,cubren toda la superficie de una cancha de tennis!!
Respuestas en Google
1. http://www.bbc.com/mundo/noticias/2013/02/130220_respuestas_curiosos_23febrero_np
2. http://blogthinkbig.com/cual-es-la-resolucion-del-ojo-humano/
3. https://86400.es/2007/03/20/nuestro-sistema-visual-tiene-576-megapixeles-de-resolucion/
8. ¿Qué es lo que nos hace conocedores?
“Lo que para una persona
común es una piedra, para un
conocedor es una perla.” Rumi poeta
persa (1207-1273).
10. Se Puede Interpretar una Gráfica de Acuerdo a la Perspectiva.
Gráfica de participantes por día
0
100
200
300
400
500
600
700
800
900
1000
lunes martes miércoles jueves viernes
Participates
Los mismos datos en otra escala
0
10
20
30
40
50
60
70
80
90
100
lunes martes miércoles jueves viernes
Participates
12. Datos e Información
Un dato se trata de una representación simbólica, la cual puede ser números,
letras, hechos, situaciones.
Para ser útiles, los datos deben estar completos y asociarse dentro de un
contexto. La organización de los datos permiten formar un mensaje sobre
determinado tema.
La información son datos significativos y pertinentes, asociados dentro de un
contexto, de tal forma que se pueden usar para la toma de decisiones.
13. Diferencia entre Datos e Información
Datos
Representación Simbólica.
No tienen sentido semántico o
significado ya que se le puede
llamar dato a cualquier cosa.
No transmiten mensaje hasta que
se ubiquen en un contexto.
Describen situaciones, hechos.
Información
Conjunto de Datos procesados.
Conjunto de Datos organizados.
Tienen un significado.
Transmiten un mensaje.
Permite la toma de decisiones.
Favorece a la resolución de problemas.
Incrementa el conocimiento.
15. Clasificación de los Tipos de Datos:
Simples
Es indivisible es decir, no se puede descomponer. Sin estructura. Un año es un
dato
Compuestos
Son conjunto de partidas de datos simples con relaciones definidas entre ellos.
Estructurados Arreglos Ejemplo Una fecha es un dato Compuesto por tres datos
simples (día, mes, año)
Alfanumérico
representan información textual (palabras, frases, símbolos, etc.). No tienen valor
alguno para efectos numéricos. Pueden distinguirse porque son delimitados por
apóstrofes o comillas. Caracteres Alfabéticos : (A,B,C,…Z, a,b,c…z) Caracteres
Numéricos (0,1,2,…9) Caracteres Especiales: (+, -, *, /, ^, . , ;, <, >, $, …….)
16. Clasificación de los Tipos de Datos:
Numéricos:
Son aquéllos que representan una cantidad o valor determinado. Su
representación se lleva a cabo en los formatos ya conocidos (enteros, punto
y fracciones decimales si estas existen). Se clasifican en dos categorías:
Tipo Numérico Entero: Es un conjunto finito de los números enteros. Los enteros son
números completos, no tienen componentes fraccionarios o decimales y pueden ser
negativos y positivos.
Tipo Numérico Real: Consiste en un subconjunto de los números reales. Estos
números siempre tienen un punto decimal y pueden ser positivos o negativos.
17. Fuentes de Datos e Información
Se denominan fuentes a diversos tipos de documentos que contienen
datos útiles para satisfacer una demanda de información o
conocimiento.
Conocer, distinguir y seleccionar las fuentes adecuadas es muy
importante para la validez y pertinencia de la información requerida.
Usan fuentes apropiadas para recopilar la información evita el
obtener información irrelevante e innecesaria que complica el
proceso.
18. Tipos de Fuentes de Información
Ejemplo fuentes primarias
Revistas científicas
Periódicos, noticieros
Documentos oficiales
Informes técnicos y de investigación
Patentes
Normas técnicas
Estadísticas Página Web
Formulario de consulta
Encuestas
Observación directa
Grupos focales
Experimentación
Google Analytics
Estadísticas de Slide Share
19. Tipos de Fuentes de Información
Ejemplo fuentes secundarias
Enciclopedias
Antologías
Directorios
Libros o artículos que interpretan
otros trabajos o investigaciones
Contienen información organizada, elaborada, producto de análisis, extracción o
reorganización que refiere a documentos primarios originales:
Catálogos
Bibliografías
Índices de citas
Revistas de resúmenes
Boletines de sumarios
21. Plataforma para Recopilar Datos Particulares
Hoy casi todas las empresas tienen promociones y anuncios en Facebook donde por una cantidad de
muy económica pueden seleccionar las características del público a quien quieren llevar su publicidad.
También la plataforma les provee las estadísticas de los resultados de su promoción.
Algunas compañías venden sus servicios para hacer encuestas ofreciendo premios a los participantes y
de esta forma obtienen datos.
Cada gobierno utiliza diferentes plataforma para obtener información de sus habitantes en el
sistema educativo.
Ejemplo: El Departamento de Educación en Puerto Rico utiliza el SIE, en Uruguay utilizan el Plan Ceibal, Colombia
utiliza CREATIC.
El ofrecimiento de los servicios ciudadanos mediante plataformas como la Colecturía Virtual, son
plataforma que proveen datos continuos y actualizados.
22. Herramientas de recopilar y analizar bases de datos
SpreadSheets SQL
Structured Query Language
Visualización & Dashboard
Business Intelligence
Analytics
Statistics Software
24. Pasos procesamiento de Datos
Recolección – usando diferentes medios o herramientas.
Validación - Asegurar que los datos suministrados son correctos y
completos.
Clasificación- Ordena elementos de cierta secuencia y/o en diferentes
conjuntos.
Recapitulación - reducir los detalles de los datos a sus principales
puntos.
Análisis - la colección, organización, interpretación y presentación de
datos.
Información- resumen del resultado del análisis.
25. Herramientas procesamiento de Datos
Análisis de Pareto Diagrama Causa Efecto Gráfica de control
Distribución de frecuencias
Histograma Polígono de frecuencia Gráfica de barra
26. Herramientas procesamiento de Datos
Medidas de tendencia central
Medidas de dispersión
Media Moda Mediana
Varianza Desviación Estándar
27. Herramientas Procesamiento de Datos
Usada en Oficina de Proyectos Especiales, AMPR Virtual
La Plataforma Moodle nos provee estadísticas sobre los participantes de forma
general o por taller en línea. Podemos ver los datos por uso de cada
herramienta como una prueba, por curso o por todos los usuarios en generar.
Usamos archivos csv – comma delimited para matricularlos en la plataforma
Moodle. Los archivos CSV (del inglés comma-separated values) son un tipo de
documento en formato abierto sencillo para representar datos en forma de
tabla, en las que las columnas se separan por comas.
28. Herramientas Procesamiento de Datos
Usada en Oficina de Proyectos Especiales, AMPR Virtual, AMPR
Descargamos la información de los usuarios de la plataforma en hojas de
trabajo usando Excel, como las puntuaciones obtenidas en los trabajos
realizados por los participantes.
Cuando necesitamos usar un Formulario de matrícula, o de contáctenos,
utilizamos Google Apps en Drive. Luego se descarga en Excel y se filtra la
información según se necesita.
Usamos el Google Analytics para conocer las estadísticas de participación de
guiapad.org
También vemos las estadísticas de los usuarios en las estadísticas de las
presentaciones que subimos a Slide Share o los videos de You Tube que se
utilizan en los Talleres y Repasos.
37. Recapitulando sobre los datos
Tener acceso a datos no garantiza el éxito. Las empresas dependen de la eficiencia en la
recopilación fidedigna y análisis estratégico que redunden en estrategias efectivas que
provean resultados..
Es recomendable establecer un sistema para manejar los datos.
Usar fuentes confiables y verificables.
Usar herramientas para recopilación y análisis.
Guardar los datos importantes usando medidas seguridad.
Mantener los datos actualizados..
38. Recapitulando sobre los datos
Analizar los datos en el contexto apropiado, antes de tomar decisiones. El poder manejar
los datos con la rapidez necesaria para que estén actualizados es un activo muy valioso en
cualquier campo.
Para tener un buen control de su vida debe tener un sistema de monitoria personal de sus
datos, que fluya como parte de su rutina diaria. Según los resultados hacer ajustes
necesarios para mantener los datos en niveles de control en nuestra vida personal.
Es importante enseñar a nuestros hijos y estudiantes el manejo de los datos en su vida, sin
olvidar que, existen muchas otras cosas que nos permiten disfrutar calidad de vida, como
una conversación interesante, un abrazo, o los momentos familiares.
Un buen control de calidad de nuestros datos nos ayudarán a tener una vida más feliz.
40. La Educación en línea
En la actualidad, la educación en línea está convirtiéndose en una opción accesible para realizar estudios
de bachillerato, universitarios y de especialización o posgrado para aquellas personas que por su
ubicación geográfica o por cuestiones laborales les resulta muy difícil acudir a una institución presencial,
además de ser una estrategia educativa basada en la aplicación de tecnología al aprendizaje sin
limitación del lugar, tiempo, ocupación o edad de los estudiantes. Con el tiempo el campo de esta
disciplina se ha profesionalizado cada vez más hasta abarcar no solo estudios formales, sino también
cursos de actualización y capacitación laboral en múltiples profesiones y oficios. Vamos a ver un poco la
gran expansión que tiene esta modalidad en diferentes lugares.
Algunas características de esta modalidad son:
Los estudiantes trabajan en un entorno digital a través del cual interactúan mientras transcurren los procesos de
aprendizaje.
El uso pedagógico de las Tecnologías de la Información y Comunicación.
La inclusión de actividades que proponen trabajo colaborativo entre los estudiantes.
La utilización de materiales didácticos en diversos formatos digitales.
41. Educación en Línea en Puerto Rico
En Puerto Rico existen muchas alternativas de programas de educación en línea debido a la versatilidad y
fácil acceso a los participantes. Algunas de ellas ofrecen cursos a estudiantes de otros países. Usan
diferentes plataformas como Blackboard, Canvas y Moodle.
46. Referencias
www.adecpr.org
https://data.pr.gov/
http://marketing4ecommerce.mx/tips-para-crear-una-estrategia-de-datos-para-tu-negocio/
http://www.monografias.com/trabajos14/datos/datos.shtml
http://es.slideshare.net/KaterineBurneo/manejo-de-datos
http://es.slideshare.net/angela1140/bases-de-datos-en-excel
http://www.estadisticas.gobierno.pr/iepr/LinkClick.aspx?fileticket=m8j9w8ftbhE%3D&tabid=165
http://www2.pr.gov/agencias/cepr/inicio/publicaciones/Publicaciones/El%20perfil%20de%20los%20estudiantes%20a%20dista
ncia%20en%20la%20educacion%20superior%20de%20PR.pdf Consejo de Educación Superior de Puerto Rico CEDESP El
perfil de los estudiantes a distancia en la educación superior de Puerto Rico: Aspectos psicosociológicos, académicos, éticos y
legales
http://rogeliomoran.galeon.com/productos2234641.html
http://www.uoc.edu/web/esp/art/uoc/moore/moore.html
http://www3.uah.es/bibliotecaformacion/BPOL/FUENTESDEINFORMACION/tipos_de_fuentes_de_informacin.html
http://ponce.inter.edu/cai/manuales/FUENTES-PRIMARIA.pdf
https://platzi.com/blog/herramientas-analisis-datos/
http://definicion.de/varianza/#ixzz4OViKm4o5
Notas del editor
Usaremos la perspectiva como el punto de vista desde el cual se considera un asunto determinado. En esta imagen la perspectiva representada no es la agricultura, la población, o el clima; es el producto doméstico por cada país en todo el mundo. Es notable que el color es por la leyenda que representan los datos y favorece a crear la perspectiva para procesar los datos presentado y entender la información.
Si la mayoría tiene una idea clara de lo que es un dato, nuestro énfasis no es en definir que es un dato, sino como recopilan, se verifican y se analizan.
Vean la cantidad de personas que han visto este video, esta muy bien creado y nos invita a creer lo que dice.
Este es un ejemplo de la importancia de verificar los datos y no creer en todo lo que vemos en Facebook, por muy creíble que parezca.
Esta imagen se presenta para que el espectador identifique los datos que organizamos mentalmente, para entender la imagen.
Algunas se usan de forma cotidiana a través de algunas plataformas de recopilación de datos, otras por analistas expertos y programadores, según las necesidades del cliente o la organización.
SpreadSheets
Esta aplicación de software es la herramienta más popular para analizar y tabular datos, comúnmente usada por muchos emprendedores. Los usuarios pueden introducir fórmulas en celdas discretas para agilizar los cálculos en otras celdas. Es rápida, sencilla de usar y ofrece increíbles resultados para ciertas tareas. Recientemente, herramientas en la nube como ésta y otras open source como OpenOffice Calc han crecido en popularidad, pero se quedan un poco cortas para ciertos análisis.
Software estadístico
El software estadístico te permite hacer algo más riguroso como varianzas o regresiones lineales.
Este software te ayudará a lanzar tests estadísticos, aunque no te ayudará a interpretar los resultados.
SQL – Structured Query Language – es el más joven y universal lenguaje usado para la interacción con bases de datos.
SQL proporciona a los usuarios una herramienta extremadamente poderosa para moldear complejas conexiones de datos. Un buen reporte en SQL toma Software estadístico
Si no quieres convertir tu reporte en un aburrido conjunto de medias y operaciones, Este software ayudará a lanzar tests estadísticos, aunque no ayudará a interpretar los resultados.Básicamente, la principal virtud de este tipo de estadísticas está en su poder de ayudar a tu empresa a entender eventos en tiempo real, o qué hay detrás de cada usuario en la plataforma. Herramientas como esta pueden ayudar a determinar los efectos que tienen campañas directamente en las ventas.
Visualization & Dashboard
Las herramientas de visualización de datos mejoran el visionado de los datos de tu startup. No son tan ideales para el scrapeo pero si el análisis está terminado y pretende traducirlo, ésta es la herramienta.La diferencia radica en la visualización de los datos. El “dashboard” es más parecido a un tablón con bloques agrupando las métricas con indicaciones para los usuarios. E.g.: Baremetrics. Ideal para presentar tus datos a la “normalidad” de la gente, así los pueden entender.
Analytics
Hoy en día cualquier software que adquieras en el mercado, probablemente traerá́ un componente de analítica web. Estas herramientas son realmente útiles para coleccionar datos desde tu dominio web hasta su visualización simple en forma de reportes.Business Intelligence
Estas herramientas extraen datos de los sistemas transaccionales y los recogen para prepararlos en los cálculos. Es decir, estas herramientas toman datos “crudos” y los transforman en direcciones útiles para los usuarios.¿Suena difícil? Es muy complejo. Para conseguir buenos resultados, las herramientas BI trabajan con “alta tecnología” como ETL, data warehousing, data visualization y más.
Luego de recopilar los datos usamos diferentes herramientas para analizarlos. Pueden ser programados que nos ayuden a organizar y analizar la información mediante gráficas o modelos, algunos más simples, otros más complejos.
El diagrama de Pareto, también llamado curva cerrada o Distribución A-B-C, es una gráfica para organizar datos de forma que estos queden en orden descendente, de izquierda a derecha y separados por barras. Permite asignar un orden de prioridades. El diagrama permite mostrar gráficamente el principio de Pareto (pocos vitales, muchos triviales), es decir, que hay muchos problemas sin importancia frente a unos pocos muy importantes. Mediante la gráfica colocamos los "pocos que son vitales" a la izquierda y los "muchos triviales" a la derecha.
El diagrama facilita el estudio de las fallas en las industrias o empresas comerciales, así como fenómenos sociales o naturales psicosomáticos, Hay que tener en cuenta que tanto la distribución de los efectos como sus posibles causas no es un proceso lineal sino que el 20% de las causas totales hace que sean originados el 80% de los efectos y rebotes internos del pronosticado. El principal uso que tiene el elaborar este tipo de diagrama es para poder establecer un orden de prioridades en la toma de decisiones dentro de una organización. Evaluar todas las fallas, saber si se pueden resolver o mejor evitarla.
Luego de recopilar los datos usamos diferentes herramientas para analizarlos. Pueden ser programados que nos ayuden a organizar y analizar la información mediante gráficas o modelos, algunos más simples, otros más complejos.
La varianza de las variables aleatorias, por lo tanto, consiste en una medida vinculada a su dispersión. Se trata de la esperanza del cuadrado de la desviación de esa variable considerada frente su media y se mide en una unidad diferente. Por ejemplo: en los casos en que la variable mide una distancia en kilómetros, su varianza se expresa en kilómetros al cuadrado.La desviación estándar o típica Uno de los conceptos más importantes relacionados con la varianza es la desviación estándar, también conocida como típica, que representa la magnitud de la dispersión de variables de intervalo y de razón, y resulta muy útil en el campo de la estadística descriptiva. Para obtenerla, simplemente se parte de la varianza y se calcula su raíz cuadrada.
Estos datos resultan muy útiles y necesarios para analizar y describir información, dado que nos ofrecen distintos puntos de vista, así como diferentes tendencias de los datos que caracterizan el objeto en cuestión y permiten establecer parámetros de comparación más complejos y dinámicos que los meros valores aislados o simplemente sometidos a su promedio aritmético.
Podemos ir en vivo a la plataforma a ver como se recopilan y se organizan los datos en cada una de estas instancias.
Podemos ir en vivo a la plataforma a ver como se recopilan y se organizan los datos en cada una de estas instancias.
Se recopila la información y descarga en formato de Excel
Se aplican filtros para organizar los datos recopilados.
Se puede filtrar la información por periodos de tiempo, según sea pertinente al usuario.
Se puede organizar las estadísticas por periodo de tiempo, presenta los lugares de procedencia de los visitantes y la cantidad de visitantes de cada lugar o país.
Están todo el tiempo en todos los ámbitos de nuestra vida. Nos gusta mantenernos actualizados en los datos, esto es parte del éxito de las redes sociales.
A quien no le interesa leer la alguna sección de "datos curiosos" o "datos secretos“. Cuando buscas en la red, se generan datos y de ahí salen los anuncios que promocionan en tus futuras búsquedas en el Web. Esto es una forma de mercadeo con los datos.
Están todo el tiempo en todos los ámbitos de nuestra vida. Nos gusta mantenernos actualizados en los datos, esto es parte del éxito de las redes sociales.
A quien no le interesa leer la alguna sección de "datos curiosos" o "datos secretos“. Cuando buscas en la red, se generan datos y de ahí salen los anuncios que promocionan en tus futuras búsquedas en el Web. Esto es una forma de mercadeo con los datos.
Esta es la página de la AMPR donde ofrecemos servicios en línea, a la vez que se recopilan datos sobre la interacción de los usuarios con la plataforma.
http://www.altillo.com/universidades/universidades_puertol.asp es el enlace para ver los datos de las universidades en linea en PR.
http://www.altillo.com/universidades/universidades_puertol.asp es el enlace para ver los datos de las universidades en línea en cada país, según la bandera.
Me falta organizar la bibliografía en formato APA….