SlideShare una empresa de Scribd logo
1 de 29
Descargar para leer sin conexión
Introducción al Big Data en educación
[1.1] ¿Cómo estudiar este tema?
[1.2] Introducción
[1.3] ¿Qué es Big Data?
[1.4] Tratamiento de la información
[1.5] Tecnologías de Big Data
[1.6] Infraestructura del Big Data
[1.7] Big Data en la educación
[1.8] Características de Big Data en la educación
[1.9] Finalidad de Big Data en educación
[1.10] Herramientas de Big Data para educación
[1.11] Referencias bibliográficas
1TEMA
Del Dato (Big Data) a la Información (Internet)
TEMA 1 – Esquema © Universidad Internacional de La Rioja (UNIR)
Esquema
IntroducciónalBigDataeneducación
Las7V
•Volumen
•Velocidad
•Variedad
•Veracidad
•Valor
•Variabilidad
•Visualización
¿QuéesBigData?BigDataeneducación
Características
•Usodetecnología
•Produccióndedatosdiversos
(multidimensionales)
•Almacenamientoenbasesde
datosestructuradasyno
estructuradas
•Analíticas/tomadedecisiones
•Procesocomplejo,dinámicoy
flexible
Tratamientodela
información
TecnologíasdeBig
Data
Infraestructurade
BigData
Finalidad
•Mejorarelaprendizaje
•Personalizacióndelaeducación
•Predeciryminimizarelfracaso
escolar
•Mejorarlaspolíticas
institucionales
Técnicasyherramientas
1.Herramientasdeanálisisy
análisisavanzado
2.Herramientasdegeneración
deinformespaneles
3.Herramientasdevisualización
Analíticas/mineríade
datos
Del Dato (Big Data) a la Información (Internet)
TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR)
Ideas clave
1.1. ¿Cómo estudiar este tema?
Para trabajar este tema deberás leer los siguientes artículos:
» Camargo, J. J., Camargo, J. F. y Joyanes, L. (enero-abril, 2015). Conociendo Big Data.
Revista Facultad de Ingeniería, 24(38), 63-77.
Disponible en el aula virtual e virtud del artículo 32.4 de la Ley de Propiedad Intelectual.
» Ortoll, E. (octubre, 2014). Big Data se escribe con V [artículo en línea]. Revista de los
Estudios de Ciencias de la Información y de la Comunicación, 37.
Disponible en
http://www.uoc.edu/divulgacio/comein/es/numero37/articles/Article-Eva-Ortoll.html
1.2. Introducción
Los grandes volúmenes de datos que se producen en la actualidad gracias a las
tecnologías de la información y la comunicación están generando nuevas perspectivas y
necesidades de manejo de los mismos. La sociedad digital en la que estamos inmersos
está caracterizada por una producción ingente de datos, datos y más datos de los
que en general no se tiene consciencia.
Cada vez que las personas publican o interactúan por Facebook, cuando publican Tweets,
publican y comentan fotografías, noticias o páginas web, cada vez que se consulta la web
para conocer los pronósticos del tiempo o cuando se hacen compras online de productos
de todo tipo, tanto para pedir una pizza como para comprar ropa, billetes de viaje,
artículos para el hogar o contenidos digitales, libros, aplicaciones, etc., estamos
produciendo miles de datos. Cuando nos conectamos a las clases online o cuando
usamos una aplicación educativa o publicamos en el blog de aula o participamos en un
MOOC, estamos igualmente sumando datos a esa gran masa de datos.
¿Qué se hace o qué se puede hacer con esos datos? ¿Cuál es la contribución que
se hace con el uso de las TIC en la educación a esa gran producción de datos? Son
preguntas que trataremos de responder con el estudio de este tema.
Del Dato (Big Data) a la Información (Internet)
TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR)
1.3. ¿Qué es Big Data?
El término Big Data hace referencia al gran volumen de datos que se están produciendo
continuamente a través de los medios electrónicos. Esta producción de datos proviene
de múltiples fuentes, son de diferente naturaleza y además se producen a gran velocidad.
Con esta imagen nos podemos hacer una idea de cómo va creciendo la producción de
información, la velocidad y algunas de la fuentes a través de las que se produce.
Figura 1. Big Data. Fuente: https://community.hpe.com/t5/IT-Operations-Management-ITOM/A-BIG-
brother-for-your-BIG-data-environment/ba-p/6284087#.WRMzIuXyhPZ
El concepto de Big Data fue introducido por primera vez por Roger Magoulas de O’Reilly
en 2005 y lo hizo para definir aquella gran cantidad de datos que no podía gestionarse
por medio de técnicas y procesos tradicionales debido a su complejidad y tamaño. A
partir de esa definición, el concepto de Big Data se estudió desde distintos puntos de
vista, ya que permitió indagar en las implicaciones que existían desde los distintos
campos involucrados.
En esos momentos se determinó que el Big Data constaba de tres facetas diferentes,
denominadas las tres V de Big Data: volumen, velocidad y variedad. Sin embargo,
con la evolución en el tiempo, el uso y el procesamiento de los mismos se ha establecido
que estos datos deben tener otras características que son veracidad, valor,
variabilidad y visualización.
Del Dato (Big Data) a la Información (Internet)
TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR)
Las 7 V del Big Data
Las 7 V a las que se hace referencia en el entorno del tratamiento de los grandes datos
son las siguientes:
» Volumen: hace alusión a la gran producción de datos a nivel mundial. Esta gran
cantidad de datos sirve para generar información que, a su vez, se utiliza para generar
conocimiento. Los datos informáticos se miden en bits, que es la unidad mínima de
información. Un bit almacena un cero o un uno. La siguiente unidad de medida es el
byte que corresponden a 8 bits. Y a partir de esa medida se establecen las siguientes
unidades de medidas de información:
Figura 2. Unidades de medidas de información. Fuente:
http://cuartoinformatica.tecnojulio.com/2015/09/21/unidades-de-medidas-de-la-informacion-
actividad-5/
Se estima que para el 2020 haya un volumen de datos de 35 zettabyte.
Figura 3. Qué es un zettabyte. Fuente: http://www.csc.com/insights/flxwd/78931-
big_data_universe_beginning_to_explode
» Velocidad: hace referencia a la rapidez con la que se dispone de los datos donde sea
y cuando sea (anytime-anywhere). Se dispone de los datos en tiempo real, en el
mismo momento en el que se están produciendo, por lo que es muy importante la
Del Dato (Big Data) a la Información (Internet)
TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR)
velocidad del tratamiento de esos datos. A mayor velocidad mayor validez de la
información que se pueda obtener.
» Variedad: los datos provienen de diferentes fuentes y pueden ser estructurados o
no estructurados.
o Los estructurados son aquellos que están encorsetados en una estructura
definida, se dispone de los mismos datos para todos los elementos, por ejemplo, en
una base de datos de empleados (nombre, edad, titulación, años de servicio, etc.).
o Los datos no estructurados son aquellos que no tienen una estructura definida,
como pueden ser imágenes, vídeos o ficheros de sonido.
Figura 4. Captura de pantalla de «Webinar: Big Data para Dummies». Fuente:
https://www.youtube.com/watch?v=fZhpLdZx5Qg
Figura 5. Cinco tipos de datos. Fuente: Ortoll (2014).
Datos fruto de transacciones comerciales, de la navegación web a un lugar
determinado, del uso de la telefonía móvil
Datos públicos
Data exhaust
Datos comunitarios
Self-quantification data
Datos privados
Datos que tienen los gobiernos, ayuntamientos, comunidades locales, (por
ejemplo, datos sobre transporte, uso de energía, sanidad, etc.)
Datos ambientales que se recogen de forma pasiva. Estos datos no tienen
utilidad para aquellos quien las captan pero que combinadas con otros datos
pueden aportar valor
Datos producidos principalmente en las redes sociales, contenidos generados
por el usuario, etc.
Datos proporcionados por los individuos al cuantificar sus comportamientos y
acciones. Por ejemplo, los datos monitorizados sobre las pulsaciones durante la
realización de ejercicio físico que son recogidos por dispositivos móviles
1
2
3
4
5
Del Dato (Big Data) a la Información (Internet)
TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR)
» Veracidad: los datos deben ser reales, deben corresponder con lo que señalan que
son y no con datos falsos. La depuración de los datos y la limpieza de las bases de
datos de las organizaciones o instituciones es un paso previo a la toma de decisiones
sobre la base de los datos de los que dispone.
Figura 5. Big Data: 7 V. Fuente: http://www.impactradius.com/blog/7-vs-big-data/
» Valor: toda la producción y procesamiento de datos, los análisis y decisiones deben
conducir a acciones que repercutan positivamente en la sociedad, en las
organizaciones o instituciones que las procesan.
» Variabilidad: la variabilidad de los datos se refiere a la variación que pueden tener
los datos, los cambios que experimentan y que impactan en la homogeneización de
los mismos, así como las posibilidades de predicción.
» Visualización: característica definitoria de los grandes datos. En este caso, toma
mucho significado la expresión «una imagen vale más que mil palabras». Poder
traducir la ingente cantidad de datos y los resultados de los análisis a esquemas,
diagramas o gráficos que resuman o sinteticen la información obtenida de los análisis
de los macrodatos o Big Data es otra de las necesidades que han surgido en este
campo. Es mucha la información que se puede transmitir con las herramientas de
visualización de datos, las cuales permiten percibir tendencias y facilitar la toma de
decisiones.
Como puede verse, son muchos los elementos a considerar para considerar una fuente
de datos como Big Data.
Del Dato (Big Data) a la Información (Internet)
TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR)
1.4. Tratamiento de la información
Con la presencia de la IOT (Internet de las cosas) se fortifica mucho la producción de los
grandes volúmenes de datos. Sin embargo, lo más importante no es el volumen de datos
(si hay más o menos teras), sino el aprovechamiento de los mismos con el tratamiento y
análisis que se haga de ellos para que se pueda obtener información en un primer
momento y luego construir el conocimiento que influirá en las decisiones que se espera
repercutan en un mayor bienestar para todos en general. Es por eso que Big Data no
trata solo el término de dato, sino que también está relacionada con las técnicas que
pueden mejorar el manejo de las 7 V para que incrementen su valor. Estas V implican
que exista un tratamiento de los datos enfocándose en distintos aspectos:
» El modo en el que se capturan los datos junto con la selección de los datos que se
capturan.
» El modo de almacenamiento de los datos que han sido capturados.
» Una vez almacenados, deberán existir herramientas que permitan una búsqueda
adecuada de los datos.
» En el caso de que sea necesario, esos datos han de ser compartidos entre distintos
entornos.
» El último aspecto a tener en cuenta cuando se tiene esa gran cantidad de datos es el
modo en el que van a ser visualizados.
Figura 6. Tratamiento de los datos. Fuente: Soergel (1985).
Es decir, cada vez que se hace necesaria la extracción de resultados en base a los datos
básicos, se hace necesaria una transformación que permita obtener conclusiones. El
proceso básico de esa transformación es el siguiente: partiendo de los datos sin
tratar, lo que se hace es un preprocesado para llevar a cabo una concreción de los mismos
para que luego se pueda realizar un análisis de correlación que permita una extracción
exhaustiva de información que proporcionará una serie de resultados.
Del Dato (Big Data) a la Información (Internet)
TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR)
El esquema básico está representado en el siguiente diagrama:
Figura 7. Esquema de la transformación de los datos. Fuente: Soergel (1985).
El objetivo del análisis de datos es examinar grandes cantidades de datos con una
variedad de clases, con el fin de descubrir información que sea relevante y útil para la
empresa, de manera que le permita tomar las mejores decisiones y obtener ventajas
competitivas en comparación con otras de su clase. (Camargo, Camargo y Joyanes
(2015).
Para ello se utilizan técnicas y herramientas especializadas para el manejo de grandes
bases de datos. El procesamiento comienza desde la captura del dato, el
procesamiento y tratamiento del mismo para la organización, estructuración e
integración si los datos provienen de diferentes fuentes y establecimiento de relaciones
con otros, los análisis del conjunto de relaciones, también llamado Data Mining, y la
producción de información y conocimiento como resultado de todo el proceso.
Para que el proceso llegue a buen fin, es necesario abordar una serie de retos. En cuanto
a la captura, se hace necesario un control dependiendo del tipo de datos, ya que las
transformaciones que se tienen que aplicar en cada caso no son las mismas. Por ejemplo,
la información que se debe tratar en una imagen y en un PDF es distinta. En un PDF se
puede tener que realizar un análisis del tamaño según el número de páginas que
contiene, que en una imagen nunca se podría realizar dado que no contiene número de
páginas, pero, por el contrario, sí que existe un tamaño que será su dimensión, alto y
ancho.
Datos sin procesar
Captura
Organización
Integración
Análisis (Data Mining)
Resultados del análisis
Del Dato (Big Data) a la Información (Internet)
TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR)
Cuando los datos preprocesados necesitan organización, en el proceso de análisis nos
encontramos en muchos casos con que este proceso se debe realizar secuencialmente y
que se hace necesaria una máquina con gran potencia de cálculo y gran cantidad de
memoria que pueda soportarlo.
En el sistema de integración de los datos tienen que tener las conexiones suficientes
como para que se puedan enlazar y se puede hacer muy complejo si, además, los datos
que se quieren enlazar son de formatos muy heterogéneos. También hay que tener en
cuenta que cuando se realiza la correlación de los datos puede ocurrir que el tiempo para
realizar la sincronización puede ser crítico en el procesamiento.
En el proceso de análisis, también denominado Data Mining, hay que tener en cuenta
que para la extracción de los resultados de información es necesario el uso de modelos o
patrones que hagan la extracción de información de esos datos, ya sea por su propia
estructura o por sus conexiones.
1.5. Tecnologías de Big Data
Las tecnologías de Big Data abarcan dos grandes tipos de campos: el campo
operacional y el campo analítico, en ciertos ámbitos también denominados
tecnologías operacionales y tecnologías de la información.
Las técnicas operacionales se centran en la carga en tiempo real e interactivo de datos
capturándolos y almacenándolos. Y, por otro lado, las técnicas analíticas permiten el
análisis en retrospectiva de datos complejos. Aunque estas dos tecnologías son dispares,
se complementan para integrarse en herramientas que permiten el tratamiento masivo
de datos, formando así lo que se conoce como arquitectura de las tecnologías Big
Data.
Figura 8. Tipos de técnicas. Fuente: Machlup (1980).
Del Dato (Big Data) a la Información (Internet)
TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR)
Las exigencias que demandan cada una de estas herramientas son contrapuestas. En el
caso de las herramientas operacionales es necesario que tengan un gran rendimiento,
que permitan peticiones concurrentemente y que sean escalables, es decir, que puedan
adaptarse a la cantidad de información demandada aunque sean varias las peticiones
realizadas. En cambio, en las herramientas analíticas lo que se demanda es que sean
capaces de gestionar consultas complejas con un rendimiento muy alto en su salida,
dando sus resultados en tiempos mínimos.
1.6. Infraestructura del Big Data
Para dar soporte al procesamiento de Big Data es necesario crear una infraestructura
de componentes que permita su tratamiento. Se pueden mencionar las siguientes:
» Aplicaciones Big Data: son aplicaciones que se adaptan a entornos concretos para
dar soporte a problemas específicos.
» Herramientas de creación de informes y de visualización: facilitan la
transmisión de la información y conocimiento obtenido de los análisis de los datos y
su comunicación a los usuarios finales. En el ámbito de la educación sería, por
ejemplo, para el profesor, el alumno o el director del centro o el ministro de educación.
» Análisis (tradicional y avanzado): incluye todos los procedimientos que se han
señalado en el apartado técnicas de Big Data. Las herramientas de análisis permiten
extraer la información de los almacenes y hacer que sea comprensible al ser humano.
Pueden ser de análisis predictivo, que son aquellas que permiten, tras el estudio
de datos que han sucedido en un tiempo determinado, predecir acontecimientos
futuros. También pueden ser de análisis de sentimiento o de opinión, que
permiten extraer el contenido de un texto indicando realmente su sentido de la
opinión o la subjetividad que quiere reflejar.
» Data Warehouse y herramientas analíticas: los Data Warehouse son
estructuras de almacenamiento de datos propios de las instituciones u organizaciones
muy comunes antes de que existieran las herramientas de Big Data. En estas
estructuras los datos se encuentran organizados y bien estructurados. En muchos
casos actúan como sistema o herramienta de seguridad de los mismos.
Del Dato (Big Data) a la Información (Internet)
TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR)
» Bases de datos y herramientas para la organización: permiten la validación y
la estructuración de grandes cantidades de datos en agrupaciones de datos,
denominadas colecciones. Dentro de estas herramientas se encuentran las
herramientas ETL (Extraction Transformation Load) o herramientas de extracción,
trasformación y carga de información, servicios de flujo de datos, servicios de
serialización, sistemas de archivos distribuidos y servicios de coordinación, estos dos
últimos utilizados para desarrollar sistemas que no se encuentran directamente en
una máquina, sino que se utilizan un conjunto de máquinas interconectadas que
funcionan como una unidad.
» Datos estructurados y no estructurados en bases de datos operacionales:
puede incluir todos los datos provenientes de todas las fuentes posibles.
» Herramientas de seguridad: las que se aplican a un sistema de Big Data no
difieren mucho de los sistemas tradicionales. Los puntos críticos son los siguientes:
o La encriptación y cifrado de la información siempre que las bases de datos sean
sensibles.
o Controlar niveles de acceso y permisos de usuario de las herramientas de análisis.
o Encriptación de comunicaciones y controles de acceso desde sistemas externos al
que se encuentra el sistema Big Data.
» Herramientas de redundancia de datos: estas herramientas de redundancia
permiten que el sistema pueda proporcionar el mismo sistema de respuesta aunque
parte del sistema haya caído o se haya producido algún tipo de error.
En la siguiente imagen se representan la cantidad de herramientas, las aplicaciones y los
tipos de desarrollo que conforman la infraestructura del Big Data en la actualización
para el 2016.
Del Dato (Big Data) a la Información (Internet)
TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR)
Figura 9. Infraestructura Big Data 2016. Fuente: http://www.icemd.com/digital-knowledge/articulos/se-
busca-experto-arquitectura-big-data/
1.7. Big Data en la educación
El uso de las tecnologías en la educación posibilita la acumulación de grandes cantidades
de datos. Cuando se emplean sistemas de e-learning o incluso con las herramientas de
la web 2.0 y web 3.0, cada día se contribuye a la producción de una gran masa de datos.
El uso de los LMS (Learning Management System) posibilita que se tengan datos de
diferentes fuentes y naturaleza, datos de los estudiantes, de sus rutas de aprendizaje, de
los resultados que van obteniendo, de lo que han dejado de hacer, de los fallos que han
tenido. Toda esa producción de datos, una vez organizada, estructurada y analizada,
permite percibir tendencias, conocer el comportamiento de los estudiantes y su
interacción con los contenidos de aprendizaje.
Del Dato (Big Data) a la Información (Internet)
TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR)
Figura 10. Big Data en educación. Fuente:
http://image.slidesharecdn.com/onlineeducaconferencepresentationberlin-bigdataineducation-chmsm-
131212201607-phpapp02/95/online-educa-berlin-conference-big-data-in-education-theory-and-practice-
6-638.jpg?cb=1386879645
Pero no son solo los datos de los estudiantes los que se toman en cuenta, son también los
datos de los contenidos mismos, sus características, si son multimedia o solo textuales o
animaciones, sus niveles de dificultad, la organización. Por otro lado, están los datos de
los profesores, los años de experiencia, si son los autores o no de los contenidos y
actividades. Los datos de la institución si es pública, privada, si incluye varios niveles
educativos, el alcance, la localidad, las condiciones socioeducativas de los agentes que
forman parte su target, etc. En los últimos años también se están considerando las
interacciones de los estudiantes y profesores a través de las redes sociales y de estos con
otros agentes externos a la institución educativa con los que construyen el conocimiento
y fortalecen los aprendizajes.
Toda esta información o, mejor dicho, todos los datos que se generan en este ambiente
educativo, demanda el uso de herramientas de minería de datos, puesto que la estadística
se queda corta, para poder establecer los análisis y establecer relaciones entre todos esos
datos que servirán para la generación de conocimiento para ser usado luego en la
personalización de la educación.
Del Dato (Big Data) a la Información (Internet)
TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR)
1.8. Características de Big Data en la educación
Figura 11. Cómo funciona el proceso Big Data. Fuente: http://www.theflippedclassroom.es/sabes-lo-que-
es-el-big-data/
Para poder hablar de Big Data en educación se debe empezar por considerar el uso de
las plataformas tecnológicas o de la tecnología digital como mediadora de la enseñanza
y el aprendizaje. Tradicionalmente, se parte de sistemas gestores de aprendizaje (LMS o
Learning Management System) con los que los estudiantes interactúan. Estos datos de
comportamiento del alumno se almacenan en bases de datos. A partir de ellos, se hacen
predicciones sobre el éxito o fracaso de los estudiantes y se proporcionan las ayudas y
tutorías pertinentes en cada caso.
Aun cuando esta es una realidad en muchas instituciones de formación online, y aun
cuando la producción masiva de datos está impulsando el desarrollo de técnicas y
estrategias de Big Data para la optimización de su funcionamiento, el campo de la
educación en general es uno de los que más ha tardado en aprovechar los beneficios y
ventajas que ofrece el tratamiento de los grandes datos (Big Data).
Del Dato (Big Data) a la Información (Internet)
TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR)
Uno de las mayores dificultades es la gran disparidad de datos, la falta de acuerdo en
la organización de los datos para su posterior tratamiento, la velocidad con la que se
producen en contraposición con la rapidez en la estructuración de los datos para los
posteriores análisis. No obstante, hay importantes iniciativas que están optimizando
el uso de los datos para personalizar la educación.
Se encuentra por ejemplo el caso del semáforo para los estudiantes de posgrado de una
universidad mejicana (http://ladobe.com.mx/2016/12/crean-la-buap-semaforo-frenar-
desercion-posgrados-mexicanos/). Se trata de la única aplicación mexicana que ayuda
en la predicción del comportamiento de los estudiantes de posgrado. Las plataformas de
e-learning tradicionales como Moodle, BlackBoard, Sakai, etc. también ofrecen
información de valor para el seguimiento de los estudiantes.
Con el surgimiento y proliferación de los MOOC (Massive Open Online Courses) se ha
abierto otra fuente inmensa de producción de datos masivos en educación. Otras
alternativas de aprendizaje abierto y colaborativo son los casos de Khan Academy o
Gooru, las cuáles se basan en Big Data para la gestión de todos los contenidos formativos
que ofrecen, producen y comparten.
1.9. Finalidad de Big Data en educación
Son muchos los beneficios que se pueden obtener del uso del Big Data en la educación.
En cualquier caso, lo que se busca es obtener los mejores resultados en todo el proceso,
que es bastante complejo, multifactorial y que se encuentra en trasformación por la
paralela transformación de la sociedad. Se puede decir que entre los objetivos del uso del
Big Data en educación están los siguientes:
» Mejorar el aprendizaje a través de la personalización la educación.
» Predecir y minimizar el fracaso escolar.
» Mejorar las políticas institucionales en función de las analíticas de los datos.
Por su parte, Kerns (2013) hace un listado de aportes del Big Data a la educación primaria:
1. Poder atender las diferencias individuales. Conocer las habilidades y destrezas
de los alumnos por los resultados que van obteniendo y que puedan ir avanzando
según sus posibilidades y su propio ritmo.
Del Dato (Big Data) a la Información (Internet)
TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR)
2. Compartir información entre diferentes centros educativos, así evitar los
problemas de falta de información sobre un alumno cuando tiene un cambio.
3. Identificar las áreas problemáticas, así los profesores pueden dar mayor apoyo
a los estudiantes en dichas áreas y reforzar las actividades para su desarrollo.
4. Demanda de especialistas en el análisis de datos y de formación a los docentes en
la organización de la información sobre la enseñanza y las evaluaciones para la mayor
y mejor comprensión de los procesos.
5. Personalización de la educación, permitiendo a los más dotados avanzar más
rápido.
6. Hacer avances consistentes. Si un alumno ha avanzado o un nivel y se ha olvidado
de aprender algo, luego puede repasar y completar lo que falta.
7. Involucrar a padres y estudiantes, respaldados en los datos, los informes y la
visualización de los resultados.
1.10. Herramientas de Big Data para educación
Para el logro de todos los objetivos del uso del Big Data en el campo educativo, es
importante el uso de técnicas y herramientas que permitan sacar el mayor provecho de
los datos.
En muchos casos se dispone del historial de datos, pero no se tiene información o
conocimiento de los mismos. Una de las principales técnicas para solucionar esta
situación es la minería de datos educacionales (EDM o Educational Data Mining).
La minería de datos educacionales es el conjunto de técnicas de extracción de
conocimientos a partir de la exploración de datos que se dan en el ámbito educativo,
es la utilización de estos métodos para entender mejor a los estudiantes y los contextos
en los que ellos aprenden.
Del Dato (Big Data) a la Información (Internet)
TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR)
Figura 12. Técnicas de minería de datos educacionales. Modelo de predicción de fracaso escolar. Fuente:
Márquez, Romero y Ventura (2012).
Herramientas de análisis y análisis avanzado
Las técnicas de minería de datos, también conocidas como técnicas de análisis, son las
que se emplean para encontrar significado en el mar de datos que se dispone. Son las que
permiten realizar la interpretación de los datos para darle significado para la mente
humana. Se pueden realizar distintos tipos de análisis, como pueden ser predictivos o
perceptivos. En el campo educativo se han usado para pronosticar fracaso (Márquez,
Romero y Ventura, 2012) y recomendar acciones para evitarlo.
Figura 13. Fuente: http://www.silicon.es/la-necesidad-de-sumar-analisis-predictivo-mas-analisis-
preceptivo-72497
Del Dato (Big Data) a la Información (Internet)
TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR)
Herramientas de generación de informes y paneles
Herramientas que trasforman los datos en información para que pueda ser entendida y
analizada por las personas, en este caso por los gestores educativos.
Figura 14. Gráficos, paneles e informes para Visual Studio ALM. Fuente: https://msdn.microsoft.com/es-
es/library/bb649552.aspx
Herramientas de visualización
El conjunto de herramientas que transforman los datos para el mejor manejo y análisis
de los mismos, muy parecidos a los informes y paneles, con la diferencia de que estas
herramientas permiten la interacción dinámica con el usuario, ofreciendo un valor
agregado al poder visualizar escenarios alternativos de la configuración de los datos.
Del Dato (Big Data) a la Información (Internet)
TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR)
Figura 15. Fuente http://blogthinkbig.com/visualizacion-de-datos/
Hay todo un ecosistema de recursos que van enriqueciendo y surgiendo las alternativas
de trabajo en torno al Big Data educativo que cada día es más social y abierto y, por
tanto, más amplio y retador al momento de hacer los análisis, establecer las conclusiones
y tomar las decisiones institucionales y de personalización del aprendizaje. Unas que han
creado polémica son las herramientas de captura de gestos, tanto de los alumnos como
de los profesores y todos los artilugios que nos hacen reflexionar sobre la situación de
«gran hermano» en la que podemos vivir o, tal vez, en la que ya vivimos.
Finalizamos con esta infografía sobre los mitos del Big Data en la educación.
Del Dato (Big Data) a la Información (Internet)
TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR)
Figura 16. Mitos del Big Data. Fuente: http://www.openeducationchallenge.eu/blog/use-big-data-
education-22
Del Dato (Big Data) a la Información (Internet)
TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR)
1.11. Referencias bibliográficas
Bermúdez, C. (2010). Definición de hoy: yottabyte [entrada en un blog]. Recuperado de
http://www.digitalika.com/2010/06/definicin-de-hoy-yottabyte/
Kerns, D. (3 de septiembre de 2013). 10 Ways Big Data is Changing K-12 Education
[artículo en línea]. Recuperado de http://www.dreambox.com/blog/10-ways-big-data-
changing-k-12-education-2
Machlup, F. (1980). Knowledge and knowledge production. Nueva Jersey: Princeton
University Press.
Márquez, C., Romero, C. y Ventura, S. (2012) Predicción del fracaso escolar mediante
técnicas de minería de datos. IEEE-RITA, 7(3), 109-117. Recuperado de
http://rita.det.uvigo.es/201208/uploads/IEEE-RITA.2012.V7.N3.A1.pdf
Soergel, D. (1985). Organizing information: Principles of data base andretrieval
systems. Orlando: Academic Press.
Del Dato (Big Data) a la Información (Internet)
TEMA 1 – Lo + recomendado © Universidad Internacional de La Rioja (UNIR)
Lo + recomendado
No dejes de leer…
Aplicando minería de datos para descubrir rutas de aprendizaje frecuentes
en Moodle
Bogarín, A., Romero, C. y Cerezo, R. (2016). Aplicando minería de datos para descubrir
rutas de aprendizaje frecuentes en Moodle. Edmetic, 5(1), 73-92.
En este artículo se propone un uso de técnicas de minería de datos con las que se
organizan a los alumnos de un curso en Moodle según su tipo, para conocer sus rutas de
aprendizaje y los factores que influyen en ello.
Accede al artículo a través del aula virtual o desde la siguiente dirección web:
https://www.uco.es/ucopress/ojs/index.php/edmetic/article/view/4017/3845
Del Dato (Big Data) a la Información (Internet)
TEMA 1 – Lo + recomendado © Universidad Internacional de La Rioja (UNIR)
No dejes de ver…
Big Data al servicio de la educación, learning world
Reportaje de los usos que tiene el Big Data en el ámbito educativo, cómo se están
beneficiando los estudiantes con los resultados del uso de la tecnología y del análisis de
los datos que se registran en los sistemas de educación online.
Accede al vídeo a través del aula virtual o desde la siguiente dirección web:
https://www.youtube.com/watch?v=w07yJkHbIwE
Del Dato (Big Data) a la Información (Internet)
TEMA 1 – Lo + recomendado © Universidad Internacional de La Rioja (UNIR)
Educación y datos masivos (Big Data): presentación de Fernando
Santamaría (2014)
Los datos masivos (Big Data) están cambiando la forma de acceder, comprender,
planificar y también la forma de vivir. Este nuevo paradigma está entrando de lleno en
todos los ámbitos sociales. El mundo académico y de aprendizaje no va ser menos. La
analítica del aprendizaje y académico está focalizado en la educación. Esta es la
presentación que mostró el autor en MoodleMoot 2014 en Colombia para dar a conocer
todo este ecosistema del dato.
Accede al vídeo a través del aula virtual o desde la siguiente dirección web:
https://es.slideshare.net/lernys/educacion-y-datos-masivos-big-data
Del Dato (Big Data) a la Información (Internet)
TEMA 1 – + Información © Universidad Internacional de La Rioja (UNIR)
+ Información
A fondo
Predicción del fracaso escolar mediante técnicas de minería de datos
Márquez, C., Romero, C. y Ventura, S. (2012) Predicción del fracaso escolar mediante
técnicas de minería de datos. IEEE-RITA, 7(3), 109-117.
En este artículo los autores destacan las ventajas que ofrece el uso de la minería de datos
educativos para la predicción del éxito y fracaso escolar, así como para ofrecer
oportunidades de intervención en los casos de fallos en el aprendizaje.
Accede al artículo a través del aula virtual o desde la siguiente dirección web:
http://rita.det.uvigo.es/201208/uploads/IEEE-RITA.2012.V7.N3.A1.pdf
Analítica de aprendizaje y personalización
Zapata, M. (2013). Analítica de aprendizaje y personalización. Campus Virtuales, 2(2),
88-118.
En este artículo el autor reflexiona sobre la concepción de la educación y los múltiples
factores que se incorporan en la era digital, el papel de la tutoría y de los apoyos
tecnológicos, así como de todos los elementos que aún no se han incorporado en las
analíticas de aprendizaje y que son una realidad a tener en cuenta.
Accede al artículo a través del aula virtual o desde la siguiente dirección web:
http://uajournals.com/ojs/index.php/campusvirtuales/article/view/41/40
Del Dato (Big Data) a la Información (Internet)
TEMA 1 – + Información © Universidad Internacional de La Rioja (UNIR)
Webgrafía
Inspiring Science Education
Página web que provee herramientas y recursos para promover e inspirar a los alumnos
en la utilización de herramientas online.
Accede a la página web a través del aula virtual o desde la siguiente dirección:
http://www.inspiring-science-education.net/home
MathWorks
MATLAB y Simulink son herramientas que facilitan la inspiración y la innovación, como
demuestra su uso en más de 5000 universidades de todo el mundo.
Accede a la página web a través del aula virtual o desde la siguiente dirección:
https://es.mathworks.com/
Bibliografía
BBVA Innovation Center (s. f.) Herramientas para la visualización de datos. Recuperado
de http://www.centrodeinnovacionbbva.com/ebook/ebook-herramientas-de-
visualizacion-de-datos
Del Dato (Big Data) a la Información (Internet)
TEMA 1 – Test © Universidad Internacional de La Rioja (UNIR)
Test
1. La disposición de datos privados, públicos o comunitarios hace alusión a la
característica del Big Data relacionada con:
A. La velocidad.
B. El volumen.
C. La variedad
2. La minería de datos abarca el conjunto de técnicas, métodos y acciones para extraer
información de los grandes volúmenes de datos para darle significado y favorecer la toma
de decisiones.
A. Verdadero.
B. Falso.
3. En el ámbito del Big Data, cuando el procesamiento de datos, los análisis y las
decisiones se enfocan a acciones que repercutan positivamente en la sociedad, en las
organizaciones o instituciones que las procesan, se hace referencia:
A. Veracidad de los datos.
B. Valor de los datos.
C. Visibilidad de los datos.
4. Conjunto de herramientas que transforman los datos para el mejor manejo y análisis
de los mismos, que permiten la interacción dinámica con el usuario.
A. Herramientas de generación de informes y paneles.
B. Herramientas de análisis avanzado.
C. Herramientas de visualización.
5. El Big Data en educación lo que pretende es estandarizar los procesos de enseñanza y
aprendizaje para facilitar el desarrollo de los cursos de formación.
A. Verdadero.
B. Falso.
Del Dato (Big Data) a la Información (Internet)
TEMA 1 – Test © Universidad Internacional de La Rioja (UNIR)
6. La minería de datos educacionales, cuando está basada en datos multivariados y
provenientes de diferentes fuentes, es un proceso caracterizado por:
A. La velocidad de los resultados.
B. La necesidad de integración de los datos.
C. La confiabilidad de los datos.
7. Son algunas de las características que deben reunir los datos del Big Data:
A. Variabilidad, visibilidad, volumen.
B. Verosimilitud, variedad, velocidad.
C. Veracidad, valor, volumen.
8. La principal finalidad del Big Data en educación es:
A. Personalizar la educación.
B. Facilitar el trabajo del profesor.
C. Aumentar los ingresos de los centros privados.
9. Las analíticas de aprendizaje y métodos de minería de datos educacionales solo
consideran los datos que se obtienen de los LSM por considerarlos de mayor
confiabilidad que los provenientes de las herramientas web 2.0.
A. Verdadero.
B. Falso.
10. Fases a cumplir en el tratamiento de los datos para optimizar los resultados en los
análisis de los mismos:
A. Recopilación, minería, integración.
B. Captura, organización, análisis.
C. Interpretación, preprocesado, análisis.

Más contenido relacionado

La actualidad más candente

Educación y datos masivos (Big Data)
Educación y datos masivos (Big Data)Educación y datos masivos (Big Data)
Educación y datos masivos (Big Data)Fernando Santamaría
 
Big data, NoSQL y tendencias en Bases de Datos 2018.
Big data, NoSQL y tendencias en Bases de Datos 2018.Big data, NoSQL y tendencias en Bases de Datos 2018.
Big data, NoSQL y tendencias en Bases de Datos 2018.Roman Herrera
 
Big data en entornos corporativos - CommCorp
Big data en entornos corporativos - CommCorpBig data en entornos corporativos - CommCorp
Big data en entornos corporativos - CommCorpGrupo DIRCOM
 
Qué es el Big Data?
Qué es el Big Data?Qué es el Big Data?
Qué es el Big Data?Carla Buj
 
Calidad de datos. Preparación y limpieza de los datos
Calidad de datos. Preparación y limpieza de los datosCalidad de datos. Preparación y limpieza de los datos
Calidad de datos. Preparación y limpieza de los datosRoman Herrera
 
Nuevas tecnologias power point pptx
Nuevas tecnologias power point pptxNuevas tecnologias power point pptx
Nuevas tecnologias power point pptxnelsonsanchez86
 
Innovación en el tratamiento de la información desde la Ingeniería del Conoc...
Innovación en el tratamiento de la información desde la  Ingeniería del Conoc...Innovación en el tratamiento de la información desde la  Ingeniería del Conoc...
Innovación en el tratamiento de la información desde la Ingeniería del Conoc...Joaquín Borrego-Díaz
 
Big Data para Dummies
Big Data para DummiesBig Data para Dummies
Big Data para DummiesStratebi
 
Big data
Big dataBig data
Big dataTaniaQu
 
Curso de big data
Curso de big data Curso de big data
Curso de big data Luis Joyanes
 
Big data y la inteligencia de negocios
Big data y la inteligencia de negociosBig data y la inteligencia de negocios
Big data y la inteligencia de negociosnnakasone
 
Big data diapositivas
Big data diapositivasBig data diapositivas
Big data diapositivassgcuadrado
 
Dirigiendo y gestionando proyectos Big Data
Dirigiendo y gestionando proyectos Big DataDirigiendo y gestionando proyectos Big Data
Dirigiendo y gestionando proyectos Big DataEmilio del Prado
 

La actualidad más candente (20)

Educación y datos masivos (Big Data)
Educación y datos masivos (Big Data)Educación y datos masivos (Big Data)
Educación y datos masivos (Big Data)
 
BIG DATA
BIG DATABIG DATA
BIG DATA
 
Big data, NoSQL y tendencias en Bases de Datos 2018.
Big data, NoSQL y tendencias en Bases de Datos 2018.Big data, NoSQL y tendencias en Bases de Datos 2018.
Big data, NoSQL y tendencias en Bases de Datos 2018.
 
Big data en entornos corporativos - CommCorp
Big data en entornos corporativos - CommCorpBig data en entornos corporativos - CommCorp
Big data en entornos corporativos - CommCorp
 
Que es big data
Que es big dataQue es big data
Que es big data
 
Qué es el Big Data?
Qué es el Big Data?Qué es el Big Data?
Qué es el Big Data?
 
Calidad de datos. Preparación y limpieza de los datos
Calidad de datos. Preparación y limpieza de los datosCalidad de datos. Preparación y limpieza de los datos
Calidad de datos. Preparación y limpieza de los datos
 
Nuevas tecnologias power point pptx
Nuevas tecnologias power point pptxNuevas tecnologias power point pptx
Nuevas tecnologias power point pptx
 
Innovación en el tratamiento de la información desde la Ingeniería del Conoc...
Innovación en el tratamiento de la información desde la  Ingeniería del Conoc...Innovación en el tratamiento de la información desde la  Ingeniería del Conoc...
Innovación en el tratamiento de la información desde la Ingeniería del Conoc...
 
Big Data para Dummies
Big Data para DummiesBig Data para Dummies
Big Data para Dummies
 
Presentacion big data
Presentacion big dataPresentacion big data
Presentacion big data
 
Big data
Big dataBig data
Big data
 
Big data
Big data Big data
Big data
 
Iniciación al BiG Data - español
Iniciación al BiG Data - españolIniciación al BiG Data - español
Iniciación al BiG Data - español
 
Curso de big data
Curso de big data Curso de big data
Curso de big data
 
Big data y la inteligencia de negocios
Big data y la inteligencia de negociosBig data y la inteligencia de negocios
Big data y la inteligencia de negocios
 
Big Data
Big DataBig Data
Big Data
 
Tendencias en Big Data (2015-2016)
Tendencias en Big Data (2015-2016)Tendencias en Big Data (2015-2016)
Tendencias en Big Data (2015-2016)
 
Big data diapositivas
Big data diapositivasBig data diapositivas
Big data diapositivas
 
Dirigiendo y gestionando proyectos Big Data
Dirigiendo y gestionando proyectos Big DataDirigiendo y gestionando proyectos Big Data
Dirigiendo y gestionando proyectos Big Data
 

Similar a BigDataEducación

Afc module 1 translated
Afc module 1 translatedAfc module 1 translated
Afc module 1 translatedSoniaNaiba
 
Big data o datos masivos en investigación en odontología
Big data o datos masivos en investigación en odontologíaBig data o datos masivos en investigación en odontología
Big data o datos masivos en investigación en odontologíaJuan Carlos Munévar
 
El Big Data como fenómeno y herramienta para el e‐research en CSyH Digitales
El Big Data como fenómeno y herramienta para el e‐research en CSyH DigitalesEl Big Data como fenómeno y herramienta para el e‐research en CSyH Digitales
El Big Data como fenómeno y herramienta para el e‐research en CSyH DigitalesMaría Sánchez González (@cibermarikiya)
 
Código de buenas prácticas en protección de datos para proyectos Big Data
Código de buenas prácticas en protección de datos para proyectos Big DataCódigo de buenas prácticas en protección de datos para proyectos Big Data
Código de buenas prácticas en protección de datos para proyectos Big DataAlfredo Vela Zancada
 
La geografía y la estadística. dos necesidades para entender big data
La geografía y la estadística. dos necesidades para entender big dataLa geografía y la estadística. dos necesidades para entender big data
La geografía y la estadística. dos necesidades para entender big datapedro_juanes
 
Revista TicNews Edición Mayo 2014
Revista TicNews Edición Mayo 2014Revista TicNews Edición Mayo 2014
Revista TicNews Edición Mayo 2014Edicion Ticnews
 
Aplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de DatosAplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de DatosLuis Fernando Aguas Bucheli
 
Bigdata trabajo de investigacion
Bigdata trabajo de investigacion Bigdata trabajo de investigacion
Bigdata trabajo de investigacion Ris Fernandez
 
Big-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptxBig-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptxJavierNavarrete43
 
De tic big data
De tic big dataDe tic big data
De tic big datadandiosa2
 
De tic big data
De tic big dataDe tic big data
De tic big datadandiosa2
 

Similar a BigDataEducación (20)

Fundamentos.pptx
Fundamentos.pptxFundamentos.pptx
Fundamentos.pptx
 
¿Qué es el Big Data?
¿Qué es el Big Data?¿Qué es el Big Data?
¿Qué es el Big Data?
 
Afc module 1 translated
Afc module 1 translatedAfc module 1 translated
Afc module 1 translated
 
BIG DATA
BIG DATABIG DATA
BIG DATA
 
Big data o datos masivos en investigación en odontología
Big data o datos masivos en investigación en odontologíaBig data o datos masivos en investigación en odontología
Big data o datos masivos en investigación en odontología
 
Articulo de Big Data
Articulo de Big DataArticulo de Big Data
Articulo de Big Data
 
El Big Data como fenómeno y herramienta para el e‐research en CSyH Digitales
El Big Data como fenómeno y herramienta para el e‐research en CSyH DigitalesEl Big Data como fenómeno y herramienta para el e‐research en CSyH Digitales
El Big Data como fenómeno y herramienta para el e‐research en CSyH Digitales
 
Código de buenas prácticas en protección de datos para proyectos Big Data
Código de buenas prácticas en protección de datos para proyectos Big DataCódigo de buenas prácticas en protección de datos para proyectos Big Data
Código de buenas prácticas en protección de datos para proyectos Big Data
 
Big data
Big dataBig data
Big data
 
La geografía y la estadística. dos necesidades para entender big data
La geografía y la estadística. dos necesidades para entender big dataLa geografía y la estadística. dos necesidades para entender big data
La geografía y la estadística. dos necesidades para entender big data
 
Revista TicNews Edición Mayo 2014
Revista TicNews Edición Mayo 2014Revista TicNews Edición Mayo 2014
Revista TicNews Edición Mayo 2014
 
Wp 2015-07
Wp 2015-07Wp 2015-07
Wp 2015-07
 
El big data pedro ruiz
El big data pedro ruizEl big data pedro ruiz
El big data pedro ruiz
 
Aplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de DatosAplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de Datos
 
Bigdata trabajo de investigacion
Bigdata trabajo de investigacion Bigdata trabajo de investigacion
Bigdata trabajo de investigacion
 
Big-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptxBig-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptx
 
Sesión itdUPM. Data revolution
Sesión itdUPM. Data revolutionSesión itdUPM. Data revolution
Sesión itdUPM. Data revolution
 
De tic big data
De tic big dataDe tic big data
De tic big data
 
Big data
Big dataBig data
Big data
 
De tic big data
De tic big dataDe tic big data
De tic big data
 

Más de 1311480063

Uso educativo de_los_blogs
Uso educativo de_los_blogsUso educativo de_los_blogs
Uso educativo de_los_blogs1311480063
 
Signo de puntuacion
Signo de puntuacionSigno de puntuacion
Signo de puntuacion1311480063
 
Por que y para que la didactica
Por que y para que la didacticaPor que y para que la didactica
Por que y para que la didactica1311480063
 
Manual de didactica de las ciencias naturales
Manual de didactica de las ciencias naturalesManual de didactica de las ciencias naturales
Manual de didactica de las ciencias naturales1311480063
 
Comprension lectora 2
Comprension lectora 2Comprension lectora 2
Comprension lectora 21311480063
 
Comprension lectora 1
Comprension lectora 1Comprension lectora 1
Comprension lectora 11311480063
 
3egb len-mat-eess-ccnn-f1 texto 3ero
3egb len-mat-eess-ccnn-f1 texto 3ero3egb len-mat-eess-ccnn-f1 texto 3ero
3egb len-mat-eess-ccnn-f1 texto 3ero1311480063
 
pca-lectura-critica-de-mensaje-iii-bgu
 pca-lectura-critica-de-mensaje-iii-bgu pca-lectura-critica-de-mensaje-iii-bgu
pca-lectura-critica-de-mensaje-iii-bgu1311480063
 
Calendario vivencial
Calendario vivencialCalendario vivencial
Calendario vivencial1311480063
 
Asignatura optativa-lectura-critica-de-mensajes-ll-3 bgu
Asignatura optativa-lectura-critica-de-mensajes-ll-3 bguAsignatura optativa-lectura-critica-de-mensajes-ll-3 bgu
Asignatura optativa-lectura-critica-de-mensajes-ll-3 bgu1311480063
 

Más de 1311480063 (10)

Uso educativo de_los_blogs
Uso educativo de_los_blogsUso educativo de_los_blogs
Uso educativo de_los_blogs
 
Signo de puntuacion
Signo de puntuacionSigno de puntuacion
Signo de puntuacion
 
Por que y para que la didactica
Por que y para que la didacticaPor que y para que la didactica
Por que y para que la didactica
 
Manual de didactica de las ciencias naturales
Manual de didactica de las ciencias naturalesManual de didactica de las ciencias naturales
Manual de didactica de las ciencias naturales
 
Comprension lectora 2
Comprension lectora 2Comprension lectora 2
Comprension lectora 2
 
Comprension lectora 1
Comprension lectora 1Comprension lectora 1
Comprension lectora 1
 
3egb len-mat-eess-ccnn-f1 texto 3ero
3egb len-mat-eess-ccnn-f1 texto 3ero3egb len-mat-eess-ccnn-f1 texto 3ero
3egb len-mat-eess-ccnn-f1 texto 3ero
 
pca-lectura-critica-de-mensaje-iii-bgu
 pca-lectura-critica-de-mensaje-iii-bgu pca-lectura-critica-de-mensaje-iii-bgu
pca-lectura-critica-de-mensaje-iii-bgu
 
Calendario vivencial
Calendario vivencialCalendario vivencial
Calendario vivencial
 
Asignatura optativa-lectura-critica-de-mensajes-ll-3 bgu
Asignatura optativa-lectura-critica-de-mensajes-ll-3 bguAsignatura optativa-lectura-critica-de-mensajes-ll-3 bgu
Asignatura optativa-lectura-critica-de-mensajes-ll-3 bgu
 

Último

MAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grandeMAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grandeMarjorie Burga
 
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxTIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxlclcarmen
 
plande accion dl aula de innovación pedagogica 2024.pdf
plande accion dl aula de innovación pedagogica 2024.pdfplande accion dl aula de innovación pedagogica 2024.pdf
plande accion dl aula de innovación pedagogica 2024.pdfenelcielosiempre
 
PIAR v 015. 2024 Plan Individual de ajustes razonables
PIAR v 015. 2024 Plan Individual de ajustes razonablesPIAR v 015. 2024 Plan Individual de ajustes razonables
PIAR v 015. 2024 Plan Individual de ajustes razonablesYanirisBarcelDelaHoz
 
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Alejandrino Halire Ccahuana
 
ORGANIZACIÓN SOCIAL INCA EN EL TAHUANTINSUYO.pptx
ORGANIZACIÓN SOCIAL INCA EN EL TAHUANTINSUYO.pptxORGANIZACIÓN SOCIAL INCA EN EL TAHUANTINSUYO.pptx
ORGANIZACIÓN SOCIAL INCA EN EL TAHUANTINSUYO.pptxnandoapperscabanilla
 
Dinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes dDinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes dstEphaniiie
 
PLAN DE REFUERZO ESCOLAR primaria (1).docx
PLAN DE REFUERZO ESCOLAR primaria (1).docxPLAN DE REFUERZO ESCOLAR primaria (1).docx
PLAN DE REFUERZO ESCOLAR primaria (1).docxlupitavic
 
Valoración Crítica de EEEM Feco2023 FFUCV
Valoración Crítica de EEEM Feco2023 FFUCVValoración Crítica de EEEM Feco2023 FFUCV
Valoración Crítica de EEEM Feco2023 FFUCVGiustinoAdesso1
 
actividades comprensión lectora para 3° grado
actividades comprensión lectora para 3° gradoactividades comprensión lectora para 3° grado
actividades comprensión lectora para 3° gradoJosDanielEstradaHern
 
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptxSEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptxYadi Campos
 
Programacion Anual Matemática4 MPG 2024 Ccesa007.pdf
Programacion Anual Matemática4    MPG 2024  Ccesa007.pdfProgramacion Anual Matemática4    MPG 2024  Ccesa007.pdf
Programacion Anual Matemática4 MPG 2024 Ccesa007.pdfDemetrio Ccesa Rayme
 
proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niñoproyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niñotapirjackluis
 
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdfGUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdfPaolaRopero2
 
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLAACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLAJAVIER SOLIS NOYOLA
 

Último (20)

MAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grandeMAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grande
 
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxTIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
 
Presentacion Metodología de Enseñanza Multigrado
Presentacion Metodología de Enseñanza MultigradoPresentacion Metodología de Enseñanza Multigrado
Presentacion Metodología de Enseñanza Multigrado
 
plande accion dl aula de innovación pedagogica 2024.pdf
plande accion dl aula de innovación pedagogica 2024.pdfplande accion dl aula de innovación pedagogica 2024.pdf
plande accion dl aula de innovación pedagogica 2024.pdf
 
PIAR v 015. 2024 Plan Individual de ajustes razonables
PIAR v 015. 2024 Plan Individual de ajustes razonablesPIAR v 015. 2024 Plan Individual de ajustes razonables
PIAR v 015. 2024 Plan Individual de ajustes razonables
 
Power Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptxPower Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptx
 
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
 
ORGANIZACIÓN SOCIAL INCA EN EL TAHUANTINSUYO.pptx
ORGANIZACIÓN SOCIAL INCA EN EL TAHUANTINSUYO.pptxORGANIZACIÓN SOCIAL INCA EN EL TAHUANTINSUYO.pptx
ORGANIZACIÓN SOCIAL INCA EN EL TAHUANTINSUYO.pptx
 
Dinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes dDinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes d
 
Fe contra todo pronóstico. La fe es confianza.
Fe contra todo pronóstico. La fe es confianza.Fe contra todo pronóstico. La fe es confianza.
Fe contra todo pronóstico. La fe es confianza.
 
PLAN DE REFUERZO ESCOLAR primaria (1).docx
PLAN DE REFUERZO ESCOLAR primaria (1).docxPLAN DE REFUERZO ESCOLAR primaria (1).docx
PLAN DE REFUERZO ESCOLAR primaria (1).docx
 
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdfTema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
 
Valoración Crítica de EEEM Feco2023 FFUCV
Valoración Crítica de EEEM Feco2023 FFUCVValoración Crítica de EEEM Feco2023 FFUCV
Valoración Crítica de EEEM Feco2023 FFUCV
 
actividades comprensión lectora para 3° grado
actividades comprensión lectora para 3° gradoactividades comprensión lectora para 3° grado
actividades comprensión lectora para 3° grado
 
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptxSEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
 
Programacion Anual Matemática4 MPG 2024 Ccesa007.pdf
Programacion Anual Matemática4    MPG 2024  Ccesa007.pdfProgramacion Anual Matemática4    MPG 2024  Ccesa007.pdf
Programacion Anual Matemática4 MPG 2024 Ccesa007.pdf
 
proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niñoproyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
 
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdfGUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
 
Unidad 3 | Metodología de la Investigación
Unidad 3 | Metodología de la InvestigaciónUnidad 3 | Metodología de la Investigación
Unidad 3 | Metodología de la Investigación
 
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLAACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
 

BigDataEducación

  • 1. Introducción al Big Data en educación [1.1] ¿Cómo estudiar este tema? [1.2] Introducción [1.3] ¿Qué es Big Data? [1.4] Tratamiento de la información [1.5] Tecnologías de Big Data [1.6] Infraestructura del Big Data [1.7] Big Data en la educación [1.8] Características de Big Data en la educación [1.9] Finalidad de Big Data en educación [1.10] Herramientas de Big Data para educación [1.11] Referencias bibliográficas 1TEMA
  • 2. Del Dato (Big Data) a la Información (Internet) TEMA 1 – Esquema © Universidad Internacional de La Rioja (UNIR) Esquema IntroducciónalBigDataeneducación Las7V •Volumen •Velocidad •Variedad •Veracidad •Valor •Variabilidad •Visualización ¿QuéesBigData?BigDataeneducación Características •Usodetecnología •Produccióndedatosdiversos (multidimensionales) •Almacenamientoenbasesde datosestructuradasyno estructuradas •Analíticas/tomadedecisiones •Procesocomplejo,dinámicoy flexible Tratamientodela información TecnologíasdeBig Data Infraestructurade BigData Finalidad •Mejorarelaprendizaje •Personalizacióndelaeducación •Predeciryminimizarelfracaso escolar •Mejorarlaspolíticas institucionales Técnicasyherramientas 1.Herramientasdeanálisisy análisisavanzado 2.Herramientasdegeneración deinformespaneles 3.Herramientasdevisualización Analíticas/mineríade datos
  • 3. Del Dato (Big Data) a la Información (Internet) TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR) Ideas clave 1.1. ¿Cómo estudiar este tema? Para trabajar este tema deberás leer los siguientes artículos: » Camargo, J. J., Camargo, J. F. y Joyanes, L. (enero-abril, 2015). Conociendo Big Data. Revista Facultad de Ingeniería, 24(38), 63-77. Disponible en el aula virtual e virtud del artículo 32.4 de la Ley de Propiedad Intelectual. » Ortoll, E. (octubre, 2014). Big Data se escribe con V [artículo en línea]. Revista de los Estudios de Ciencias de la Información y de la Comunicación, 37. Disponible en http://www.uoc.edu/divulgacio/comein/es/numero37/articles/Article-Eva-Ortoll.html 1.2. Introducción Los grandes volúmenes de datos que se producen en la actualidad gracias a las tecnologías de la información y la comunicación están generando nuevas perspectivas y necesidades de manejo de los mismos. La sociedad digital en la que estamos inmersos está caracterizada por una producción ingente de datos, datos y más datos de los que en general no se tiene consciencia. Cada vez que las personas publican o interactúan por Facebook, cuando publican Tweets, publican y comentan fotografías, noticias o páginas web, cada vez que se consulta la web para conocer los pronósticos del tiempo o cuando se hacen compras online de productos de todo tipo, tanto para pedir una pizza como para comprar ropa, billetes de viaje, artículos para el hogar o contenidos digitales, libros, aplicaciones, etc., estamos produciendo miles de datos. Cuando nos conectamos a las clases online o cuando usamos una aplicación educativa o publicamos en el blog de aula o participamos en un MOOC, estamos igualmente sumando datos a esa gran masa de datos. ¿Qué se hace o qué se puede hacer con esos datos? ¿Cuál es la contribución que se hace con el uso de las TIC en la educación a esa gran producción de datos? Son preguntas que trataremos de responder con el estudio de este tema.
  • 4. Del Dato (Big Data) a la Información (Internet) TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR) 1.3. ¿Qué es Big Data? El término Big Data hace referencia al gran volumen de datos que se están produciendo continuamente a través de los medios electrónicos. Esta producción de datos proviene de múltiples fuentes, son de diferente naturaleza y además se producen a gran velocidad. Con esta imagen nos podemos hacer una idea de cómo va creciendo la producción de información, la velocidad y algunas de la fuentes a través de las que se produce. Figura 1. Big Data. Fuente: https://community.hpe.com/t5/IT-Operations-Management-ITOM/A-BIG- brother-for-your-BIG-data-environment/ba-p/6284087#.WRMzIuXyhPZ El concepto de Big Data fue introducido por primera vez por Roger Magoulas de O’Reilly en 2005 y lo hizo para definir aquella gran cantidad de datos que no podía gestionarse por medio de técnicas y procesos tradicionales debido a su complejidad y tamaño. A partir de esa definición, el concepto de Big Data se estudió desde distintos puntos de vista, ya que permitió indagar en las implicaciones que existían desde los distintos campos involucrados. En esos momentos se determinó que el Big Data constaba de tres facetas diferentes, denominadas las tres V de Big Data: volumen, velocidad y variedad. Sin embargo, con la evolución en el tiempo, el uso y el procesamiento de los mismos se ha establecido que estos datos deben tener otras características que son veracidad, valor, variabilidad y visualización.
  • 5. Del Dato (Big Data) a la Información (Internet) TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR) Las 7 V del Big Data Las 7 V a las que se hace referencia en el entorno del tratamiento de los grandes datos son las siguientes: » Volumen: hace alusión a la gran producción de datos a nivel mundial. Esta gran cantidad de datos sirve para generar información que, a su vez, se utiliza para generar conocimiento. Los datos informáticos se miden en bits, que es la unidad mínima de información. Un bit almacena un cero o un uno. La siguiente unidad de medida es el byte que corresponden a 8 bits. Y a partir de esa medida se establecen las siguientes unidades de medidas de información: Figura 2. Unidades de medidas de información. Fuente: http://cuartoinformatica.tecnojulio.com/2015/09/21/unidades-de-medidas-de-la-informacion- actividad-5/ Se estima que para el 2020 haya un volumen de datos de 35 zettabyte. Figura 3. Qué es un zettabyte. Fuente: http://www.csc.com/insights/flxwd/78931- big_data_universe_beginning_to_explode » Velocidad: hace referencia a la rapidez con la que se dispone de los datos donde sea y cuando sea (anytime-anywhere). Se dispone de los datos en tiempo real, en el mismo momento en el que se están produciendo, por lo que es muy importante la
  • 6. Del Dato (Big Data) a la Información (Internet) TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR) velocidad del tratamiento de esos datos. A mayor velocidad mayor validez de la información que se pueda obtener. » Variedad: los datos provienen de diferentes fuentes y pueden ser estructurados o no estructurados. o Los estructurados son aquellos que están encorsetados en una estructura definida, se dispone de los mismos datos para todos los elementos, por ejemplo, en una base de datos de empleados (nombre, edad, titulación, años de servicio, etc.). o Los datos no estructurados son aquellos que no tienen una estructura definida, como pueden ser imágenes, vídeos o ficheros de sonido. Figura 4. Captura de pantalla de «Webinar: Big Data para Dummies». Fuente: https://www.youtube.com/watch?v=fZhpLdZx5Qg Figura 5. Cinco tipos de datos. Fuente: Ortoll (2014). Datos fruto de transacciones comerciales, de la navegación web a un lugar determinado, del uso de la telefonía móvil Datos públicos Data exhaust Datos comunitarios Self-quantification data Datos privados Datos que tienen los gobiernos, ayuntamientos, comunidades locales, (por ejemplo, datos sobre transporte, uso de energía, sanidad, etc.) Datos ambientales que se recogen de forma pasiva. Estos datos no tienen utilidad para aquellos quien las captan pero que combinadas con otros datos pueden aportar valor Datos producidos principalmente en las redes sociales, contenidos generados por el usuario, etc. Datos proporcionados por los individuos al cuantificar sus comportamientos y acciones. Por ejemplo, los datos monitorizados sobre las pulsaciones durante la realización de ejercicio físico que son recogidos por dispositivos móviles 1 2 3 4 5
  • 7. Del Dato (Big Data) a la Información (Internet) TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR) » Veracidad: los datos deben ser reales, deben corresponder con lo que señalan que son y no con datos falsos. La depuración de los datos y la limpieza de las bases de datos de las organizaciones o instituciones es un paso previo a la toma de decisiones sobre la base de los datos de los que dispone. Figura 5. Big Data: 7 V. Fuente: http://www.impactradius.com/blog/7-vs-big-data/ » Valor: toda la producción y procesamiento de datos, los análisis y decisiones deben conducir a acciones que repercutan positivamente en la sociedad, en las organizaciones o instituciones que las procesan. » Variabilidad: la variabilidad de los datos se refiere a la variación que pueden tener los datos, los cambios que experimentan y que impactan en la homogeneización de los mismos, así como las posibilidades de predicción. » Visualización: característica definitoria de los grandes datos. En este caso, toma mucho significado la expresión «una imagen vale más que mil palabras». Poder traducir la ingente cantidad de datos y los resultados de los análisis a esquemas, diagramas o gráficos que resuman o sinteticen la información obtenida de los análisis de los macrodatos o Big Data es otra de las necesidades que han surgido en este campo. Es mucha la información que se puede transmitir con las herramientas de visualización de datos, las cuales permiten percibir tendencias y facilitar la toma de decisiones. Como puede verse, son muchos los elementos a considerar para considerar una fuente de datos como Big Data.
  • 8. Del Dato (Big Data) a la Información (Internet) TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR) 1.4. Tratamiento de la información Con la presencia de la IOT (Internet de las cosas) se fortifica mucho la producción de los grandes volúmenes de datos. Sin embargo, lo más importante no es el volumen de datos (si hay más o menos teras), sino el aprovechamiento de los mismos con el tratamiento y análisis que se haga de ellos para que se pueda obtener información en un primer momento y luego construir el conocimiento que influirá en las decisiones que se espera repercutan en un mayor bienestar para todos en general. Es por eso que Big Data no trata solo el término de dato, sino que también está relacionada con las técnicas que pueden mejorar el manejo de las 7 V para que incrementen su valor. Estas V implican que exista un tratamiento de los datos enfocándose en distintos aspectos: » El modo en el que se capturan los datos junto con la selección de los datos que se capturan. » El modo de almacenamiento de los datos que han sido capturados. » Una vez almacenados, deberán existir herramientas que permitan una búsqueda adecuada de los datos. » En el caso de que sea necesario, esos datos han de ser compartidos entre distintos entornos. » El último aspecto a tener en cuenta cuando se tiene esa gran cantidad de datos es el modo en el que van a ser visualizados. Figura 6. Tratamiento de los datos. Fuente: Soergel (1985). Es decir, cada vez que se hace necesaria la extracción de resultados en base a los datos básicos, se hace necesaria una transformación que permita obtener conclusiones. El proceso básico de esa transformación es el siguiente: partiendo de los datos sin tratar, lo que se hace es un preprocesado para llevar a cabo una concreción de los mismos para que luego se pueda realizar un análisis de correlación que permita una extracción exhaustiva de información que proporcionará una serie de resultados.
  • 9. Del Dato (Big Data) a la Información (Internet) TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR) El esquema básico está representado en el siguiente diagrama: Figura 7. Esquema de la transformación de los datos. Fuente: Soergel (1985). El objetivo del análisis de datos es examinar grandes cantidades de datos con una variedad de clases, con el fin de descubrir información que sea relevante y útil para la empresa, de manera que le permita tomar las mejores decisiones y obtener ventajas competitivas en comparación con otras de su clase. (Camargo, Camargo y Joyanes (2015). Para ello se utilizan técnicas y herramientas especializadas para el manejo de grandes bases de datos. El procesamiento comienza desde la captura del dato, el procesamiento y tratamiento del mismo para la organización, estructuración e integración si los datos provienen de diferentes fuentes y establecimiento de relaciones con otros, los análisis del conjunto de relaciones, también llamado Data Mining, y la producción de información y conocimiento como resultado de todo el proceso. Para que el proceso llegue a buen fin, es necesario abordar una serie de retos. En cuanto a la captura, se hace necesario un control dependiendo del tipo de datos, ya que las transformaciones que se tienen que aplicar en cada caso no son las mismas. Por ejemplo, la información que se debe tratar en una imagen y en un PDF es distinta. En un PDF se puede tener que realizar un análisis del tamaño según el número de páginas que contiene, que en una imagen nunca se podría realizar dado que no contiene número de páginas, pero, por el contrario, sí que existe un tamaño que será su dimensión, alto y ancho. Datos sin procesar Captura Organización Integración Análisis (Data Mining) Resultados del análisis
  • 10. Del Dato (Big Data) a la Información (Internet) TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR) Cuando los datos preprocesados necesitan organización, en el proceso de análisis nos encontramos en muchos casos con que este proceso se debe realizar secuencialmente y que se hace necesaria una máquina con gran potencia de cálculo y gran cantidad de memoria que pueda soportarlo. En el sistema de integración de los datos tienen que tener las conexiones suficientes como para que se puedan enlazar y se puede hacer muy complejo si, además, los datos que se quieren enlazar son de formatos muy heterogéneos. También hay que tener en cuenta que cuando se realiza la correlación de los datos puede ocurrir que el tiempo para realizar la sincronización puede ser crítico en el procesamiento. En el proceso de análisis, también denominado Data Mining, hay que tener en cuenta que para la extracción de los resultados de información es necesario el uso de modelos o patrones que hagan la extracción de información de esos datos, ya sea por su propia estructura o por sus conexiones. 1.5. Tecnologías de Big Data Las tecnologías de Big Data abarcan dos grandes tipos de campos: el campo operacional y el campo analítico, en ciertos ámbitos también denominados tecnologías operacionales y tecnologías de la información. Las técnicas operacionales se centran en la carga en tiempo real e interactivo de datos capturándolos y almacenándolos. Y, por otro lado, las técnicas analíticas permiten el análisis en retrospectiva de datos complejos. Aunque estas dos tecnologías son dispares, se complementan para integrarse en herramientas que permiten el tratamiento masivo de datos, formando así lo que se conoce como arquitectura de las tecnologías Big Data. Figura 8. Tipos de técnicas. Fuente: Machlup (1980).
  • 11. Del Dato (Big Data) a la Información (Internet) TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR) Las exigencias que demandan cada una de estas herramientas son contrapuestas. En el caso de las herramientas operacionales es necesario que tengan un gran rendimiento, que permitan peticiones concurrentemente y que sean escalables, es decir, que puedan adaptarse a la cantidad de información demandada aunque sean varias las peticiones realizadas. En cambio, en las herramientas analíticas lo que se demanda es que sean capaces de gestionar consultas complejas con un rendimiento muy alto en su salida, dando sus resultados en tiempos mínimos. 1.6. Infraestructura del Big Data Para dar soporte al procesamiento de Big Data es necesario crear una infraestructura de componentes que permita su tratamiento. Se pueden mencionar las siguientes: » Aplicaciones Big Data: son aplicaciones que se adaptan a entornos concretos para dar soporte a problemas específicos. » Herramientas de creación de informes y de visualización: facilitan la transmisión de la información y conocimiento obtenido de los análisis de los datos y su comunicación a los usuarios finales. En el ámbito de la educación sería, por ejemplo, para el profesor, el alumno o el director del centro o el ministro de educación. » Análisis (tradicional y avanzado): incluye todos los procedimientos que se han señalado en el apartado técnicas de Big Data. Las herramientas de análisis permiten extraer la información de los almacenes y hacer que sea comprensible al ser humano. Pueden ser de análisis predictivo, que son aquellas que permiten, tras el estudio de datos que han sucedido en un tiempo determinado, predecir acontecimientos futuros. También pueden ser de análisis de sentimiento o de opinión, que permiten extraer el contenido de un texto indicando realmente su sentido de la opinión o la subjetividad que quiere reflejar. » Data Warehouse y herramientas analíticas: los Data Warehouse son estructuras de almacenamiento de datos propios de las instituciones u organizaciones muy comunes antes de que existieran las herramientas de Big Data. En estas estructuras los datos se encuentran organizados y bien estructurados. En muchos casos actúan como sistema o herramienta de seguridad de los mismos.
  • 12. Del Dato (Big Data) a la Información (Internet) TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR) » Bases de datos y herramientas para la organización: permiten la validación y la estructuración de grandes cantidades de datos en agrupaciones de datos, denominadas colecciones. Dentro de estas herramientas se encuentran las herramientas ETL (Extraction Transformation Load) o herramientas de extracción, trasformación y carga de información, servicios de flujo de datos, servicios de serialización, sistemas de archivos distribuidos y servicios de coordinación, estos dos últimos utilizados para desarrollar sistemas que no se encuentran directamente en una máquina, sino que se utilizan un conjunto de máquinas interconectadas que funcionan como una unidad. » Datos estructurados y no estructurados en bases de datos operacionales: puede incluir todos los datos provenientes de todas las fuentes posibles. » Herramientas de seguridad: las que se aplican a un sistema de Big Data no difieren mucho de los sistemas tradicionales. Los puntos críticos son los siguientes: o La encriptación y cifrado de la información siempre que las bases de datos sean sensibles. o Controlar niveles de acceso y permisos de usuario de las herramientas de análisis. o Encriptación de comunicaciones y controles de acceso desde sistemas externos al que se encuentra el sistema Big Data. » Herramientas de redundancia de datos: estas herramientas de redundancia permiten que el sistema pueda proporcionar el mismo sistema de respuesta aunque parte del sistema haya caído o se haya producido algún tipo de error. En la siguiente imagen se representan la cantidad de herramientas, las aplicaciones y los tipos de desarrollo que conforman la infraestructura del Big Data en la actualización para el 2016.
  • 13. Del Dato (Big Data) a la Información (Internet) TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR) Figura 9. Infraestructura Big Data 2016. Fuente: http://www.icemd.com/digital-knowledge/articulos/se- busca-experto-arquitectura-big-data/ 1.7. Big Data en la educación El uso de las tecnologías en la educación posibilita la acumulación de grandes cantidades de datos. Cuando se emplean sistemas de e-learning o incluso con las herramientas de la web 2.0 y web 3.0, cada día se contribuye a la producción de una gran masa de datos. El uso de los LMS (Learning Management System) posibilita que se tengan datos de diferentes fuentes y naturaleza, datos de los estudiantes, de sus rutas de aprendizaje, de los resultados que van obteniendo, de lo que han dejado de hacer, de los fallos que han tenido. Toda esa producción de datos, una vez organizada, estructurada y analizada, permite percibir tendencias, conocer el comportamiento de los estudiantes y su interacción con los contenidos de aprendizaje.
  • 14. Del Dato (Big Data) a la Información (Internet) TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR) Figura 10. Big Data en educación. Fuente: http://image.slidesharecdn.com/onlineeducaconferencepresentationberlin-bigdataineducation-chmsm- 131212201607-phpapp02/95/online-educa-berlin-conference-big-data-in-education-theory-and-practice- 6-638.jpg?cb=1386879645 Pero no son solo los datos de los estudiantes los que se toman en cuenta, son también los datos de los contenidos mismos, sus características, si son multimedia o solo textuales o animaciones, sus niveles de dificultad, la organización. Por otro lado, están los datos de los profesores, los años de experiencia, si son los autores o no de los contenidos y actividades. Los datos de la institución si es pública, privada, si incluye varios niveles educativos, el alcance, la localidad, las condiciones socioeducativas de los agentes que forman parte su target, etc. En los últimos años también se están considerando las interacciones de los estudiantes y profesores a través de las redes sociales y de estos con otros agentes externos a la institución educativa con los que construyen el conocimiento y fortalecen los aprendizajes. Toda esta información o, mejor dicho, todos los datos que se generan en este ambiente educativo, demanda el uso de herramientas de minería de datos, puesto que la estadística se queda corta, para poder establecer los análisis y establecer relaciones entre todos esos datos que servirán para la generación de conocimiento para ser usado luego en la personalización de la educación.
  • 15. Del Dato (Big Data) a la Información (Internet) TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR) 1.8. Características de Big Data en la educación Figura 11. Cómo funciona el proceso Big Data. Fuente: http://www.theflippedclassroom.es/sabes-lo-que- es-el-big-data/ Para poder hablar de Big Data en educación se debe empezar por considerar el uso de las plataformas tecnológicas o de la tecnología digital como mediadora de la enseñanza y el aprendizaje. Tradicionalmente, se parte de sistemas gestores de aprendizaje (LMS o Learning Management System) con los que los estudiantes interactúan. Estos datos de comportamiento del alumno se almacenan en bases de datos. A partir de ellos, se hacen predicciones sobre el éxito o fracaso de los estudiantes y se proporcionan las ayudas y tutorías pertinentes en cada caso. Aun cuando esta es una realidad en muchas instituciones de formación online, y aun cuando la producción masiva de datos está impulsando el desarrollo de técnicas y estrategias de Big Data para la optimización de su funcionamiento, el campo de la educación en general es uno de los que más ha tardado en aprovechar los beneficios y ventajas que ofrece el tratamiento de los grandes datos (Big Data).
  • 16. Del Dato (Big Data) a la Información (Internet) TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR) Uno de las mayores dificultades es la gran disparidad de datos, la falta de acuerdo en la organización de los datos para su posterior tratamiento, la velocidad con la que se producen en contraposición con la rapidez en la estructuración de los datos para los posteriores análisis. No obstante, hay importantes iniciativas que están optimizando el uso de los datos para personalizar la educación. Se encuentra por ejemplo el caso del semáforo para los estudiantes de posgrado de una universidad mejicana (http://ladobe.com.mx/2016/12/crean-la-buap-semaforo-frenar- desercion-posgrados-mexicanos/). Se trata de la única aplicación mexicana que ayuda en la predicción del comportamiento de los estudiantes de posgrado. Las plataformas de e-learning tradicionales como Moodle, BlackBoard, Sakai, etc. también ofrecen información de valor para el seguimiento de los estudiantes. Con el surgimiento y proliferación de los MOOC (Massive Open Online Courses) se ha abierto otra fuente inmensa de producción de datos masivos en educación. Otras alternativas de aprendizaje abierto y colaborativo son los casos de Khan Academy o Gooru, las cuáles se basan en Big Data para la gestión de todos los contenidos formativos que ofrecen, producen y comparten. 1.9. Finalidad de Big Data en educación Son muchos los beneficios que se pueden obtener del uso del Big Data en la educación. En cualquier caso, lo que se busca es obtener los mejores resultados en todo el proceso, que es bastante complejo, multifactorial y que se encuentra en trasformación por la paralela transformación de la sociedad. Se puede decir que entre los objetivos del uso del Big Data en educación están los siguientes: » Mejorar el aprendizaje a través de la personalización la educación. » Predecir y minimizar el fracaso escolar. » Mejorar las políticas institucionales en función de las analíticas de los datos. Por su parte, Kerns (2013) hace un listado de aportes del Big Data a la educación primaria: 1. Poder atender las diferencias individuales. Conocer las habilidades y destrezas de los alumnos por los resultados que van obteniendo y que puedan ir avanzando según sus posibilidades y su propio ritmo.
  • 17. Del Dato (Big Data) a la Información (Internet) TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR) 2. Compartir información entre diferentes centros educativos, así evitar los problemas de falta de información sobre un alumno cuando tiene un cambio. 3. Identificar las áreas problemáticas, así los profesores pueden dar mayor apoyo a los estudiantes en dichas áreas y reforzar las actividades para su desarrollo. 4. Demanda de especialistas en el análisis de datos y de formación a los docentes en la organización de la información sobre la enseñanza y las evaluaciones para la mayor y mejor comprensión de los procesos. 5. Personalización de la educación, permitiendo a los más dotados avanzar más rápido. 6. Hacer avances consistentes. Si un alumno ha avanzado o un nivel y se ha olvidado de aprender algo, luego puede repasar y completar lo que falta. 7. Involucrar a padres y estudiantes, respaldados en los datos, los informes y la visualización de los resultados. 1.10. Herramientas de Big Data para educación Para el logro de todos los objetivos del uso del Big Data en el campo educativo, es importante el uso de técnicas y herramientas que permitan sacar el mayor provecho de los datos. En muchos casos se dispone del historial de datos, pero no se tiene información o conocimiento de los mismos. Una de las principales técnicas para solucionar esta situación es la minería de datos educacionales (EDM o Educational Data Mining). La minería de datos educacionales es el conjunto de técnicas de extracción de conocimientos a partir de la exploración de datos que se dan en el ámbito educativo, es la utilización de estos métodos para entender mejor a los estudiantes y los contextos en los que ellos aprenden.
  • 18. Del Dato (Big Data) a la Información (Internet) TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR) Figura 12. Técnicas de minería de datos educacionales. Modelo de predicción de fracaso escolar. Fuente: Márquez, Romero y Ventura (2012). Herramientas de análisis y análisis avanzado Las técnicas de minería de datos, también conocidas como técnicas de análisis, son las que se emplean para encontrar significado en el mar de datos que se dispone. Son las que permiten realizar la interpretación de los datos para darle significado para la mente humana. Se pueden realizar distintos tipos de análisis, como pueden ser predictivos o perceptivos. En el campo educativo se han usado para pronosticar fracaso (Márquez, Romero y Ventura, 2012) y recomendar acciones para evitarlo. Figura 13. Fuente: http://www.silicon.es/la-necesidad-de-sumar-analisis-predictivo-mas-analisis- preceptivo-72497
  • 19. Del Dato (Big Data) a la Información (Internet) TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR) Herramientas de generación de informes y paneles Herramientas que trasforman los datos en información para que pueda ser entendida y analizada por las personas, en este caso por los gestores educativos. Figura 14. Gráficos, paneles e informes para Visual Studio ALM. Fuente: https://msdn.microsoft.com/es- es/library/bb649552.aspx Herramientas de visualización El conjunto de herramientas que transforman los datos para el mejor manejo y análisis de los mismos, muy parecidos a los informes y paneles, con la diferencia de que estas herramientas permiten la interacción dinámica con el usuario, ofreciendo un valor agregado al poder visualizar escenarios alternativos de la configuración de los datos.
  • 20. Del Dato (Big Data) a la Información (Internet) TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR) Figura 15. Fuente http://blogthinkbig.com/visualizacion-de-datos/ Hay todo un ecosistema de recursos que van enriqueciendo y surgiendo las alternativas de trabajo en torno al Big Data educativo que cada día es más social y abierto y, por tanto, más amplio y retador al momento de hacer los análisis, establecer las conclusiones y tomar las decisiones institucionales y de personalización del aprendizaje. Unas que han creado polémica son las herramientas de captura de gestos, tanto de los alumnos como de los profesores y todos los artilugios que nos hacen reflexionar sobre la situación de «gran hermano» en la que podemos vivir o, tal vez, en la que ya vivimos. Finalizamos con esta infografía sobre los mitos del Big Data en la educación.
  • 21. Del Dato (Big Data) a la Información (Internet) TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR) Figura 16. Mitos del Big Data. Fuente: http://www.openeducationchallenge.eu/blog/use-big-data- education-22
  • 22. Del Dato (Big Data) a la Información (Internet) TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR) 1.11. Referencias bibliográficas Bermúdez, C. (2010). Definición de hoy: yottabyte [entrada en un blog]. Recuperado de http://www.digitalika.com/2010/06/definicin-de-hoy-yottabyte/ Kerns, D. (3 de septiembre de 2013). 10 Ways Big Data is Changing K-12 Education [artículo en línea]. Recuperado de http://www.dreambox.com/blog/10-ways-big-data- changing-k-12-education-2 Machlup, F. (1980). Knowledge and knowledge production. Nueva Jersey: Princeton University Press. Márquez, C., Romero, C. y Ventura, S. (2012) Predicción del fracaso escolar mediante técnicas de minería de datos. IEEE-RITA, 7(3), 109-117. Recuperado de http://rita.det.uvigo.es/201208/uploads/IEEE-RITA.2012.V7.N3.A1.pdf Soergel, D. (1985). Organizing information: Principles of data base andretrieval systems. Orlando: Academic Press.
  • 23. Del Dato (Big Data) a la Información (Internet) TEMA 1 – Lo + recomendado © Universidad Internacional de La Rioja (UNIR) Lo + recomendado No dejes de leer… Aplicando minería de datos para descubrir rutas de aprendizaje frecuentes en Moodle Bogarín, A., Romero, C. y Cerezo, R. (2016). Aplicando minería de datos para descubrir rutas de aprendizaje frecuentes en Moodle. Edmetic, 5(1), 73-92. En este artículo se propone un uso de técnicas de minería de datos con las que se organizan a los alumnos de un curso en Moodle según su tipo, para conocer sus rutas de aprendizaje y los factores que influyen en ello. Accede al artículo a través del aula virtual o desde la siguiente dirección web: https://www.uco.es/ucopress/ojs/index.php/edmetic/article/view/4017/3845
  • 24. Del Dato (Big Data) a la Información (Internet) TEMA 1 – Lo + recomendado © Universidad Internacional de La Rioja (UNIR) No dejes de ver… Big Data al servicio de la educación, learning world Reportaje de los usos que tiene el Big Data en el ámbito educativo, cómo se están beneficiando los estudiantes con los resultados del uso de la tecnología y del análisis de los datos que se registran en los sistemas de educación online. Accede al vídeo a través del aula virtual o desde la siguiente dirección web: https://www.youtube.com/watch?v=w07yJkHbIwE
  • 25. Del Dato (Big Data) a la Información (Internet) TEMA 1 – Lo + recomendado © Universidad Internacional de La Rioja (UNIR) Educación y datos masivos (Big Data): presentación de Fernando Santamaría (2014) Los datos masivos (Big Data) están cambiando la forma de acceder, comprender, planificar y también la forma de vivir. Este nuevo paradigma está entrando de lleno en todos los ámbitos sociales. El mundo académico y de aprendizaje no va ser menos. La analítica del aprendizaje y académico está focalizado en la educación. Esta es la presentación que mostró el autor en MoodleMoot 2014 en Colombia para dar a conocer todo este ecosistema del dato. Accede al vídeo a través del aula virtual o desde la siguiente dirección web: https://es.slideshare.net/lernys/educacion-y-datos-masivos-big-data
  • 26. Del Dato (Big Data) a la Información (Internet) TEMA 1 – + Información © Universidad Internacional de La Rioja (UNIR) + Información A fondo Predicción del fracaso escolar mediante técnicas de minería de datos Márquez, C., Romero, C. y Ventura, S. (2012) Predicción del fracaso escolar mediante técnicas de minería de datos. IEEE-RITA, 7(3), 109-117. En este artículo los autores destacan las ventajas que ofrece el uso de la minería de datos educativos para la predicción del éxito y fracaso escolar, así como para ofrecer oportunidades de intervención en los casos de fallos en el aprendizaje. Accede al artículo a través del aula virtual o desde la siguiente dirección web: http://rita.det.uvigo.es/201208/uploads/IEEE-RITA.2012.V7.N3.A1.pdf Analítica de aprendizaje y personalización Zapata, M. (2013). Analítica de aprendizaje y personalización. Campus Virtuales, 2(2), 88-118. En este artículo el autor reflexiona sobre la concepción de la educación y los múltiples factores que se incorporan en la era digital, el papel de la tutoría y de los apoyos tecnológicos, así como de todos los elementos que aún no se han incorporado en las analíticas de aprendizaje y que son una realidad a tener en cuenta. Accede al artículo a través del aula virtual o desde la siguiente dirección web: http://uajournals.com/ojs/index.php/campusvirtuales/article/view/41/40
  • 27. Del Dato (Big Data) a la Información (Internet) TEMA 1 – + Información © Universidad Internacional de La Rioja (UNIR) Webgrafía Inspiring Science Education Página web que provee herramientas y recursos para promover e inspirar a los alumnos en la utilización de herramientas online. Accede a la página web a través del aula virtual o desde la siguiente dirección: http://www.inspiring-science-education.net/home MathWorks MATLAB y Simulink son herramientas que facilitan la inspiración y la innovación, como demuestra su uso en más de 5000 universidades de todo el mundo. Accede a la página web a través del aula virtual o desde la siguiente dirección: https://es.mathworks.com/ Bibliografía BBVA Innovation Center (s. f.) Herramientas para la visualización de datos. Recuperado de http://www.centrodeinnovacionbbva.com/ebook/ebook-herramientas-de- visualizacion-de-datos
  • 28. Del Dato (Big Data) a la Información (Internet) TEMA 1 – Test © Universidad Internacional de La Rioja (UNIR) Test 1. La disposición de datos privados, públicos o comunitarios hace alusión a la característica del Big Data relacionada con: A. La velocidad. B. El volumen. C. La variedad 2. La minería de datos abarca el conjunto de técnicas, métodos y acciones para extraer información de los grandes volúmenes de datos para darle significado y favorecer la toma de decisiones. A. Verdadero. B. Falso. 3. En el ámbito del Big Data, cuando el procesamiento de datos, los análisis y las decisiones se enfocan a acciones que repercutan positivamente en la sociedad, en las organizaciones o instituciones que las procesan, se hace referencia: A. Veracidad de los datos. B. Valor de los datos. C. Visibilidad de los datos. 4. Conjunto de herramientas que transforman los datos para el mejor manejo y análisis de los mismos, que permiten la interacción dinámica con el usuario. A. Herramientas de generación de informes y paneles. B. Herramientas de análisis avanzado. C. Herramientas de visualización. 5. El Big Data en educación lo que pretende es estandarizar los procesos de enseñanza y aprendizaje para facilitar el desarrollo de los cursos de formación. A. Verdadero. B. Falso.
  • 29. Del Dato (Big Data) a la Información (Internet) TEMA 1 – Test © Universidad Internacional de La Rioja (UNIR) 6. La minería de datos educacionales, cuando está basada en datos multivariados y provenientes de diferentes fuentes, es un proceso caracterizado por: A. La velocidad de los resultados. B. La necesidad de integración de los datos. C. La confiabilidad de los datos. 7. Son algunas de las características que deben reunir los datos del Big Data: A. Variabilidad, visibilidad, volumen. B. Verosimilitud, variedad, velocidad. C. Veracidad, valor, volumen. 8. La principal finalidad del Big Data en educación es: A. Personalizar la educación. B. Facilitar el trabajo del profesor. C. Aumentar los ingresos de los centros privados. 9. Las analíticas de aprendizaje y métodos de minería de datos educacionales solo consideran los datos que se obtienen de los LSM por considerarlos de mayor confiabilidad que los provenientes de las herramientas web 2.0. A. Verdadero. B. Falso. 10. Fases a cumplir en el tratamiento de los datos para optimizar los resultados en los análisis de los mismos: A. Recopilación, minería, integración. B. Captura, organización, análisis. C. Interpretación, preprocesado, análisis.