Laboratorio 3 big data

Universidad Nacional Abierta y a Distancia UNAD
1
INFORME DE LABORATORIO ARQUITECTURA DE COMPUTADORES
(PRACTICA No. 4)
Andrés González Téllez
Cód.: 1022929026 Tel: 3203021447 E-Mail: agonzalezte@unadvirtual.edu.co
Tutor: Wilson Pérez Correa
Abstract
Analyze the operation of Big Data its history and how it
has been growing since in 2008 hovered peta bytes and
every day grows enormously since all electronic devices
are storing data is also known as macro data, massive
data, data intelligence or data On a large scale and as all
information has been changing from the physical
equipment of each company to move to the cloud to
manage immense amounts of information.
Resumen
Realizar un análisis sobre el Big Data y su
funcionamiento como también en que ámbito se utiliza
el big data y como es su almacenamiento
Palabras Clave: macro datos, peta bytes, zettabits,
datos relacionales, datos no relacionales
1. Introducción
Big data: (Tomado de Wikipedia) disciplina dedicada a
los datos masivos se enmarca en el sector de las
tecnologías de la información y la comunicación. Esta
disciplina se ocupa de todas las actividades relacionadas
con los sistemas que manipulan grandes conjuntos de
datos. Las dificultades más habituales vinculadas a la
gestión de estas cantidades de datos se centran en la
recolección y el almacenamiento, 3 búsquedas,
compartición, análisis, 4 y visualización. La tendencia a
manipular enormes cantidades de datos se debe a la
necesidad en muchos casos de incluir dicha información
para la creación de informes estadísticos y modelos
predictivos utilizados en diversas materias, como los
análisis de negocio, publicitarios, los datos de
enfermedades infecciosas, el espionaje y seguimiento a
la población o la lucha contra el crimen organizado.
2. Herramientas para Big data
Hadoop: sistema de código abierto que se utiliza para
almacenar, procesar y analizar grandes volúmenes de datos.
Se puede descargar del siguiente link:
http://hadoop.apache.org/releases.html
Fig.1. Logo Hadoop
Hadoop
Difiere del modelo clásico relacional de bases de datos
ya que las consultas no van en tablas y se utilizan
principalmente en las redes sociales, se clasifican según
su forma de almacenar los datos, y comprenden
categorías como clave-valor.
Hadoop es una gran plataforma, especialmente para
combinar los datos de ambos legados, viejos y nuevos
datos no estructurados. 2) Una gran cantidad de
proveedores están entrando en el juego de ofrecer
soporte y servicios en torno a Hadoop, por lo que es más
aceptable para las empresas
Algunas de las empresas más conocidas que utilizan
Hadoop son IBM, Intel, Microsoft
Fig.2. No SQL
Apache Cassandra:
Base de datos nosql de distribución libre bajo la
plataforma java y permite la gestión de grandes
volúmenes de datos en forma distribuida y se basa
principalmente en la escalabilidad lineal y la
disponibilidad inmediata su estructura está conformada
por una serie de nodos iguales que se comunican por
medio de P2P.
Se puede descargar con del siguiente link:
http://cassandra.apache.org/download/
Algunas de las empresas más conocidas que utilizan
Cassandra son Netflix, Spotify y Twitter.
Fig.3. Logo Apache Cassandra
Mongodb
Crear nuevos tipos de aplicaciones por medio de bases
de datos no relacionales, mejorar la experiencia del

Universidad Nacional Abierta y a Distancia UNAD
2
cliente, acelerar el tiempo de comercialización y reducir
costes al ser rápido y confiable.
Ejemplo: la empresa Bosch está poniendo a prueba una
aplicación que es capaz de capturar datos del vehículo
como el sistema de frenado, la dirección asistida, los
limpiaparabrisas, etc. Con todos esos datos capturados,
se pueden hacer diagnósticos de necesidad de
mantenimiento preventivo
Se puede descargar con del siguiente link:
https://www.mongodb.com/download-
center?jmp=nav#community
Fig.3. Logo Mongodb
2.1. Tipos de big data
2.2.1. Datos Estructurados: se determinan por su
longitud y por su formato como por ejemplo números,
cadenas, caracteres y son almacenados en tablas que se
clasifican en datos relacionales o las hojas de cálculo.
2.2.2. Datos no estructurados: estos datos no poseen un
formato y no se almacenan en tablas o crear relaciones
entre los más conocidos son documentos en pdf,
documentos, correos.
2.2.3. Datos Semiestructurados: se basa en una
estructura regular y no tiene un orden específico pueden
tener o no relaciones entre ellos y acaban siendo
aceptados como por ejemplo un HTML o un XML
3. Conclusiones
Se comprendió los conceptos básicos del big data y
como dar los primeros pasos para su utilización.
Se Identificaron los diferentes tipos de datos y
como ha ido evolucionando el almacenamiento de datos
hasta el día de hoy.
Se verificaron programas o software para iniciar
con la gestión de las bases de datos o macro datos de
una capacidad inmensa
4. Referencias
[1] Administre cantidades masivas de datos, rápido, sin perder el
sueño. (Dakota Del Norte.). Obtenido el 27 de Abril de
2017, de http://cassandra.apache.org/
[2] Big Data. (2017, 16 de abril). Obtenido el 27 de abril de
2017, de https://es.wikipedia.org/wiki/Big_dat [3]
Gutiérrez (2015). Circuito paralelo [Video]. Recuperado de
http://hdl.handle.net/10596/6924.
[3] Banker, K. (2011). MongoDB in action. Manning
Publications Co...
[4] Manyika, J., Chui, M., Brown, B., Bughin, J., Dobbs, R.,
Roxburgh, C., & Byers, A. H. (2011). Big data: The next
frontier for innovation, competition, and productivity.

Laboratorio 3 big data

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (16)

Similar a Laboratorio 3 big data

Similar a Laboratorio 3 big data (20)

Último

Último (20)

Laboratorio 3 big data