Este documento describe el concepto de Big Data y las tecnologías asociadas. Big Data se refiere al almacenamiento y análisis de grandes cantidades de datos estructurados, semiestructurados y no estructurados. El documento explica diferentes técnicas de análisis de datos como asociación, minería de datos y agrupación. Finalmente, concluye que el uso de Big Data ha ayudado a los investigadores a descubrir patrones más rápidamente de lo que podrían hacerlo manualmente.
2. INTRODUCCION
La tendencia en el avance de la tecnología que ha
abierto las puertas hacia un nuevo enfoque de
entendimiento y toma de decisiones, la cual es
utilizada para describir enormes cantidades de
datos.
3. ¿QUE ES BIG DATA?
es un concepto que hace referencia al
almacenamiento de grandes cantidades de
datos y a los procedimientos usados para
encontrar patrones repetitivos dentro de esos
datos.
4. TECNOLOGIA
• Datos estructurados (Structured Data): Datos que tienen
bien definidos su longitud y su formato, como las fechas,
los números o las cadenas de caracteres. Se almacenan en
tablas. Un ejemplo son las bases de datos relacionales y
las hojas de cálculo.
• Datos no estructurados (Unstructured Data): Datos en el
formato tal y como fueron recolectados, carecen de un
formato específico. No se pueden almacenar dentro de una
tabla ya que no se puede desgranar su información a tipos
básicos de datos. Algunos ejemplos son los PDF,
documentos multimedia, e-mails o documentos de texto.
5. • Datos semiestructurados: Datos que no se
limitan a campos determinados, pero que
contiene marcadores para separar los diferentes
elementos. Es una información poco regular
como para ser gestionada de una forma estándar.
Estos datos poseen sus
propios metadatos semiestructurados16 que
describen los objetos y las relaciones entre ellos,
y pueden acabar siendo aceptados por
convención. Un ejemplo es el HTML.
6. ANALISIS DE DATOS
Asociación: Permite encontrar relaciones entre
diferentes variables. Bajo la premisa de
causalidad, se pretende encontrar una
predicción en el comportamiento de otras
variables. Estas relaciones pueden ser los
sistemas de ventas cruzadas en los e-commerce.
7. Minería de datos: Tiene como objetivo
encontrar comportamientos predictivos.
Engloba el conjunto de técnicas que combina
métodos estadísticos y de machine learning con
almacenamiento en bases de datos. Está
estrechamente relacionada con
los modelos utilizados para descubrir patrones
en grandes cantidades de datos.
8. Agrupación: El análisis de clústeres es un tipo
de minería de datos que divide grandes grupos
de individuos en grupos más pequeños de los
cuales no conocíamos su parecido antes del
análisis.
9.
10. CONCLUSION
El uso de Big Data ha ayudado a los investigadores a descubrir
cosas que les podrían haber tomado años en descubrir por si
mismos sin el uso de estas herramientas, debido a la velocidad
del análisis, es posible que el analista de datos pueda cambiar
sus ideas basándose en el resultado obtenido y retrabajar el
procedimiento una y otra vez hasta encontrar el verdadero valor
al que se está tratando de llegar.