2. ¿QUÉ ES BIG DATA Y POR QUÉ ES IMPORTANTE?
Una cantidad de datos tal que supera la capacidad del
software convencional para ser capturados,
administrados y procesados en un tiempo razonable.
3. Análisis Big Data?
. En los términos se trata de analizar datos y en muchos casos análisis avanzados
Volumen: Grandes cantidades de datos, desde conjuntos de datos con tamaños de terabytes
a zettabyte
Velocidad: Grandes cantidades de datos de transacciones con alta frecuencia de
actualización
. Variedad: Los datos provienen de diferentes fuentes de datos, pueden venir de ambas
fuentes de datos interna y externas.
4. ¿En qué se diferencia el Big Data de las
fuentes de datos tradicionales?
Los grandes datos pueden ser una fuente de datos completamente
nueva.
La velocidad de la alimentación de datos ha aumentado en tal medida
que califica como una nueva fuente de datos.
Las fuentes de datos no estructuradas son aquellas en las que tiene
poco o ningún control sobre su formato.
5. Entre los datos estructurados y no
estructurados se encuentran los datos
semiestructurados.
Los datos semiestructurados son datos que
pueden ser irregulares o incompletos y tienen
una estructura que puede cambiar
rápidamente o impredeciblemente.
6. Segmentación y predicción
Una gran cantidad de aplicaciones de Big data caen en la
categoría de clasificación y predicción.
Tome los bancos para un ejemplo
Todos los días, personas solicitan nuevas tarjetas de crédito,
préstamos, e hipotecas.
En el proceso de toma de decisiones, los bancos usan un
número para revisar el historial financiero y evaluar su
probabilidad de pagar la deuda:
un puntaje de crédito. Este puntaje es calculado a partir de
todos los datos que los bancos conocen sobre usted.
7. Sistemas de recomendación y marketing
dirigido
Se usan para reservar recomendaciones,
algunas recomendaciones se basan en general tendencias mientras
que otras son más personalizadas
Sistema de recomendación, cuando se implementa correctamente
puede afectar el negocio de manera significativa.
8. Análisis operacional
Incorporar análisis en los procesos comerciales y la
automatización decisiones para que millones de decisiones
todos los días se realizan mediante procesos de análisis sin
ninguna intervención humana.
9. LOS PRINCIPALES COMPONENTES TECNOLÓGICOS
EN UN ECOSISTEMA DE BIG DATA
• los grandes datos requieren un nuevo tipo de gestión de datos
solución debido a su naturaleza de alto volumen, alta velocidad y / o
alta variedad.
• Este nuevo tipo de la solución de gestión de datos lleva la marca
registrada de altamente escalable, masivamente paralela, y
económico.
10. 4.2 Técnicas analíticas
• La mayoría de las técnicas analíticas ampliamente utilizadas se
incluyen en una de las siguientes categorías.
• Métodos estadísticos, pronóstico, análisis de regresión.
• Consulta de la base de datos
• Almacén de datos
• Aprendizaje automático y minería de datos
11. Resumen
• Los datos provienen de una variedad de fuentes y se pueden usar en diversas
aplicaciones industriales.
• A menudo es la combinación de fuentes de datos lo que cuenta.
• Junto con los macrodatos, también existe un llamado cambio de paradigma en
términos de enfoque analítico.
• Eso es un cambio del análisis descriptivo al análisis predictivo y prescriptivo.
• Big Data necesita un nuevo tipo de solución de administración de datos debido
a su alto volumen, naturaleza de alta velocidad y / o alta variedad. Este nuevo
tipo de gestión de datos solución lleva la marca registrada de altamente
escalable, masivamente paralela y rentable.
• Las nuevas tecnologías, como Hadoop, no reemplazan otras tecnologías, como
• base de datos relacional, sino que se están agregando junto a ellos.
•
12. Referencias
• Mark A. Beyer and Douglas Laney. “The Importance of 'Big Data': A
Definition”. Gartner, 2012 Bill Franks. “Taming the big data tidal
wave”. Wiley, 2012 David R. Hardoon and Galit Shmueli. “Getting
started with business analytics – insightful decision making”. Talor &
Francis Group.2013 Foster Provost and Tom Fawcett. “Data science
for business”. O’Relly, 2013 Thomas H. Davenport and D.J. Patil .
• “Data Scientist: The Sexiest Job of the 21st Century”, Harvard
Business Review, 2012