Se ha denunciado esta presentación.
Se está descargando tu SlideShare. ×

Business intelligence (bi) y big data0

Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Cargando en…3
×

Eche un vistazo a continuación

1 de 42 Anuncio

Más Contenido Relacionado

Presentaciones para usted (20)

Similares a Business intelligence (bi) y big data0 (20)

Anuncio

Más de Pedro Contreras Flores (20)

Más reciente (20)

Anuncio

Business intelligence (bi) y big data0

  1. 1. Business Intelligence (BI) y Big Data Pedro Contreras Flores
  2. 2. Temario • Definición • Historia • Niveles BI • Data Mining • Gestión de datos • Big Data
  3. 3. Definiciones • La Inteligencia de Negocios (BI) es un marco conceptual para el apoyo a la decisión. • Es la habilidad adquirida por las empresas para transformar datos en información e información en conocimiento, de modo que se optimice el proceso de toma de decisiones. • Combina arquitectura, bases de datos (o almacén de datos), herramientas analíticas y aplicaciones. • Uso de Analítica Empresarial (Business Analytics) que permite conseguir los objetivos empresariales, a partir del análisis de datos que permite detectar tendencias y realizar pronósticos a partir de modelos predictivos y utilizar estos modelos para optimizar los procesos de negocio. • BA y BI son esencialmente lo mismo.
  4. 4. Fuente: CoreBI, Empresa Regional de Data & Analytics Hechos Datos Información Conocimiento Sabiduría
  5. 5. Historia Fuente: BI Usability: evolución y tendencia, Dataprix
  6. 6. Historia • Inteligencia = buenas decisiones • Personas + inteligencia= decisiones • Inteligencia + información = ¿decisiones correctas? • Información=conocimientos=secretos=innovación=nvensión • Información= respuestas • Personas de negocios = respuestas de negocios • Almacenar información valiosa=recolectar datos (1969 - SGBD) • Database = almacenamiento de datos (1970 - Empresas) • Aplicaciones de empresas + Database = facilitan entradas de datos • Datos + acceso = respuestas • BI1=acceso datos + administración = consumo • Nace termino BI, por Howard Dresner (1989) • Reportes y análisis, mas datos y mas demanda • Mayor rapidez y rendimiento • WWW (1990) más datos • BI2=Plataformas BI, más funcionalidades • Intuitivo, usabilidad, múltiples formatos, des-estructurados • Web 2.0 • Nuevas técnicas de visualización de datos • BI=Datos correctos + Tiempo correcto + Persona correcta
  7. 7. Pioneras del Rubro • SAP 1972 • JDEdwards 1977 • Hyperion 1981 (Oracle) • Cognos 1982 (Canada) • Crystal Reports 1985 • PeopleSoft 1987 • MicroStreategy 1989 • Business Object 1990 • Cartesis 1990 (Francia) • Siebel Systems 1993 • Actuate 1993 • Xcelsius • Information builders • SRC
  8. 8. Historia • SGBD: Sistemas de gestión de bases de datos (database management system) • SQL: Lenguaje de consulta estructurada (Structured Query Language) • Arquitectura CS: las tareas se reparten entre los proveedores de recursos o servicios. • BD distribuidas: múltiples bases lógicamente relacionadas distribuidas en diferentes espacios lógicos y geográficos, interconectados por red. • Data Warehouse: Data = datos y WareHouse = almacén, almacén de datos • Olap: Procesamiento analítico en línea (On-Line Analytical Processing) • Datamarts: • Ajax • Web services • Hadoop • Amazon AWS • Cloud BI • Social BI • Redshift
  9. 9. Olap Fuente: https://decoratex.biz/bsn/es/sistemyi-olap---eto-chto-takoe.html
  10. 10. Las principales teorías y características de la inteligencia empresarial
  11. 11. Las principales teorías y características de la inteligencia empresarial
  12. 12. Niveles de BI Fuente: Scope and Challenges in the Retail Industry: Application of Data Science, Sreeparna Mukherjee, Triparna Mukherjee, Asoke Nath
  13. 13. Componentes de la BI
  14. 14. Usos • Bussiness strategy (estrategia de negocios) • Dashboards (Tableros) • Adhoc Reporting (informes a la medida) • Data Warehouse (almacén de datos) • Predictive Analysis (análisis predictivo) • Analytical Skills (capacidad de análisis) • Metrics (métricas)
  15. 15. BI Usability • Software BI con interfaz amigable, intuitiva, fácil de utilizar; interfaz que permita la creación de nuevos contenidos como análisis interactivos, reporting, dashboards. • Fácil navegación, con énfasis en la presentación de dichos contenidos, todo de manera visual e interactiva • El usuario debe sentirse cómodo con la herramienta para sacar el mayor provecho a sus datos.
  16. 16. Plataformas Business Intelligence • Comerciales – Tableau (Sales Force) – Power BI (Microsoft) – Pentaho • Open Source – Kibana (Elastic search) – Banana (Solr) – Redash – Apache SuperSet – Metabase
  17. 17. Comparación de Herramientas BI Fuente: https://www.slideshare.net/zanorte/business-intelligence-tools-comparison-99210656
  18. 18. Comparación de Herramientas BI Fuente: https://www.slideshare.net/zanorte/business-intelligence-tools-comparison-99210656
  19. 19. Tableau Fuente: https://public.tableau.com/profile/sebastian1047#!/vizhome/Recursoshumanos2/Dashboard1
  20. 20. Power BI de Microsoft Fuente: https://app.powerbi.com/
  21. 21. Pentaho BI 9.0 Fuente: https://www.hitachivantara.com/en-us/products/data-management-analytics/pentaho- platform.html?source=pentaho-redirect
  22. 22. Oracle Business Intelligence Fuente: https://www.datavail.com/blog/first-look-oracle-business-intelligence-12c/
  23. 23. Ejemplo: Indicadores de mercado LarrainVial Fuente: http://larrainvial.finmarketslive.cl/www/index.html?mercado=chile
  24. 24. Ejemplo: Atlas económico mundial Fuente: https://atlas.cid.harvard.edu/
  25. 25. Tendencias
  26. 26. Tendencias • Immersive Analytics – https://www.youtube.com/watch?v=qiWIPePTsOA • Analytics Catalog – https://www.youtube.com/watch?v=goqpghSfytE
  27. 27. Data Mining • Definición: • Proceso de extraer conocimiento útil y comprensible, previamente desconocido, desde grandes cantidades de datos almacenados en distintos formatos. • Para que este proceso sea efectivo debe ser automático o semiautomático (asistido) y el uso de los patrones descubiertos debería ayudar a tomar decisiones más seguras que reporten por tanto, algún beneficio en la organización. • Proceso de Descubrimiento de Conocimiento en Bases de Datos (más conocido por sus siglas KDD, de su nombre en inglés Knowledge Discovery in Databases) Fuente: Orallo et al., Introducción a la Minería de Datos
  28. 28. KDD • El proceso KDD es interactivo e iterativo, involucrando numerosos pasos con muchas decisiones tomadas por el usuario. Brachman y Anand (1996) dan una visión práctica del proceso KDD, enfatizando la naturaleza interactiva del proceso.
  29. 29. Data Mining Data Mining Predictivo Clasificación Regresión Análisis de Series de Tiempo Predicción Descriptivo Clustering Resumen Reglas de asociación Descubrir secuencias
  30. 30. Técnicas y algoritmos más utilizados
  31. 31. Casos de ejemplos • Financieros – Análisis de créditos bancarios – Emails bancos, análisis de sentimientos • Cesta de compras – WalMart , pañales y cervezas – Correlación compras (pañales y leche, huevos y aceite) – Determinar ventas de un producto (Stock) • Salud – UCI, costo día y psiquiatría – Letalidad Coronavirus
  32. 32. Minerías de datos complejos • Minería de datos espaciales, temporales, secuenciales, multimedia • Minería web y textos – Caso de éxito
  33. 33. Gestión de Datos/ Data management • La gestión de datos comprende todas las disciplinas relacionadas con la gestión de datos como un recurso valioso. • El concepto de gestión de datos surgió en la década de 1980 cuando la tecnología pasó del procesamiento secuencial (primero tarjetas perforadas , luego cinta magnética ) al almacenamiento de acceso aleatorio. • En el uso de la administración moderna , el término datos se reemplaza cada vez más por información o incluso conocimiento en un contexto no técnico. • La gestión de datos se ha convertido en gestión de la información o gestión del conocimiento . • Durante años la prioridad fue el procesamiento de datos dada su lentitud en estas tareas, aumentado hoy el computo. • Y los datos han regresado con la popularización del término big data , que se refiere a la recopilación y análisis de conjuntos masivos de datos. • Varias organizaciones han establecido centros de gestión de datos (DMC) para sus operaciones.
  34. 34. Modalidades de Gestión de Datos • Gestión de datos maestros (MDM/Master Data Management) garantiza que la organización emplea siempre la versión única del dato (verdaderos y actualizados). • Administración de datos (DM/Data Management) controla la recopilación de datos, políticas de uso, movimientos y transacciones, respaldos, recuperación y preservación. • Gestión de calidad de datos (DQM/ Data Quality Management) encargado de los duplicados y versiones de los datos, además de definición de roles, políticas de adquisición, mantenimiento y distribución de datos. • Seguridad de datos: Gestionan las políticas de seguridad informáticas y de activos de información, protocolos y normas de seguridad (ISO27000), accesos, incidentes y plataformas expuestas. • Gobernanza de datos: establece políticas de entrada, flujo y protección de la información institucional en pro de una política de gobernanza que redunde en un enfoque de gestión de datos maestros (únicos). • Gestión de big data: recopilación, análisis y empleo de cantidades ingentes de información digital para mejorar las operaciones • Almacenamiento de datos: proporciona y supervisa la infraestructura física o en cloud para consolidar datos en bruto y analizarlos en profundidad para generar información de valor comercial.
  35. 35. Big Data • Actualmente se producen diariamente grandes volúmenes de datos de diversos tipos (textos, imágenes, audio, videos) y desde los más variados orígenes (web, GPS, redes sociales, sensores). • Se proyecta que en los próximos años las aplicaciones Internet de las cosas aumentaran el volumen de datos a un nivel sin precedentes.
  36. 36. Plataforma Big Data
  37. 37. Indexar la web (2006) Fuente: Ricardo Baeza Yates, El poder de buscar.
  38. 38. Almacenamiento
  39. 39. Big data: Componentes - Hadoop • Google y Hadoop (2006) • Problema de indexar la web, crea sistema de archivos distribuidos, haciendo suyo el lema “divide y vencerás”. • Hadoop Distribuited File System HDFS: sistema de archivos distribuidos a traves de miles de nodos • Map reduce: – Map (Mapeo): Encargada de la división de las unidades de procesamiento a ejecutar en cada nodo y de su distribución para su ejecución en paralelo. Aquí a cada llamada se le asignará una lista de pares key/value. – Shuffle and sort (Combinación y Orden): Aquí se mezclan los resultados de la etapa anterior con todas las parejas clave/valor para combinarlos en una lista y a su vez se ordenan por clave. – Reduce: Aquí se reciben todas las claves y listas de valores haciendo si es necesaria la agregación de las mismas. • Hive: herramienta de data warehousing, consultas HiveQL en datos. • Apache Hbase: BD Hadoop distribuida y escalable. Su principal uso se encuentra cuando se requieren escrituras/lecturas en tiempo real y acceso aleatorio para grandes conjuntos de datos
  40. 40. Map reduce
  41. 41. Global Information Storage Capacity

Notas del editor

  • https://www.dataprix.com/es/articulo/business-intelligence/bi-usability-evolucion-y-tendencia
    Video historio BI
    https://www.youtube.com/watch?v=_1y5jBESLPE
    Video Leyes del aprendizaje colectivo- Cesar Hidalgo
    https://archive.org/details/VISDatosSCL2018HidalgoTheLawsOfCollectiveLearning


    El seminario del cual les comente algunas implementaciones de visualización sobre texto es http://seminario.visdatos.cl/
    Algunas presentaciones destacadas son:
     
    APRENDIZAJE COLECTIVO EN LA SOCIEDAD Y LA ECONOMíA
    César Hidalgo,
    Collective Learning Group, The MIT Media Lab
    https://archive.org/details/VISDatosSCL2018HidalgoTheLawsOfCollectiveLearning
     
     
    VISUALIZACIÓN DE PATRONES LINGÜÍSTICOS EN DISCURSOS POLÍTICOS
    Riva Quiroga
    https://archive.org/embed/VISDatosSCL2018VisualizacionDePatronesLinguisticos?autoplay=1
     
     
    PALABRAS POLÍTICAS Y PÚBLICAS: VISUALIZACIÓN DEL DISCURSO PRESIDENCIAL EN CHILE ENTRE 1971 Y 2017
    Edgardo Moraga https://archive.org/details/VISDatosSCL2018PalabrasPoliticasYPublicas



  • https://www.slideshare.net/QuestionProLatinoamerica/inteligencia-de-negocios-para-empresas-20
  • https://www.slideshare.net/QuestionProLatinoamerica/inteligencia-de-negocios-para-empresas-20
  • https://www.youtube.com/watch?v=M0onHJ6M0Co
  • http://catalogoenlinea.pjud.cl/libros2/29638/index.html#5/z
  • https://es.talend.com/resources/what-is-data-management/

×