SlideShare una empresa de Scribd logo
Universidad Internacional de La Rioja
Silvia Antón Lara
Entendiendo la cuenta de P&G mediante técnicas cuantitativas y
de aprendizaje automático.
Máster Universitario en Inteligencia de Negocio
Índice & Contenido
1. Planteamiento general: descripción y justificación del proyecto.
2. Objetivos del TFM.
3. Qué es la inteligencia de negocio.
4. Arquitectura del proyecto.
Proyecto A: EDA Análisis.
Proyecto B: Aprendizaje supervisado, regresión.
Proyecto C: Análisis multivariante y árboles de decisión.
5. Conclusiones
6. Limitaciones y prospectiva
7. Cierre
2
3
1) Planteamiento general: descripción y
justificación del proyecto.
• Existen multitud de
factores que influyen en el
comportamiento de los
consumidores.
• Tanto Kahneman y
Gigerenzer están de
acuerdo en la centralidad
de la heurística en la toma
de decisiones.
2) Objetivos del TFM
Objetivo General
 Estudiar la base de datos
de AdventureWorks 17,
prestando especial atención
a las ventas y clientes de la
compañía.
Objetivos específicos
 Definir qué es la IN
 Realizar una comparativa
de las distintas técnicas de
aprendizaje supervisado y
no supervisado.
 Presentar los resultados de
una manera “amigable” al
lector, siguiendo técnicas
específicas de BI y de
storytelling.
4
3) ¿Qué es la Inteligencia de Negocio?
5
INTELIGENCIA DE
NEGOCIO
ANALISIS DE DATOS
ESTRATEGIA Y
GESTION
EMPRESARIAL
FUNDAMENTOS
TECNOLOGICOS
INTELIGENCIA DE
CLIENTE_CRM
VISUALIZACIÓN DE
DATOS
GESTIÓN DE
PROYECTOS DE IN
INTELIGENCIA DE
NEGOCIO APLICADA
HISTORIA DE LA I.N.
6
HISTORIA DE LA I.N.
7
Rafi,Q 2012 2014 Debortolli 2015 Sangari, Razmi
2018 Schmarzo 2019 Ratia & others
4) PROYECTO A: ANÁLISIS CLIENTES I
• 4) PROYECTO A: ANÁLISIS CLIENTES II
• PROYECTO : ANÁLISIS PRODUCTOS
PROYECTO A: EDAANALYSIS
11
PROYECTO C) APRENDIZAJE NO SUPERVISADO
12
PCA.
Análisis de componentes
principales.
K-MEANS
Cada grupo está
representado por el centro o
los medios de los puntos de
datos pertenecientes al
grupo.
HIERARCHICAL
CLUSTERING
.
PROYECTO B) APRENDIZAJE SUPERVISADO
13
Regresión lineal.
Su expresión general se basa en
la ecuación de la recta y = mx +
b.
Fórmulas de mínimos
Árboles de decisión
Datos contiene una gran lista de
predictores
Máquinas de vectores soporte
o SVM
Utilizado sobre todo para
temas de clasificación.
ANÁLISIS MULTIVARIANTE Y ÁRBOLES DE DECISIÓN.
14
LIMITACIONES Y
PROSPECTIVA. DAFO
15
OPORTUNIDADES
•Gráficos de fácil comprensión por usuarios finales.
•Informes fácilmente customizables.
•Facilidad para la comprensión y visión de grandes cantidades de datos.
•Establecer un criterio científico riguroso para el análisis de datos e hipótesis y complementarlo con el análisis visual.
AMENAZAS
•Usuarios finales no muy versados con el análisis de datos riguroso.
•Exceso de datos que pueden amenazar el debate.
•Facilidad de manipulación de los datos.
•Complejidad para explicar modelos econométricos y distribuciones de probabilidad. ¿Qué
entendemos por media, varianza, desviación típica?
•Facilidad para desechar valores extremos u outliers que pueden ser de interés para nuestro estudio.
•Lo que puede ser correcto para un modelo de machine learning, en el que los datos tienen que estar
equilibrados o "balanced", puede no serlo para el estudio cuantitativo y de distribuciones analíticas.
FORTALEZAS
• Se trata de análisis tanto visual como cuantitativo.
• Conectar directamente la fuente de datos, o una consulta, permite posteriores modificaciones.
• Útil para hacer predicciones si entendemos el modelo.
•Muy útil para hacernos una imagen holística del funcionamiento de una empresa.
DEBILIDADES
•Debilidades de programación y conocimiento más profundo de R Studio y Phyton.
ENLACES
16
Título URL
TOWARDS DATA SCIENCE https://www.linkedin.com/company/toward
s-data-science/
GITHUB (github.com)https://github.com/SANTONL
A?tab=repositories
LINKEDIN http://www.linkedin.com/in/tecnicodecompr
assantonla
DATA SCIENCE DOJO https://www.linkedin.com/company/data-
science-dojo/
DATA SCIENCE CENTRAL https://www.linkedin.com/company/data-
science-central/
GITMIND https://github.com/SANTONLA?tab=reposi
tories
COMUNITY RSTUDIO https://community.rstudio.com/u/santonla/s
ummary
GRAPHEXT https://app.graphext.com/teams/VGVhbS01
MzU2/projects
STACKOVERFLOW https://stackoverflow.com/
www.unir.net
GRACIAS POR SU ATENCIÓN

Más contenido relacionado

Similar a Plantilla ppt pv_santon_slideshare

Session01.pptx
Session01.pptxSession01.pptx
Session01.pptx
ADPTechnology
 
Open Session Multiplica - UX Analytics: el mejor amigo de las decisiones obje...
Open Session Multiplica - UX Analytics: el mejor amigo de las decisiones obje...Open Session Multiplica - UX Analytics: el mejor amigo de las decisiones obje...
Open Session Multiplica - UX Analytics: el mejor amigo de las decisiones obje...
Multiplica
 
Curso Analisis de Datos y Estadistica Avanzada aplicada a negocios
Curso Analisis de Datos y Estadistica Avanzada  aplicada a negociosCurso Analisis de Datos y Estadistica Avanzada  aplicada a negocios
Curso Analisis de Datos y Estadistica Avanzada aplicada a negocios
LPI ONG
 
SESION 1_SIM_wk.pdf
SESION 1_SIM_wk.pdfSESION 1_SIM_wk.pdf
SESION 1_SIM_wk.pdf
JackAlarico1
 
Seminario Almacenamiento Datos Hoy - 13/12/10
Seminario Almacenamiento Datos Hoy - 13/12/10Seminario Almacenamiento Datos Hoy - 13/12/10
Seminario Almacenamiento Datos Hoy - 13/12/10
CAESCG.org
 
aplicacion_de_la_investigacion_de_operaciones
aplicacion_de_la_investigacion_de_operacionesaplicacion_de_la_investigacion_de_operaciones
aplicacion_de_la_investigacion_de_operaciones
Marcos Joel Huaman Zegarra
 
Curso Superior BI Software Libre
Curso Superior BI Software LibreCurso Superior BI Software Libre
Curso Superior BI Software Libre
anovacampus
 
Seminarios de Analítica Predictiva con Rapid Miner
Seminarios de Analítica Predictiva con Rapid MinerSeminarios de Analítica Predictiva con Rapid Miner
Seminarios de Analítica Predictiva con Rapid Miner
LPI ONG
 
Mineria y modelado de datos
Mineria y modelado de datosMineria y modelado de datos
Mineria y modelado de datos
Sergio Salimbeni
 
10. Análisis de datos cuantitativos.pptx
10. Análisis de datos cuantitativos.pptx10. Análisis de datos cuantitativos.pptx
10. Análisis de datos cuantitativos.pptx
VictorReyes883901
 
Propuesta en Gestión de Proyectos y Análisis de Negocios
 Propuesta en Gestión de Proyectos y Análisis de Negocios Propuesta en Gestión de Proyectos y Análisis de Negocios
Propuesta en Gestión de Proyectos y Análisis de Negocios
RedRITA
 
Silabo Curso inteligencia de Negocios - Maestria en Computación y Sistemas Se...
Silabo Curso inteligencia de Negocios - Maestria en Computación y Sistemas Se...Silabo Curso inteligencia de Negocios - Maestria en Computación y Sistemas Se...
Silabo Curso inteligencia de Negocios - Maestria en Computación y Sistemas Se...
LPI ONG
 
Máster Big Data y Business Analytics Universidad Complutense de Madrid
Máster Big Data y Business Analytics Universidad Complutense de MadridMáster Big Data y Business Analytics Universidad Complutense de Madrid
Máster Big Data y Business Analytics Universidad Complutense de Madrid
Jose Carlos Soto Gómez
 
Semestre 2011 i - proyecto - semana nº 05 (2)
Semestre 2011   i -  proyecto - semana nº 05 (2)Semestre 2011   i -  proyecto - semana nº 05 (2)
Semestre 2011 i - proyecto - semana nº 05 (2)
MANUEL GARCIA
 
Semestre 2011 i - proyecto - semana nº 05
Semestre 2011   i -  proyecto - semana nº 05Semestre 2011   i -  proyecto - semana nº 05
Semestre 2011 i - proyecto - semana nº 05
MANUEL GARCIA
 
Power-BI-básico.pdf
Power-BI-básico.pdfPower-BI-básico.pdf
Power-BI-básico.pdf
CarlosCastro72554
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
Anyeni Garay
 
Base de Datos II UTPL 20071
Base de Datos II UTPL 20071Base de Datos II UTPL 20071
Base de Datos II UTPL 20071
Juan Carlos
 
Programacion lineal investigacion operaciones
Programacion lineal investigacion operacionesProgramacion lineal investigacion operaciones
Programacion lineal investigacion operaciones
Manuel Bedoya D
 
Tema 4 Metodologías de DW 2024bhjbhb.pdf
Tema 4 Metodologías de DW 2024bhjbhb.pdfTema 4 Metodologías de DW 2024bhjbhb.pdf
Tema 4 Metodologías de DW 2024bhjbhb.pdf
43276932
 

Similar a Plantilla ppt pv_santon_slideshare (20)

Session01.pptx
Session01.pptxSession01.pptx
Session01.pptx
 
Open Session Multiplica - UX Analytics: el mejor amigo de las decisiones obje...
Open Session Multiplica - UX Analytics: el mejor amigo de las decisiones obje...Open Session Multiplica - UX Analytics: el mejor amigo de las decisiones obje...
Open Session Multiplica - UX Analytics: el mejor amigo de las decisiones obje...
 
Curso Analisis de Datos y Estadistica Avanzada aplicada a negocios
Curso Analisis de Datos y Estadistica Avanzada  aplicada a negociosCurso Analisis de Datos y Estadistica Avanzada  aplicada a negocios
Curso Analisis de Datos y Estadistica Avanzada aplicada a negocios
 
SESION 1_SIM_wk.pdf
SESION 1_SIM_wk.pdfSESION 1_SIM_wk.pdf
SESION 1_SIM_wk.pdf
 
Seminario Almacenamiento Datos Hoy - 13/12/10
Seminario Almacenamiento Datos Hoy - 13/12/10Seminario Almacenamiento Datos Hoy - 13/12/10
Seminario Almacenamiento Datos Hoy - 13/12/10
 
aplicacion_de_la_investigacion_de_operaciones
aplicacion_de_la_investigacion_de_operacionesaplicacion_de_la_investigacion_de_operaciones
aplicacion_de_la_investigacion_de_operaciones
 
Curso Superior BI Software Libre
Curso Superior BI Software LibreCurso Superior BI Software Libre
Curso Superior BI Software Libre
 
Seminarios de Analítica Predictiva con Rapid Miner
Seminarios de Analítica Predictiva con Rapid MinerSeminarios de Analítica Predictiva con Rapid Miner
Seminarios de Analítica Predictiva con Rapid Miner
 
Mineria y modelado de datos
Mineria y modelado de datosMineria y modelado de datos
Mineria y modelado de datos
 
10. Análisis de datos cuantitativos.pptx
10. Análisis de datos cuantitativos.pptx10. Análisis de datos cuantitativos.pptx
10. Análisis de datos cuantitativos.pptx
 
Propuesta en Gestión de Proyectos y Análisis de Negocios
 Propuesta en Gestión de Proyectos y Análisis de Negocios Propuesta en Gestión de Proyectos y Análisis de Negocios
Propuesta en Gestión de Proyectos y Análisis de Negocios
 
Silabo Curso inteligencia de Negocios - Maestria en Computación y Sistemas Se...
Silabo Curso inteligencia de Negocios - Maestria en Computación y Sistemas Se...Silabo Curso inteligencia de Negocios - Maestria en Computación y Sistemas Se...
Silabo Curso inteligencia de Negocios - Maestria en Computación y Sistemas Se...
 
Máster Big Data y Business Analytics Universidad Complutense de Madrid
Máster Big Data y Business Analytics Universidad Complutense de MadridMáster Big Data y Business Analytics Universidad Complutense de Madrid
Máster Big Data y Business Analytics Universidad Complutense de Madrid
 
Semestre 2011 i - proyecto - semana nº 05 (2)
Semestre 2011   i -  proyecto - semana nº 05 (2)Semestre 2011   i -  proyecto - semana nº 05 (2)
Semestre 2011 i - proyecto - semana nº 05 (2)
 
Semestre 2011 i - proyecto - semana nº 05
Semestre 2011   i -  proyecto - semana nº 05Semestre 2011   i -  proyecto - semana nº 05
Semestre 2011 i - proyecto - semana nº 05
 
Power-BI-básico.pdf
Power-BI-básico.pdfPower-BI-básico.pdf
Power-BI-básico.pdf
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Base de Datos II UTPL 20071
Base de Datos II UTPL 20071Base de Datos II UTPL 20071
Base de Datos II UTPL 20071
 
Programacion lineal investigacion operaciones
Programacion lineal investigacion operacionesProgramacion lineal investigacion operaciones
Programacion lineal investigacion operaciones
 
Tema 4 Metodologías de DW 2024bhjbhb.pdf
Tema 4 Metodologías de DW 2024bhjbhb.pdfTema 4 Metodologías de DW 2024bhjbhb.pdf
Tema 4 Metodologías de DW 2024bhjbhb.pdf
 

Último

Presentación simple corporativa degradado en violeta blanco.pptx
Presentación simple corporativa degradado en violeta blanco.pptxPresentación simple corporativa degradado en violeta blanco.pptx
Presentación simple corporativa degradado en violeta blanco.pptx
eleandroth
 
vivienda segura concreto, construcción y métodos
vivienda segura concreto, construcción y métodosvivienda segura concreto, construcción y métodos
vivienda segura concreto, construcción y métodos
DilmerCarranza
 
Plan de Compensación Dxn Internacional peru pdf
Plan de Compensación Dxn Internacional peru pdfPlan de Compensación Dxn Internacional peru pdf
Plan de Compensación Dxn Internacional peru pdf
agustincarranza11
 
MI CECTOR POSTE BLANCO - Paián .pdf
MI  CECTOR  POSTE  BLANCO - Paián   .pdfMI  CECTOR  POSTE  BLANCO - Paián   .pdf
MI CECTOR POSTE BLANCO - Paián .pdf
GustavoTello19
 
04 capital interes simple.pdf de la clase métodos cuantitativos
04 capital interes simple.pdf de la clase métodos cuantitativos04 capital interes simple.pdf de la clase métodos cuantitativos
04 capital interes simple.pdf de la clase métodos cuantitativos
MarcoPolo545324
 
Informe fina mini bibliotecacomunitaria .docx
Informe fina mini bibliotecacomunitaria .docxInforme fina mini bibliotecacomunitaria .docx
Informe fina mini bibliotecacomunitaria .docx
mirimerlos5
 
REPORTE-HEMEROGRÁFICO-MAYO 2024-IRAPUATO.pdf
REPORTE-HEMEROGRÁFICO-MAYO 2024-IRAPUATO.pdfREPORTE-HEMEROGRÁFICO-MAYO 2024-IRAPUATO.pdf
REPORTE-HEMEROGRÁFICO-MAYO 2024-IRAPUATO.pdf
IrapuatoCmovamos
 
Plan Emergencia solicitado en obras de construccion
Plan Emergencia  solicitado en obras de construccionPlan Emergencia  solicitado en obras de construccion
Plan Emergencia solicitado en obras de construccion
christianllacchasand
 
PROCESAMIENTO DIGITAL DE IMAGENES PDS 2020
PROCESAMIENTO DIGITAL DE IMAGENES PDS 2020PROCESAMIENTO DIGITAL DE IMAGENES PDS 2020
PROCESAMIENTO DIGITAL DE IMAGENES PDS 2020
hugowagner811
 
ANA0003227-lagunas.pdfñlñlñlñlñññlñlllll
ANA0003227-lagunas.pdfñlñlñlñlñññlñlllllANA0003227-lagunas.pdfñlñlñlñlñññlñlllll
ANA0003227-lagunas.pdfñlñlñlñlñññlñlllll
eliassalascolonia43
 
UGEL SAN MIGUEL SACALE TARJETA ROJA A LA VIOLENCIA.pptx
UGEL SAN MIGUEL SACALE TARJETA ROJA A LA VIOLENCIA.pptxUGEL SAN MIGUEL SACALE TARJETA ROJA A LA VIOLENCIA.pptx
UGEL SAN MIGUEL SACALE TARJETA ROJA A LA VIOLENCIA.pptx
Mayra798665
 
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIOLINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
AaronPleitez
 
INTELIGENCIA ARTIFICIAL monografia02.pdf
INTELIGENCIA ARTIFICIAL monografia02.pdfINTELIGENCIA ARTIFICIAL monografia02.pdf
INTELIGENCIA ARTIFICIAL monografia02.pdf
YulEz1
 
MONOGRAFIA DEL BUSCADOR YAHOO! APSTI1"A"
MONOGRAFIA DEL BUSCADOR YAHOO! APSTI1"A"MONOGRAFIA DEL BUSCADOR YAHOO! APSTI1"A"
MONOGRAFIA DEL BUSCADOR YAHOO! APSTI1"A"
darkskills2011
 
resumen de manual de organizacion y funciones de TI
resumen de manual de organizacion y funciones de TIresumen de manual de organizacion y funciones de TI
resumen de manual de organizacion y funciones de TI
riveroarlett5b
 

Último (15)

Presentación simple corporativa degradado en violeta blanco.pptx
Presentación simple corporativa degradado en violeta blanco.pptxPresentación simple corporativa degradado en violeta blanco.pptx
Presentación simple corporativa degradado en violeta blanco.pptx
 
vivienda segura concreto, construcción y métodos
vivienda segura concreto, construcción y métodosvivienda segura concreto, construcción y métodos
vivienda segura concreto, construcción y métodos
 
Plan de Compensación Dxn Internacional peru pdf
Plan de Compensación Dxn Internacional peru pdfPlan de Compensación Dxn Internacional peru pdf
Plan de Compensación Dxn Internacional peru pdf
 
MI CECTOR POSTE BLANCO - Paián .pdf
MI  CECTOR  POSTE  BLANCO - Paián   .pdfMI  CECTOR  POSTE  BLANCO - Paián   .pdf
MI CECTOR POSTE BLANCO - Paián .pdf
 
04 capital interes simple.pdf de la clase métodos cuantitativos
04 capital interes simple.pdf de la clase métodos cuantitativos04 capital interes simple.pdf de la clase métodos cuantitativos
04 capital interes simple.pdf de la clase métodos cuantitativos
 
Informe fina mini bibliotecacomunitaria .docx
Informe fina mini bibliotecacomunitaria .docxInforme fina mini bibliotecacomunitaria .docx
Informe fina mini bibliotecacomunitaria .docx
 
REPORTE-HEMEROGRÁFICO-MAYO 2024-IRAPUATO.pdf
REPORTE-HEMEROGRÁFICO-MAYO 2024-IRAPUATO.pdfREPORTE-HEMEROGRÁFICO-MAYO 2024-IRAPUATO.pdf
REPORTE-HEMEROGRÁFICO-MAYO 2024-IRAPUATO.pdf
 
Plan Emergencia solicitado en obras de construccion
Plan Emergencia  solicitado en obras de construccionPlan Emergencia  solicitado en obras de construccion
Plan Emergencia solicitado en obras de construccion
 
PROCESAMIENTO DIGITAL DE IMAGENES PDS 2020
PROCESAMIENTO DIGITAL DE IMAGENES PDS 2020PROCESAMIENTO DIGITAL DE IMAGENES PDS 2020
PROCESAMIENTO DIGITAL DE IMAGENES PDS 2020
 
ANA0003227-lagunas.pdfñlñlñlñlñññlñlllll
ANA0003227-lagunas.pdfñlñlñlñlñññlñlllllANA0003227-lagunas.pdfñlñlñlñlñññlñlllll
ANA0003227-lagunas.pdfñlñlñlñlñññlñlllll
 
UGEL SAN MIGUEL SACALE TARJETA ROJA A LA VIOLENCIA.pptx
UGEL SAN MIGUEL SACALE TARJETA ROJA A LA VIOLENCIA.pptxUGEL SAN MIGUEL SACALE TARJETA ROJA A LA VIOLENCIA.pptx
UGEL SAN MIGUEL SACALE TARJETA ROJA A LA VIOLENCIA.pptx
 
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIOLINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
 
INTELIGENCIA ARTIFICIAL monografia02.pdf
INTELIGENCIA ARTIFICIAL monografia02.pdfINTELIGENCIA ARTIFICIAL monografia02.pdf
INTELIGENCIA ARTIFICIAL monografia02.pdf
 
MONOGRAFIA DEL BUSCADOR YAHOO! APSTI1"A"
MONOGRAFIA DEL BUSCADOR YAHOO! APSTI1"A"MONOGRAFIA DEL BUSCADOR YAHOO! APSTI1"A"
MONOGRAFIA DEL BUSCADOR YAHOO! APSTI1"A"
 
resumen de manual de organizacion y funciones de TI
resumen de manual de organizacion y funciones de TIresumen de manual de organizacion y funciones de TI
resumen de manual de organizacion y funciones de TI
 

Plantilla ppt pv_santon_slideshare

  • 1. Universidad Internacional de La Rioja Silvia Antón Lara Entendiendo la cuenta de P&G mediante técnicas cuantitativas y de aprendizaje automático. Máster Universitario en Inteligencia de Negocio
  • 2. Índice & Contenido 1. Planteamiento general: descripción y justificación del proyecto. 2. Objetivos del TFM. 3. Qué es la inteligencia de negocio. 4. Arquitectura del proyecto. Proyecto A: EDA Análisis. Proyecto B: Aprendizaje supervisado, regresión. Proyecto C: Análisis multivariante y árboles de decisión. 5. Conclusiones 6. Limitaciones y prospectiva 7. Cierre 2
  • 3. 3 1) Planteamiento general: descripción y justificación del proyecto. • Existen multitud de factores que influyen en el comportamiento de los consumidores. • Tanto Kahneman y Gigerenzer están de acuerdo en la centralidad de la heurística en la toma de decisiones.
  • 4. 2) Objetivos del TFM Objetivo General  Estudiar la base de datos de AdventureWorks 17, prestando especial atención a las ventas y clientes de la compañía. Objetivos específicos  Definir qué es la IN  Realizar una comparativa de las distintas técnicas de aprendizaje supervisado y no supervisado.  Presentar los resultados de una manera “amigable” al lector, siguiendo técnicas específicas de BI y de storytelling. 4
  • 5. 3) ¿Qué es la Inteligencia de Negocio? 5 INTELIGENCIA DE NEGOCIO ANALISIS DE DATOS ESTRATEGIA Y GESTION EMPRESARIAL FUNDAMENTOS TECNOLOGICOS INTELIGENCIA DE CLIENTE_CRM VISUALIZACIÓN DE DATOS GESTIÓN DE PROYECTOS DE IN INTELIGENCIA DE NEGOCIO APLICADA
  • 6. HISTORIA DE LA I.N. 6
  • 7. HISTORIA DE LA I.N. 7 Rafi,Q 2012 2014 Debortolli 2015 Sangari, Razmi 2018 Schmarzo 2019 Ratia & others
  • 8. 4) PROYECTO A: ANÁLISIS CLIENTES I
  • 9. • 4) PROYECTO A: ANÁLISIS CLIENTES II
  • 10. • PROYECTO : ANÁLISIS PRODUCTOS
  • 12. PROYECTO C) APRENDIZAJE NO SUPERVISADO 12 PCA. Análisis de componentes principales. K-MEANS Cada grupo está representado por el centro o los medios de los puntos de datos pertenecientes al grupo. HIERARCHICAL CLUSTERING .
  • 13. PROYECTO B) APRENDIZAJE SUPERVISADO 13 Regresión lineal. Su expresión general se basa en la ecuación de la recta y = mx + b. Fórmulas de mínimos Árboles de decisión Datos contiene una gran lista de predictores Máquinas de vectores soporte o SVM Utilizado sobre todo para temas de clasificación.
  • 14. ANÁLISIS MULTIVARIANTE Y ÁRBOLES DE DECISIÓN. 14
  • 15. LIMITACIONES Y PROSPECTIVA. DAFO 15 OPORTUNIDADES •Gráficos de fácil comprensión por usuarios finales. •Informes fácilmente customizables. •Facilidad para la comprensión y visión de grandes cantidades de datos. •Establecer un criterio científico riguroso para el análisis de datos e hipótesis y complementarlo con el análisis visual. AMENAZAS •Usuarios finales no muy versados con el análisis de datos riguroso. •Exceso de datos que pueden amenazar el debate. •Facilidad de manipulación de los datos. •Complejidad para explicar modelos econométricos y distribuciones de probabilidad. ¿Qué entendemos por media, varianza, desviación típica? •Facilidad para desechar valores extremos u outliers que pueden ser de interés para nuestro estudio. •Lo que puede ser correcto para un modelo de machine learning, en el que los datos tienen que estar equilibrados o "balanced", puede no serlo para el estudio cuantitativo y de distribuciones analíticas. FORTALEZAS • Se trata de análisis tanto visual como cuantitativo. • Conectar directamente la fuente de datos, o una consulta, permite posteriores modificaciones. • Útil para hacer predicciones si entendemos el modelo. •Muy útil para hacernos una imagen holística del funcionamiento de una empresa. DEBILIDADES •Debilidades de programación y conocimiento más profundo de R Studio y Phyton.
  • 16. ENLACES 16 Título URL TOWARDS DATA SCIENCE https://www.linkedin.com/company/toward s-data-science/ GITHUB (github.com)https://github.com/SANTONL A?tab=repositories LINKEDIN http://www.linkedin.com/in/tecnicodecompr assantonla DATA SCIENCE DOJO https://www.linkedin.com/company/data- science-dojo/ DATA SCIENCE CENTRAL https://www.linkedin.com/company/data- science-central/ GITMIND https://github.com/SANTONLA?tab=reposi tories COMUNITY RSTUDIO https://community.rstudio.com/u/santonla/s ummary GRAPHEXT https://app.graphext.com/teams/VGVhbS01 MzU2/projects STACKOVERFLOW https://stackoverflow.com/