SlideShare una empresa de Scribd logo
Utilizando la
Ciencia de
Datos en una
Organización
Instituto Tecnológico y de Estudios Superiores de Monterrey, México.
Fernando Aguada. Febrero 2020
Indice
1.Introducción...........................................................................................................................................................2
2.Indicadores de Desempeño................................................................................................................................3
3.Tipo de Análisis......................................................................................................................................................4
4.Propuesta................................................................................................................................................................5
5.Conclusiones..........................................................................................................................................................6
1
1.Introducción
El presente trabajo tiene como objetivo aplicar los conceptos aprendidos sobre la ciencia de datos
a una organización especifica, la librería Iztaccihuatl, ubicada en la ciudad de Monterrey, Nuevo
León, México.
En primer lugar, a partir del análisis de la información proporcionada, la cual se presenta en
cuatro archivos:
1. El archivo“books”, contiene los datos generales de cada libro.
2. El archivo“top_books”, contiene los 20 libros mas vendidos.
3. El archivo“raitings”, contiene los libros mas votados por los clientes en el sitio web de la
empresa.
4. El archivo“to_read”, contiene las recomendaciones que los usuarios hacen acerca de los
libros a leer.
Se identifican una serie de indicadores de desempeño, desde allí se inicia el análisis para
finalmente elaborar una propuesta que permita mejorar los indicadores identificados y al mismo
tiempo desarrollar e implementar una mejor estrategia en el proceso de toma de decisiones.
2
2.Indicadores de Desempeño
A partir del análisis de la información contenida en los archivos, identificamos los siguientes
indicadores de desempeño que serán tomados para nuestro análisis, estos son:
1. Libros mas vendidos.
2. Libros mas votados.
3. Libros mas recomendados.
3
3.Tipo de Análisis
Para nuestro trabajo nos inclinamos por utilizar la metodología CRISP-DM, (Cross Industry
Standard Process for Data Mining) . Esta fue creada en 1999 por un conglomerado de empresas
(SPSS, NCR y Daimler Chrysler), donde se busca la recolección y análisis de grandes volúmenes
de datos. Se destaca por proporcionar un enfoque estructurado en un proyecto de datos. Como
ventajas tiene a su favor que es una metodología robusta, flexible y esta comprobada su utilidad
para resolver problemas. Se compone de una serie de fases:
1. Entender el negocio: se identifican los objetivos a conseguir después de un estudio del negocio,
exigencias y necesidades del cliente. Se crea un plan estratégico para alcanzar dichos objetivos.
2. Comprender los datos: Se identifican los datos necesarios para alcanzar los objetivos. Se
reconocen las fuentes de datos y describen los tipos de datos con los que vamos a trabajar e
identificar aquellos que realmente son necesarios. Hay que reconocer problemas en los mismos,
como si existen datos repetidos, incompletos, inconsistentes, con errores, entre otros.
3. Preparar los datos: Procesar los flujos de datos, resolver los problemas de datos faltantes,
controlar las inconsistencias de los flujos de datos y realizar la limpieza y estandarización de los
datos, etc.
4. Modelado: Hay que definir qué modelo o técnica es el más apropiado para la resolución del
problema a tratar y que técnicas a aplicar segun los datos que tenemos, los recursos y
necesidades. Se puede volver a la fase anterior para trabajar con los datos y tener una entrada de
los mismos, acorde a las necesidades del modelo.
5. Evaluación: Visualizar y análisis de los datos obtenidos y su relación con los objetivos.
6. Despliegue: Se visualiza el conocimiento y los resultados obtenidos y se muestran al cliente.
4
4.Propuesta
Estrategia de Implementación
A partir del análisis de los indicadores de desempeño identificados podemos hacer las siguientes
propuestas que se aplican a todos los indicadores:
En primer lugar agregar la tabla/archivo clientes y que esta contenga como minimo la edad, sexo
y datos de contacto del mismo.
Segundo se recomienda implementar un algoritmo que permita el análisis de los indicadores
mencionados pero incluyendo ademas el sexo del lector, la edad, la temática general del libro y el
autor. Toda esta información permite crear vectores de características, el cual, aplicado el
aprendizaje automático nos ayudará a encontrar patrones ocultos en la información y de esta
manera identificar con mayor precisión los patrones de compras y/o intereses de los lectores.
Tercero, elaborar un perfil de cada cliente, según sus temas preferidos de lectura, edad, sexo y
hacer recomendaciones y ofertas regularmente de aquellos libros que se adecuen a su perfil.
Cuarto, crear un modelo predictivo que permita anticiparse a la demanda de los clientes y/o
lectores a partir del análisis de los libros mas recomendados, votados y comprados, que permita
tomar decisiones sobre que libros comprar y cuales no, en función de las predicciones que arroje
el modelo.
Evaluación
Para evaluar la marcha del negocio y la eficiencia de los modelos propuesto, se recomienda el
monitoreo constante de los indicadores definidos para asegurarnos que estamos en el camino de
mejorar los indicadores identificados.
Buenas Practicas
Se recomienda el seguimiento constante de la relación entre los indicadores de desempeño
mencionados, de funcionar la estrategia propuesta, debería manifestarse un estrecha relación
entre los libros mas vendidos y los libros mas votados y recomendados. Lo contrario, seria un
indicador de que se ha cometido un error en la estrategia.
Justificación de la estrategia
Como se menciona en la estrategia de implementación, el contar con información clave del cliente,
permitirá al modelo desarrollado encontrar patrones entre los libros que mas se venden, que mas se
recomiendan y los que mas se votan vinculados con la edad y sexo del cliente, asi como los autores y
temas preferidos de lectura e interés. El modelo predictivo, permitirá sacar a la luz los hábitos de los
clientes y ofrecerles una experiencia mas personal y certera de lo que quieren leer, a su vez esto tendrá su
correspondiente correlato en una mejora en la toma de decisiones acerca de como gestionar la compra y
existencia de los libros.
5
5.Conclusiones
El análisis de los indicadores identificados conjuntamente con la elaboración de un algoritmo que
nos permita comprender con mayor claridad como se compone la demanda e intereses de libros,
permite elaborar un“análisis descriptivo”, es decir comprender la situación actual del negocio.
A partir de esta comprensión podemos avanzar hacia una segunda etapa, la elaboración de un
“análisis predictivo” que nos permita anticiparnos a la demanda de los clientes y/o lectores.
Por ultimo, partiendo de los resultados del análisis predictivo concluir con un“análisis
prescriptivo” que mejore el proceso de toma de decisiones y de esta manera las mismas sean
resultado del análisis de los datos y no de la intuición.
6

Más contenido relacionado

La actualidad más candente

Utilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónUtilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organización
Diego Farfan
 
Introduccion a la ciencia de datos
Introduccion a la ciencia de datosIntroduccion a la ciencia de datos
Introduccion a la ciencia de datos
AngheloDanielPrez
 
Proyecto individual daniel murillo
Proyecto individual daniel murilloProyecto individual daniel murillo
Proyecto individual daniel murillo
Daniel866358
 
Trabajo de ciencia de datos evaluado por pares
Trabajo de ciencia de datos evaluado por paresTrabajo de ciencia de datos evaluado por pares
Trabajo de ciencia de datos evaluado por pares
FrancoGotuzzo
 
Bigdata Herramientas Caso Libreria Iztaccihuatl
Bigdata Herramientas Caso Libreria IztaccihuatlBigdata Herramientas Caso Libreria Iztaccihuatl
Bigdata Herramientas Caso Libreria Iztaccihuatl
Paola Quiroz Alvarez
 
Proyecto herramientas para el análisis de big data
Proyecto herramientas para el análisis de big dataProyecto herramientas para el análisis de big data
Proyecto herramientas para el análisis de big data
MarcoPoloSanchez1
 
Actividad 1 - Jesus Axel Dominguez Rocha
Actividad 1 - Jesus Axel Dominguez RochaActividad 1 - Jesus Axel Dominguez Rocha
Actividad 1 - Jesus Axel Dominguez Rocha
AxelRocha3
 
Utilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónUtilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organización
Kozhaya Elias Sfeir
 
Trabajo de pares
Trabajo de paresTrabajo de pares
Trabajo de pares
matiasgatica9
 
Práctica de evaluación entre pares
Práctica de evaluación entre paresPráctica de evaluación entre pares
Práctica de evaluación entre pares
Sofía Ardila
 
Propuesta PROYECTO Iztaccíhuatl
Propuesta PROYECTO IztaccíhuatlPropuesta PROYECTO Iztaccíhuatl
Propuesta PROYECTO Iztaccíhuatl
Diego Avendaño
 
Práctica big data
Práctica big dataPráctica big data
Práctica big data
Ignacio González Velasco
 
Proyecto individual - Introducción a la ciencia de datos
Proyecto individual - Introducción a la ciencia de datosProyecto individual - Introducción a la ciencia de datos
Proyecto individual - Introducción a la ciencia de datos
RebecaHernandez59
 
Trabajo de visualización de datos evaluado por pares
Trabajo de visualización de datos evaluado por paresTrabajo de visualización de datos evaluado por pares
Trabajo de visualización de datos evaluado por pares
Franco Gotuzzo Flórez
 
Tarea Visualización de datos
Tarea Visualización de datosTarea Visualización de datos
Tarea Visualización de datos
OlgaMaraGarzaSilva
 
Trabajo intro a la ciencia de datos
Trabajo intro a la ciencia de datosTrabajo intro a la ciencia de datos
Trabajo intro a la ciencia de datos
EsneiderOrozcoVidal
 
Utilizando la ciencia de datos en una organizacion
Utilizando la ciencia de datos en una organizacionUtilizando la ciencia de datos en una organizacion
Utilizando la ciencia de datos en una organizacion
Alejandro Uribe Rodriguez
 
Proyecto evaluado por pares
Proyecto evaluado por paresProyecto evaluado por pares
Proyecto evaluado por pares
Juan Alfonso Cruz Vázquez
 
Utilizando la Ciencia de Datos - Caso: Librería Iztaccihuatl
Utilizando la Ciencia de Datos - Caso: Librería IztaccihuatlUtilizando la Ciencia de Datos - Caso: Librería Iztaccihuatl
Utilizando la Ciencia de Datos - Caso: Librería Iztaccihuatl
angelfeijoo
 

La actualidad más candente (19)

Utilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónUtilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organización
 
Introduccion a la ciencia de datos
Introduccion a la ciencia de datosIntroduccion a la ciencia de datos
Introduccion a la ciencia de datos
 
Proyecto individual daniel murillo
Proyecto individual daniel murilloProyecto individual daniel murillo
Proyecto individual daniel murillo
 
Trabajo de ciencia de datos evaluado por pares
Trabajo de ciencia de datos evaluado por paresTrabajo de ciencia de datos evaluado por pares
Trabajo de ciencia de datos evaluado por pares
 
Bigdata Herramientas Caso Libreria Iztaccihuatl
Bigdata Herramientas Caso Libreria IztaccihuatlBigdata Herramientas Caso Libreria Iztaccihuatl
Bigdata Herramientas Caso Libreria Iztaccihuatl
 
Proyecto herramientas para el análisis de big data
Proyecto herramientas para el análisis de big dataProyecto herramientas para el análisis de big data
Proyecto herramientas para el análisis de big data
 
Actividad 1 - Jesus Axel Dominguez Rocha
Actividad 1 - Jesus Axel Dominguez RochaActividad 1 - Jesus Axel Dominguez Rocha
Actividad 1 - Jesus Axel Dominguez Rocha
 
Utilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónUtilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organización
 
Trabajo de pares
Trabajo de paresTrabajo de pares
Trabajo de pares
 
Práctica de evaluación entre pares
Práctica de evaluación entre paresPráctica de evaluación entre pares
Práctica de evaluación entre pares
 
Propuesta PROYECTO Iztaccíhuatl
Propuesta PROYECTO IztaccíhuatlPropuesta PROYECTO Iztaccíhuatl
Propuesta PROYECTO Iztaccíhuatl
 
Práctica big data
Práctica big dataPráctica big data
Práctica big data
 
Proyecto individual - Introducción a la ciencia de datos
Proyecto individual - Introducción a la ciencia de datosProyecto individual - Introducción a la ciencia de datos
Proyecto individual - Introducción a la ciencia de datos
 
Trabajo de visualización de datos evaluado por pares
Trabajo de visualización de datos evaluado por paresTrabajo de visualización de datos evaluado por pares
Trabajo de visualización de datos evaluado por pares
 
Tarea Visualización de datos
Tarea Visualización de datosTarea Visualización de datos
Tarea Visualización de datos
 
Trabajo intro a la ciencia de datos
Trabajo intro a la ciencia de datosTrabajo intro a la ciencia de datos
Trabajo intro a la ciencia de datos
 
Utilizando la ciencia de datos en una organizacion
Utilizando la ciencia de datos en una organizacionUtilizando la ciencia de datos en una organizacion
Utilizando la ciencia de datos en una organizacion
 
Proyecto evaluado por pares
Proyecto evaluado por paresProyecto evaluado por pares
Proyecto evaluado por pares
 
Utilizando la Ciencia de Datos - Caso: Librería Iztaccihuatl
Utilizando la Ciencia de Datos - Caso: Librería IztaccihuatlUtilizando la Ciencia de Datos - Caso: Librería Iztaccihuatl
Utilizando la Ciencia de Datos - Caso: Librería Iztaccihuatl
 

Similar a Aplicación de La ciencia de datos en una Organización

Project.docx
Project.docxProject.docx
Project.docx
JosLzaroViverosHernn
 
Introduccion_a_la_investigacion_de_mercados 1.pptx
Introduccion_a_la_investigacion_de_mercados 1.pptxIntroduccion_a_la_investigacion_de_mercados 1.pptx
Introduccion_a_la_investigacion_de_mercados 1.pptx
Oscar Lopez
 
GRUPO 3 - Instrumentos y técnicas de recolección de datos en una investigació...
GRUPO 3 - Instrumentos y técnicas de recolección de datos en una investigació...GRUPO 3 - Instrumentos y técnicas de recolección de datos en una investigació...
GRUPO 3 - Instrumentos y técnicas de recolección de datos en una investigació...
NolyIsabelPanduroPiz
 
Proyecto individual evaluado_por_pares_v1
Proyecto individual evaluado_por_pares_v1Proyecto individual evaluado_por_pares_v1
Proyecto individual evaluado_por_pares_v1
juandavidgallo
 
Reporte.pdf
Reporte.pdfReporte.pdf
Reporte.pdf
JuanJosTrivio
 
Metodologia de la Investigacion en Mercadotecnia
Metodologia de la Investigacion en Mercadotecnia Metodologia de la Investigacion en Mercadotecnia
Metodologia de la Investigacion en Mercadotecnia Jezz Pilgrim
 
producto integrador
producto integradorproducto integrador
producto integrador
olimpiagutirrez
 
Erdozain, Diego.pdf
Erdozain, Diego.pdfErdozain, Diego.pdf
Erdozain, Diego.pdf
DiegoErdozainNavarro
 
Biblioteca Virtual
Biblioteca VirtualBiblioteca Virtual
Biblioteca Virtual
olimpiagutirrez
 
Reporte_practica_2.pdf
Reporte_practica_2.pdfReporte_practica_2.pdf
Reporte_practica_2.pdf
Juan José Triviño
 
Aplicando La Ciencia de Datos en Una Organizacion
Aplicando La Ciencia de Datos en Una OrganizacionAplicando La Ciencia de Datos en Una Organizacion
Aplicando La Ciencia de Datos en Una Organizacion
Fernando Aguada
 
Mercadotecnia I
Mercadotecnia I Mercadotecnia I
Mercadotecnia I
Seck Opqa
 
Unidad I. planeacion_de_la_investigacion_de_mercados_v1_1 [Recuperado].pptx
Unidad I. planeacion_de_la_investigacion_de_mercados_v1_1 [Recuperado].pptxUnidad I. planeacion_de_la_investigacion_de_mercados_v1_1 [Recuperado].pptx
Unidad I. planeacion_de_la_investigacion_de_mercados_v1_1 [Recuperado].pptx
AdrianGonzalez180936
 
Metodologia de investigacion de mercados
Metodologia de investigacion de mercadosMetodologia de investigacion de mercados
Metodologia de investigacion de mercados
FabianVenturaGraciel
 
Proyecto libreria Iztaccihuatl.docx
Proyecto libreria Iztaccihuatl.docxProyecto libreria Iztaccihuatl.docx
Proyecto libreria Iztaccihuatl.docx
LuchoTalledo
 
Introducción a la ciencia de datos y el big data
Introducción a la ciencia de datos y el big dataIntroducción a la ciencia de datos y el big data
Introducción a la ciencia de datos y el big data
Almudena Casado
 
Investigación de marketing
Investigación de marketingInvestigación de marketing
Investigación de marketingCatherine Torres
 
Filosofía Six Sigma.pdf
Filosofía Six Sigma.pdfFilosofía Six Sigma.pdf
Filosofía Six Sigma.pdf
Ramses CF
 
marketin confecc.camisetas
marketin confecc.camisetasmarketin confecc.camisetas
marketin confecc.camisetasmafermo123
 

Similar a Aplicación de La ciencia de datos en una Organización (20)

Project.docx
Project.docxProject.docx
Project.docx
 
Introduccion_a_la_investigacion_de_mercados 1.pptx
Introduccion_a_la_investigacion_de_mercados 1.pptxIntroduccion_a_la_investigacion_de_mercados 1.pptx
Introduccion_a_la_investigacion_de_mercados 1.pptx
 
GRUPO 3 - Instrumentos y técnicas de recolección de datos en una investigació...
GRUPO 3 - Instrumentos y técnicas de recolección de datos en una investigació...GRUPO 3 - Instrumentos y técnicas de recolección de datos en una investigació...
GRUPO 3 - Instrumentos y técnicas de recolección de datos en una investigació...
 
Proyecto individual evaluado_por_pares_v1
Proyecto individual evaluado_por_pares_v1Proyecto individual evaluado_por_pares_v1
Proyecto individual evaluado_por_pares_v1
 
Reporte.pdf
Reporte.pdfReporte.pdf
Reporte.pdf
 
Metodologia de la Investigacion en Mercadotecnia
Metodologia de la Investigacion en Mercadotecnia Metodologia de la Investigacion en Mercadotecnia
Metodologia de la Investigacion en Mercadotecnia
 
producto integrador
producto integradorproducto integrador
producto integrador
 
La investigación como medio de desarrollo empresarial
La investigación como medio de desarrollo empresarial  La investigación como medio de desarrollo empresarial
La investigación como medio de desarrollo empresarial
 
Erdozain, Diego.pdf
Erdozain, Diego.pdfErdozain, Diego.pdf
Erdozain, Diego.pdf
 
Biblioteca Virtual
Biblioteca VirtualBiblioteca Virtual
Biblioteca Virtual
 
Reporte_practica_2.pdf
Reporte_practica_2.pdfReporte_practica_2.pdf
Reporte_practica_2.pdf
 
Aplicando La Ciencia de Datos en Una Organizacion
Aplicando La Ciencia de Datos en Una OrganizacionAplicando La Ciencia de Datos en Una Organizacion
Aplicando La Ciencia de Datos en Una Organizacion
 
Mercadotecnia I
Mercadotecnia I Mercadotecnia I
Mercadotecnia I
 
Unidad I. planeacion_de_la_investigacion_de_mercados_v1_1 [Recuperado].pptx
Unidad I. planeacion_de_la_investigacion_de_mercados_v1_1 [Recuperado].pptxUnidad I. planeacion_de_la_investigacion_de_mercados_v1_1 [Recuperado].pptx
Unidad I. planeacion_de_la_investigacion_de_mercados_v1_1 [Recuperado].pptx
 
Metodologia de investigacion de mercados
Metodologia de investigacion de mercadosMetodologia de investigacion de mercados
Metodologia de investigacion de mercados
 
Proyecto libreria Iztaccihuatl.docx
Proyecto libreria Iztaccihuatl.docxProyecto libreria Iztaccihuatl.docx
Proyecto libreria Iztaccihuatl.docx
 
Introducción a la ciencia de datos y el big data
Introducción a la ciencia de datos y el big dataIntroducción a la ciencia de datos y el big data
Introducción a la ciencia de datos y el big data
 
Investigación de marketing
Investigación de marketingInvestigación de marketing
Investigación de marketing
 
Filosofía Six Sigma.pdf
Filosofía Six Sigma.pdfFilosofía Six Sigma.pdf
Filosofía Six Sigma.pdf
 
marketin confecc.camisetas
marketin confecc.camisetasmarketin confecc.camisetas
marketin confecc.camisetas
 

Último

contraguerrilla.pdf sobre anti emboscadas
contraguerrilla.pdf sobre anti emboscadascontraguerrilla.pdf sobre anti emboscadas
contraguerrilla.pdf sobre anti emboscadas
DieguinhoSalazar
 
Claves Ipsos numero 29 --- Mayo 2024.pdf
Claves Ipsos numero 29 --- Mayo 2024.pdfClaves Ipsos numero 29 --- Mayo 2024.pdf
Claves Ipsos numero 29 --- Mayo 2024.pdf
Emisor Digital
 
e learning^.pptxdieguearmandozuñiga. Comhot
e learning^.pptxdieguearmandozuñiga. Comhote learning^.pptxdieguearmandozuñiga. Comhot
e learning^.pptxdieguearmandozuñiga. Comhot
diegozuniga768
 
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIOLINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
AaronPleitez
 
MINEDUC-MINEDUC-2023-00075-A Comité de Padres y Representantes.pdf
MINEDUC-MINEDUC-2023-00075-A Comité de Padres y Representantes.pdfMINEDUC-MINEDUC-2023-00075-A Comité de Padres y Representantes.pdf
MINEDUC-MINEDUC-2023-00075-A Comité de Padres y Representantes.pdf
RicardoNacevilla1
 
Desarrollo de habilidades de pensamiento
Desarrollo de habilidades de pensamientoDesarrollo de habilidades de pensamiento
Desarrollo de habilidades de pensamiento
ManuelaReina3
 
Presentación sobre la geometría, aplicaciones y ramas
Presentación sobre la geometría, aplicaciones y ramasPresentación sobre la geometría, aplicaciones y ramas
Presentación sobre la geometría, aplicaciones y ramas
JosMuoz943377
 
10 colonias - Análisis socio-demográfico 2024.pdf
10 colonias - Análisis socio-demográfico 2024.pdf10 colonias - Análisis socio-demográfico 2024.pdf
10 colonias - Análisis socio-demográfico 2024.pdf
IrapuatoCmovamos
 
DEFENSA NACIONAL.ppt muy fácil de entender
DEFENSA NACIONAL.ppt muy fácil de entenderDEFENSA NACIONAL.ppt muy fácil de entender
DEFENSA NACIONAL.ppt muy fácil de entender
mvargasleveau
 
REPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdf
REPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdfREPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdf
REPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdf
IrapuatoCmovamos
 
Instituciones financieras globales por efectivo disponible (2024).pdf
Instituciones financieras globales por efectivo disponible (2024).pdfInstituciones financieras globales por efectivo disponible (2024).pdf
Instituciones financieras globales por efectivo disponible (2024).pdf
JC Díaz Herrera
 
Informe de violencia mayo 2024 - Multigremial Mayo.pdf
Informe de violencia mayo 2024 - Multigremial Mayo.pdfInforme de violencia mayo 2024 - Multigremial Mayo.pdf
Informe de violencia mayo 2024 - Multigremial Mayo.pdf
Emisor Digital
 
mapa conceptual y mental para niños de primaria y secundaria
mapa conceptual y mental para niños de primaria y secundariamapa conceptual y mental para niños de primaria y secundaria
mapa conceptual y mental para niños de primaria y secundaria
ManuelAlbertoHeredia1
 
Países_por_participacion_porcentual_en_el PNB global (2024) .pdf
Países_por_participacion_porcentual_en_el PNB global (2024) .pdfPaíses_por_participacion_porcentual_en_el PNB global (2024) .pdf
Países_por_participacion_porcentual_en_el PNB global (2024) .pdf
JC Díaz Herrera
 
sistema paralingüística fhdjsjsbsnnssnnsbs
sistema paralingüística fhdjsjsbsnnssnnsbssistema paralingüística fhdjsjsbsnnssnnsbs
sistema paralingüística fhdjsjsbsnnssnnsbs
SantiagoMejia99
 
3-Modelamiento de Procesos usando BPMN.ppt
3-Modelamiento de Procesos usando BPMN.ppt3-Modelamiento de Procesos usando BPMN.ppt
3-Modelamiento de Procesos usando BPMN.ppt
nahumrondanurbano
 
ACOMPAÑAMIENTO INTEGRAL DE VALORES .pptx
ACOMPAÑAMIENTO INTEGRAL DE VALORES .pptxACOMPAÑAMIENTO INTEGRAL DE VALORES .pptx
ACOMPAÑAMIENTO INTEGRAL DE VALORES .pptx
MelanieYuksselleCarr
 
Comunidades virtuales de aprendizaje o educativas E-LEARNING.pdf
Comunidades virtuales de aprendizaje  o educativas E-LEARNING.pdfComunidades virtuales de aprendizaje  o educativas E-LEARNING.pdf
Comunidades virtuales de aprendizaje o educativas E-LEARNING.pdf
brayansangar73
 
PPT Interes-Simple-pptx.pptx-ejercicios.
PPT Interes-Simple-pptx.pptx-ejercicios.PPT Interes-Simple-pptx.pptx-ejercicios.
PPT Interes-Simple-pptx.pptx-ejercicios.
MELANYANELKACRUZLEON
 

Último (19)

contraguerrilla.pdf sobre anti emboscadas
contraguerrilla.pdf sobre anti emboscadascontraguerrilla.pdf sobre anti emboscadas
contraguerrilla.pdf sobre anti emboscadas
 
Claves Ipsos numero 29 --- Mayo 2024.pdf
Claves Ipsos numero 29 --- Mayo 2024.pdfClaves Ipsos numero 29 --- Mayo 2024.pdf
Claves Ipsos numero 29 --- Mayo 2024.pdf
 
e learning^.pptxdieguearmandozuñiga. Comhot
e learning^.pptxdieguearmandozuñiga. Comhote learning^.pptxdieguearmandozuñiga. Comhot
e learning^.pptxdieguearmandozuñiga. Comhot
 
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIOLINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
 
MINEDUC-MINEDUC-2023-00075-A Comité de Padres y Representantes.pdf
MINEDUC-MINEDUC-2023-00075-A Comité de Padres y Representantes.pdfMINEDUC-MINEDUC-2023-00075-A Comité de Padres y Representantes.pdf
MINEDUC-MINEDUC-2023-00075-A Comité de Padres y Representantes.pdf
 
Desarrollo de habilidades de pensamiento
Desarrollo de habilidades de pensamientoDesarrollo de habilidades de pensamiento
Desarrollo de habilidades de pensamiento
 
Presentación sobre la geometría, aplicaciones y ramas
Presentación sobre la geometría, aplicaciones y ramasPresentación sobre la geometría, aplicaciones y ramas
Presentación sobre la geometría, aplicaciones y ramas
 
10 colonias - Análisis socio-demográfico 2024.pdf
10 colonias - Análisis socio-demográfico 2024.pdf10 colonias - Análisis socio-demográfico 2024.pdf
10 colonias - Análisis socio-demográfico 2024.pdf
 
DEFENSA NACIONAL.ppt muy fácil de entender
DEFENSA NACIONAL.ppt muy fácil de entenderDEFENSA NACIONAL.ppt muy fácil de entender
DEFENSA NACIONAL.ppt muy fácil de entender
 
REPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdf
REPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdfREPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdf
REPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdf
 
Instituciones financieras globales por efectivo disponible (2024).pdf
Instituciones financieras globales por efectivo disponible (2024).pdfInstituciones financieras globales por efectivo disponible (2024).pdf
Instituciones financieras globales por efectivo disponible (2024).pdf
 
Informe de violencia mayo 2024 - Multigremial Mayo.pdf
Informe de violencia mayo 2024 - Multigremial Mayo.pdfInforme de violencia mayo 2024 - Multigremial Mayo.pdf
Informe de violencia mayo 2024 - Multigremial Mayo.pdf
 
mapa conceptual y mental para niños de primaria y secundaria
mapa conceptual y mental para niños de primaria y secundariamapa conceptual y mental para niños de primaria y secundaria
mapa conceptual y mental para niños de primaria y secundaria
 
Países_por_participacion_porcentual_en_el PNB global (2024) .pdf
Países_por_participacion_porcentual_en_el PNB global (2024) .pdfPaíses_por_participacion_porcentual_en_el PNB global (2024) .pdf
Países_por_participacion_porcentual_en_el PNB global (2024) .pdf
 
sistema paralingüística fhdjsjsbsnnssnnsbs
sistema paralingüística fhdjsjsbsnnssnnsbssistema paralingüística fhdjsjsbsnnssnnsbs
sistema paralingüística fhdjsjsbsnnssnnsbs
 
3-Modelamiento de Procesos usando BPMN.ppt
3-Modelamiento de Procesos usando BPMN.ppt3-Modelamiento de Procesos usando BPMN.ppt
3-Modelamiento de Procesos usando BPMN.ppt
 
ACOMPAÑAMIENTO INTEGRAL DE VALORES .pptx
ACOMPAÑAMIENTO INTEGRAL DE VALORES .pptxACOMPAÑAMIENTO INTEGRAL DE VALORES .pptx
ACOMPAÑAMIENTO INTEGRAL DE VALORES .pptx
 
Comunidades virtuales de aprendizaje o educativas E-LEARNING.pdf
Comunidades virtuales de aprendizaje  o educativas E-LEARNING.pdfComunidades virtuales de aprendizaje  o educativas E-LEARNING.pdf
Comunidades virtuales de aprendizaje o educativas E-LEARNING.pdf
 
PPT Interes-Simple-pptx.pptx-ejercicios.
PPT Interes-Simple-pptx.pptx-ejercicios.PPT Interes-Simple-pptx.pptx-ejercicios.
PPT Interes-Simple-pptx.pptx-ejercicios.
 

Aplicación de La ciencia de datos en una Organización

  • 1. Utilizando la Ciencia de Datos en una Organización Instituto Tecnológico y de Estudios Superiores de Monterrey, México. Fernando Aguada. Febrero 2020
  • 2. Indice 1.Introducción...........................................................................................................................................................2 2.Indicadores de Desempeño................................................................................................................................3 3.Tipo de Análisis......................................................................................................................................................4 4.Propuesta................................................................................................................................................................5 5.Conclusiones..........................................................................................................................................................6 1
  • 3. 1.Introducción El presente trabajo tiene como objetivo aplicar los conceptos aprendidos sobre la ciencia de datos a una organización especifica, la librería Iztaccihuatl, ubicada en la ciudad de Monterrey, Nuevo León, México. En primer lugar, a partir del análisis de la información proporcionada, la cual se presenta en cuatro archivos: 1. El archivo“books”, contiene los datos generales de cada libro. 2. El archivo“top_books”, contiene los 20 libros mas vendidos. 3. El archivo“raitings”, contiene los libros mas votados por los clientes en el sitio web de la empresa. 4. El archivo“to_read”, contiene las recomendaciones que los usuarios hacen acerca de los libros a leer. Se identifican una serie de indicadores de desempeño, desde allí se inicia el análisis para finalmente elaborar una propuesta que permita mejorar los indicadores identificados y al mismo tiempo desarrollar e implementar una mejor estrategia en el proceso de toma de decisiones. 2
  • 4. 2.Indicadores de Desempeño A partir del análisis de la información contenida en los archivos, identificamos los siguientes indicadores de desempeño que serán tomados para nuestro análisis, estos son: 1. Libros mas vendidos. 2. Libros mas votados. 3. Libros mas recomendados. 3
  • 5. 3.Tipo de Análisis Para nuestro trabajo nos inclinamos por utilizar la metodología CRISP-DM, (Cross Industry Standard Process for Data Mining) . Esta fue creada en 1999 por un conglomerado de empresas (SPSS, NCR y Daimler Chrysler), donde se busca la recolección y análisis de grandes volúmenes de datos. Se destaca por proporcionar un enfoque estructurado en un proyecto de datos. Como ventajas tiene a su favor que es una metodología robusta, flexible y esta comprobada su utilidad para resolver problemas. Se compone de una serie de fases: 1. Entender el negocio: se identifican los objetivos a conseguir después de un estudio del negocio, exigencias y necesidades del cliente. Se crea un plan estratégico para alcanzar dichos objetivos. 2. Comprender los datos: Se identifican los datos necesarios para alcanzar los objetivos. Se reconocen las fuentes de datos y describen los tipos de datos con los que vamos a trabajar e identificar aquellos que realmente son necesarios. Hay que reconocer problemas en los mismos, como si existen datos repetidos, incompletos, inconsistentes, con errores, entre otros. 3. Preparar los datos: Procesar los flujos de datos, resolver los problemas de datos faltantes, controlar las inconsistencias de los flujos de datos y realizar la limpieza y estandarización de los datos, etc. 4. Modelado: Hay que definir qué modelo o técnica es el más apropiado para la resolución del problema a tratar y que técnicas a aplicar segun los datos que tenemos, los recursos y necesidades. Se puede volver a la fase anterior para trabajar con los datos y tener una entrada de los mismos, acorde a las necesidades del modelo. 5. Evaluación: Visualizar y análisis de los datos obtenidos y su relación con los objetivos. 6. Despliegue: Se visualiza el conocimiento y los resultados obtenidos y se muestran al cliente. 4
  • 6. 4.Propuesta Estrategia de Implementación A partir del análisis de los indicadores de desempeño identificados podemos hacer las siguientes propuestas que se aplican a todos los indicadores: En primer lugar agregar la tabla/archivo clientes y que esta contenga como minimo la edad, sexo y datos de contacto del mismo. Segundo se recomienda implementar un algoritmo que permita el análisis de los indicadores mencionados pero incluyendo ademas el sexo del lector, la edad, la temática general del libro y el autor. Toda esta información permite crear vectores de características, el cual, aplicado el aprendizaje automático nos ayudará a encontrar patrones ocultos en la información y de esta manera identificar con mayor precisión los patrones de compras y/o intereses de los lectores. Tercero, elaborar un perfil de cada cliente, según sus temas preferidos de lectura, edad, sexo y hacer recomendaciones y ofertas regularmente de aquellos libros que se adecuen a su perfil. Cuarto, crear un modelo predictivo que permita anticiparse a la demanda de los clientes y/o lectores a partir del análisis de los libros mas recomendados, votados y comprados, que permita tomar decisiones sobre que libros comprar y cuales no, en función de las predicciones que arroje el modelo. Evaluación Para evaluar la marcha del negocio y la eficiencia de los modelos propuesto, se recomienda el monitoreo constante de los indicadores definidos para asegurarnos que estamos en el camino de mejorar los indicadores identificados. Buenas Practicas Se recomienda el seguimiento constante de la relación entre los indicadores de desempeño mencionados, de funcionar la estrategia propuesta, debería manifestarse un estrecha relación entre los libros mas vendidos y los libros mas votados y recomendados. Lo contrario, seria un indicador de que se ha cometido un error en la estrategia. Justificación de la estrategia Como se menciona en la estrategia de implementación, el contar con información clave del cliente, permitirá al modelo desarrollado encontrar patrones entre los libros que mas se venden, que mas se recomiendan y los que mas se votan vinculados con la edad y sexo del cliente, asi como los autores y temas preferidos de lectura e interés. El modelo predictivo, permitirá sacar a la luz los hábitos de los clientes y ofrecerles una experiencia mas personal y certera de lo que quieren leer, a su vez esto tendrá su correspondiente correlato en una mejora en la toma de decisiones acerca de como gestionar la compra y existencia de los libros. 5
  • 7. 5.Conclusiones El análisis de los indicadores identificados conjuntamente con la elaboración de un algoritmo que nos permita comprender con mayor claridad como se compone la demanda e intereses de libros, permite elaborar un“análisis descriptivo”, es decir comprender la situación actual del negocio. A partir de esta comprensión podemos avanzar hacia una segunda etapa, la elaboración de un “análisis predictivo” que nos permita anticiparnos a la demanda de los clientes y/o lectores. Por ultimo, partiendo de los resultados del análisis predictivo concluir con un“análisis prescriptivo” que mejore el proceso de toma de decisiones y de esta manera las mismas sean resultado del análisis de los datos y no de la intuición. 6