SlideShare una empresa de Scribd logo
1 de 7
Descargar para leer sin conexión
Utilizando la
Ciencia de
Datos en una
Organización
Instituto Tecnológico y de Estudios Superiores de Monterrey, México.
Fernando Aguada. Febrero 2020
Indice
1.Introducción...........................................................................................................................................................2
2.Indicadores de Desempeño................................................................................................................................3
3.Tipo de Análisis......................................................................................................................................................4
4.Propuesta................................................................................................................................................................5
5.Conclusiones..........................................................................................................................................................6
1
1.Introducción
El presente trabajo tiene como objetivo aplicar los conceptos aprendidos sobre la ciencia de datos
a una organización especifica, la librería Iztaccihuatl, ubicada en la ciudad de Monterrey, Nuevo
León, México.
En primer lugar, a partir del análisis de la información proporcionada, la cual se presenta en
cuatro archivos:
1. El archivo“books”, contiene los datos generales de cada libro.
2. El archivo“top_books”, contiene los 20 libros mas vendidos.
3. El archivo“raitings”, contiene los libros mas votados por los clientes en el sitio web de la
empresa.
4. El archivo“to_read”, contiene las recomendaciones que los usuarios hacen acerca de los
libros a leer.
Se identifican una serie de indicadores de desempeño, desde allí se inicia el análisis para
finalmente elaborar una propuesta que permita mejorar los indicadores identificados y al mismo
tiempo desarrollar e implementar una mejor estrategia en el proceso de toma de decisiones.
2
2.Indicadores de Desempeño
A partir del análisis de la información contenida en los archivos, identificamos los siguientes
indicadores de desempeño que serán tomados para nuestro análisis, estos son:
1. Libros mas vendidos.
2. Libros mas votados.
3. Libros mas recomendados.
3
3.Tipo de Análisis
Para nuestro trabajo nos inclinamos por utilizar la metodología CRISP-DM, (Cross Industry
Standard Process for Data Mining) . Esta fue creada en 1999 por un conglomerado de empresas
(SPSS, NCR y Daimler Chrysler), donde se busca la recolección y análisis de grandes volúmenes
de datos. Se destaca por proporcionar un enfoque estructurado en un proyecto de datos. Como
ventajas tiene a su favor que es una metodología robusta, flexible y esta comprobada su utilidad
para resolver problemas. Se compone de una serie de fases:
1. Entender el negocio: se identifican los objetivos a conseguir después de un estudio del negocio,
exigencias y necesidades del cliente. Se crea un plan estratégico para alcanzar dichos objetivos.
2. Comprender los datos: Se identifican los datos necesarios para alcanzar los objetivos. Se
reconocen las fuentes de datos y describen los tipos de datos con los que vamos a trabajar e
identificar aquellos que realmente son necesarios. Hay que reconocer problemas en los mismos,
como si existen datos repetidos, incompletos, inconsistentes, con errores, entre otros.
3. Preparar los datos: Procesar los flujos de datos, resolver los problemas de datos faltantes,
controlar las inconsistencias de los flujos de datos y realizar la limpieza y estandarización de los
datos, etc.
4. Modelado: Hay que definir qué modelo o técnica es el más apropiado para la resolución del
problema a tratar y que técnicas a aplicar segun los datos que tenemos, los recursos y
necesidades. Se puede volver a la fase anterior para trabajar con los datos y tener una entrada de
los mismos, acorde a las necesidades del modelo.
5. Evaluación: Visualizar y análisis de los datos obtenidos y su relación con los objetivos.
6. Despliegue: Se visualiza el conocimiento y los resultados obtenidos y se muestran al cliente.
4
4.Propuesta
Estrategia de Implementación
A partir del análisis de los indicadores de desempeño identificados podemos hacer las siguientes
propuestas que se aplican a todos los indicadores:
En primer lugar agregar la tabla/archivo clientes y que esta contenga como minimo la edad, sexo
y datos de contacto del mismo.
Segundo se recomienda implementar un algoritmo que permita el análisis de los indicadores
mencionados pero incluyendo ademas el sexo del lector, la edad, la temática general del libro y el
autor. Toda esta información permite crear vectores de características, el cual, aplicado el
aprendizaje automático nos ayudará a encontrar patrones ocultos en la información y de esta
manera identificar con mayor precisión los patrones de compras y/o intereses de los lectores.
Tercero, elaborar un perfil de cada cliente, según sus temas preferidos de lectura, edad, sexo y
hacer recomendaciones y ofertas regularmente de aquellos libros que se adecuen a su perfil.
Cuarto, crear un modelo predictivo que permita anticiparse a la demanda de los clientes y/o
lectores a partir del análisis de los libros mas recomendados, votados y comprados, que permita
tomar decisiones sobre que libros comprar y cuales no, en función de las predicciones que arroje
el modelo.
Evaluación
Para evaluar la marcha del negocio y la eficiencia de los modelos propuesto, se recomienda el
monitoreo constante de los indicadores definidos para asegurarnos que estamos en el camino de
mejorar los indicadores identificados.
Buenas Practicas
Se recomienda el seguimiento constante de la relación entre los indicadores de desempeño
mencionados, de funcionar la estrategia propuesta, debería manifestarse un estrecha relación
entre los libros mas vendidos y los libros mas votados y recomendados. Lo contrario, seria un
indicador de que se ha cometido un error en la estrategia.
Justificación de la estrategia
Como se menciona en la estrategia de implementación, el contar con información clave del cliente,
permitirá al modelo desarrollado encontrar patrones entre los libros que mas se venden, que mas se
recomiendan y los que mas se votan vinculados con la edad y sexo del cliente, asi como los autores y
temas preferidos de lectura e interés. El modelo predictivo, permitirá sacar a la luz los hábitos de los
clientes y ofrecerles una experiencia mas personal y certera de lo que quieren leer, a su vez esto tendrá su
correspondiente correlato en una mejora en la toma de decisiones acerca de como gestionar la compra y
existencia de los libros.
5
5.Conclusiones
El análisis de los indicadores identificados conjuntamente con la elaboración de un algoritmo que
nos permita comprender con mayor claridad como se compone la demanda e intereses de libros,
permite elaborar un“análisis descriptivo”, es decir comprender la situación actual del negocio.
A partir de esta comprensión podemos avanzar hacia una segunda etapa, la elaboración de un
“análisis predictivo” que nos permita anticiparnos a la demanda de los clientes y/o lectores.
Por ultimo, partiendo de los resultados del análisis predictivo concluir con un“análisis
prescriptivo” que mejore el proceso de toma de decisiones y de esta manera las mismas sean
resultado del análisis de los datos y no de la intuición.
6

Más contenido relacionado

La actualidad más candente

Utilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónUtilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónDiego Farfan
 
Introduccion a la ciencia de datos
Introduccion a la ciencia de datosIntroduccion a la ciencia de datos
Introduccion a la ciencia de datosAngheloDanielPrez
 
Proyecto individual daniel murillo
Proyecto individual daniel murilloProyecto individual daniel murillo
Proyecto individual daniel murilloDaniel866358
 
Trabajo de ciencia de datos evaluado por pares
Trabajo de ciencia de datos evaluado por paresTrabajo de ciencia de datos evaluado por pares
Trabajo de ciencia de datos evaluado por paresFrancoGotuzzo
 
Bigdata Herramientas Caso Libreria Iztaccihuatl
Bigdata Herramientas Caso Libreria IztaccihuatlBigdata Herramientas Caso Libreria Iztaccihuatl
Bigdata Herramientas Caso Libreria IztaccihuatlPaola Quiroz Alvarez
 
Proyecto herramientas para el análisis de big data
Proyecto herramientas para el análisis de big dataProyecto herramientas para el análisis de big data
Proyecto herramientas para el análisis de big dataMarcoPoloSanchez1
 
Actividad 1 - Jesus Axel Dominguez Rocha
Actividad 1 - Jesus Axel Dominguez RochaActividad 1 - Jesus Axel Dominguez Rocha
Actividad 1 - Jesus Axel Dominguez RochaAxelRocha3
 
Utilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónUtilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónKozhaya Elias Sfeir
 
Práctica de evaluación entre pares
Práctica de evaluación entre paresPráctica de evaluación entre pares
Práctica de evaluación entre paresSofía Ardila
 
Propuesta PROYECTO Iztaccíhuatl
Propuesta PROYECTO IztaccíhuatlPropuesta PROYECTO Iztaccíhuatl
Propuesta PROYECTO IztaccíhuatlDiego Avendaño
 
Proyecto individual - Introducción a la ciencia de datos
Proyecto individual - Introducción a la ciencia de datosProyecto individual - Introducción a la ciencia de datos
Proyecto individual - Introducción a la ciencia de datosRebecaHernandez59
 
Trabajo de visualización de datos evaluado por pares
Trabajo de visualización de datos evaluado por paresTrabajo de visualización de datos evaluado por pares
Trabajo de visualización de datos evaluado por paresFranco Gotuzzo Flórez
 
Trabajo intro a la ciencia de datos
Trabajo intro a la ciencia de datosTrabajo intro a la ciencia de datos
Trabajo intro a la ciencia de datosEsneiderOrozcoVidal
 
Utilizando la ciencia de datos en una organizacion
Utilizando la ciencia de datos en una organizacionUtilizando la ciencia de datos en una organizacion
Utilizando la ciencia de datos en una organizacionAlejandro Uribe Rodriguez
 
Utilizando la Ciencia de Datos - Caso: Librería Iztaccihuatl
Utilizando la Ciencia de Datos - Caso: Librería IztaccihuatlUtilizando la Ciencia de Datos - Caso: Librería Iztaccihuatl
Utilizando la Ciencia de Datos - Caso: Librería Iztaccihuatlangelfeijoo
 

La actualidad más candente (19)

Utilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónUtilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organización
 
Introduccion a la ciencia de datos
Introduccion a la ciencia de datosIntroduccion a la ciencia de datos
Introduccion a la ciencia de datos
 
Proyecto individual daniel murillo
Proyecto individual daniel murilloProyecto individual daniel murillo
Proyecto individual daniel murillo
 
Trabajo de ciencia de datos evaluado por pares
Trabajo de ciencia de datos evaluado por paresTrabajo de ciencia de datos evaluado por pares
Trabajo de ciencia de datos evaluado por pares
 
Bigdata Herramientas Caso Libreria Iztaccihuatl
Bigdata Herramientas Caso Libreria IztaccihuatlBigdata Herramientas Caso Libreria Iztaccihuatl
Bigdata Herramientas Caso Libreria Iztaccihuatl
 
Proyecto herramientas para el análisis de big data
Proyecto herramientas para el análisis de big dataProyecto herramientas para el análisis de big data
Proyecto herramientas para el análisis de big data
 
Actividad 1 - Jesus Axel Dominguez Rocha
Actividad 1 - Jesus Axel Dominguez RochaActividad 1 - Jesus Axel Dominguez Rocha
Actividad 1 - Jesus Axel Dominguez Rocha
 
Utilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónUtilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organización
 
Trabajo de pares
Trabajo de paresTrabajo de pares
Trabajo de pares
 
Práctica de evaluación entre pares
Práctica de evaluación entre paresPráctica de evaluación entre pares
Práctica de evaluación entre pares
 
Propuesta PROYECTO Iztaccíhuatl
Propuesta PROYECTO IztaccíhuatlPropuesta PROYECTO Iztaccíhuatl
Propuesta PROYECTO Iztaccíhuatl
 
Práctica big data
Práctica big dataPráctica big data
Práctica big data
 
Proyecto individual - Introducción a la ciencia de datos
Proyecto individual - Introducción a la ciencia de datosProyecto individual - Introducción a la ciencia de datos
Proyecto individual - Introducción a la ciencia de datos
 
Trabajo de visualización de datos evaluado por pares
Trabajo de visualización de datos evaluado por paresTrabajo de visualización de datos evaluado por pares
Trabajo de visualización de datos evaluado por pares
 
Tarea Visualización de datos
Tarea Visualización de datosTarea Visualización de datos
Tarea Visualización de datos
 
Trabajo intro a la ciencia de datos
Trabajo intro a la ciencia de datosTrabajo intro a la ciencia de datos
Trabajo intro a la ciencia de datos
 
Utilizando la ciencia de datos en una organizacion
Utilizando la ciencia de datos en una organizacionUtilizando la ciencia de datos en una organizacion
Utilizando la ciencia de datos en una organizacion
 
Proyecto evaluado por pares
Proyecto evaluado por paresProyecto evaluado por pares
Proyecto evaluado por pares
 
Utilizando la Ciencia de Datos - Caso: Librería Iztaccihuatl
Utilizando la Ciencia de Datos - Caso: Librería IztaccihuatlUtilizando la Ciencia de Datos - Caso: Librería Iztaccihuatl
Utilizando la Ciencia de Datos - Caso: Librería Iztaccihuatl
 

Similar a Aplicación de La ciencia de datos en una Organización

Introduccion_a_la_investigacion_de_mercados 1.pptx
Introduccion_a_la_investigacion_de_mercados 1.pptxIntroduccion_a_la_investigacion_de_mercados 1.pptx
Introduccion_a_la_investigacion_de_mercados 1.pptxOscar Lopez
 
GRUPO 3 - Instrumentos y técnicas de recolección de datos en una investigació...
GRUPO 3 - Instrumentos y técnicas de recolección de datos en una investigació...GRUPO 3 - Instrumentos y técnicas de recolección de datos en una investigació...
GRUPO 3 - Instrumentos y técnicas de recolección de datos en una investigació...NolyIsabelPanduroPiz
 
Proyecto individual evaluado_por_pares_v1
Proyecto individual evaluado_por_pares_v1Proyecto individual evaluado_por_pares_v1
Proyecto individual evaluado_por_pares_v1juandavidgallo
 
Metodologia de la Investigacion en Mercadotecnia
Metodologia de la Investigacion en Mercadotecnia Metodologia de la Investigacion en Mercadotecnia
Metodologia de la Investigacion en Mercadotecnia Jezz Pilgrim
 
Aplicando La Ciencia de Datos en Una Organizacion
Aplicando La Ciencia de Datos en Una OrganizacionAplicando La Ciencia de Datos en Una Organizacion
Aplicando La Ciencia de Datos en Una OrganizacionFernando Aguada
 
Mercadotecnia I
Mercadotecnia I Mercadotecnia I
Mercadotecnia I Seck Opqa
 
Unidad I. planeacion_de_la_investigacion_de_mercados_v1_1 [Recuperado].pptx
Unidad I. planeacion_de_la_investigacion_de_mercados_v1_1 [Recuperado].pptxUnidad I. planeacion_de_la_investigacion_de_mercados_v1_1 [Recuperado].pptx
Unidad I. planeacion_de_la_investigacion_de_mercados_v1_1 [Recuperado].pptxAdrianGonzalez180936
 
Metodologia de investigacion de mercados
Metodologia de investigacion de mercadosMetodologia de investigacion de mercados
Metodologia de investigacion de mercadosFabianVenturaGraciel
 
Proyecto libreria Iztaccihuatl.docx
Proyecto libreria Iztaccihuatl.docxProyecto libreria Iztaccihuatl.docx
Proyecto libreria Iztaccihuatl.docxLuchoTalledo
 
Introducción a la ciencia de datos y el big data
Introducción a la ciencia de datos y el big dataIntroducción a la ciencia de datos y el big data
Introducción a la ciencia de datos y el big dataAlmudena Casado
 
Investigación de marketing
Investigación de marketingInvestigación de marketing
Investigación de marketingCatherine Torres
 
Filosofía Six Sigma.pdf
Filosofía Six Sigma.pdfFilosofía Six Sigma.pdf
Filosofía Six Sigma.pdfRamses CF
 
marketin confecc.camisetas
marketin confecc.camisetasmarketin confecc.camisetas
marketin confecc.camisetasmafermo123
 

Similar a Aplicación de La ciencia de datos en una Organización (20)

Project.docx
Project.docxProject.docx
Project.docx
 
Introduccion_a_la_investigacion_de_mercados 1.pptx
Introduccion_a_la_investigacion_de_mercados 1.pptxIntroduccion_a_la_investigacion_de_mercados 1.pptx
Introduccion_a_la_investigacion_de_mercados 1.pptx
 
GRUPO 3 - Instrumentos y técnicas de recolección de datos en una investigació...
GRUPO 3 - Instrumentos y técnicas de recolección de datos en una investigació...GRUPO 3 - Instrumentos y técnicas de recolección de datos en una investigació...
GRUPO 3 - Instrumentos y técnicas de recolección de datos en una investigació...
 
Proyecto individual evaluado_por_pares_v1
Proyecto individual evaluado_por_pares_v1Proyecto individual evaluado_por_pares_v1
Proyecto individual evaluado_por_pares_v1
 
Reporte.pdf
Reporte.pdfReporte.pdf
Reporte.pdf
 
Metodologia de la Investigacion en Mercadotecnia
Metodologia de la Investigacion en Mercadotecnia Metodologia de la Investigacion en Mercadotecnia
Metodologia de la Investigacion en Mercadotecnia
 
producto integrador
producto integradorproducto integrador
producto integrador
 
La investigación como medio de desarrollo empresarial
La investigación como medio de desarrollo empresarial  La investigación como medio de desarrollo empresarial
La investigación como medio de desarrollo empresarial
 
Erdozain, Diego.pdf
Erdozain, Diego.pdfErdozain, Diego.pdf
Erdozain, Diego.pdf
 
Biblioteca Virtual
Biblioteca VirtualBiblioteca Virtual
Biblioteca Virtual
 
Reporte_practica_2.pdf
Reporte_practica_2.pdfReporte_practica_2.pdf
Reporte_practica_2.pdf
 
Aplicando La Ciencia de Datos en Una Organizacion
Aplicando La Ciencia de Datos en Una OrganizacionAplicando La Ciencia de Datos en Una Organizacion
Aplicando La Ciencia de Datos en Una Organizacion
 
Mercadotecnia I
Mercadotecnia I Mercadotecnia I
Mercadotecnia I
 
Unidad I. planeacion_de_la_investigacion_de_mercados_v1_1 [Recuperado].pptx
Unidad I. planeacion_de_la_investigacion_de_mercados_v1_1 [Recuperado].pptxUnidad I. planeacion_de_la_investigacion_de_mercados_v1_1 [Recuperado].pptx
Unidad I. planeacion_de_la_investigacion_de_mercados_v1_1 [Recuperado].pptx
 
Metodologia de investigacion de mercados
Metodologia de investigacion de mercadosMetodologia de investigacion de mercados
Metodologia de investigacion de mercados
 
Proyecto libreria Iztaccihuatl.docx
Proyecto libreria Iztaccihuatl.docxProyecto libreria Iztaccihuatl.docx
Proyecto libreria Iztaccihuatl.docx
 
Introducción a la ciencia de datos y el big data
Introducción a la ciencia de datos y el big dataIntroducción a la ciencia de datos y el big data
Introducción a la ciencia de datos y el big data
 
Investigación de marketing
Investigación de marketingInvestigación de marketing
Investigación de marketing
 
Filosofía Six Sigma.pdf
Filosofía Six Sigma.pdfFilosofía Six Sigma.pdf
Filosofía Six Sigma.pdf
 
marketin confecc.camisetas
marketin confecc.camisetasmarketin confecc.camisetas
marketin confecc.camisetas
 

Último

Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticJamithGarcia1
 
Data Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosData Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosssuser948499
 
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
Novelas Turcas vs Series de EUA en audiencia  (2024).pdfNovelas Turcas vs Series de EUA en audiencia  (2024).pdf
Novelas Turcas vs Series de EUA en audiencia (2024).pdfJC Díaz Herrera
 
Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...israel garcia
 
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfJC Díaz Herrera
 
presentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.pptpresentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.pptMelina Alama Visitacion
 
Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudirTriptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudirluis809799
 
Técnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalTécnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalIngrid459352
 
Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaJoellyAlejandraRodrg
 
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfJC Díaz Herrera
 
Posiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfPosiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfJC Díaz Herrera
 
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdf
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdfLos_países_con_la_mayor_cantidad_de_rascacielos (2023).pdf
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdfJC Díaz Herrera
 
Evolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfEvolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfJC Díaz Herrera
 
Las marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfLas marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfJC Díaz Herrera
 
Las familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfLas familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfJC Díaz Herrera
 
Premios_nobel_por_grupo_racial_ (2024).pdf
Premios_nobel_por_grupo_racial_ (2024).pdfPremios_nobel_por_grupo_racial_ (2024).pdf
Premios_nobel_por_grupo_racial_ (2024).pdfJC Díaz Herrera
 
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptxINTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptxJamesHerberthBacaTel
 
Presentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdfPresentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdfDodiAcuaArstica
 
Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024AndrsReinosoSnchez1
 
Familias_más_ricas_de_AL_en_la_historia.pdf
Familias_más_ricas_de_AL_en_la_historia.pdfFamilias_más_ricas_de_AL_en_la_historia.pdf
Familias_más_ricas_de_AL_en_la_historia.pdfJC Díaz Herrera
 

Último (20)

Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
 
Data Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosData Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datos
 
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
Novelas Turcas vs Series de EUA en audiencia  (2024).pdfNovelas Turcas vs Series de EUA en audiencia  (2024).pdf
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
 
Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...
 
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
 
presentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.pptpresentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.ppt
 
Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudirTriptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
 
Técnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalTécnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dental
 
Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problema
 
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
 
Posiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfPosiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdf
 
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdf
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdfLos_países_con_la_mayor_cantidad_de_rascacielos (2023).pdf
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdf
 
Evolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfEvolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdf
 
Las marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfLas marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdf
 
Las familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfLas familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdf
 
Premios_nobel_por_grupo_racial_ (2024).pdf
Premios_nobel_por_grupo_racial_ (2024).pdfPremios_nobel_por_grupo_racial_ (2024).pdf
Premios_nobel_por_grupo_racial_ (2024).pdf
 
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptxINTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
 
Presentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdfPresentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdf
 
Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024
 
Familias_más_ricas_de_AL_en_la_historia.pdf
Familias_más_ricas_de_AL_en_la_historia.pdfFamilias_más_ricas_de_AL_en_la_historia.pdf
Familias_más_ricas_de_AL_en_la_historia.pdf
 

Aplicación de La ciencia de datos en una Organización

  • 1. Utilizando la Ciencia de Datos en una Organización Instituto Tecnológico y de Estudios Superiores de Monterrey, México. Fernando Aguada. Febrero 2020
  • 2. Indice 1.Introducción...........................................................................................................................................................2 2.Indicadores de Desempeño................................................................................................................................3 3.Tipo de Análisis......................................................................................................................................................4 4.Propuesta................................................................................................................................................................5 5.Conclusiones..........................................................................................................................................................6 1
  • 3. 1.Introducción El presente trabajo tiene como objetivo aplicar los conceptos aprendidos sobre la ciencia de datos a una organización especifica, la librería Iztaccihuatl, ubicada en la ciudad de Monterrey, Nuevo León, México. En primer lugar, a partir del análisis de la información proporcionada, la cual se presenta en cuatro archivos: 1. El archivo“books”, contiene los datos generales de cada libro. 2. El archivo“top_books”, contiene los 20 libros mas vendidos. 3. El archivo“raitings”, contiene los libros mas votados por los clientes en el sitio web de la empresa. 4. El archivo“to_read”, contiene las recomendaciones que los usuarios hacen acerca de los libros a leer. Se identifican una serie de indicadores de desempeño, desde allí se inicia el análisis para finalmente elaborar una propuesta que permita mejorar los indicadores identificados y al mismo tiempo desarrollar e implementar una mejor estrategia en el proceso de toma de decisiones. 2
  • 4. 2.Indicadores de Desempeño A partir del análisis de la información contenida en los archivos, identificamos los siguientes indicadores de desempeño que serán tomados para nuestro análisis, estos son: 1. Libros mas vendidos. 2. Libros mas votados. 3. Libros mas recomendados. 3
  • 5. 3.Tipo de Análisis Para nuestro trabajo nos inclinamos por utilizar la metodología CRISP-DM, (Cross Industry Standard Process for Data Mining) . Esta fue creada en 1999 por un conglomerado de empresas (SPSS, NCR y Daimler Chrysler), donde se busca la recolección y análisis de grandes volúmenes de datos. Se destaca por proporcionar un enfoque estructurado en un proyecto de datos. Como ventajas tiene a su favor que es una metodología robusta, flexible y esta comprobada su utilidad para resolver problemas. Se compone de una serie de fases: 1. Entender el negocio: se identifican los objetivos a conseguir después de un estudio del negocio, exigencias y necesidades del cliente. Se crea un plan estratégico para alcanzar dichos objetivos. 2. Comprender los datos: Se identifican los datos necesarios para alcanzar los objetivos. Se reconocen las fuentes de datos y describen los tipos de datos con los que vamos a trabajar e identificar aquellos que realmente son necesarios. Hay que reconocer problemas en los mismos, como si existen datos repetidos, incompletos, inconsistentes, con errores, entre otros. 3. Preparar los datos: Procesar los flujos de datos, resolver los problemas de datos faltantes, controlar las inconsistencias de los flujos de datos y realizar la limpieza y estandarización de los datos, etc. 4. Modelado: Hay que definir qué modelo o técnica es el más apropiado para la resolución del problema a tratar y que técnicas a aplicar segun los datos que tenemos, los recursos y necesidades. Se puede volver a la fase anterior para trabajar con los datos y tener una entrada de los mismos, acorde a las necesidades del modelo. 5. Evaluación: Visualizar y análisis de los datos obtenidos y su relación con los objetivos. 6. Despliegue: Se visualiza el conocimiento y los resultados obtenidos y se muestran al cliente. 4
  • 6. 4.Propuesta Estrategia de Implementación A partir del análisis de los indicadores de desempeño identificados podemos hacer las siguientes propuestas que se aplican a todos los indicadores: En primer lugar agregar la tabla/archivo clientes y que esta contenga como minimo la edad, sexo y datos de contacto del mismo. Segundo se recomienda implementar un algoritmo que permita el análisis de los indicadores mencionados pero incluyendo ademas el sexo del lector, la edad, la temática general del libro y el autor. Toda esta información permite crear vectores de características, el cual, aplicado el aprendizaje automático nos ayudará a encontrar patrones ocultos en la información y de esta manera identificar con mayor precisión los patrones de compras y/o intereses de los lectores. Tercero, elaborar un perfil de cada cliente, según sus temas preferidos de lectura, edad, sexo y hacer recomendaciones y ofertas regularmente de aquellos libros que se adecuen a su perfil. Cuarto, crear un modelo predictivo que permita anticiparse a la demanda de los clientes y/o lectores a partir del análisis de los libros mas recomendados, votados y comprados, que permita tomar decisiones sobre que libros comprar y cuales no, en función de las predicciones que arroje el modelo. Evaluación Para evaluar la marcha del negocio y la eficiencia de los modelos propuesto, se recomienda el monitoreo constante de los indicadores definidos para asegurarnos que estamos en el camino de mejorar los indicadores identificados. Buenas Practicas Se recomienda el seguimiento constante de la relación entre los indicadores de desempeño mencionados, de funcionar la estrategia propuesta, debería manifestarse un estrecha relación entre los libros mas vendidos y los libros mas votados y recomendados. Lo contrario, seria un indicador de que se ha cometido un error en la estrategia. Justificación de la estrategia Como se menciona en la estrategia de implementación, el contar con información clave del cliente, permitirá al modelo desarrollado encontrar patrones entre los libros que mas se venden, que mas se recomiendan y los que mas se votan vinculados con la edad y sexo del cliente, asi como los autores y temas preferidos de lectura e interés. El modelo predictivo, permitirá sacar a la luz los hábitos de los clientes y ofrecerles una experiencia mas personal y certera de lo que quieren leer, a su vez esto tendrá su correspondiente correlato en una mejora en la toma de decisiones acerca de como gestionar la compra y existencia de los libros. 5
  • 7. 5.Conclusiones El análisis de los indicadores identificados conjuntamente con la elaboración de un algoritmo que nos permita comprender con mayor claridad como se compone la demanda e intereses de libros, permite elaborar un“análisis descriptivo”, es decir comprender la situación actual del negocio. A partir de esta comprensión podemos avanzar hacia una segunda etapa, la elaboración de un “análisis predictivo” que nos permita anticiparnos a la demanda de los clientes y/o lectores. Por ultimo, partiendo de los resultados del análisis predictivo concluir con un“análisis prescriptivo” que mejore el proceso de toma de decisiones y de esta manera las mismas sean resultado del análisis de los datos y no de la intuición. 6