SlideShare una empresa de Scribd logo
HERRAMIENTAS DE ANÁLISIS
DE DATOS
Big Data Science
1
Índice
Introducción.............................................................................................................................. 2
Desarrollo. ................................................................................................................................ 3
Conclusiones............................................................................................................................. 5
2
Introducción.
Hoy en día hemos podido ver como la Data-Science y las herramientas de análisis de datos
son cada vez más utilizada en muchos sectores del desarrollo humano, esto permite que los
diferentes procesos de desarrollo se realicen en menos tiempo.
En este trabajo analizaremos la Librería Iztaccihuatl que se encuentra en la ciudad de
Monterrey, Nuevo León, México. Por medio del análisis de datos implementaremos una
mejora en las estrategias de toma de decisiones, logrando así mayor efectividad en los
procesos operativos y de gestión.
Gracias al aporte positivo de estas herramientas al ambiente empresarial, se utilizarán
herramientas de lenguaje de programación, bases de datos y servicio de nube, todo para lograr
identificar mejoras, oportunidades y falencias que la librería pueda tener, además de aportarle
el conocimiento de estas herramientas para impulsarlos a mejorar.
3
Desarrollo.
¿Qué lenguaje de programación para ciencia de datos utilizaría
para realizar el análisis de datos de la Librería Iztaccíhuatl?
El lenguaje de programación por elección sería Python, ya que es uno de los más utilizados
en la actualidad, además de ser excelente a la hora de implementarlo por primera vez y ser
de gran facilidad para novatos en la programación, por otro lado, es una gran opción cuando
estamos en frente de una cantidad de datos abundante como en este caso en particular.
¿Qué predicciones se podrían obtener de los datos de la Librería
Iztaccíhuatl?
1- Se puede intentar conocer la antigüedad de los libros que la librería posee, esto para
conocer si las ventas de libros son en general y si no se han acumulado libros que no son
atractivos para los clientes.
2- El conocer la cantidad de libros que se han vendido por los títulos, autores, y demás
elementos dentro de los datos que se nos otorgaron, esto para identificar el número de
unidades vendidas en general y también por especificaciones.
3- Se puede también indagar dentro de la cantidad de ingresos que se obtienen por las ventas
de los libros, esto ayudará a conocer la estabilidad económica y rentabilidad de la librería.
¿Qué adecuaciones se podría hacer a los datos de la Librería
Iztaccíhuatl para poder realizar un análisis predictivo?
Una de las ventajas de los datos suministrados para este proyecto es que los datos son muy
detallistas y en gran cantidad, lo que ayuda a generar un supuesto de una maneras más fácil,
4
pero muchos de los datos suministrados se hicieron por vía web, lo que nos deja a una gran
parte de los clientes por fuera, es por esto que es necesario expandir el área de recolección
de opiniones e información a los clientes tanto físicos como virtuales, esto para manejar
bien las suposiciones y poseer más veracidad en los datos que se obtienen, esto estaría
enfocado hacia el archivo “ratings” y el “to read”, en dónde el segundo archivo es de suma
importancia ya que posee recomendaciones de los clientes, lo que ayudaría a identificar
oportunidades y falencias de la librería.
¿Qué tipo de base de datos se utilizaría para alojar los análisis de
los datos de la Librería Iztaccíhuatl?
Para este proyecto se implementará una base de datos relacional, ya que los datos
suministrados están vinculados entre sí, lo que hace que sea el más conveniente para trabajar,
además de que trabaja con uniformidad y no permite la duplicidad de datos, es una forma de
trabajar sistematizadamente y de forma ordenada con grandes cantidades de datos, por lo que
también se utilizará Microsoft SQL Server, que es uno de los tipos de bases de datos que el
lenguaje Python que utilizaremos, se enlazan bien entre sí.
¿Qué tipo de servicio de la nube podría contratar la Librería
Iztaccíhuatl para alojar la información y el proyecto de ciencia de
datos?
Se puede decir que el más conveniente para este trabajo sería el Software como un Servicio
o más conocido como SaaS, ya que es uno de los más rentables a la hora de trabajar o
emplearlo en una empresa, beneficioso para el análisis de datos que se utilizará debido a sus
características de ayudar a las empresas a redireccionar su negocio. Github
5
Conclusiones.
El implementar este nuevo sistema de análisis de datos es un gran paso a la actualización y
perfección de una organización, esto debido a la gran información de importancia que las
herramientas digitales para el análisis de datos les ofrecen a las empresas, identificando sus
puntos fuertes y los débiles, ayudando a enderezar a la organización.
Dentro de este plan se utilizarán grandes herramientas de importancia en la actualidad,
como el lenguaje Python, la base de datos Microsoft SQL Server y el servicio de la nube
SaaS, y se aplicará a una empresa por primera vez, lo que nos deja analizar la importancia
de la facilidad de acceso y utilización de estas herramientas en cualquier empresa que tenga
la disposición de mejorar sus funciones con el Big Data.
Por último, las predicciones que se quieren realizar ayudarán a conocer con detalle y bases,
la funcionalidad eficaz de la librería Iztaccíhuatl, además de darle unos cambios a algunos
de los datos para trabajar más en general con los clientes, lo que ayudará a enfocar la
predicción en aspectos más completos y obteniendo de la misma forma respuestas
completas.

Más contenido relacionado

Similar a edx caso.docx

Aplicando Ciencia de Datos en una Organización
Aplicando Ciencia de Datos en una OrganizaciónAplicando Ciencia de Datos en una Organización
Aplicando Ciencia de Datos en una Organización
CarlosMacarlup
 
Introducción a la ciencia de datos y el big data
Introducción a la ciencia de datos y el big dataIntroducción a la ciencia de datos y el big data
Introducción a la ciencia de datos y el big data
Almudena Casado
 
PlataformasIA
PlataformasIAPlataformasIA
PlataformasIA
Cade Soluciones
 
Evaluacion entre pares - Ciencia de datos.
Evaluacion entre pares - Ciencia de datos.Evaluacion entre pares - Ciencia de datos.
Evaluacion entre pares - Ciencia de datos.
HugoCastro854432
 
Aplicando la ciencia de datos en una organización
Aplicando la ciencia de datos en una organizaciónAplicando la ciencia de datos en una organización
Aplicando la ciencia de datos en una organización
KozhayaSfeir
 
Proyecto 1 ciencia de datos
Proyecto 1 ciencia de datosProyecto 1 ciencia de datos
Proyecto 1 ciencia de datos
Alejandro Moyano
 
Proyecto 1 ciencia de datos
Proyecto 1 ciencia de datosProyecto 1 ciencia de datos
Proyecto 1 ciencia de datos
Alejandro Moyano
 
Proyecto 1 ciencia de datos
Proyecto 1 ciencia de datosProyecto 1 ciencia de datos
Proyecto 1 ciencia de datos
Alejandro Moyano
 
01. Introducción a la Analítica de Datos.pptx
01. Introducción a la Analítica de Datos.pptx01. Introducción a la Analítica de Datos.pptx
01. Introducción a la Analítica de Datos.pptx
JuanCarlosRomanPerez1
 
SQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight ServerSQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight Server
Eduardo Castro
 
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdf
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdfAPLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdf
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdf
CarlosChin
 
Empleos con futuro. Perfil de un ingeniero de datos
Empleos con futuro. Perfil de un ingeniero de datosEmpleos con futuro. Perfil de un ingeniero de datos
Empleos con futuro. Perfil de un ingeniero de datos
Antonio Santos Ramos
 
Implantando un ERP a medida desde cero
Implantando un ERP a medida desde ceroImplantando un ERP a medida desde cero
Implantando un ERP a medida desde cero
Oreka IT
 
Big Data Introducción
Big Data IntroducciónBig Data Introducción
Big Data Introducción
Gorka Armentia
 
Exploradata - A new BigData Company
Exploradata - A new BigData CompanyExploradata - A new BigData Company
Exploradata - A new BigData Company
Exploradata
 
Aplicación de La ciencia de datos en una Organización
Aplicación de La ciencia de datos en una OrganizaciónAplicación de La ciencia de datos en una Organización
Aplicación de La ciencia de datos en una Organización
Fernando Aguada
 
Analisis services
Analisis servicesAnalisis services
Analisis services
Irene Lorza
 
Big-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptxBig-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptx
JavierNavarrete43
 
Microsoft power BI
Microsoft power BIMicrosoft power BI
Microsoft power BI
Juan Frias
 
Big data
Big dataBig data

Similar a edx caso.docx (20)

Aplicando Ciencia de Datos en una Organización
Aplicando Ciencia de Datos en una OrganizaciónAplicando Ciencia de Datos en una Organización
Aplicando Ciencia de Datos en una Organización
 
Introducción a la ciencia de datos y el big data
Introducción a la ciencia de datos y el big dataIntroducción a la ciencia de datos y el big data
Introducción a la ciencia de datos y el big data
 
PlataformasIA
PlataformasIAPlataformasIA
PlataformasIA
 
Evaluacion entre pares - Ciencia de datos.
Evaluacion entre pares - Ciencia de datos.Evaluacion entre pares - Ciencia de datos.
Evaluacion entre pares - Ciencia de datos.
 
Aplicando la ciencia de datos en una organización
Aplicando la ciencia de datos en una organizaciónAplicando la ciencia de datos en una organización
Aplicando la ciencia de datos en una organización
 
Proyecto 1 ciencia de datos
Proyecto 1 ciencia de datosProyecto 1 ciencia de datos
Proyecto 1 ciencia de datos
 
Proyecto 1 ciencia de datos
Proyecto 1 ciencia de datosProyecto 1 ciencia de datos
Proyecto 1 ciencia de datos
 
Proyecto 1 ciencia de datos
Proyecto 1 ciencia de datosProyecto 1 ciencia de datos
Proyecto 1 ciencia de datos
 
01. Introducción a la Analítica de Datos.pptx
01. Introducción a la Analítica de Datos.pptx01. Introducción a la Analítica de Datos.pptx
01. Introducción a la Analítica de Datos.pptx
 
SQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight ServerSQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight Server
 
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdf
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdfAPLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdf
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdf
 
Empleos con futuro. Perfil de un ingeniero de datos
Empleos con futuro. Perfil de un ingeniero de datosEmpleos con futuro. Perfil de un ingeniero de datos
Empleos con futuro. Perfil de un ingeniero de datos
 
Implantando un ERP a medida desde cero
Implantando un ERP a medida desde ceroImplantando un ERP a medida desde cero
Implantando un ERP a medida desde cero
 
Big Data Introducción
Big Data IntroducciónBig Data Introducción
Big Data Introducción
 
Exploradata - A new BigData Company
Exploradata - A new BigData CompanyExploradata - A new BigData Company
Exploradata - A new BigData Company
 
Aplicación de La ciencia de datos en una Organización
Aplicación de La ciencia de datos en una OrganizaciónAplicación de La ciencia de datos en una Organización
Aplicación de La ciencia de datos en una Organización
 
Analisis services
Analisis servicesAnalisis services
Analisis services
 
Big-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptxBig-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptx
 
Microsoft power BI
Microsoft power BIMicrosoft power BI
Microsoft power BI
 
Big data
Big dataBig data
Big data
 

Último

LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIOLINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
AaronPleitez
 
10 colonias - Análisis socio-demográfico 2024.pdf
10 colonias - Análisis socio-demográfico 2024.pdf10 colonias - Análisis socio-demográfico 2024.pdf
10 colonias - Análisis socio-demográfico 2024.pdf
IrapuatoCmovamos
 
e learning^.pptxdieguearmandozuñiga. Comhot
e learning^.pptxdieguearmandozuñiga. Comhote learning^.pptxdieguearmandozuñiga. Comhot
e learning^.pptxdieguearmandozuñiga. Comhot
diegozuniga768
 
04 capital interes simple.pdf de la clase métodos cuantitativos
04 capital interes simple.pdf de la clase métodos cuantitativos04 capital interes simple.pdf de la clase métodos cuantitativos
04 capital interes simple.pdf de la clase métodos cuantitativos
MarcoPolo545324
 
Encuesta CATI Verdad Venezuela abril 2024 (PÚBLICO).pdf
Encuesta CATI Verdad Venezuela abril 2024 (PÚBLICO).pdfEncuesta CATI Verdad Venezuela abril 2024 (PÚBLICO).pdf
Encuesta CATI Verdad Venezuela abril 2024 (PÚBLICO).pdf
DivergenteDespierto
 
vivienda segura concreto, construcción y métodos
vivienda segura concreto, construcción y métodosvivienda segura concreto, construcción y métodos
vivienda segura concreto, construcción y métodos
DilmerCarranza
 
Minería de Datos e IA Conceptos, Fundamentos y Aplicaciones.pdf
Minería de Datos e IA  Conceptos, Fundamentos y Aplicaciones.pdfMinería de Datos e IA  Conceptos, Fundamentos y Aplicaciones.pdf
Minería de Datos e IA Conceptos, Fundamentos y Aplicaciones.pdf
MedTechBiz
 
Semana 09 - Tema 02 Dinámica de cuentas del plan contable.pdf
Semana 09 - Tema 02 Dinámica de cuentas del plan contable.pdfSemana 09 - Tema 02 Dinámica de cuentas del plan contable.pdf
Semana 09 - Tema 02 Dinámica de cuentas del plan contable.pdf
WendyMLaura
 
Comunidades virtuales de aprendizaje o educativas E-LEARNING.pdf
Comunidades virtuales de aprendizaje  o educativas E-LEARNING.pdfComunidades virtuales de aprendizaje  o educativas E-LEARNING.pdf
Comunidades virtuales de aprendizaje o educativas E-LEARNING.pdf
brayansangar73
 
Informe de violencia mayo 2024 - Multigremial Mayo.pdf
Informe de violencia mayo 2024 - Multigremial Mayo.pdfInforme de violencia mayo 2024 - Multigremial Mayo.pdf
Informe de violencia mayo 2024 - Multigremial Mayo.pdf
Emisor Digital
 
Obligaciones_de_los_Municipios_y_Departamentos_en_los_Determinantes_Ambiental...
Obligaciones_de_los_Municipios_y_Departamentos_en_los_Determinantes_Ambiental...Obligaciones_de_los_Municipios_y_Departamentos_en_los_Determinantes_Ambiental...
Obligaciones_de_los_Municipios_y_Departamentos_en_los_Determinantes_Ambiental...
defola5717
 
MI CECTOR POSTE BLANCO - Paián .pdf
MI  CECTOR  POSTE  BLANCO - Paián   .pdfMI  CECTOR  POSTE  BLANCO - Paián   .pdf
MI CECTOR POSTE BLANCO - Paián .pdf
GustavoTello19
 
sistema paralingüística fhdjsjsbsnnssnnsbs
sistema paralingüística fhdjsjsbsnnssnnsbssistema paralingüística fhdjsjsbsnnssnnsbs
sistema paralingüística fhdjsjsbsnnssnnsbs
SantiagoMejia99
 
DEFENSA NACIONAL.ppt muy fácil de entender
DEFENSA NACIONAL.ppt muy fácil de entenderDEFENSA NACIONAL.ppt muy fácil de entender
DEFENSA NACIONAL.ppt muy fácil de entender
mvargasleveau
 
REPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdf
REPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdfREPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdf
REPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdf
IrapuatoCmovamos
 
Sistema informatico, power point asir 1 curso
Sistema informatico, power point asir 1 cursoSistema informatico, power point asir 1 curso
Sistema informatico, power point asir 1 curso
NereaMolina10
 
Plan Emergencia solicitado en obras de construccion
Plan Emergencia  solicitado en obras de construccionPlan Emergencia  solicitado en obras de construccion
Plan Emergencia solicitado en obras de construccion
christianllacchasand
 
3-Modelamiento de Procesos usando BPMN.ppt
3-Modelamiento de Procesos usando BPMN.ppt3-Modelamiento de Procesos usando BPMN.ppt
3-Modelamiento de Procesos usando BPMN.ppt
nahumrondanurbano
 
contraguerrilla.pdf sobre anti emboscadas
contraguerrilla.pdf sobre anti emboscadascontraguerrilla.pdf sobre anti emboscadas
contraguerrilla.pdf sobre anti emboscadas
DieguinhoSalazar
 
nombres de las unidades y situacion significativa 2024.docx
nombres de las unidades y situacion significativa 2024.docxnombres de las unidades y situacion significativa 2024.docx
nombres de las unidades y situacion significativa 2024.docx
silvanasotos
 

Último (20)

LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIOLINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
 
10 colonias - Análisis socio-demográfico 2024.pdf
10 colonias - Análisis socio-demográfico 2024.pdf10 colonias - Análisis socio-demográfico 2024.pdf
10 colonias - Análisis socio-demográfico 2024.pdf
 
e learning^.pptxdieguearmandozuñiga. Comhot
e learning^.pptxdieguearmandozuñiga. Comhote learning^.pptxdieguearmandozuñiga. Comhot
e learning^.pptxdieguearmandozuñiga. Comhot
 
04 capital interes simple.pdf de la clase métodos cuantitativos
04 capital interes simple.pdf de la clase métodos cuantitativos04 capital interes simple.pdf de la clase métodos cuantitativos
04 capital interes simple.pdf de la clase métodos cuantitativos
 
Encuesta CATI Verdad Venezuela abril 2024 (PÚBLICO).pdf
Encuesta CATI Verdad Venezuela abril 2024 (PÚBLICO).pdfEncuesta CATI Verdad Venezuela abril 2024 (PÚBLICO).pdf
Encuesta CATI Verdad Venezuela abril 2024 (PÚBLICO).pdf
 
vivienda segura concreto, construcción y métodos
vivienda segura concreto, construcción y métodosvivienda segura concreto, construcción y métodos
vivienda segura concreto, construcción y métodos
 
Minería de Datos e IA Conceptos, Fundamentos y Aplicaciones.pdf
Minería de Datos e IA  Conceptos, Fundamentos y Aplicaciones.pdfMinería de Datos e IA  Conceptos, Fundamentos y Aplicaciones.pdf
Minería de Datos e IA Conceptos, Fundamentos y Aplicaciones.pdf
 
Semana 09 - Tema 02 Dinámica de cuentas del plan contable.pdf
Semana 09 - Tema 02 Dinámica de cuentas del plan contable.pdfSemana 09 - Tema 02 Dinámica de cuentas del plan contable.pdf
Semana 09 - Tema 02 Dinámica de cuentas del plan contable.pdf
 
Comunidades virtuales de aprendizaje o educativas E-LEARNING.pdf
Comunidades virtuales de aprendizaje  o educativas E-LEARNING.pdfComunidades virtuales de aprendizaje  o educativas E-LEARNING.pdf
Comunidades virtuales de aprendizaje o educativas E-LEARNING.pdf
 
Informe de violencia mayo 2024 - Multigremial Mayo.pdf
Informe de violencia mayo 2024 - Multigremial Mayo.pdfInforme de violencia mayo 2024 - Multigremial Mayo.pdf
Informe de violencia mayo 2024 - Multigremial Mayo.pdf
 
Obligaciones_de_los_Municipios_y_Departamentos_en_los_Determinantes_Ambiental...
Obligaciones_de_los_Municipios_y_Departamentos_en_los_Determinantes_Ambiental...Obligaciones_de_los_Municipios_y_Departamentos_en_los_Determinantes_Ambiental...
Obligaciones_de_los_Municipios_y_Departamentos_en_los_Determinantes_Ambiental...
 
MI CECTOR POSTE BLANCO - Paián .pdf
MI  CECTOR  POSTE  BLANCO - Paián   .pdfMI  CECTOR  POSTE  BLANCO - Paián   .pdf
MI CECTOR POSTE BLANCO - Paián .pdf
 
sistema paralingüística fhdjsjsbsnnssnnsbs
sistema paralingüística fhdjsjsbsnnssnnsbssistema paralingüística fhdjsjsbsnnssnnsbs
sistema paralingüística fhdjsjsbsnnssnnsbs
 
DEFENSA NACIONAL.ppt muy fácil de entender
DEFENSA NACIONAL.ppt muy fácil de entenderDEFENSA NACIONAL.ppt muy fácil de entender
DEFENSA NACIONAL.ppt muy fácil de entender
 
REPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdf
REPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdfREPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdf
REPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdf
 
Sistema informatico, power point asir 1 curso
Sistema informatico, power point asir 1 cursoSistema informatico, power point asir 1 curso
Sistema informatico, power point asir 1 curso
 
Plan Emergencia solicitado en obras de construccion
Plan Emergencia  solicitado en obras de construccionPlan Emergencia  solicitado en obras de construccion
Plan Emergencia solicitado en obras de construccion
 
3-Modelamiento de Procesos usando BPMN.ppt
3-Modelamiento de Procesos usando BPMN.ppt3-Modelamiento de Procesos usando BPMN.ppt
3-Modelamiento de Procesos usando BPMN.ppt
 
contraguerrilla.pdf sobre anti emboscadas
contraguerrilla.pdf sobre anti emboscadascontraguerrilla.pdf sobre anti emboscadas
contraguerrilla.pdf sobre anti emboscadas
 
nombres de las unidades y situacion significativa 2024.docx
nombres de las unidades y situacion significativa 2024.docxnombres de las unidades y situacion significativa 2024.docx
nombres de las unidades y situacion significativa 2024.docx
 

edx caso.docx

  • 1. HERRAMIENTAS DE ANÁLISIS DE DATOS Big Data Science
  • 3. 2 Introducción. Hoy en día hemos podido ver como la Data-Science y las herramientas de análisis de datos son cada vez más utilizada en muchos sectores del desarrollo humano, esto permite que los diferentes procesos de desarrollo se realicen en menos tiempo. En este trabajo analizaremos la Librería Iztaccihuatl que se encuentra en la ciudad de Monterrey, Nuevo León, México. Por medio del análisis de datos implementaremos una mejora en las estrategias de toma de decisiones, logrando así mayor efectividad en los procesos operativos y de gestión. Gracias al aporte positivo de estas herramientas al ambiente empresarial, se utilizarán herramientas de lenguaje de programación, bases de datos y servicio de nube, todo para lograr identificar mejoras, oportunidades y falencias que la librería pueda tener, además de aportarle el conocimiento de estas herramientas para impulsarlos a mejorar.
  • 4. 3 Desarrollo. ¿Qué lenguaje de programación para ciencia de datos utilizaría para realizar el análisis de datos de la Librería Iztaccíhuatl? El lenguaje de programación por elección sería Python, ya que es uno de los más utilizados en la actualidad, además de ser excelente a la hora de implementarlo por primera vez y ser de gran facilidad para novatos en la programación, por otro lado, es una gran opción cuando estamos en frente de una cantidad de datos abundante como en este caso en particular. ¿Qué predicciones se podrían obtener de los datos de la Librería Iztaccíhuatl? 1- Se puede intentar conocer la antigüedad de los libros que la librería posee, esto para conocer si las ventas de libros son en general y si no se han acumulado libros que no son atractivos para los clientes. 2- El conocer la cantidad de libros que se han vendido por los títulos, autores, y demás elementos dentro de los datos que se nos otorgaron, esto para identificar el número de unidades vendidas en general y también por especificaciones. 3- Se puede también indagar dentro de la cantidad de ingresos que se obtienen por las ventas de los libros, esto ayudará a conocer la estabilidad económica y rentabilidad de la librería. ¿Qué adecuaciones se podría hacer a los datos de la Librería Iztaccíhuatl para poder realizar un análisis predictivo? Una de las ventajas de los datos suministrados para este proyecto es que los datos son muy detallistas y en gran cantidad, lo que ayuda a generar un supuesto de una maneras más fácil,
  • 5. 4 pero muchos de los datos suministrados se hicieron por vía web, lo que nos deja a una gran parte de los clientes por fuera, es por esto que es necesario expandir el área de recolección de opiniones e información a los clientes tanto físicos como virtuales, esto para manejar bien las suposiciones y poseer más veracidad en los datos que se obtienen, esto estaría enfocado hacia el archivo “ratings” y el “to read”, en dónde el segundo archivo es de suma importancia ya que posee recomendaciones de los clientes, lo que ayudaría a identificar oportunidades y falencias de la librería. ¿Qué tipo de base de datos se utilizaría para alojar los análisis de los datos de la Librería Iztaccíhuatl? Para este proyecto se implementará una base de datos relacional, ya que los datos suministrados están vinculados entre sí, lo que hace que sea el más conveniente para trabajar, además de que trabaja con uniformidad y no permite la duplicidad de datos, es una forma de trabajar sistematizadamente y de forma ordenada con grandes cantidades de datos, por lo que también se utilizará Microsoft SQL Server, que es uno de los tipos de bases de datos que el lenguaje Python que utilizaremos, se enlazan bien entre sí. ¿Qué tipo de servicio de la nube podría contratar la Librería Iztaccíhuatl para alojar la información y el proyecto de ciencia de datos? Se puede decir que el más conveniente para este trabajo sería el Software como un Servicio o más conocido como SaaS, ya que es uno de los más rentables a la hora de trabajar o emplearlo en una empresa, beneficioso para el análisis de datos que se utilizará debido a sus características de ayudar a las empresas a redireccionar su negocio. Github
  • 6. 5 Conclusiones. El implementar este nuevo sistema de análisis de datos es un gran paso a la actualización y perfección de una organización, esto debido a la gran información de importancia que las herramientas digitales para el análisis de datos les ofrecen a las empresas, identificando sus puntos fuertes y los débiles, ayudando a enderezar a la organización. Dentro de este plan se utilizarán grandes herramientas de importancia en la actualidad, como el lenguaje Python, la base de datos Microsoft SQL Server y el servicio de la nube SaaS, y se aplicará a una empresa por primera vez, lo que nos deja analizar la importancia de la facilidad de acceso y utilización de estas herramientas en cualquier empresa que tenga la disposición de mejorar sus funciones con el Big Data. Por último, las predicciones que se quieren realizar ayudarán a conocer con detalle y bases, la funcionalidad eficaz de la librería Iztaccíhuatl, además de darle unos cambios a algunos de los datos para trabajar más en general con los clientes, lo que ayudará a enfocar la predicción en aspectos más completos y obteniendo de la misma forma respuestas completas.