SlideShare una empresa de Scribd logo
1 de 4
Descargar para leer sin conexión
Trabajo Evaluado por Pares # 2

Curso: Herramientas para el Análisis de Big Data
Realizado por: Franco Gotuzzo Florez
1-¿Qué lenguaje de programación para ciencia de datos utilizaría para
realizar el análisis de datos de la Librería Iztaccihuatl?
El Lenguaje de Programación sugerido de mi parte sería Python, a razón de
ser usado mayormente en Ciencia, Data e Ingeniería.
Para el caso de la Librería serán archivos de data lingüística en su mayoría.
2-¿Qué predicciones se podrían obtener de los datos de la Librería
Iztaccihuatl?
Como requerido las 3 predicciones que se podrían realizar serían:
• Categorías más vendidas
(el Archivo Top Books ayudará a predecir gracias al histórico de Ventas
que Categorías de Libros han sido las más vendidas, y por lo tanto
continuar en dicha línea de Producto, por ejemplo especializarse en
dicho segmento de clientes, promocionar y posicionarse en dicho nicho
de Mercado).
• Autores más vendidos
(dentro del archivo antes mencionado se puede también listar a los
Autores mas vendidos y continuar con la Promoción y Venta de mas
Obras de dichos autores).
• Casas Editoriales con la mayor venta
(si de los Libros más Vendidos estos pertenecen a un número pequeño
de Casas Editoriales, se puede trabajar en relación directa con ellas,
optimizando la operación, precio y producto, como Reducción de
Costos, Mejora en Tiempos de Entrega, Firma de Contratos Directos
para su Venta, así como Ventas Exclusivas y Lanzamientos).
3-¿Qué adecuaciones se podría hacer a los datos de la Librería Iztaccihuatl
para poder realizar un análisis predictivo?
Segmentación de Datos en Archivos separados
Por ejemplo:
-Categorías
-Autores
-Casas Editoriales
-Fecha de Publicación
-Precios
Visto que la información está en el archivo de Top Books, aunque junta,
trabajarla y analizarla en archivos separados generaría una perspectiva
diferente de dicha información desde un ángulo de pertenencia o género,
modernidad de la obra, escalas de precios y de matriz de producción.
4-¿Qué tipo de base de datos se utilizaría para alojar los análisis de los datos
de la Librería Iztaccihuatl?
Base de Datos en la Nube (de uso gratuito inicialmente, posterior o si se
desea una Base Premium o con Costo).
Visto que la cantidad de datos no es grande, esta no necesita la inversión de
servidores por parte de la Librería para el almacenamiento, ni tampoco el
pago por el uso de un espacio excesivo en la nube, a menos que su cantidad
de datos así lo requiera.
5-¿Qué tipo de servicio de la nube podría contratar la Librería Iztaccihuatl
para alojar la información y el proyecto de ciencia de datos?
Servicio Gratuito de Almacenamiento en la Nube (hasta que sea
necesario pagar una Cuenta Premium).
Sobre todo que soporten diferentes Lenguajes de Programación (que
acepten el Lenguaje a ser utilizado, en este trabajo se propuso Python y
por ejemplo HEROKU como primera opción la trabaja.
Dos ejemplos de las mismas en orden de practicidad para este fin, por tener
uso gratuito y cuentas premium, y soportar diferentes Lenguajes de
Programación podrían ser:
• HEROKU
• CleverCloud
CONCLUSIONES
Al trabajar con un Lenguaje de Programación fuertemente usado de “Open
Source” como Python así como un Servicio en la Nube Gratuito como Heroku,
se ahorran costos para la Empresa, ya que el objetivo de la misma es tanto la
explotación de datos y maximización de su uso, generación de Análisis
Descriptivos como Predictivos, y si fuese también Prescriptivos, como la
rentabilidad en términos económicos, también se sugiere la desagregación y
separación de datos (Autor, Fecha, Categoría, Casa Editorial, Fecha de
Publicación) para optimizarlos independientemente y poder encontrarle una
explotación a cada uno y su uso separado, el cual nos puede dar lecturas
diferentes que teniéndolos agrupados.

Más contenido relacionado

La actualidad más candente

La actualidad más candente (11)

Cbs Google Cloud Platform fundamentals 2
Cbs Google Cloud Platform fundamentals 2Cbs Google Cloud Platform fundamentals 2
Cbs Google Cloud Platform fundamentals 2
 
Servicios de Bases de Datos de AWS
Servicios de Bases de Datos de AWSServicios de Bases de Datos de AWS
Servicios de Bases de Datos de AWS
 
Comenzando con Docker en AWS
Comenzando con Docker en AWSComenzando con Docker en AWS
Comenzando con Docker en AWS
 
Arquitectura a escala
Arquitectura a escalaArquitectura a escala
Arquitectura a escala
 
Mejores prácticas para migrar sus bases de datos a AWS
Mejores prácticas para migrar sus bases de datos a AWSMejores prácticas para migrar sus bases de datos a AWS
Mejores prácticas para migrar sus bases de datos a AWS
 
Estudio sobre Spark, Storm, Kafka y Hive
Estudio sobre Spark, Storm, Kafka y HiveEstudio sobre Spark, Storm, Kafka y Hive
Estudio sobre Spark, Storm, Kafka y Hive
 
Arquitectura a escala
Arquitectura a escalaArquitectura a escala
Arquitectura a escala
 
Construyendo aplicaciones de Big Data en AWS
Construyendo aplicaciones de Big Data en AWSConstruyendo aplicaciones de Big Data en AWS
Construyendo aplicaciones de Big Data en AWS
 
Big data con Hadoop y SSIS 2016
Big data con Hadoop y SSIS 2016Big data con Hadoop y SSIS 2016
Big data con Hadoop y SSIS 2016
 
¿Por que cambiar de Apache Hadoop a Apache Spark?
¿Por que cambiar de Apache Hadoop a Apache Spark?¿Por que cambiar de Apache Hadoop a Apache Spark?
¿Por que cambiar de Apache Hadoop a Apache Spark?
 
SOFTWARE APACHE.
SOFTWARE APACHE.SOFTWARE APACHE.
SOFTWARE APACHE.
 

Similar a Trabajo de herramientas para la ciencia de datos evaluado por pares

Similar a Trabajo de herramientas para la ciencia de datos evaluado por pares (20)

Aplicando la Ciencia de Datos en una organización
Aplicando la Ciencia de Datos en una organización Aplicando la Ciencia de Datos en una organización
Aplicando la Ciencia de Datos en una organización
 
Aplicando la Ciencia de Datos en una organización.docx
Aplicando la Ciencia de Datos en una organización.docxAplicando la Ciencia de Datos en una organización.docx
Aplicando la Ciencia de Datos en una organización.docx
 
Aplicando la ciencia de datos en una organización
Aplicando la ciencia de datos en una organizaciónAplicando la ciencia de datos en una organización
Aplicando la ciencia de datos en una organización
 
Practica mariadejoz
Practica mariadejozPractica mariadejoz
Practica mariadejoz
 
Proyecto Jaime Salinas
Proyecto Jaime SalinasProyecto Jaime Salinas
Proyecto Jaime Salinas
 
Reporte_practica_2.pdf
Reporte_practica_2.pdfReporte_practica_2.pdf
Reporte_practica_2.pdf
 
Caso libreria - herramientas para el análisis de big data - edx
Caso libreria - herramientas para el análisis de big data - edxCaso libreria - herramientas para el análisis de big data - edx
Caso libreria - herramientas para el análisis de big data - edx
 
Aplicando Ciencia de Datos en una Organización
Aplicando Ciencia de Datos en una OrganizaciónAplicando Ciencia de Datos en una Organización
Aplicando Ciencia de Datos en una Organización
 
edx caso.docx
edx caso.docxedx caso.docx
edx caso.docx
 
Trabajo ciencia de datos camilo sanhueza
Trabajo ciencia de datos camilo sanhuezaTrabajo ciencia de datos camilo sanhueza
Trabajo ciencia de datos camilo sanhueza
 
Python - Lenguaje de programación para Ciencia de Datos
Python - Lenguaje de programación para Ciencia de DatosPython - Lenguaje de programación para Ciencia de Datos
Python - Lenguaje de programación para Ciencia de Datos
 
Proyecto 1 ciencia de datos
Proyecto 1 ciencia de datosProyecto 1 ciencia de datos
Proyecto 1 ciencia de datos
 
Proyecto 1 ciencia de datos
Proyecto 1 ciencia de datosProyecto 1 ciencia de datos
Proyecto 1 ciencia de datos
 
Proyecto 1 ciencia de datos
Proyecto 1 ciencia de datosProyecto 1 ciencia de datos
Proyecto 1 ciencia de datos
 
Big Data - Conceptos, herramientas y patrones
Big Data - Conceptos, herramientas y patronesBig Data - Conceptos, herramientas y patrones
Big Data - Conceptos, herramientas y patrones
 
procesamiento de datos con python para resolucion de ciencia de datos, aplica...
procesamiento de datos con python para resolucion de ciencia de datos, aplica...procesamiento de datos con python para resolucion de ciencia de datos, aplica...
procesamiento de datos con python para resolucion de ciencia de datos, aplica...
 
Power pivot
Power pivotPower pivot
Power pivot
 
Bigdata Herramientas Caso Libreria Iztaccihuatl
Bigdata Herramientas Caso Libreria IztaccihuatlBigdata Herramientas Caso Libreria Iztaccihuatl
Bigdata Herramientas Caso Libreria Iztaccihuatl
 
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdf
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdfAPLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdf
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdf
 
Tarea T2.2 EDX.docx
Tarea T2.2 EDX.docxTarea T2.2 EDX.docx
Tarea T2.2 EDX.docx
 

Último

🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
EliaHernndez7
 
RESOLUCIÓN VICEMINISTERIAL 00048 - 2024 EVALUACION
RESOLUCIÓN VICEMINISTERIAL 00048 - 2024 EVALUACIONRESOLUCIÓN VICEMINISTERIAL 00048 - 2024 EVALUACION
RESOLUCIÓN VICEMINISTERIAL 00048 - 2024 EVALUACION
amelia poma
 
PROPUESTA COMERCIAL SENA ETAPA 2 ACTIVIDAD 3.pdf
PROPUESTA COMERCIAL SENA ETAPA 2 ACTIVIDAD 3.pdfPROPUESTA COMERCIAL SENA ETAPA 2 ACTIVIDAD 3.pdf
PROPUESTA COMERCIAL SENA ETAPA 2 ACTIVIDAD 3.pdf
EduardoJosVargasCama1
 

Último (20)

AEC 2. Aventura en el Antiguo Egipto.pptx
AEC 2. Aventura en el Antiguo Egipto.pptxAEC 2. Aventura en el Antiguo Egipto.pptx
AEC 2. Aventura en el Antiguo Egipto.pptx
 
Power Point E. S.: Los dos testigos.pptx
Power Point E. S.: Los dos testigos.pptxPower Point E. S.: Los dos testigos.pptx
Power Point E. S.: Los dos testigos.pptx
 
Novena de Pentecostés con textos de san Juan Eudes
Novena de Pentecostés con textos de san Juan EudesNovena de Pentecostés con textos de san Juan Eudes
Novena de Pentecostés con textos de san Juan Eudes
 
ACERTIJO LA RUTA DEL MARATÓN OLÍMPICO DEL NÚMERO PI EN PARÍS. Por JAVIER SOL...
ACERTIJO LA RUTA DEL MARATÓN OLÍMPICO DEL NÚMERO PI EN  PARÍS. Por JAVIER SOL...ACERTIJO LA RUTA DEL MARATÓN OLÍMPICO DEL NÚMERO PI EN  PARÍS. Por JAVIER SOL...
ACERTIJO LA RUTA DEL MARATÓN OLÍMPICO DEL NÚMERO PI EN PARÍS. Por JAVIER SOL...
 
Supuestos_prácticos_funciones.docx
Supuestos_prácticos_funciones.docxSupuestos_prácticos_funciones.docx
Supuestos_prácticos_funciones.docx
 
Biografía de Charles Coulomb física .pdf
Biografía de Charles Coulomb física .pdfBiografía de Charles Coulomb física .pdf
Biografía de Charles Coulomb física .pdf
 
Lecciones 06 Esc. Sabática. Los dos testigos
Lecciones 06 Esc. Sabática. Los dos testigosLecciones 06 Esc. Sabática. Los dos testigos
Lecciones 06 Esc. Sabática. Los dos testigos
 
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
 
RESOLUCIÓN VICEMINISTERIAL 00048 - 2024 EVALUACION
RESOLUCIÓN VICEMINISTERIAL 00048 - 2024 EVALUACIONRESOLUCIÓN VICEMINISTERIAL 00048 - 2024 EVALUACION
RESOLUCIÓN VICEMINISTERIAL 00048 - 2024 EVALUACION
 
Tema 17. Biología de los microorganismos 2024
Tema 17. Biología de los microorganismos 2024Tema 17. Biología de los microorganismos 2024
Tema 17. Biología de los microorganismos 2024
 
LA LITERATURA DEL BARROCO 2023-2024pptx.pptx
LA LITERATURA DEL BARROCO 2023-2024pptx.pptxLA LITERATURA DEL BARROCO 2023-2024pptx.pptx
LA LITERATURA DEL BARROCO 2023-2024pptx.pptx
 
Interpretación de cortes geológicos 2024
Interpretación de cortes geológicos 2024Interpretación de cortes geológicos 2024
Interpretación de cortes geológicos 2024
 
prostitución en España: una mirada integral!
prostitución en España: una mirada integral!prostitución en España: una mirada integral!
prostitución en España: una mirada integral!
 
Revista Apuntes de Historia. Mayo 2024.pdf
Revista Apuntes de Historia. Mayo 2024.pdfRevista Apuntes de Historia. Mayo 2024.pdf
Revista Apuntes de Historia. Mayo 2024.pdf
 
Tema 10. Dinámica y funciones de la Atmosfera 2024
Tema 10. Dinámica y funciones de la Atmosfera 2024Tema 10. Dinámica y funciones de la Atmosfera 2024
Tema 10. Dinámica y funciones de la Atmosfera 2024
 
Los avatares para el juego dramático en entornos virtuales
Los avatares para el juego dramático en entornos virtualesLos avatares para el juego dramático en entornos virtuales
Los avatares para el juego dramático en entornos virtuales
 
Tema 19. Inmunología y el sistema inmunitario 2024
Tema 19. Inmunología y el sistema inmunitario 2024Tema 19. Inmunología y el sistema inmunitario 2024
Tema 19. Inmunología y el sistema inmunitario 2024
 
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdfFeliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
 
PROPUESTA COMERCIAL SENA ETAPA 2 ACTIVIDAD 3.pdf
PROPUESTA COMERCIAL SENA ETAPA 2 ACTIVIDAD 3.pdfPROPUESTA COMERCIAL SENA ETAPA 2 ACTIVIDAD 3.pdf
PROPUESTA COMERCIAL SENA ETAPA 2 ACTIVIDAD 3.pdf
 
1ro Programación Anual D.P.C.C planificación anual del área para el desarroll...
1ro Programación Anual D.P.C.C planificación anual del área para el desarroll...1ro Programación Anual D.P.C.C planificación anual del área para el desarroll...
1ro Programación Anual D.P.C.C planificación anual del área para el desarroll...
 

Trabajo de herramientas para la ciencia de datos evaluado por pares

  • 1. Trabajo Evaluado por Pares # 2  Curso: Herramientas para el Análisis de Big Data Realizado por: Franco Gotuzzo Florez
  • 2. 1-¿Qué lenguaje de programación para ciencia de datos utilizaría para realizar el análisis de datos de la Librería Iztaccihuatl? El Lenguaje de Programación sugerido de mi parte sería Python, a razón de ser usado mayormente en Ciencia, Data e Ingeniería. Para el caso de la Librería serán archivos de data lingüística en su mayoría. 2-¿Qué predicciones se podrían obtener de los datos de la Librería Iztaccihuatl? Como requerido las 3 predicciones que se podrían realizar serían: • Categorías más vendidas (el Archivo Top Books ayudará a predecir gracias al histórico de Ventas que Categorías de Libros han sido las más vendidas, y por lo tanto continuar en dicha línea de Producto, por ejemplo especializarse en dicho segmento de clientes, promocionar y posicionarse en dicho nicho de Mercado). • Autores más vendidos (dentro del archivo antes mencionado se puede también listar a los Autores mas vendidos y continuar con la Promoción y Venta de mas Obras de dichos autores). • Casas Editoriales con la mayor venta (si de los Libros más Vendidos estos pertenecen a un número pequeño de Casas Editoriales, se puede trabajar en relación directa con ellas, optimizando la operación, precio y producto, como Reducción de Costos, Mejora en Tiempos de Entrega, Firma de Contratos Directos para su Venta, así como Ventas Exclusivas y Lanzamientos). 3-¿Qué adecuaciones se podría hacer a los datos de la Librería Iztaccihuatl para poder realizar un análisis predictivo? Segmentación de Datos en Archivos separados Por ejemplo:
  • 3. -Categorías -Autores -Casas Editoriales -Fecha de Publicación -Precios Visto que la información está en el archivo de Top Books, aunque junta, trabajarla y analizarla en archivos separados generaría una perspectiva diferente de dicha información desde un ángulo de pertenencia o género, modernidad de la obra, escalas de precios y de matriz de producción. 4-¿Qué tipo de base de datos se utilizaría para alojar los análisis de los datos de la Librería Iztaccihuatl? Base de Datos en la Nube (de uso gratuito inicialmente, posterior o si se desea una Base Premium o con Costo). Visto que la cantidad de datos no es grande, esta no necesita la inversión de servidores por parte de la Librería para el almacenamiento, ni tampoco el pago por el uso de un espacio excesivo en la nube, a menos que su cantidad de datos así lo requiera. 5-¿Qué tipo de servicio de la nube podría contratar la Librería Iztaccihuatl para alojar la información y el proyecto de ciencia de datos? Servicio Gratuito de Almacenamiento en la Nube (hasta que sea necesario pagar una Cuenta Premium). Sobre todo que soporten diferentes Lenguajes de Programación (que acepten el Lenguaje a ser utilizado, en este trabajo se propuso Python y por ejemplo HEROKU como primera opción la trabaja. Dos ejemplos de las mismas en orden de practicidad para este fin, por tener uso gratuito y cuentas premium, y soportar diferentes Lenguajes de Programación podrían ser: • HEROKU • CleverCloud
  • 4. CONCLUSIONES Al trabajar con un Lenguaje de Programación fuertemente usado de “Open Source” como Python así como un Servicio en la Nube Gratuito como Heroku, se ahorran costos para la Empresa, ya que el objetivo de la misma es tanto la explotación de datos y maximización de su uso, generación de Análisis Descriptivos como Predictivos, y si fuese también Prescriptivos, como la rentabilidad en términos económicos, también se sugiere la desagregación y separación de datos (Autor, Fecha, Categoría, Casa Editorial, Fecha de Publicación) para optimizarlos independientemente y poder encontrarle una explotación a cada uno y su uso separado, el cual nos puede dar lecturas diferentes que teniéndolos agrupados.