28 cityanalytics slide

•Descargar como PPTX, PDF•

0 recomendaciones•392 vistas

Jairo Rodriguez Arias

Machine Learning y Big Data aplicada a la localización de negocios.

Datos y análisis

Equipo
Daniel Martínez García
Jesús Moya Gaona
Jairo Rodríguez Arias

Indice:
1. 28/CityAnalytics
2. Génesis. Proyecto
3. Implementación
a. Cloud & Machine
Learning
b. La visualización
4. El futuro

Nuestro producto:
Herramienta analitica y motor de recomendación
¿Qué ofrecemos?
Respuestas a las preguntas del emprendedor:
1.- ¿Qué ubicación elijo para mi negocio?
2.- ¿Que tipo de negocio debería montar aquí?
3.- ¿Conozco el entorno y la competencia?
4.- ¿Cómo evolucionará cada tipo de negocio?

Todos los tramos de vía
Analizamos todas las calles, secciones, barrios y distritos.
20 GB/ año
Datos procesados por el motor para cada municipio
3.000.000 /mesCálculo de distancias entre locales realizados cada mes
¿Cómo lo hacemos?
Identificamos cada negocio
Datos históricos e individuales de todos los negocios

El centro de
nuestro
proyecto es el
conocimiento
Buscamos construir un
modelo escalable de
recomendación a los
emprendedores dentro del
territorio nacional.

Los pilares de 28/ City Analytics
OPEN DATA
CLOUD
COMPUTING
28/ City
Analytics
BIG DATA
MACHINE
LEARNING

ORIGEN Y JUSTIFICACIÓN
DEL PROYECTO
▸En el ámbito del open data residen verdaderas
oportunidades que pueden aportar valor social y/o
rentabilidad económica y comercial.
▸Es imprescindible emprender una actividad
empresarial conociendo el entorno, la evolución de
la actividad económica en él y la competencia.

EL ITINERARIO
1
Iniciativa de negocio
2
• Obtención y preparación de datos
3
• Procesado y modelado
4.
• Recomendación y análisis

ETAPAS DEL
PROYECTO
“Los planes son solo buenas intenciones a no ser que se
conviertan en trabajo duro” Peter Drucker

Metodología
CRISP - DM
Eje de análisis: ¿sección
censal o tramo de vía?
Objeto del análisis: ¿Local
comercial, negocio o
actividad económica?

3.Implementación
a. Cloud &
Machine
Learning

LA ARQUITECTURA
Spark lee los datos de la BBDD y escribe el
resultado en BBDD

Conclusiones y mejoras
o Incorporación de nuevas fuentes (datos
inmobiliarios, de tránsito, franquicias comerciales).
o Mejora de la calidad del dato: data quality (four C´s) y
data cleaning (limpieza y deduplicación).
o Identificación geográfica de cada local físico y sus
características.
o Cambio del objeto del análisis (negocio - local - tipo
de actividad económica).
o Nueva agrupación de negocios a medida en lugar de
por epígrafe de actividad económica.
o Uso en planificación de ocupación en centros
comerciales.
o Uso inverso (qué no hay, qué no emprender).

28/ City
Analytics
Podemos ayudar a tu negocio.

Simplifica tus decisiones:
28/ City
Analytics
Cloud
computing
¡Empieza!
Open data
! No te la juegues a ciegas !

Gracias !
jmoyagaona@gmail.com
danielmartinezgarcia92@hotmail.com
jairorodriguezarias@gmail.com

Más contenido relacionado

Destacado

9rokchiomo

Halloween Party Ideas for Kids & ClassroomsSignUp.com

Alvy warison (Ingg)alvy warison

Graças senhorDavinia Martínez

ResumeBeatriz Luzuriaga

Actividades LucialunaLuciaLunaSuarez

Tammetõru ja LeivalaulPärtel Toompere

Marketing plan outlineJennifer Dunbar

03. día de entrenamientoDavinia Martínez

10. nuevo consejo generalDavinia Martínez

Meccanico e Ricambi - Catalogo Tamarri SpATamarri SpA

Destacado (11)

Halloween Party Ideas for Kids & Classrooms

Alvy warison (Ingg)

Graças senhor

Resume

Actividades Lucialuna

Tammetõru ja Leivalaul

Marketing plan outline

03. día de entrenamiento

10. nuevo consejo general

Meccanico e Ricambi - Catalogo Tamarri SpA

28 cityanalytics slide

1. 28/City Analytics

2. Equipo Daniel Martínez García Jesús Moya Gaona Jairo Rodríguez Arias

3. Indice: 1. 28/CityAnalytics 2. Génesis. Proyecto 3. Implementación a. Cloud & Machine Learning b. La visualización 4. El futuro

4. 1. 28/CityAnalytics Empezamos

5. Nuestro producto: Herramienta analitica y motor de recomendación ¿Qué ofrecemos? Respuestas a las preguntas del emprendedor: 1.- ¿Qué ubicación elijo para mi negocio? 2.- ¿Que tipo de negocio debería montar aquí? 3.- ¿Conozco el entorno y la competencia? 4.- ¿Cómo evolucionará cada tipo de negocio?

6. Todos los tramos de vía Analizamos todas las calles, secciones, barrios y distritos. 20 GB/ año Datos procesados por el motor para cada municipio 3.000.000 /mesCálculo de distancias entre locales realizados cada mes ¿Cómo lo hacemos? Identificamos cada negocio Datos históricos e individuales de todos los negocios

7. El centro de nuestro proyecto es el conocimiento Buscamos construir un modelo escalable de recomendación a los emprendedores dentro del territorio nacional.

8. Los pilares de 28/ City Analytics OPEN DATA CLOUD COMPUTING 28/ City Analytics BIG DATA MACHINE LEARNING

9. 2. GÉNESIS. EL PROYECTO Empezamos

10. ORIGEN Y JUSTIFICACIÓN DEL PROYECTO ▸En el ámbito del open data residen verdaderas oportunidades que pueden aportar valor social y/o rentabilidad económica y comercial. ▸Es imprescindible emprender una actividad empresarial conociendo el entorno, la evolución de la actividad económica en él y la competencia.

11. EL ITINERARIO 1 Iniciativa de negocio 2 • Obtención y preparación de datos 3 • Procesado y modelado 4. • Recomendación y análisis

12. ETAPAS DEL PROYECTO “Los planes son solo buenas intenciones a no ser que se conviertan en trabajo duro” Peter Drucker

13. EL CRONOGRAMA

14. Metodología CRISP - DM Eje de análisis: ¿sección censal o tramo de vía? Objeto del análisis: ¿Local comercial, negocio o actividad económica?

15. 3.Implementación a. Cloud & Machine Learning

16. LA ARQUITECTURA Spark lee los datos de la BBDD y escribe el resultado en BBDD

17. LA INFRAESTRUCTURA

18. 3.Implementación b.La visualización

19. Visualización:

20.

21.

22.

23.

24. Análisis multidimensional (OLAP):

25. 4. FUTURO Ahora empieza todo..

26. Objetivo: escalabilidad

27. Conclusiones y mejoras o Incorporación de nuevas fuentes (datos inmobiliarios, de tránsito, franquicias comerciales). o Mejora de la calidad del dato: data quality (four C´s) y data cleaning (limpieza y deduplicación). o Identificación geográfica de cada local físico y sus características. o Cambio del objeto del análisis (negocio - local - tipo de actividad económica). o Nueva agrupación de negocios a medida en lugar de por epígrafe de actividad económica. o Uso en planificación de ocupación en centros comerciales. o Uso inverso (qué no hay, qué no emprender).

28. 28/ City Analytics Podemos ayudar a tu negocio.

29. Simplifica tus decisiones: 28/ City Analytics Cloud computing ¡Empieza! Open data ! No te la juegues a ciegas !

30. Gracias ! jmoyagaona@gmail.com danielmartinezgarcia92@hotmail.com jairorodriguezarias@gmail.com

Notas del editor

Hola a todos somos 28City analytics
Respuesta a ese tipo de preguntas que surgen antes de emprender un negocio. Respuestas basadas en el estudio y análisis de datos Respuestas personalizadas para cada barrio cada calle y cada tipo de negocio. Respuestas para todos y cada uno, respuestas al alcance de todos , a un solo click ¿Qué tipo de negocio? ¿Dónde lo monto? ¿Dónde está mi competencia ¿Como funcionara la zona?
Cómo somos capaces de responder a las preguntas Nuestros datos son nuestra base Todos los negocio, repito todos los datos de los negocio, desde un histórico de rótulos a su situación geográfica Todas las calles, a nivel distrito, barrio, sección y via, lo que nos permite realizan análisis con diferente profundidad geográfica
Lo más importante es la calidad del servicio, es imprescindible una buena insfraestrutura, pues es el centro de nuestro negocio. Es imprescindible que sea un modelos escalable, por esto seleccionamos un servicio en la nube
Cual es la base, cuales son los pilares sobre los que se puede construir esta empresa Open data, nuestros datos son abiertos, no dependemos de ninguna empresa que nos los suministre ni pagamos por ellos, nuestros datos no estan al servicio de nadie. Cloud Computing, infraestructura en la nube, rapida y escalable. Big Data, procesamos muchisisma información en un tiempo muy pequeño, Machine Learning, usamos técnicas no predictivas
Cuatro sencillos puntos marcan nuestro proyecto, el exito esta en llegar al punto cuatro.
Agrupamos todas las tareas en seis puntos principales, (leer los puntos), estimando para cada uno, El resultado fue claro, vamos a tener que trabajar todos los días, incluso el dia antes de la presentación. Plazos muy ajsutados, imprescindible controlar el cronograma.
Este fue nuestro cronograma, el que nos ayudó a repartir las tareas y poder llegar a tiempo a las entregas.
Metodologia empleada
En este capítulo vamos a hablar de la solución tecnológica seleccionada
Simplificamos la arquitectura, SQL server, Mlig de Spark y visualizacion en Tableau, y un conector para Excel.
Cuadro de mando con el que controlamos la infraestructura, Muy importante para poder dimensionar bien las herramientas y controlar los costes.
Conector con sql server nativo Servidor propio, lo que facilita mucho el publicar los tableros de mando, ademas Azure, dispone de una maquina virtual con tableu server. Dispone de dos versión; Gratis y versión de pago, nosotros disponemos de la versión de pago gracias a la universidad de Duke, Carolina del Norte, lo cual hace posible el uso del concerto con SQL server
Busca a tus competidores, Buscamos todos los negocios cuyo rotulo contiene la palabra cafetaria, luego filtramos por distrito y nos muestra todas las empresas en cuyo nombre esta la palabra cafeteria asi como sus dos competidores mas cercacnos, indicando la distnacia a los mismos.
Nos muestra el cluster de la calle serrano al paso por cada barrio, en este caso pasa por cuatro barrios y dos distritos, mostrando el cluster al que pertenece en cada tramos, Esto lo conseguimos introduciendo el nombre en el cuadro superior y aceptando.
Todo esto no tendria sentido, si no tenemos un plan para seguir trazando el camino necesario
Hadoop HDFS Gracias al sistema de archivos distribuido HDFS podemos almacenar gran cantidad de datos extra cuando ampliemos el sistema a otras ciudades. Apache Spark Spark posee una potente librería de Machine Learning (MLlib) que permite realizar aprendizaje automático en entornos distribuidos. Python/Scala Se están desarrollando algoritmos de machine learning previamente probados en Knime usando estos dos lenguajes junto con Spark Cloud Actualmente se tiene una arquitectura Big Data en local que se encuentra en proceso de migración a la cloud para garantizar una disponibilidad mayor de recursos.
Desde 29/CityAnalytics apostamos por ayudar a las empresas, apostamos por el negocio para el negocio. Por ello vamos a monetizar nuestra empresa. ¿Como?
Esto es parte del valor que aportamos, simplificamos las decisiones, ahorramos tiempo y costes.

28 cityanalytics slide

Recomendados

Recomendados

Más contenido relacionado

Destacado

Destacado (11)

Similar a 28 cityanalytics slide

Similar a 28 cityanalytics slide (20)

Último

Último (20)

28 cityanalytics slide

Notas del editor