5. Nuestro producto:
Herramienta analitica y motor de recomendación
¿Qué ofrecemos?
Respuestas a las preguntas del emprendedor:
1.- ¿Qué ubicación elijo para mi negocio?
2.- ¿Que tipo de negocio debería montar aquí?
3.- ¿Conozco el entorno y la competencia?
4.- ¿Cómo evolucionará cada tipo de negocio?
6. Todos los tramos de vía
Analizamos todas las calles, secciones, barrios y distritos.
20 GB/ año
Datos procesados por el motor para cada municipio
3.000.000 /mesCálculo de distancias entre locales realizados cada mes
¿Cómo lo hacemos?
Identificamos cada negocio
Datos históricos e individuales de todos los negocios
7. El centro de
nuestro
proyecto es el
conocimiento
Buscamos construir un
modelo escalable de
recomendación a los
emprendedores dentro del
territorio nacional.
8. Los pilares de 28/ City Analytics
OPEN DATA
CLOUD
COMPUTING
28/ City
Analytics
BIG DATA
MACHINE
LEARNING
10. ORIGEN Y JUSTIFICACIÓN
DEL PROYECTO
▸En el ámbito del open data residen verdaderas
oportunidades que pueden aportar valor social y/o
rentabilidad económica y comercial.
▸Es imprescindible emprender una actividad
empresarial conociendo el entorno, la evolución de
la actividad económica en él y la competencia.
11. EL ITINERARIO
1
Iniciativa de negocio
2
• Obtención y preparación de datos
3
• Procesado y modelado
4.
• Recomendación y análisis
27. Conclusiones y mejoras
o Incorporación de nuevas fuentes (datos
inmobiliarios, de tránsito, franquicias comerciales).
o Mejora de la calidad del dato: data quality (four C´s) y
data cleaning (limpieza y deduplicación).
o Identificación geográfica de cada local físico y sus
características.
o Cambio del objeto del análisis (negocio - local - tipo
de actividad económica).
o Nueva agrupación de negocios a medida en lugar de
por epígrafe de actividad económica.
o Uso en planificación de ocupación en centros
comerciales.
o Uso inverso (qué no hay, qué no emprender).
Respuesta a ese tipo de preguntas que surgen antes de emprender un negocio.
Respuestas basadas en el estudio y análisis de datos
Respuestas personalizadas para cada barrio cada calle y cada tipo de negocio.
Respuestas para todos y cada uno, respuestas al alcance de todos , a un solo click
¿Qué tipo de negocio?
¿Dónde lo monto?
¿Dónde está mi competencia
¿Como funcionara la zona?
Cómo somos capaces de responder a las preguntas
Nuestros datos son nuestra base
Todos los negocio, repito todos los datos de los negocio, desde un histórico de rótulos a su situación geográfica
Todas las calles, a nivel distrito, barrio, sección y via, lo que nos permite realizan análisis con diferente profundidad geográfica
Lo más importante es la calidad del servicio, es imprescindible una buena insfraestrutura, pues es el centro de nuestro negocio.
Es imprescindible que sea un modelos escalable, por esto seleccionamos un servicio en la nube
Cual es la base, cuales son los pilares sobre los que se puede construir esta empresa
Open data, nuestros datos son abiertos, no dependemos de ninguna empresa que nos los suministre ni pagamos por ellos, nuestros datos no estan al servicio de nadie.
Cloud Computing, infraestructura en la nube, rapida y escalable.
Big Data, procesamos muchisisma información en un tiempo muy pequeño,
Machine Learning, usamos técnicas no predictivas
Cuatro sencillos puntos marcan nuestro proyecto, el exito esta en llegar al punto cuatro.
Agrupamos todas las tareas en seis puntos principales, (leer los puntos), estimando para cada uno,
El resultado fue claro, vamos a tener que trabajar todos los días, incluso el dia antes de la presentación.
Plazos muy ajsutados, imprescindible controlar el cronograma.
Este fue nuestro cronograma, el que nos ayudó a repartir las tareas y poder llegar a tiempo a las entregas.
Metodologia empleada
En este capítulo vamos a hablar de la solución tecnológica seleccionada
Simplificamos la arquitectura, SQL server, Mlig de Spark y visualizacion en Tableau, y un conector para Excel.
Cuadro de mando con el que controlamos la infraestructura,
Muy importante para poder dimensionar bien las herramientas y controlar los costes.
Conector con sql server nativo
Servidor propio, lo que facilita mucho el publicar los tableros de mando, ademas Azure, dispone de una maquina virtual con tableu server.
Dispone de dos versión; Gratis y versión de pago, nosotros disponemos de la versión de pago gracias a la universidad de Duke, Carolina del Norte, lo cual hace posible el uso del concerto con SQL server
Busca a tus competidores,
Buscamos todos los negocios cuyo rotulo contiene la palabra cafetaria, luego filtramos por distrito y nos muestra todas las empresas en cuyo nombre esta la palabra cafeteria asi como sus dos competidores mas cercacnos, indicando la distnacia a los mismos.
Nos muestra el cluster de la calle serrano al paso por cada barrio, en este caso pasa por cuatro barrios y dos distritos, mostrando el cluster al que pertenece en cada tramos,
Esto lo conseguimos introduciendo el nombre en el cuadro superior y aceptando.
Todo esto no tendria sentido, si no tenemos un plan para seguir trazando el camino necesario
Hadoop HDFS Gracias al sistema de archivos distribuido HDFS podemos almacenar gran cantidad de datos extra cuando ampliemos el sistema a otras ciudades.
Apache Spark Spark posee una potente librería de Machine Learning (MLlib) que permite realizar aprendizaje automático en entornos distribuidos.
Python/Scala Se están desarrollando algoritmos de machine learning previamente probados en Knime usando estos dos lenguajes junto con Spark
Cloud Actualmente se tiene una arquitectura Big Data en local que se encuentra en proceso de migración a la cloud para garantizar una disponibilidad mayor de recursos.
Desde 29/CityAnalytics apostamos por ayudar a las empresas, apostamos por el negocio para el negocio.
Por ello vamos a monetizar nuestra empresa.
¿Como?
Esto es parte del valor que aportamos, simplificamos las decisiones, ahorramos tiempo y costes.