Analítica Avanzada
Azure Fridays
Elena López
Especialista en Base de Datos e Inteligencia de Negocios
Microsoft MVP
elopez@srlsti.com
www.bdconsql.com
www.srlsti.com
https://www.linkedin.com/in/ingelenalopez
www.srlsti.com
www.srlsti.com
SOBRE NOSOTROS
Somos una empresa dedicada a tecnologías inherentes al área de datos, desde su origen en los procesos hasta su
explotación. Nos definimos como una familia de profesionales que han tenido la dicha de participar en grandes
proyectos de la República Dominicana y El Caribe, obteniendo innumerables logros de forma individual, y que han
sabido aunar conocimientos y fuerzas para brindar a las empresas soluciones de calidad, basados en principios éticos y
morales que garantizan calidad en cada entregable.
Las recomendaciones de nuestros clientes y relacionados son nuestra principal carta de presentación
www.srlsti.com
Elena López, Socia Fundadora
Actual Gerente Técnico para
proyectos de datos
LOS DATOS SON EL PRINCIPAL ACTIVO COOPORATIVO
Estoy altamente convencida de que podemos desarrollar soluciones de datos funcionales e interesantes para
nuestros clientes. La forma que lo hemos ido logrando, es sencilla pero exitosa, conjugando un equipo con grandes
experiencias y habilidades técnicas, apoyados en una base metodológica que respeta todas las reglas a seguir en
proyectos de esta naturaleza. La clave de nuestro acelerado crecimiento está precisamente en nuestro equipo y los
valores que les adorna.
www.srlsti.com
Elena López, Socia Fundadora
Actual Gerente Técnico para
proyectos de datos
elopez@srlsti.com
Alberto Marrero, Socio
Fundador
Actual Especialista en Análisis
Funcional y de Negocios
amarrero@srlsti.com
Ingeniera de sistemas, especialista en bases de datos
con más de 15 años de experiencia.
Diseño, administración y gestión de soluciones que
impliquen datos y gestores de bases de datos,
inteligencia de negocios, integración y migración de
datos, contingencia y alta disponibilidad.
Ganadora del reconcomiendo Most Valuable
Professional (MVP) de Microsoft, 2017-2018
Administrador con especializaciones en el área de
gestión de la calidad y mejora de procesos;
experiencia de más de 10 años en optimización de
procesos, análisis funcional de sistemas
informáticos y soluciones de inteligencia de
negocios.
www.srlsti.com
Alfonso Then
Consultor especialista en Data
Science
athen@srlsti.com
Marcio Báez
Especialista en Integración de
Datos e Inteligencia de
Negocios
mbaez@srlsti.com
Economista con especialidad en matemática
aplicada; más de 20 años de experiencia en
análisis de datos e implementación de soluciones
de analítica avanzada, machine learning y
estadística.
Estudiante de ingeniería de sistemas, apasionado
de las bases de datos y la inteligencia de negocio.
Ha trabajado en proyectos de gran escala, con
grandes volúmenes de datos.
www.srlsti.com
Dra. Anggie Mateo Cabral
Analista de Procesos
anmateo@srlsti.com
Anny Mateo
Analista Funcional
amateo@srlsti.com
Administradora con especialización en el área de
gestión de la calidad y mejora de procesos;
experiencia de más de 7 años en análisis funcional
de sistemas informáticos y coordinación de
proyectos tecnológicos.
Especialidad en Alta Dirección, experimentada en
el área de calidad total, proyectos y mejora de
métodos. Analista de costos y asesora
metodológica.
www.srlsti.com
Inteligencia de Negocios:
- Levantamiento de requerimientos con usuarios de mandos altos y medios
- Análisis técnico y funcional de las preguntas negocios que los datos responderían
- Diseño de equivalencias entre la fuente de datos y el almacén final (data warehouse)
- Diseño y puesta en marcha de Extracción, Transformación y Carga de datos de fuentes diversas
- Diseño y puesta en producción de Cubo de consumos a través de tarjetas de crédito, débito,
fidelización de clientes; tarjetas de llamadas, recargas y otros productos de origen gubernamental.
- Entrenamiento a usuarios técnicos y operativos
Instalación de la infraestructura actual de BI
Segunda fase (en desarrollo actual):
- Incluye mejoras a la versión original y nuevas soluciones de datos para el área comercial.
- Alertas diarias con temas específicos
- Reportes con analítica
Contacto: Juan Utate
Gerente de Proyectos Visanet
www.srlsti.com
Migración e Integración de Datos del Nuevo Portal Transaccional de Compras del Estado Dominicano
-Análisis, diseño e implementación de la migración de datos.
-Definición de las estrategias de migración.
-Auditoría a los datos existentes para determinar niveles de calidad e integridad de los mismos y en
base a estos resultados establecer planes de acción con los especialistas de las áreas relacionadas.
-Garantizar el cumplimiento de los hitos del proyecto en temas relacionados con datos e información.
-Conciliación y pruebas técnicas con los proveedores del portal que los datos migrados lleguen a su
destino sin comprometer la calidad de los mismos.
Análisis Funcional Portal Transaccional de Compras del Estado Dominicano
- Levantamiento y optimización de procesos
- Diseño de Modelo de Negocio
- Determinación de métricas e indicadores de ejecución por procesos
- Confección de instructivos y manuales de procedimientos
- Diseño de requerimientos funcionales y no funcionales para software de gestión
Contacto: Jhonattan Toribio
Director de Tecnología
www.srlsti.com
Migración Bases de Datos de Producción
- Instalación y configuración de nuevo ambiente de base de datos para Laboratorios Magnachem
- Movimiento de todas las bases de datos institucionales a SQL Server 2016
Inteligencia de Negocios (Desarrollo Fase I):
- Levantamiento de requerimientos con usuarios de mandos altos y medios
- Análisis técnico y funcional de las preguntas negocios que los datos responderían
Contacto: Juan Coronado
Gerente de Tecnología
www.srlsti.com
Inteligencia de Negocios (Desarrollo Fase I):
- Levantamiento de requerimientos con usuarios de mandos altos y medios en absolutamente
todas las áreas operativas del laboratorio.
- Análisis técnico y funcional de las preguntas negocios que los datos responderían
- Propuesta técnica para abordar la forma de convertir Laboratorios Acromax en una empresa
impulsada por datos
- Dashboards ejecutivos para áreas gerenciales y administrativas
Contacto: Miguel Paredes
Gerente de Tecnología
www.srlsti.com
Modelo de Negocio:
-Análisis del marco regulatorio existente: Misión, Visión, Valores, Políticas, Certificaciones, Procesos,
Instructivos y Manuales de procedimientos.
- Diseño del Modelo de Negocios:
o Levantamiento y evaluación de los procesos;
o Optimización de procesos;
o Determinación de métricas e indicadores de ejecución por procesos;
o Confección de instructivos y manuales de procedimientos;
o Capacitación al personal en los nuevos procesos y métodos de trabajo;
o Diseño de los requerimientos funcionales/No funcionales del software de gestión;
Contacto: Dalexis Aponte
Directora Administrativa y Financiera
www.srlsti.com
ANALÍTICA AVANZADA
Es el análisis autónomo o semi-autónomo de datos utilizando técnicas y herramientas sofisticadas,
más allá de la inteligencia de negocios tradicional, para realizar descubrimientos profundos, realizar
predicciones o generar recomendaciones. Incluye:
Minería de datos y de texto
Machine Learning
Clústers
Inteligencia artificial
Búsqueda de patrones
Predicciones
Análisis de sentimiento
Reconocimiento de imágenes
Simulación
Grafos
Redes neuronales
Visualización,
Etc.
Gartner
www.srlsti.com
TIPOS DE ANÁLISIS
¿Qué pasó?
• Estadística Descriptiva:
Mín, Máx, Avg, Desv
¿Por qué pasó?
• Análisis de correlación
¿Qué pasará?
• Modelos predictivos,
Regresión lineal, redes
neuronales, árboles de
decisiones, análisis de
serie de tiempo
¿Cómo hacer que
pase?
• Modelos de
recomendación,
análisis cognitivo
www.srlsti.com
APLICACIONES
Mercadeo analítico
Ventas cruzadas
Programas de fidelización
Predicción de demanda
Personalización de ofertas
Recomendaciones
Adquisición de nuevos clientes
Finanzas
Detección de fraudes
Riesgo crediticio
Operaciones
Mantenimiento preventivo
Optimización de cadenas de distribución
Monitoreo remoto
www.srlsti.com
ADQUISICIÓN Y ENTENDIMIENTO DE LOS DATOS
Lograr un conjunto de datos claros y de alta calidad analítica, donde la relación entre variables es bien
entendida y ubicada en el ambiente apropiado para el inicio del proceso analítico.
Cargar datos dentro del ambiente analítico
Explorar datos para determinar la calidad; incluye la limpieza de los mismos. Es una tarea muy visual
(de muestreo), donde la estadística descriptiva juega un rol fundamental. Se determina además si la
calidad de los datos es suficiente para responder las preguntas de negocio.
Desarrollar un esquema de validación de los registros que se vayan a utilizar.
Configuración de una canalización de datos para apuntar los datos nuevos o que se actualicen con
regularidad
• Valores nulos
• Valores vacíos
• Valores por defecto
Completitud
• Estandarizados
• Legibles
Conformidad
• No se contradicenConsistencia
www.srlsti.com
CUANDO EL INSUMO CARECE DE CALIDAD
• Veracidad de los datosPrecisión
• Redundancia
• Valor que representa un mismo
dato en diferente formato
Duplicidad
• ¿Podemos usar y confiar en los
datos que tenemos?Integridad
www.srlsti.com
MODELAMIENTO
Ingeniería de atributos.
Construcción de nuevas variables que faciliten el proceso de minería de datos.
Reducción de la dimensionalidad –variables correlacionadas
Normalización de datos y discretización de variables continuas
Entrenamiento y validación; determinar si el modelo está preparado para ser puesto en producción.
Diseño de las técnicas de modelados, siendo las más usadas las que responden preguntas tales como:
• ¿Cuánto o cuánto? (regresión)
• ¿Qué categoría? (clasificación)
• ¿Qué grupo? (agrupaciones en clústeres)
• ¿Será extraño sí? ¿Es raro la presencia de? (detección de anomalías)
• ¿Qué opción debo elegir? (Recomendación)
www.srlsti.com
RETOS
Integración de datos de múltiples fuentes
Calidad de los datos
Carencia de expertos en el área: es un trabajo multidisciplinario
Desconocimiento: se requieren habilidades
Construir una cultura real de toma de decisiones impulsadas por datos
No es una tarea exclusiva de tecnología
El valor de los datos que países como España regalan a Facebook podría ser de más de 500 millones de dólares al año
El auge de las redes sociales y el uso masivo de internet han generado dos grandes tendencias en el mundo de los datos: Datos abiertos y la protección de datos
La baja calidad de los datos es la razón principal por la que el 40% de las iniciativas de negocio son abandonadas, impactando negativamente el crecimiento, la competividad y los ingresos.
El valor de los datos que países como España regalan a Facebook podría ser de más de 500 millones de dólares al año
El auge de las redes sociales y el uso masivo de internet han generado dos grandes tendencias en el mundo de los datos: Datos abiertos y la protección de datos
El valor de los datos que países como España regalan a Facebook podría ser de más de 500 millones de dólares al año
El auge de las redes sociales y el uso masivo de internet han generado dos grandes tendencias en el mundo de los datos: Datos abiertos y la protección de datos
El valor de los datos que países como España regalan a Facebook podría ser de más de 500 millones de dólares al año
El auge de las redes sociales y el uso masivo de internet han generado dos grandes tendencias en el mundo de los datos: Datos abiertos y la protección de datos
La baja calidad de los datos es la razón principal por la que el 40% de las iniciativas de negocio son abandonadas, impactando negativamente el crecimiento, la competividad y los ingresos.
La baja calidad de los datos es la razón principal por la que el 40% de las iniciativas de negocio son abandonadas, impactando negativamente el crecimiento, la competividad y los ingresos.
La baja calidad de los datos es la razón principal por la que el 40% de las iniciativas de negocio son abandonadas, impactando negativamente el crecimiento, la competividad y los ingresos.
La baja calidad de los datos es la razón principal por la que el 40% de las iniciativas de negocio son abandonadas, impactando negativamente el crecimiento, la competividad y los ingresos.
La baja calidad de los datos es la razón principal por la que el 40% de las iniciativas de negocio son abandonadas, impactando negativamente el crecimiento, la competividad y los ingresos.
La baja calidad de los datos es la razón principal por la que el 40% de las iniciativas de negocio son abandonadas, impactando negativamente el crecimiento, la competividad y los ingresos.
La baja calidad de los datos es la razón principal por la que el 40% de las iniciativas de negocio son abandonadas, impactando negativamente el crecimiento, la competividad y los ingresos.
La baja calidad de los datos es la razón principal por la que el 40% de las iniciativas de negocio son abandonadas, impactando negativamente el crecimiento, la competividad y los ingresos.
La baja calidad de los datos es la razón principal por la que el 40% de las iniciativas de negocio son abandonadas, impactando negativamente el crecimiento, la competividad y los ingresos.
La baja calidad de los datos es la razón principal por la que el 40% de las iniciativas de negocio son abandonadas, impactando negativamente el crecimiento, la competividad y los ingresos.
La baja calidad de los datos es la razón principal por la que el 40% de las iniciativas de negocio son abandonadas, impactando negativamente el crecimiento, la competividad y los ingresos.
La baja calidad de los datos es la razón principal por la que el 40% de las iniciativas de negocio son abandonadas, impactando negativamente el crecimiento, la competividad y los ingresos.
La baja calidad de los datos es la razón principal por la que el 40% de las iniciativas de negocio son abandonadas, impactando negativamente el crecimiento, la competividad y los ingresos.
La baja calidad de los datos es la razón principal por la que el 40% de las iniciativas de negocio son abandonadas, impactando negativamente el crecimiento, la competividad y los ingresos.
La baja calidad de los datos es la razón principal por la que el 40% de las iniciativas de negocio son abandonadas, impactando negativamente el crecimiento, la competividad y los ingresos.
El sistema no lo obliga el usuario no lo completa
Ejemplo con encuestas
Atributos escritos de diferentes formas pero con un mismo significado
Archivos duplicados
Análisis manual, manipulación de datos
La demanda para obtener calidad en los datos se está incrementando y medir el impacto de esta calidad requiere mediciones cuantitativas y cualitativas. Normalmente el estudio cuantitativo está regulado por otras instancias –dependiendo del tamaño de la empresa-
El análisis cualitativo complejiza más el análisis exploratorio para determinar y mejorar la calidad; viene dado por la propiedad intelectual, los procesos de negocios y experiencias propias de los usuarios. EJEMPLO PICOS EN DATOS
La baja calidad de los datos es la razón principal por la que el 40% de las iniciativas de negocio son abandonadas, impactando negativamente el crecimiento, la competividad y los ingresos.
La baja calidad de los datos es la razón principal por la que el 40% de las iniciativas de negocio son abandonadas, impactando negativamente el crecimiento, la competividad y los ingresos.
La baja calidad de los datos es la razón principal por la que el 40% de las iniciativas de negocio son abandonadas, impactando negativamente el crecimiento, la competividad y los ingresos.