SlideShare una empresa de Scribd logo
1 de 60
Descargar para leer sin conexión
Minería de datos en salud:
Series temporales
Jairo cesar Alexander 2017
:
Técnicas cualitativas, cuantitativas, basadas en modelos
causales y mixtos
• El primero utiliza datos cualitativos como la opinión de los expertos, y puede o no tener en cuenta el pasado.
• El segundo, por el contrario, se centra exclusivamente en patrones y cambios de patrón, y por lo tanto se
basa enteramente en datos históricos.
• La tercera utiliza la información altamente refinada y específica acerca de las relaciones entre los elementos
del sistema, y es lo suficientemente potente como para tener eventos especiales formalmente en cuenta. Al
igual que con técnicas de análisis de series temporales y de proyección, el pasado es importante para los
modelos causales.
• Los modelos mixtos dan información cuantitativa a un grupo de expertos para sacar conclusiones validas.
Como trabajar con Series
temporales
Métodos cuantitativos
Trabajar con SOFTWARE
• JDemetra+ TRAMO-SEATS, X13-ARIMA (libre)
• GRETL (Libre)
• JOINT POINT (Libre)
• EXCEL (Comercial)
• GMDH SHELL DS (Comercial)
• MATLAB (Comercial)
• IBM SPSS . MODELER (Comercial)
• R (libre)
• WEKA - PENTAHO
https://surveillance.cancer.gov/joinpoint/ http://gretl.sourceforge.net/index.html
Series temporales: definición
Colección de observaciones
hecha en el tiempo
Tareas: de la minería de series temporales
• Caracterización y comparación temporal: ejem. Dos
departamentos tienen series de dengue muy similares
• Análisis clustering temporal: ejem cluster costa atlantica
cluster area amazoncia
• Clasificacion temporal: la sifilis congenital esta bien el el
centro, critica en la periferia, y acceptable en la region
costera.
• Reglas de asociación temporal: si la economia cae 3 puntos
y la produccion agricolase mantiene la desnutrición
aumentara 7%
• Analisis de patrones temporales, en carmen de bolivar se ha
detectado un anormal caso de eventos adeversos a la
vacunación que debe ser atendido.
• Analisis de prediccción y tendencias temporales: ejemplo de
continuar la tendencia no se cumplirarn las metas de
desnutrición en niños para los proximos 4 años.
• Detección de anomalias: inceremento en los casos de
hemophilia en Colombia.
Guangchen Ruan, Paul C. Hanson, Hilary A. Dugan, Beth Plale, Mining Lake Time Series using
Symbolic Representation, Ecological Informatics,
Etapas de los Modelo de series temporales
Formulación
de un
problema
Estudio del
Fenómeno
Parte
descriptiva
70%
Parte
pronostico
30%
Explicación
de supuestos
Presentación
de
escenarios
Generación de un modelo
De los fenómenos
• Es necesario la comprensión del fenómenos, definiciones
• Datos , recuentos, porcentajes, tasas, índices
• Causalidad, asociaciones, dependencias
• Estudios y modelos anteriores
• Registros históricos
Parte descriptiva
Suministra mucha
mas información
de la que se piensa
Análisis de series temporales
• Visualización
• Filtros, atípicos, ocultos, faltantes.
• Reducción de dimensiones
• Segmentación, clasificación, comparación, distancia euclídea coeficientes DFT
y los coeficientes DWT, Distancia “time warping, asociación, similitud,
diferencias sub secuencias de las series, General-Match, reglas, evolución,
interpolación, pronósticos.
EJEMPLOS algoritmos
• Support vector regression (SVR)
• algoritmo Gecko
• Neural clustering method
• fuzzy c -means (FCM)
• Autorregresivo de media móvil (ARMA , ARIMA)
• Modelos ocultos de Markov (HMM)
• El análisis de conglomerados
• descomposición wavelet
• clasificación del vecino más cercano
• árboles de decisión basados en DTW
• transformación simbólica
• candle stick charting
Ak-chung Fu, A review on time series data mining, Engineering Applications of Artificial Intelligence, Volume 24, Issue 1, February 2011, Pages 164-181,
Los nuevos: Aproximación simbólica
Convierte los datos a
palabras y utiliza
algoritmos de
procesamiento de
lenguaje natural para
descubrir y clasificar los
patrones
Guangchen Ruan, Paul C. Hanson, Hilary A. Dugan, Beth Plale, Mining Lake
Time Series using Symbolic Representation, Ecological Informatics,
Resumen de Representaciones
• Polinómicas - regresión interpolación
• Coeficientes
• Simbólica
• Arboles
• Wavelet
• Espectral - transformada de Fourier
Los datos y las fechas
La segmentación e
incompatibilidad de
los sistemas de
información puede
ser un problema
La depuración , de
datos errados
faltantes,
inconsistentes, y con
formatos
incompatibles
pueden tomar algún
tiempo, que hay que
tener en cuenta
Outlier
• Es una observacion que se
desvian mucho de las otras
observaciones y se cree generada
por mecanimos diferentes
• La mayoria de software
recomendado puede eliminar
este tipo de datos, pero eso
depende de los objetivos del
invetigador.
Valores missing faltantes u ocultos
• El software puede detectar y
tratar este problemas con varios
métodos como la interpolación
Integración de base de datos
y formatos
Mayores capacidades
Los modelos generados deben ser pensados en producción desde el comienzo
Y también en integración para superar los problemas de segmentación de los sistemas
de información
Manejo de os formatos y estandares
Es necesario el manejo
adecuado de los formato
(estándar) en este caso la fecha
en GRETL
DATOS INGRESO DE INFORMACIÓN
http://www.ins.gov.co/lineas-de-
accion/Subdireccion-
Vigilancia/sivigila/Paginas/vigilancia-
rutinaria.aspx
FORMATO DE ARCHIVO PDF !
INS Es necesario que lo sistemas
de información suministren
información de forma útil, y
no solo para cumplir la
norma
Adquisición de información
La información
pueden venir de
base de datos, ejem
PENTAHO- Base de
datos, o KNIME, en
MYSQL.
En la imagen
integración de varios
archivos de
indicadores de salud
(INS) de Excel en
ACCESS
Un ejemplo de consulta SQL de
un conjunto de tablas de
EXCEL en ACCES (Indicadores
de salud pública)
Ejemplo de graficas y la exploración inicial
Aquí se ve el
comportamie
nto de la
varicela en
Colombia,
nota/ la
varicela tiene
vacuna
efectiva.
Registro
histórico con
proyección a
2018
Los filtros
Filtro media móvil
exponencial
Filtro tendencia polinómicaFiltro Hodrick -Prescott
Serie varicela 2012- 2016 (recuento)
Los filtros :
PERMITEN:
Mirar la tendencia
Estacionalidad,
componente aleatorio
Consideraciones sobre la Exploracion de series
de tiempo
• Algunos fenómenos son tan
complejos que es necesario
tener en cuenta ciertas cosas
sobre como se clasifican, los
fenómenos aleatorios, la teoría
del caos, la causalidad y el
manejos de escalas para tener en
cuenta en los modelos
Consideraciones
• - tipo de fenómeno
• - el azar, la mala suerte o la buena suerte
• - la causalidad
• - la teoría del caos
• - la ley de los grandes números y las escalas
-Tipos de FENÓMENOS de acuerdo a su
complejidad
ADRIANA ELISA ESPINOSA CONTRERAS “EL CAOS Y LA CARACTERIZACIÓN DE SERIES DE TIEMPO A TRAVÉS DE TÉCNICAS DE LA DINÁMICA NO-LINEAL” UNIVERSIDAD NACIONAL AUTÓNOMA
DE MÉXICO. MÉXICO, D.F. 2004
Todos los fenómenos
no son tan
predecibles como
una Varicela,
algunos rayan en lo
aleatorio y parecen
o se asemejan a
series económicas
En la figura se
pueden ver
diferentes tipos de
fenómenos
-Consideraciones sobre los FENÓMENOS
ADRIANA ELISA ESPINOSA CONTRERAS “EL CAOS Y LA CARACTERIZACIÓN DE SERIES DE TIEMPO A
TRAVÉS DE TÉCNICAS DE LA DINÁMICA NO-LINEAL” UNIVERSIDAD NACIONAL AUTÓNOMA
DE MÉXICO. MÉXICO, D.F. 2004
Se puede ver que
algunos fenómenos son
muy deterministas, otros
imposibles de predecir
(aleatoriedad) con la
ciencia actual , y otros
están en el limite de lo
predecible y tienen un
comportamiento
matemáticamente
extraño.
-Del demonio de Laplace a la física cuántica :
determinismo vs indeterminismo
Aleatoriedad
Concepto central dentro de la teoría de probabilidades y en los
estudios del comportamiento cuya definición descansa en la
suposición de que todo suceso tiene una causa, nada es azaroso.
La noción de aleatoriedad aparece asociada al espacio generado
por el desconocimiento humano (parcial o total) de tales causas.
Así, la "aleatoriedad significa que no hay una ley conocida, capaz
de ser expresada en un lenguaje coherente, que describa o
explique los eventos y sus resultados" (Kerlinger, 1994, p.126).
Demonio del mercurio alquímico, en el
libro “Della trasmutatione metallica”,
Giovani Battista Nazario, Brescia, 1589.
-Mis indicadores obedecen solo a variables conocidas a Efecto azar (purísima suerte!) a
variables desconocidas o fenómenos complejos?
-La causalidad
Según la indagación, "hasta
el momento tenemos
evidencia de que ningún
factor técnico influyó en el
accidente, todo está
involucrado en un factor
humano y gerencial".
-Hay que tener en cuenta la Teoría del caos
-Puede un discurso de donald trump en
Washington afectar gravemente la salud de
un niño en la guajira?
-consideraciones
• El azar, la suerte, o el libre albedrio es importante?
• Como estimarlos? Existen??
• Basta con cambiar la escala temporal? , o usar proporciones?
• Bata con usar filtros ?
• Toca usar índices de aletoriedad, dimesiones, fractalidad, etc..?
• Que pasa con la predicción si el fenómeno es complejo y el azar cambia los condiciones iniciales del
fenómeno?
• Los diferencia entre lo pronosticado y lo real se debe al azar, a los factores asociados o a ambos y en que
grado?
• Mi predicción o mis acciones puede alterar el futuro?
-Ley de los grandes números (aplicada)
• En la teoría de la probabilidad, bajo el término genérico de ley de los grandes
números se engloban varios teoremas que describen el comportamiento del
promedio de una sucesión de variables aleatorias conforme aumenta su número de
ensayos.
• Estos teoremas prescriben condiciones suficientes para garantizar que dicho
promedio converge al promedio de las esperanzas de las variables aleatorias
involucradas. Ejemplo la difusión de un gas es azarosa a pequeña escala pero
determinística a gran escala.
-AUMENTAR LA Escala en el tiempo
• Aumentar la escala de tiempo permite
filtrar el componente aleatorio que se
anula a si mismo y permite ver otros
elementos de la serie temporal, como
la tendencia, la estacionalidad, y los
ciclos.
• Disminuir la escala aumenta el
efecto visible del componente
suerte.
• Inconvenientes?
Por día
Por semana
Por mes
Por trimestre
Por semestre
Por año
Por 4 años
-Aumentar La escala en el evento
• Tasas x 1000 x 10 000 x 1 000 000 ….
• Proporciones
• Índices
• Funciones
• Inconvenientes
Usar denominadores puede filtrar algunos componentes aleatorios
y otros componentes como el crecimiento de la población, mortalidad
Etc.
-fractales
Algunos
fenómenos son
independientes
de escala !!!
Volviendo Al modelo y la minería
hay que Seleccionar un modelo
otras consideraciones ….
• En un modelo determinístico se pueden controlar los factores que intervienen en el estudio del
proceso o fenómeno y por tanto se pueden predecir con exactitud sus resultados.
• En un modelo estocástico no es posible controlar los factores que intervienen en el estudio del
fenómeno y en consecuencia no produce simples resultados únicos. Cada uno de los resultados
posibles se genera con una función de probabilidad que le adjudica una probabilidad a cada uno
de éstos,
Ejemplo: un modelo para predecir el tamaño de una epidemia en una población de N individuos. Para el caso
determinístico se proporciona un valor único, C, mientras que el modelo estocástico permite la posibilidad de obtener
desde cero hasta N individuos y se adjudica una cierta probabilidad a cada uno de estos sucesos. La diferencia es más
grande de lo que parece, ya que en un modelo matemático determinístico en el contexto epidemiológico; un solo sujeto
causa una epidemia generalizada, mientras que bajo un modelo estocástico existe la posibilidad de que la epidemia se
extinga
Cual es la relación de los modelos, la teoría del
caos, y la utilidad practica.
• Aun dentro de los procesos deterministas, también se da el azar en la dinámica de sistemas complejos impredecibles,
también conocidos como sistemas caóticos.
• Hasta el advenimiento de la teoría del caos, se creía que todos los sistemas deterministas eran necesariamente predecibles y,
por tanto, no azarosos.
• Sin embargo, el caos determinista se refiere a un tipo de situación de sistemas físicos que a pesar de ser deterministas y
presentan cierta predictibilidad estadística general, resultan impredecibles en sus detalles o a pequeña escala.
• En estos casos la descripción mediante modelos matemáticos deterministas que reproducen todos los detalles, se vuelve
inviable (o especial) y para describirlos o tratarlos se suele trabajar con descripciones estadísticas de conjuntos de grandes
cantidades de elementos, cada uno de ellos impredecible de manera individual pero no así globalmente
• Las propiedades especiales de los sistemas caóticos incluyen cosas como sensibilidad a las condiciones iniciales ,
emergencia, adaptación, interdependencia, y dificultad para predicción en largo plazo, o de manera individual.
Elaboración automática del modelo de serie
temporal
• La mayoría de software de alta calidad tiene funciones automatizadas para seleccionar el mejor modelo
según nuestras necesidades y datos
• En el caso de las series temporales JDEMETRA (software libre) o IBM SPSS MODELER y GMDH
SHELL (software comercial) ofrecen herramientas muy sofisticadas para elaboración automática de
modelos.
• Los modelos luego pueden exportarse a medios de producción
Los Modelos en r
son mas manuales, aunque existen muchos paquetes de automatización
• Pronostico del autor generado
con un modelo
HOLTWINTERS en R para la
serie de bajo peso al nacer en
Colombia con datos semanales
Selección automática del modelo ejemplo
Este es el modelizador
experto automático
de SPSS 20,0
Modelos automáticos en SPSS
Modelos automáticos en JDEMETRA+
Hay que tener en cuenta en la Elaboración del
modelo para serie temporal
• Información de buena calidad produce resultados de buena calidad
• Datos de pésima calidad, generalmente producen malos resultados
independiente de lo sofisticado de los algoritmos o software usado
• La elaboración de modelos temporales como por ejemplo los ARIMA puede
tomar algún tiempo , por eso puede ser recomendable iniciar con un proceso
automático en MODELER GMDH SHELL Y JDEMETRA que presentan
resultados bastante buenos .
Medidas de bondad de ajuste: (se usan para saber
que tan bueno es el modelo)
• R cuadrado estacionaria, R cuadrado (R2), raíz del error cuadrático
promedio (RMSE), error absoluto promedio (MAE), error absoluto
porcentual promedio (MAPE), error absoluto máximo (MaxAE), error
absoluto máximo porcentual (MaxAPE) y criterio de información bayesiano
(BIC) normalizado
Ejemplo DE SERIE DE TIEMPO bajo peso
al nacer
Bajo peso al nacer vs Semana Epidemiológica
Bajo peso al nacer
mapa de recurrencia
El grado de
aleatoriedad
puede estimarse
con un mapa de
recurrencia
en este caso en
MATLAB
Mapa de recurrencia
Aquí se puede
ver
Un fenómeno
desde
completamente
Azaroso (puntos)
hasta
Determinista (las
líneas)
Filtros - Curve fiting tool
General model Sin3:
f(x) =
a1*sin(b1*x+c1) + a2*sin(b2*x+c2) +
a3*sin(b3*x+c3)
where x is normalized by mean 26.58 and std
14.47
Coefficients (with 95% confidence bounds):
a1 = 2162 (1718, 2606)
b1 = 0.3811 (-0.2769, 1.039)
c1 = 1.541 (1.002, 2.079)
a2 = 6529 (-1.161e+07, 1.162e+07)
b2 = 2.792 (-42.63, 48.21)
c2 = 0.3984 (-41.46, 42.26)
a3 = 6569 (-1.161e+07, 1.162e+07)
b3 = 2.843 (-41.07, 46.75)
c3 = -2.698 (-41.6, 36.2)
Goodness of fit:
SSE: 3.479e+06
R-square: 0.9146
Adjusted R-square: 0.9118
RMSE: 121.4
Los filtros pueden
mostrar patrones no
visibles interesantes..
LOS CAMBIOS DE ESCALA PARA CONTRARESTAR AL AZAR
Función previsión
Suaviza cimiento
exponencial AAA
En Excel
Función
agregar
elemento
grafico
líneas de
tendencia
con
proyección
en Excel
Estadística Valor
Alpha 0.50
Beta 0.00
Gamma 0.50
MASE 1.20
SMAPE 0.08
MAE 23.68
RMSE 33.10
ESTE ES UN EJEMPLO DE TEST DE BONDAD DE AJUSTE EN EXCEL
EJEMPLO BAJO PESO AL NACER
• El análisis de las series temporales pude determinar que regiones
departamentos y municipios están presentado mas el fenómeno, y si alguna
política esta impactando en la región
• La información estaría disponible no solo para el tomador de decisión sino
también para la opinión publica, el medico y el usuario.
CONSIDERACIONES FINALES
DIMENSIONES:
CIRCULO O CUADRADO (2d)?
Hay que pensar
Siempre desde varias
Perspectivas
El trabajo en quipo
Multidiciplinario es
Recomendable,
Los dx poblaciones
Son de equipo
PATRONES :UNA CARA EN MARTE?
Crédito NASA
ASOCIACIONES – CAUSALIDAD - AZAR
Tyler Viglen - Spurious Correlations website
https://commons.wikimedia.org/w/index.php?curid=48043945
http://www.nature.com/nature/journal/v529/n7584/full/nature16166.html
http://science.sciencemag.org/content/347/6217/78
SIEMPRE INTERPRETAR
•“La mejor manera de predecir el
futuro es crearlo” (“The best way
to predict the future is to create
it”).
Dennis Gabor Nobel de Física en Inventando el futuro 1963
fin
• Puede usar esta presentación pero da algo de crédito al autor

Más contenido relacionado

La actualidad más candente

Técnicas de evaluación de riesgos ii prueba (3)
Técnicas de evaluación de riesgos ii prueba (3)Técnicas de evaluación de riesgos ii prueba (3)
Técnicas de evaluación de riesgos ii prueba (3)daniel4119
 
Tamaño optimo de la muestra
Tamaño optimo de la muestraTamaño optimo de la muestra
Tamaño optimo de la muestraanthonymaule
 
Mapa Conceptual Capitulo 4
Mapa Conceptual Capitulo 4Mapa Conceptual Capitulo 4
Mapa Conceptual Capitulo 4guestd95f8ee
 
Muestreo Estadístico. Presentación diseñada por el MTRO. JAVIER SOLIS NOYOLA
Muestreo Estadístico. Presentación diseñada por el MTRO. JAVIER SOLIS NOYOLAMuestreo Estadístico. Presentación diseñada por el MTRO. JAVIER SOLIS NOYOLA
Muestreo Estadístico. Presentación diseñada por el MTRO. JAVIER SOLIS NOYOLAJAVIER SOLIS NOYOLA
 
Presentación - Simulación
Presentación - SimulaciónPresentación - Simulación
Presentación - Simulaciónricardooberto
 
Población y Muestra
Población y MuestraPoblación y Muestra
Población y Muestrauci2c
 
CAP1 INVESTIGACIÓN EDUCATIVA
CAP1 INVESTIGACIÓN EDUCATIVACAP1 INVESTIGACIÓN EDUCATIVA
CAP1 INVESTIGACIÓN EDUCATIVAChise Blood
 
Métodos de Recolección y organización de Datos (MROD)
Métodos de Recolección y organización de Datos (MROD)Métodos de Recolección y organización de Datos (MROD)
Métodos de Recolección y organización de Datos (MROD)Euclides López
 
Ensayo de estadística inferencial
Ensayo de estadística inferencialEnsayo de estadística inferencial
Ensayo de estadística inferencialthomas669
 
Presentación unidad II
Presentación unidad IIPresentación unidad II
Presentación unidad IIBASEK
 
Unidad 1. determinación del tipo de distribución que presenta un proceso esto...
Unidad 1. determinación del tipo de distribución que presenta un proceso esto...Unidad 1. determinación del tipo de distribución que presenta un proceso esto...
Unidad 1. determinación del tipo de distribución que presenta un proceso esto...PEDRO LARA MALDONADO
 
Muestreo Estadistico
Muestreo EstadisticoMuestreo Estadistico
Muestreo Estadisticowendylinarez
 
Documento técnico 64 conceptos generales
Documento técnico 64   conceptos generalesDocumento técnico 64   conceptos generales
Documento técnico 64 conceptos generalesauditormilano
 

La actualidad más candente (20)

Tamaño muestra
Tamaño muestraTamaño muestra
Tamaño muestra
 
Técnicas de evaluación de riesgos ii prueba (3)
Técnicas de evaluación de riesgos ii prueba (3)Técnicas de evaluación de riesgos ii prueba (3)
Técnicas de evaluación de riesgos ii prueba (3)
 
Tamaño optimo de la muestra
Tamaño optimo de la muestraTamaño optimo de la muestra
Tamaño optimo de la muestra
 
Mapa Conceptual Capitulo 4
Mapa Conceptual Capitulo 4Mapa Conceptual Capitulo 4
Mapa Conceptual Capitulo 4
 
Muestreo Estadístico. Presentación diseñada por el MTRO. JAVIER SOLIS NOYOLA
Muestreo Estadístico. Presentación diseñada por el MTRO. JAVIER SOLIS NOYOLAMuestreo Estadístico. Presentación diseñada por el MTRO. JAVIER SOLIS NOYOLA
Muestreo Estadístico. Presentación diseñada por el MTRO. JAVIER SOLIS NOYOLA
 
Tamaño de muestra
Tamaño de muestraTamaño de muestra
Tamaño de muestra
 
Selección de muestra
Selección de muestraSelección de muestra
Selección de muestra
 
El muestreo desde un enfoque cuantitativo
El muestreo desde un enfoque cuantitativoEl muestreo desde un enfoque cuantitativo
El muestreo desde un enfoque cuantitativo
 
Presentación - Simulación
Presentación - SimulaciónPresentación - Simulación
Presentación - Simulación
 
Población y Muestra
Población y MuestraPoblación y Muestra
Población y Muestra
 
Tamaño de Muestra
Tamaño de MuestraTamaño de Muestra
Tamaño de Muestra
 
CAP1 INVESTIGACIÓN EDUCATIVA
CAP1 INVESTIGACIÓN EDUCATIVACAP1 INVESTIGACIÓN EDUCATIVA
CAP1 INVESTIGACIÓN EDUCATIVA
 
Analisis de muestreo
Analisis de muestreoAnalisis de muestreo
Analisis de muestreo
 
Métodos de Recolección y organización de Datos (MROD)
Métodos de Recolección y organización de Datos (MROD)Métodos de Recolección y organización de Datos (MROD)
Métodos de Recolección y organización de Datos (MROD)
 
Ensayo de estadística inferencial
Ensayo de estadística inferencialEnsayo de estadística inferencial
Ensayo de estadística inferencial
 
Poblaciones y muestras 8
Poblaciones y muestras 8Poblaciones y muestras 8
Poblaciones y muestras 8
 
Presentación unidad II
Presentación unidad IIPresentación unidad II
Presentación unidad II
 
Unidad 1. determinación del tipo de distribución que presenta un proceso esto...
Unidad 1. determinación del tipo de distribución que presenta un proceso esto...Unidad 1. determinación del tipo de distribución que presenta un proceso esto...
Unidad 1. determinación del tipo de distribución que presenta un proceso esto...
 
Muestreo Estadistico
Muestreo EstadisticoMuestreo Estadistico
Muestreo Estadistico
 
Documento técnico 64 conceptos generales
Documento técnico 64   conceptos generalesDocumento técnico 64   conceptos generales
Documento técnico 64 conceptos generales
 

Similar a Minería de datos en salud: Series temporales

Mineria de datos en salud - Introducción -
Mineria de datos en salud   - Introducción -Mineria de datos en salud   - Introducción -
Mineria de datos en salud - Introducción -jairo cesar
 
Las 7 herramientas basicas de la calidad
Las 7 herramientas basicas de la calidadLas 7 herramientas basicas de la calidad
Las 7 herramientas basicas de la calidadjulian52
 
Retos en los fundamentos de Data Science
Retos en los fundamentos de Data ScienceRetos en los fundamentos de Data Science
Retos en los fundamentos de Data ScienceJoaquín Borrego-Díaz
 
Estadística fernando codigo 11 9c
Estadística fernando codigo 11 9cEstadística fernando codigo 11 9c
Estadística fernando codigo 11 9cFernando Niño
 
Tecnicas Investigacion Social
Tecnicas Investigacion SocialTecnicas Investigacion Social
Tecnicas Investigacion SocialDiana Calcerrada
 
Contenido estadistica descriptiva
Contenido estadistica descriptivaContenido estadistica descriptiva
Contenido estadistica descriptivawacner galindez
 
Herramientas control estadistico
Herramientas control estadisticoHerramientas control estadistico
Herramientas control estadisticoLaura Bernal
 
1_principios básicos del diseño de experimentos (2).pptx
1_principios básicos del diseño de experimentos (2).pptx1_principios básicos del diseño de experimentos (2).pptx
1_principios básicos del diseño de experimentos (2).pptxHaroldOyarvide
 
Capítulo 13, muestreo investigación cualitativa
Capítulo 13, muestreo investigación cualitativaCapítulo 13, muestreo investigación cualitativa
Capítulo 13, muestreo investigación cualitativaBrandownTorresCastro
 
Niveles de investigacion
Niveles de investigacionNiveles de investigacion
Niveles de investigacionJosé Supo
 
Presentación clases fcc.pptx
Presentación clases fcc.pptxPresentación clases fcc.pptx
Presentación clases fcc.pptxMiguelon991
 

Similar a Minería de datos en salud: Series temporales (20)

Mineria de datos en salud - Introducción -
Mineria de datos en salud   - Introducción -Mineria de datos en salud   - Introducción -
Mineria de datos en salud - Introducción -
 
Pronósticos
PronósticosPronósticos
Pronósticos
 
Las 7 herramientas basicas de la calidad
Las 7 herramientas basicas de la calidadLas 7 herramientas basicas de la calidad
Las 7 herramientas basicas de la calidad
 
Retos en los fundamentos de Data Science
Retos en los fundamentos de Data ScienceRetos en los fundamentos de Data Science
Retos en los fundamentos de Data Science
 
Simulacion
SimulacionSimulacion
Simulacion
 
Estadística fernando codigo 11 9c
Estadística fernando codigo 11 9cEstadística fernando codigo 11 9c
Estadística fernando codigo 11 9c
 
Media aritm crvc
Media aritm crvcMedia aritm crvc
Media aritm crvc
 
Exposicion (1)
Exposicion (1)Exposicion (1)
Exposicion (1)
 
Tecnicas Investigacion Social
Tecnicas Investigacion SocialTecnicas Investigacion Social
Tecnicas Investigacion Social
 
Caly prod lic 4a_u04
Caly prod lic 4a_u04Caly prod lic 4a_u04
Caly prod lic 4a_u04
 
Estadistica espacial-y-temporal
Estadistica espacial-y-temporalEstadistica espacial-y-temporal
Estadistica espacial-y-temporal
 
Contenido estadistica descriptiva
Contenido estadistica descriptivaContenido estadistica descriptiva
Contenido estadistica descriptiva
 
Herramientas control estadistico
Herramientas control estadisticoHerramientas control estadistico
Herramientas control estadistico
 
1_principios básicos del diseño de experimentos (2).pptx
1_principios básicos del diseño de experimentos (2).pptx1_principios básicos del diseño de experimentos (2).pptx
1_principios básicos del diseño de experimentos (2).pptx
 
Capítulo 13, muestreo investigación cualitativa
Capítulo 13, muestreo investigación cualitativaCapítulo 13, muestreo investigación cualitativa
Capítulo 13, muestreo investigación cualitativa
 
Niveles de investigacion
Niveles de investigacionNiveles de investigacion
Niveles de investigacion
 
Teoria del error
Teoria del errorTeoria del error
Teoria del error
 
Presentación clases fcc.pptx
Presentación clases fcc.pptxPresentación clases fcc.pptx
Presentación clases fcc.pptx
 
Survival grupo r_def
Survival grupo r_defSurvival grupo r_def
Survival grupo r_def
 
Survival grupo r_def
Survival grupo r_defSurvival grupo r_def
Survival grupo r_def
 

Más de jairo cesar

Holtwinters en r por jairo cesar alexander
Holtwinters en r por jairo cesar alexanderHoltwinters en r por jairo cesar alexander
Holtwinters en r por jairo cesar alexanderjairo cesar
 
Arima por jairo cesar alexander
Arima por jairo cesar alexanderArima por jairo cesar alexander
Arima por jairo cesar alexanderjairo cesar
 
Trabajo de grado
Trabajo de grado Trabajo de grado
Trabajo de grado jairo cesar
 
Videos destacados JAIRO CESAR ALEXANDER
Videos destacados JAIRO CESAR ALEXANDERVideos destacados JAIRO CESAR ALEXANDER
Videos destacados JAIRO CESAR ALEXANDERjairo cesar
 
Software investigación cualitativa
Software investigación cualitativaSoftware investigación cualitativa
Software investigación cualitativajairo cesar
 
Modelos explicativos de la salud y la enfermedad
Modelos explicativos de la salud y la enfermedadModelos explicativos de la salud y la enfermedad
Modelos explicativos de la salud y la enfermedadjairo cesar
 
Determinantes salud canada
Determinantes salud canadaDeterminantes salud canada
Determinantes salud canadajairo cesar
 
Felicidad en colombia
Felicidad en colombiaFelicidad en colombia
Felicidad en colombiajairo cesar
 

Más de jairo cesar (9)

Holtwinters en r por jairo cesar alexander
Holtwinters en r por jairo cesar alexanderHoltwinters en r por jairo cesar alexander
Holtwinters en r por jairo cesar alexander
 
Arima por jairo cesar alexander
Arima por jairo cesar alexanderArima por jairo cesar alexander
Arima por jairo cesar alexander
 
Leishmaniasis
Leishmaniasis Leishmaniasis
Leishmaniasis
 
Trabajo de grado
Trabajo de grado Trabajo de grado
Trabajo de grado
 
Videos destacados JAIRO CESAR ALEXANDER
Videos destacados JAIRO CESAR ALEXANDERVideos destacados JAIRO CESAR ALEXANDER
Videos destacados JAIRO CESAR ALEXANDER
 
Software investigación cualitativa
Software investigación cualitativaSoftware investigación cualitativa
Software investigación cualitativa
 
Modelos explicativos de la salud y la enfermedad
Modelos explicativos de la salud y la enfermedadModelos explicativos de la salud y la enfermedad
Modelos explicativos de la salud y la enfermedad
 
Determinantes salud canada
Determinantes salud canadaDeterminantes salud canada
Determinantes salud canada
 
Felicidad en colombia
Felicidad en colombiaFelicidad en colombia
Felicidad en colombia
 

Último

CAPACITACIÓN VIGIA EN SEGURIDAD Y SALUD EN EL TRABAJO.ppt
CAPACITACIÓN VIGIA EN SEGURIDAD Y SALUD EN EL TRABAJO.pptCAPACITACIÓN VIGIA EN SEGURIDAD Y SALUD EN EL TRABAJO.ppt
CAPACITACIÓN VIGIA EN SEGURIDAD Y SALUD EN EL TRABAJO.pptSandraCardenas92
 
Sesión - Vacunación del Adulto (Revisión tema).pdf
Sesión - Vacunación del Adulto (Revisión tema).pdfSesión - Vacunación del Adulto (Revisión tema).pdf
Sesión - Vacunación del Adulto (Revisión tema).pdfLas Sesiones de San Blas
 
PROYECTO 3 4 5 AÑOS del nivel inicial
PROYECTO    3 4 5 AÑOS del nivel inicialPROYECTO    3 4 5 AÑOS del nivel inicial
PROYECTO 3 4 5 AÑOS del nivel inicialArtemisaReateguiCaro
 
Indicaciones y contraindicaciones de la sonda vesical y sonda nasogastrica.pptx
Indicaciones y contraindicaciones de la sonda vesical y sonda nasogastrica.pptxIndicaciones y contraindicaciones de la sonda vesical y sonda nasogastrica.pptx
Indicaciones y contraindicaciones de la sonda vesical y sonda nasogastrica.pptx Estefa RM9
 
SISTEMA DE CLORACIÓN - PARA SISTEMA DE AGUA POTABLE VIVIENDA.pptx
SISTEMA DE CLORACIÓN - PARA SISTEMA DE AGUA POTABLE VIVIENDA.pptxSISTEMA DE CLORACIÓN - PARA SISTEMA DE AGUA POTABLE VIVIENDA.pptx
SISTEMA DE CLORACIÓN - PARA SISTEMA DE AGUA POTABLE VIVIENDA.pptxGenaroElmerSifuentes6
 
IVU-PIELO-SEPSIS listo.pptxLos problemas de salud más comunes en los bebés in...
IVU-PIELO-SEPSIS listo.pptxLos problemas de salud más comunes en los bebés in...IVU-PIELO-SEPSIS listo.pptxLos problemas de salud más comunes en los bebés in...
IVU-PIELO-SEPSIS listo.pptxLos problemas de salud más comunes en los bebés in...MarcoFlores940553
 
PAI Hemofilia hereditaria en los servicios de salud
PAI Hemofilia hereditaria en los servicios de saludPAI Hemofilia hereditaria en los servicios de salud
PAI Hemofilia hereditaria en los servicios de saludLupisPerez1
 
IMPORTANCIA D ELAS VACUNAS EN LA POBLACION
IMPORTANCIA D ELAS VACUNAS EN LA POBLACIONIMPORTANCIA D ELAS VACUNAS EN LA POBLACION
IMPORTANCIA D ELAS VACUNAS EN LA POBLACIONDanielaSantos100046
 
PARASITOSIS INTESTINAL en Pediatría, Enfermería y Familiar II
PARASITOSIS INTESTINAL en Pediatría, Enfermería y Familiar IIPARASITOSIS INTESTINAL en Pediatría, Enfermería y Familiar II
PARASITOSIS INTESTINAL en Pediatría, Enfermería y Familiar IIgeraldinagutierrez81
 

Último (9)

CAPACITACIÓN VIGIA EN SEGURIDAD Y SALUD EN EL TRABAJO.ppt
CAPACITACIÓN VIGIA EN SEGURIDAD Y SALUD EN EL TRABAJO.pptCAPACITACIÓN VIGIA EN SEGURIDAD Y SALUD EN EL TRABAJO.ppt
CAPACITACIÓN VIGIA EN SEGURIDAD Y SALUD EN EL TRABAJO.ppt
 
Sesión - Vacunación del Adulto (Revisión tema).pdf
Sesión - Vacunación del Adulto (Revisión tema).pdfSesión - Vacunación del Adulto (Revisión tema).pdf
Sesión - Vacunación del Adulto (Revisión tema).pdf
 
PROYECTO 3 4 5 AÑOS del nivel inicial
PROYECTO    3 4 5 AÑOS del nivel inicialPROYECTO    3 4 5 AÑOS del nivel inicial
PROYECTO 3 4 5 AÑOS del nivel inicial
 
Indicaciones y contraindicaciones de la sonda vesical y sonda nasogastrica.pptx
Indicaciones y contraindicaciones de la sonda vesical y sonda nasogastrica.pptxIndicaciones y contraindicaciones de la sonda vesical y sonda nasogastrica.pptx
Indicaciones y contraindicaciones de la sonda vesical y sonda nasogastrica.pptx
 
SISTEMA DE CLORACIÓN - PARA SISTEMA DE AGUA POTABLE VIVIENDA.pptx
SISTEMA DE CLORACIÓN - PARA SISTEMA DE AGUA POTABLE VIVIENDA.pptxSISTEMA DE CLORACIÓN - PARA SISTEMA DE AGUA POTABLE VIVIENDA.pptx
SISTEMA DE CLORACIÓN - PARA SISTEMA DE AGUA POTABLE VIVIENDA.pptx
 
IVU-PIELO-SEPSIS listo.pptxLos problemas de salud más comunes en los bebés in...
IVU-PIELO-SEPSIS listo.pptxLos problemas de salud más comunes en los bebés in...IVU-PIELO-SEPSIS listo.pptxLos problemas de salud más comunes en los bebés in...
IVU-PIELO-SEPSIS listo.pptxLos problemas de salud más comunes en los bebés in...
 
PAI Hemofilia hereditaria en los servicios de salud
PAI Hemofilia hereditaria en los servicios de saludPAI Hemofilia hereditaria en los servicios de salud
PAI Hemofilia hereditaria en los servicios de salud
 
IMPORTANCIA D ELAS VACUNAS EN LA POBLACION
IMPORTANCIA D ELAS VACUNAS EN LA POBLACIONIMPORTANCIA D ELAS VACUNAS EN LA POBLACION
IMPORTANCIA D ELAS VACUNAS EN LA POBLACION
 
PARASITOSIS INTESTINAL en Pediatría, Enfermería y Familiar II
PARASITOSIS INTESTINAL en Pediatría, Enfermería y Familiar IIPARASITOSIS INTESTINAL en Pediatría, Enfermería y Familiar II
PARASITOSIS INTESTINAL en Pediatría, Enfermería y Familiar II
 

Minería de datos en salud: Series temporales

  • 1. Minería de datos en salud: Series temporales Jairo cesar Alexander 2017
  • 2. : Técnicas cualitativas, cuantitativas, basadas en modelos causales y mixtos • El primero utiliza datos cualitativos como la opinión de los expertos, y puede o no tener en cuenta el pasado. • El segundo, por el contrario, se centra exclusivamente en patrones y cambios de patrón, y por lo tanto se basa enteramente en datos históricos. • La tercera utiliza la información altamente refinada y específica acerca de las relaciones entre los elementos del sistema, y es lo suficientemente potente como para tener eventos especiales formalmente en cuenta. Al igual que con técnicas de análisis de series temporales y de proyección, el pasado es importante para los modelos causales. • Los modelos mixtos dan información cuantitativa a un grupo de expertos para sacar conclusiones validas.
  • 3. Como trabajar con Series temporales Métodos cuantitativos
  • 4. Trabajar con SOFTWARE • JDemetra+ TRAMO-SEATS, X13-ARIMA (libre) • GRETL (Libre) • JOINT POINT (Libre) • EXCEL (Comercial) • GMDH SHELL DS (Comercial) • MATLAB (Comercial) • IBM SPSS . MODELER (Comercial) • R (libre) • WEKA - PENTAHO https://surveillance.cancer.gov/joinpoint/ http://gretl.sourceforge.net/index.html
  • 5. Series temporales: definición Colección de observaciones hecha en el tiempo
  • 6. Tareas: de la minería de series temporales • Caracterización y comparación temporal: ejem. Dos departamentos tienen series de dengue muy similares • Análisis clustering temporal: ejem cluster costa atlantica cluster area amazoncia • Clasificacion temporal: la sifilis congenital esta bien el el centro, critica en la periferia, y acceptable en la region costera. • Reglas de asociación temporal: si la economia cae 3 puntos y la produccion agricolase mantiene la desnutrición aumentara 7% • Analisis de patrones temporales, en carmen de bolivar se ha detectado un anormal caso de eventos adeversos a la vacunación que debe ser atendido. • Analisis de prediccción y tendencias temporales: ejemplo de continuar la tendencia no se cumplirarn las metas de desnutrición en niños para los proximos 4 años. • Detección de anomalias: inceremento en los casos de hemophilia en Colombia. Guangchen Ruan, Paul C. Hanson, Hilary A. Dugan, Beth Plale, Mining Lake Time Series using Symbolic Representation, Ecological Informatics,
  • 7. Etapas de los Modelo de series temporales Formulación de un problema Estudio del Fenómeno Parte descriptiva 70% Parte pronostico 30% Explicación de supuestos Presentación de escenarios Generación de un modelo
  • 8. De los fenómenos • Es necesario la comprensión del fenómenos, definiciones • Datos , recuentos, porcentajes, tasas, índices • Causalidad, asociaciones, dependencias • Estudios y modelos anteriores • Registros históricos
  • 9. Parte descriptiva Suministra mucha mas información de la que se piensa
  • 10. Análisis de series temporales • Visualización • Filtros, atípicos, ocultos, faltantes. • Reducción de dimensiones • Segmentación, clasificación, comparación, distancia euclídea coeficientes DFT y los coeficientes DWT, Distancia “time warping, asociación, similitud, diferencias sub secuencias de las series, General-Match, reglas, evolución, interpolación, pronósticos.
  • 11. EJEMPLOS algoritmos • Support vector regression (SVR) • algoritmo Gecko • Neural clustering method • fuzzy c -means (FCM) • Autorregresivo de media móvil (ARMA , ARIMA) • Modelos ocultos de Markov (HMM) • El análisis de conglomerados • descomposición wavelet • clasificación del vecino más cercano • árboles de decisión basados en DTW • transformación simbólica • candle stick charting Ak-chung Fu, A review on time series data mining, Engineering Applications of Artificial Intelligence, Volume 24, Issue 1, February 2011, Pages 164-181,
  • 12. Los nuevos: Aproximación simbólica Convierte los datos a palabras y utiliza algoritmos de procesamiento de lenguaje natural para descubrir y clasificar los patrones Guangchen Ruan, Paul C. Hanson, Hilary A. Dugan, Beth Plale, Mining Lake Time Series using Symbolic Representation, Ecological Informatics,
  • 13. Resumen de Representaciones • Polinómicas - regresión interpolación • Coeficientes • Simbólica • Arboles • Wavelet • Espectral - transformada de Fourier
  • 14. Los datos y las fechas La segmentación e incompatibilidad de los sistemas de información puede ser un problema La depuración , de datos errados faltantes, inconsistentes, y con formatos incompatibles pueden tomar algún tiempo, que hay que tener en cuenta
  • 15. Outlier • Es una observacion que se desvian mucho de las otras observaciones y se cree generada por mecanimos diferentes • La mayoria de software recomendado puede eliminar este tipo de datos, pero eso depende de los objetivos del invetigador.
  • 16. Valores missing faltantes u ocultos • El software puede detectar y tratar este problemas con varios métodos como la interpolación
  • 17. Integración de base de datos y formatos Mayores capacidades Los modelos generados deben ser pensados en producción desde el comienzo Y también en integración para superar los problemas de segmentación de los sistemas de información
  • 18. Manejo de os formatos y estandares Es necesario el manejo adecuado de los formato (estándar) en este caso la fecha en GRETL
  • 19. DATOS INGRESO DE INFORMACIÓN http://www.ins.gov.co/lineas-de- accion/Subdireccion- Vigilancia/sivigila/Paginas/vigilancia- rutinaria.aspx FORMATO DE ARCHIVO PDF ! INS Es necesario que lo sistemas de información suministren información de forma útil, y no solo para cumplir la norma
  • 20. Adquisición de información La información pueden venir de base de datos, ejem PENTAHO- Base de datos, o KNIME, en MYSQL. En la imagen integración de varios archivos de indicadores de salud (INS) de Excel en ACCESS
  • 21. Un ejemplo de consulta SQL de un conjunto de tablas de EXCEL en ACCES (Indicadores de salud pública)
  • 22. Ejemplo de graficas y la exploración inicial Aquí se ve el comportamie nto de la varicela en Colombia, nota/ la varicela tiene vacuna efectiva. Registro histórico con proyección a 2018
  • 23. Los filtros Filtro media móvil exponencial Filtro tendencia polinómicaFiltro Hodrick -Prescott Serie varicela 2012- 2016 (recuento) Los filtros : PERMITEN: Mirar la tendencia Estacionalidad, componente aleatorio
  • 24. Consideraciones sobre la Exploracion de series de tiempo • Algunos fenómenos son tan complejos que es necesario tener en cuenta ciertas cosas sobre como se clasifican, los fenómenos aleatorios, la teoría del caos, la causalidad y el manejos de escalas para tener en cuenta en los modelos
  • 25. Consideraciones • - tipo de fenómeno • - el azar, la mala suerte o la buena suerte • - la causalidad • - la teoría del caos • - la ley de los grandes números y las escalas
  • 26. -Tipos de FENÓMENOS de acuerdo a su complejidad ADRIANA ELISA ESPINOSA CONTRERAS “EL CAOS Y LA CARACTERIZACIÓN DE SERIES DE TIEMPO A TRAVÉS DE TÉCNICAS DE LA DINÁMICA NO-LINEAL” UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO. MÉXICO, D.F. 2004 Todos los fenómenos no son tan predecibles como una Varicela, algunos rayan en lo aleatorio y parecen o se asemejan a series económicas En la figura se pueden ver diferentes tipos de fenómenos
  • 27. -Consideraciones sobre los FENÓMENOS ADRIANA ELISA ESPINOSA CONTRERAS “EL CAOS Y LA CARACTERIZACIÓN DE SERIES DE TIEMPO A TRAVÉS DE TÉCNICAS DE LA DINÁMICA NO-LINEAL” UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO. MÉXICO, D.F. 2004 Se puede ver que algunos fenómenos son muy deterministas, otros imposibles de predecir (aleatoriedad) con la ciencia actual , y otros están en el limite de lo predecible y tienen un comportamiento matemáticamente extraño.
  • 28. -Del demonio de Laplace a la física cuántica : determinismo vs indeterminismo Aleatoriedad Concepto central dentro de la teoría de probabilidades y en los estudios del comportamiento cuya definición descansa en la suposición de que todo suceso tiene una causa, nada es azaroso. La noción de aleatoriedad aparece asociada al espacio generado por el desconocimiento humano (parcial o total) de tales causas. Así, la "aleatoriedad significa que no hay una ley conocida, capaz de ser expresada en un lenguaje coherente, que describa o explique los eventos y sus resultados" (Kerlinger, 1994, p.126). Demonio del mercurio alquímico, en el libro “Della trasmutatione metallica”, Giovani Battista Nazario, Brescia, 1589.
  • 29. -Mis indicadores obedecen solo a variables conocidas a Efecto azar (purísima suerte!) a variables desconocidas o fenómenos complejos?
  • 30. -La causalidad Según la indagación, "hasta el momento tenemos evidencia de que ningún factor técnico influyó en el accidente, todo está involucrado en un factor humano y gerencial".
  • 31. -Hay que tener en cuenta la Teoría del caos
  • 32. -Puede un discurso de donald trump en Washington afectar gravemente la salud de un niño en la guajira?
  • 33. -consideraciones • El azar, la suerte, o el libre albedrio es importante? • Como estimarlos? Existen?? • Basta con cambiar la escala temporal? , o usar proporciones? • Bata con usar filtros ? • Toca usar índices de aletoriedad, dimesiones, fractalidad, etc..? • Que pasa con la predicción si el fenómeno es complejo y el azar cambia los condiciones iniciales del fenómeno? • Los diferencia entre lo pronosticado y lo real se debe al azar, a los factores asociados o a ambos y en que grado? • Mi predicción o mis acciones puede alterar el futuro?
  • 34. -Ley de los grandes números (aplicada) • En la teoría de la probabilidad, bajo el término genérico de ley de los grandes números se engloban varios teoremas que describen el comportamiento del promedio de una sucesión de variables aleatorias conforme aumenta su número de ensayos. • Estos teoremas prescriben condiciones suficientes para garantizar que dicho promedio converge al promedio de las esperanzas de las variables aleatorias involucradas. Ejemplo la difusión de un gas es azarosa a pequeña escala pero determinística a gran escala.
  • 35. -AUMENTAR LA Escala en el tiempo • Aumentar la escala de tiempo permite filtrar el componente aleatorio que se anula a si mismo y permite ver otros elementos de la serie temporal, como la tendencia, la estacionalidad, y los ciclos. • Disminuir la escala aumenta el efecto visible del componente suerte. • Inconvenientes? Por día Por semana Por mes Por trimestre Por semestre Por año Por 4 años
  • 36. -Aumentar La escala en el evento • Tasas x 1000 x 10 000 x 1 000 000 …. • Proporciones • Índices • Funciones • Inconvenientes Usar denominadores puede filtrar algunos componentes aleatorios y otros componentes como el crecimiento de la población, mortalidad Etc.
  • 38. Volviendo Al modelo y la minería hay que Seleccionar un modelo otras consideraciones …. • En un modelo determinístico se pueden controlar los factores que intervienen en el estudio del proceso o fenómeno y por tanto se pueden predecir con exactitud sus resultados. • En un modelo estocástico no es posible controlar los factores que intervienen en el estudio del fenómeno y en consecuencia no produce simples resultados únicos. Cada uno de los resultados posibles se genera con una función de probabilidad que le adjudica una probabilidad a cada uno de éstos, Ejemplo: un modelo para predecir el tamaño de una epidemia en una población de N individuos. Para el caso determinístico se proporciona un valor único, C, mientras que el modelo estocástico permite la posibilidad de obtener desde cero hasta N individuos y se adjudica una cierta probabilidad a cada uno de estos sucesos. La diferencia es más grande de lo que parece, ya que en un modelo matemático determinístico en el contexto epidemiológico; un solo sujeto causa una epidemia generalizada, mientras que bajo un modelo estocástico existe la posibilidad de que la epidemia se extinga
  • 39. Cual es la relación de los modelos, la teoría del caos, y la utilidad practica. • Aun dentro de los procesos deterministas, también se da el azar en la dinámica de sistemas complejos impredecibles, también conocidos como sistemas caóticos. • Hasta el advenimiento de la teoría del caos, se creía que todos los sistemas deterministas eran necesariamente predecibles y, por tanto, no azarosos. • Sin embargo, el caos determinista se refiere a un tipo de situación de sistemas físicos que a pesar de ser deterministas y presentan cierta predictibilidad estadística general, resultan impredecibles en sus detalles o a pequeña escala. • En estos casos la descripción mediante modelos matemáticos deterministas que reproducen todos los detalles, se vuelve inviable (o especial) y para describirlos o tratarlos se suele trabajar con descripciones estadísticas de conjuntos de grandes cantidades de elementos, cada uno de ellos impredecible de manera individual pero no así globalmente • Las propiedades especiales de los sistemas caóticos incluyen cosas como sensibilidad a las condiciones iniciales , emergencia, adaptación, interdependencia, y dificultad para predicción en largo plazo, o de manera individual.
  • 40. Elaboración automática del modelo de serie temporal • La mayoría de software de alta calidad tiene funciones automatizadas para seleccionar el mejor modelo según nuestras necesidades y datos • En el caso de las series temporales JDEMETRA (software libre) o IBM SPSS MODELER y GMDH SHELL (software comercial) ofrecen herramientas muy sofisticadas para elaboración automática de modelos. • Los modelos luego pueden exportarse a medios de producción
  • 41. Los Modelos en r son mas manuales, aunque existen muchos paquetes de automatización • Pronostico del autor generado con un modelo HOLTWINTERS en R para la serie de bajo peso al nacer en Colombia con datos semanales
  • 42. Selección automática del modelo ejemplo Este es el modelizador experto automático de SPSS 20,0
  • 45. Hay que tener en cuenta en la Elaboración del modelo para serie temporal • Información de buena calidad produce resultados de buena calidad • Datos de pésima calidad, generalmente producen malos resultados independiente de lo sofisticado de los algoritmos o software usado • La elaboración de modelos temporales como por ejemplo los ARIMA puede tomar algún tiempo , por eso puede ser recomendable iniciar con un proceso automático en MODELER GMDH SHELL Y JDEMETRA que presentan resultados bastante buenos .
  • 46. Medidas de bondad de ajuste: (se usan para saber que tan bueno es el modelo) • R cuadrado estacionaria, R cuadrado (R2), raíz del error cuadrático promedio (RMSE), error absoluto promedio (MAE), error absoluto porcentual promedio (MAPE), error absoluto máximo (MaxAE), error absoluto máximo porcentual (MaxAPE) y criterio de información bayesiano (BIC) normalizado
  • 47. Ejemplo DE SERIE DE TIEMPO bajo peso al nacer Bajo peso al nacer vs Semana Epidemiológica
  • 48. Bajo peso al nacer mapa de recurrencia El grado de aleatoriedad puede estimarse con un mapa de recurrencia en este caso en MATLAB
  • 49. Mapa de recurrencia Aquí se puede ver Un fenómeno desde completamente Azaroso (puntos) hasta Determinista (las líneas)
  • 50. Filtros - Curve fiting tool General model Sin3: f(x) = a1*sin(b1*x+c1) + a2*sin(b2*x+c2) + a3*sin(b3*x+c3) where x is normalized by mean 26.58 and std 14.47 Coefficients (with 95% confidence bounds): a1 = 2162 (1718, 2606) b1 = 0.3811 (-0.2769, 1.039) c1 = 1.541 (1.002, 2.079) a2 = 6529 (-1.161e+07, 1.162e+07) b2 = 2.792 (-42.63, 48.21) c2 = 0.3984 (-41.46, 42.26) a3 = 6569 (-1.161e+07, 1.162e+07) b3 = 2.843 (-41.07, 46.75) c3 = -2.698 (-41.6, 36.2) Goodness of fit: SSE: 3.479e+06 R-square: 0.9146 Adjusted R-square: 0.9118 RMSE: 121.4 Los filtros pueden mostrar patrones no visibles interesantes..
  • 51. LOS CAMBIOS DE ESCALA PARA CONTRARESTAR AL AZAR
  • 52. Función previsión Suaviza cimiento exponencial AAA En Excel Función agregar elemento grafico líneas de tendencia con proyección en Excel Estadística Valor Alpha 0.50 Beta 0.00 Gamma 0.50 MASE 1.20 SMAPE 0.08 MAE 23.68 RMSE 33.10 ESTE ES UN EJEMPLO DE TEST DE BONDAD DE AJUSTE EN EXCEL
  • 53. EJEMPLO BAJO PESO AL NACER • El análisis de las series temporales pude determinar que regiones departamentos y municipios están presentado mas el fenómeno, y si alguna política esta impactando en la región • La información estaría disponible no solo para el tomador de decisión sino también para la opinión publica, el medico y el usuario.
  • 55. DIMENSIONES: CIRCULO O CUADRADO (2d)? Hay que pensar Siempre desde varias Perspectivas El trabajo en quipo Multidiciplinario es Recomendable, Los dx poblaciones Son de equipo
  • 56. PATRONES :UNA CARA EN MARTE? Crédito NASA
  • 57. ASOCIACIONES – CAUSALIDAD - AZAR Tyler Viglen - Spurious Correlations website https://commons.wikimedia.org/w/index.php?curid=48043945
  • 59. •“La mejor manera de predecir el futuro es crearlo” (“The best way to predict the future is to create it”). Dennis Gabor Nobel de Física en Inventando el futuro 1963
  • 60. fin • Puede usar esta presentación pero da algo de crédito al autor