Este documento describe el desarrollo de una red neuronal convolucional para clasificar exoplanetas detectados por la misión TESS como confirmados o falsos positivos utilizando tres tipos de datos de entrada. La autora implementó redes recurrentes y convolucionales, optimizando parámetros como la función de activación, el umbral y el algoritmo de optimización. Los mejores resultados se obtuvieron con una red convolucional que procesa por separado cada entrada y las combina, logrando una precisión superior al 90%. La autora concluye que las redes convolucionales son más
Este documento introduce el concepto de computación paralela de alto rendimiento y sus aplicaciones. Explica que la simulación por computadora se ha convertido en el tercer pilar de la ciencia junto con la teoría y el experimento. Detalla algunos problemas computacionalmente intensivos como la simulación del clima global y la dinámica de agujeros negros binarios. Finalmente, señala que las tendencias de miniaturización hacen que los microprocesadores sean cada vez más paralelos para aprovechar el aumento exponencial en el número de transistores.
El presente artículo técnico tiene la siguiente estructura: estado del arte, resultados y conclusiones.
El estado del arte se define en las 5 primeras secciones:
Sección 1: Neurona biológica y artificial, describe la estructura neuronal.
Sección 2: Funciones de activación o trasnferencia, se realiza una comparación de las funciones de activación más utilizadas.
Sección 3: Funciones satlin y satlins, describe la aplicación de estas funciones.
Sección4: Redes neuronales de hopfield, describe la arquitectura de una red de hopfield.
Sección5: Diseño de una red de Hopfield, describe el diseño de la red de hopfield.
Resultados del ejercicio práctico:
Sección 7: Reconocimiento de Dígitos impares con Hopfield, se presenta la solución en matlab y resultados obtenidos.
Sección 8: Conclusiones.
El documento describe técnicas para mejorar el algoritmo de eliminación gaussiana (GE) para resolver sistemas de ecuaciones lineales densos. Explica cómo optimizar GE mediante el uso de operaciones de matrices (BLAS) en lugar de bucles anidados, almacenando factores de multiplicación en lugar de recalcularlos, y aplicando pivotaje parcial para mejorar la estabilidad numérica. También describe cómo GE en realidad calcula una factorización LU de la matriz y cómo esta factorización puede usarse para resolver el sistema de ecuaciones.
Redes Neuronales Artificiales: Aplicación de la función Hardlim para la clasi...Sheyli Patiño
Este documento propone el uso de redes neuronales artificiales para resolver problemas linealmente separables como la clasificación de vehículos y la determinación de los movimientos de un robot, utilizando las funciones de transferencia Hardlim y Hardlims. Describe la simulación de estas redes neuronales artificiales desarrolladas en Matlab para dar solución a estos problemas.
Este documento describe las funciones de activación Poslin y Purelin utilizadas en redes neuronales artificiales. Poslin devuelve la salida si es mayor o igual a cero, y cero si es menor que cero. Purelin devuelve la salida igual a la entrada en una región lineal. El documento también explica conceptos como funciones de transferencia, aprendizaje supervisado y no supervisado, y provee un ejemplo práctico utilizando Matlab.
El documento describe un prototipo de software para realizar seguimiento y análisis de jugadores y objetos en videos de fútbol utilizando múltiples cámaras. El sistema usa técnicas de visión por computadora como detección de objetos, seguimiento multi-objeto y procesamiento de datos de múltiples cámaras para generar métricas de rendimiento. Los resultados preliminares muestran que el sistema puede detectar y seguir con precisión la cantidad esperada de jugadores, árbitros y arqueros en videos de prueba.
Este documento introduce el concepto de computación paralela de alto rendimiento y sus aplicaciones. Explica que la simulación por computadora se ha convertido en el tercer pilar de la ciencia junto con la teoría y el experimento. Detalla algunos problemas computacionalmente intensivos como la simulación del clima global y la dinámica de agujeros negros binarios. Finalmente, señala que las tendencias de miniaturización hacen que los microprocesadores sean cada vez más paralelos para aprovechar el aumento exponencial en el número de transistores.
El presente artículo técnico tiene la siguiente estructura: estado del arte, resultados y conclusiones.
El estado del arte se define en las 5 primeras secciones:
Sección 1: Neurona biológica y artificial, describe la estructura neuronal.
Sección 2: Funciones de activación o trasnferencia, se realiza una comparación de las funciones de activación más utilizadas.
Sección 3: Funciones satlin y satlins, describe la aplicación de estas funciones.
Sección4: Redes neuronales de hopfield, describe la arquitectura de una red de hopfield.
Sección5: Diseño de una red de Hopfield, describe el diseño de la red de hopfield.
Resultados del ejercicio práctico:
Sección 7: Reconocimiento de Dígitos impares con Hopfield, se presenta la solución en matlab y resultados obtenidos.
Sección 8: Conclusiones.
El documento describe técnicas para mejorar el algoritmo de eliminación gaussiana (GE) para resolver sistemas de ecuaciones lineales densos. Explica cómo optimizar GE mediante el uso de operaciones de matrices (BLAS) en lugar de bucles anidados, almacenando factores de multiplicación en lugar de recalcularlos, y aplicando pivotaje parcial para mejorar la estabilidad numérica. También describe cómo GE en realidad calcula una factorización LU de la matriz y cómo esta factorización puede usarse para resolver el sistema de ecuaciones.
Redes Neuronales Artificiales: Aplicación de la función Hardlim para la clasi...Sheyli Patiño
Este documento propone el uso de redes neuronales artificiales para resolver problemas linealmente separables como la clasificación de vehículos y la determinación de los movimientos de un robot, utilizando las funciones de transferencia Hardlim y Hardlims. Describe la simulación de estas redes neuronales artificiales desarrolladas en Matlab para dar solución a estos problemas.
Este documento describe las funciones de activación Poslin y Purelin utilizadas en redes neuronales artificiales. Poslin devuelve la salida si es mayor o igual a cero, y cero si es menor que cero. Purelin devuelve la salida igual a la entrada en una región lineal. El documento también explica conceptos como funciones de transferencia, aprendizaje supervisado y no supervisado, y provee un ejemplo práctico utilizando Matlab.
El documento describe un prototipo de software para realizar seguimiento y análisis de jugadores y objetos en videos de fútbol utilizando múltiples cámaras. El sistema usa técnicas de visión por computadora como detección de objetos, seguimiento multi-objeto y procesamiento de datos de múltiples cámaras para generar métricas de rendimiento. Los resultados preliminares muestran que el sistema puede detectar y seguir con precisión la cantidad esperada de jugadores, árbitros y arqueros en videos de prueba.
Global AI nights - Casos de uso de ML en AstronomiaRoberto Muñoz
El documento describe varios desafíos en el Observatorio Europeo Austral (ESO) y cómo el aprendizaje automático (ML) puede ayudar a abordarlos. Estos incluyen la validación automática de imágenes de calibración para identificar las corruptas, predecir las condiciones atmosféricas con 2 horas de anticipación para programar observaciones, e identificar imágenes mediante descriptores computados con redes neuronales convolucionales. También se exploran métodos de ML como LSTMs y redes neuronales para predecir el seeing en rangos específ
Este documento presenta un prototipo de software para realizar seguimiento y análisis de jugadores y equipos de fútbol mediante el procesamiento de video de varias cámaras. El prototipo genera datos sobre la posición y categoría de los objetos detectados en cada cámara y luego integra esta información para mejorar la precisión. Los resultados muestran que el sistema puede detectar con éxito la cantidad de jugadores, árbitros y arqueros en diferentes cuadros. Se identifican varias mejoras futuras como el seguimiento del balón, una clasific
El documento introduce las redes neuronales, describiendo primero el modelo biológico del cerebro y las neuronas. Luego explica que una red neuronal artificial simula las propiedades de generalización y robustez de los sistemas neuronales biológicos. Se compone de unidades llamadas neuronas que reciben entradas y emiten salidas. Finalmente, da ejemplos de aplicaciones como el diagnóstico de imágenes médicas y resalta las ventajas de las redes neuronales como el aprendizaje, la auto-organización y la tolerancia a fallos.
El documento describe los sistemas jerárquicos y cómo modelarlos usando redes neuronales y sistemas borrosos. Explica los pasos para definir la estructura del modelo jerárquico, obtener datos de entrada-salida, adaptar parámetros usando retropropagación del error, y validar el modelo. Luego presenta un ejemplo de un sistema a modelar con varias plantas como entrada y cómo diseñar un modelo jerárquico de dos niveles para ello.
Presentación del proyecto de la materia de IAA de la UTPL.
Tema: Comparación de resultados en la convergencia de una red neuronal utilizando 1 y 2 capas ocultas respectivamente en el modelo del perceptrón multicapa utilizando el algoritmo BackPropagation al realizar el reconocimiento de señales de tránsito
Este documento describe el desarrollo de un modelo de predicción de tráfico basado en redes neuronales artificiales. Los datos de tráfico utilizados para entrenar la red neuronal se extrajeron de una red LAN Ethernet mediante el software Ethereal. La red neuronal de tres capas se modeló en MATLAB. Los resultados muestran que las redes neuronales pueden modelar el tráfico de una red Ethernet con flexibilidad y precisión si se dispone de suficientes muestras de tráfico para el entrenamiento. El documento concluye que las redes neuronales son una her
Existen muchos métodos o algoritmos para entrenar perceptron multicapas, sin embargo en este caso se mostrará la optimización de las respuestas al intentar entrenar una RNA Multicapa empleando el algoritmo de Simulated Annealing
Implementación de un módulo para el entrenamiento y evaluación de redes neuro...Adrián Palacios Corella
Este documento describe la implementación de un módulo para el entrenamiento y evaluación de redes neuronales mediante GPUs. El módulo mejora una implementación existente del algoritmo de retropropagación (BP) incluyendo una nueva versión en CUDA que permite la ejecución del algoritmo en GPUs. El documento detalla cuatro aportaciones clave del módulo: 1) mejoras en la implementación del BP para CPU, 2) una nueva formulación del BP en modo "bunch", 3) diseño del BP para ejecución en GPU, y 4) experimentación
Este documento presenta un método para analizar la granulometría de una pila de rocas fragmentadas usando el software de código abierto ImageJ. El método involucra importar una imagen de la pila, ajustar el brillo y contraste, segmentar las partículas usando algoritmos de erosión y relleno, y medir propiedades como el área. Los resultados se exportan a una hoja de cálculo para crear una curva granulométrica y analizar la distribución de tamaños de partícula. El método ofrece una alternativa al
Este documento presenta el diseño de un controlador PID digital para controlar un sistema de transferencia dada. Se analiza la estabilidad del sistema aplicando un filtro digital y hallando las raíces y polos. Luego se diseña el controlador PID usando el método de Ziegler-Nichols y se implementa en Simulink, ajustando los parámetros para lograr un buen seguimiento de la señal de entrada. Finalmente, se demuestra que el controlador PID ajustado mejora el comportamiento del sistema.
REDES NEURONALES Mapas con Características Autoorganizativas SomESCOM
1) El documento describe los mapas autoorganizativos de Kohonen (SOM), una técnica de redes neuronales no supervisada donde las neuronas se autoorganizan para clasificar datos de entrada. 2) Los SOM aprenden patrones en los datos y agrupan datos similares, mapeando su espacio de entrada a una grilla multidimensional. 3) Se entrenan presentando datos de entrada uno a uno, ajustando los pesos de la neurona ganadora y sus vecinas para que se parezcan más al patrón de entrada.
Este documento describe el uso de las funciones de activación purelin y poslin en redes neuronales. La función purelin devuelve directamente el valor de entrada, mientras que poslin devuelve 0 si la entrada es negativa y el valor de entrada si es positiva. El documento presenta ejemplos de redes neuronales que usan estas funciones para modificar un voltaje de entrada y variar la velocidad de un ventilador.
Este documento describe las partes principales de una red neuronal, incluyendo el perceptrón, que modela el comportamiento de una neurona biológica. Existen varios tipos de perceptrones como el perceptrón simple de dos capas y el perceptrón múltiple de más de cuatro capas. El algoritmo de retropropagación de errores se utiliza para entrenar redes neuronales multicapa minimizando el error mediante el descenso del gradiente.
Problema de Aplicación sobre la fertilidad en los hombres aplicando las Funci...Henry Quezada
Este documento describe el uso de funciones logsig y tansig en redes neuronales artificiales para resolver problemas relacionados con la fertilidad masculina en Matlab. Presenta conceptos básicos de redes neuronales y describe ejemplos de reconocimiento de dígitos y letras usando estas funciones de activación. Explica cómo el entrenamiento mejora la precisión de la red y muestra gráficas de los resultados.
Este informe de laboratorio describe el proceso de observar y analizar la ruta que toman los datos a través de las redes desde un dispositivo del usuario hasta un destino remoto utilizando las herramientas Tracert y Neotracert. Se explica el uso de estas herramientas y se muestran ejemplos de rastrear rutas a sitios como Google, YouTube y la Universidad Nacional Abierta y Virtual de Colombia. Adicionalmente, se discuten algunas consideraciones de seguridad relacionadas con la revelación de detalles técnicos sobre la infraestructura de
Este documento trata sobre un curso de procesamiento de imágenes satelitales dictado en 2008. Cubre temas como los fundamentos físicos de la teledetección, sistemas espaciales de teledetección, interpretación visual e interpretación digital básica y avanzada de imágenes satelitales. También incluye prácticas sobre visualización, correcciones y extracción de indicadores de imágenes, así como su georreferenciación e integración con sistemas de información geográfica.
Utp ia_2014-2_s10_redes de funciones de base radialjcbp_peru
Este documento presenta una sesión sobre redes de funciones de base radial. Explica la arquitectura de tres capas de estas redes, con una capa oculta que usa funciones de activación radiales como Gaussianas y una capa de salida lineal. También cubre el entrenamiento híbrido de estas redes y aplicaciones como clasificación, reconocimiento y predicción.
Este documento describe las redes neuronales artificiales y sus aplicaciones en el ámbito financiero. Brevemente explica cómo funcionan las redes neuronales, incluyendo su estructura, aprendizaje y tipos de funciones de activación. También resume algunos ejemplos de cómo se han utilizado las redes neuronales para la predicción de mercados financieros, la valoración de opciones y la optimización de carteras de inversión.
Global AI nights - Casos de uso de ML en AstronomiaRoberto Muñoz
El documento describe varios desafíos en el Observatorio Europeo Austral (ESO) y cómo el aprendizaje automático (ML) puede ayudar a abordarlos. Estos incluyen la validación automática de imágenes de calibración para identificar las corruptas, predecir las condiciones atmosféricas con 2 horas de anticipación para programar observaciones, e identificar imágenes mediante descriptores computados con redes neuronales convolucionales. También se exploran métodos de ML como LSTMs y redes neuronales para predecir el seeing en rangos específ
Este documento presenta un prototipo de software para realizar seguimiento y análisis de jugadores y equipos de fútbol mediante el procesamiento de video de varias cámaras. El prototipo genera datos sobre la posición y categoría de los objetos detectados en cada cámara y luego integra esta información para mejorar la precisión. Los resultados muestran que el sistema puede detectar con éxito la cantidad de jugadores, árbitros y arqueros en diferentes cuadros. Se identifican varias mejoras futuras como el seguimiento del balón, una clasific
El documento introduce las redes neuronales, describiendo primero el modelo biológico del cerebro y las neuronas. Luego explica que una red neuronal artificial simula las propiedades de generalización y robustez de los sistemas neuronales biológicos. Se compone de unidades llamadas neuronas que reciben entradas y emiten salidas. Finalmente, da ejemplos de aplicaciones como el diagnóstico de imágenes médicas y resalta las ventajas de las redes neuronales como el aprendizaje, la auto-organización y la tolerancia a fallos.
El documento describe los sistemas jerárquicos y cómo modelarlos usando redes neuronales y sistemas borrosos. Explica los pasos para definir la estructura del modelo jerárquico, obtener datos de entrada-salida, adaptar parámetros usando retropropagación del error, y validar el modelo. Luego presenta un ejemplo de un sistema a modelar con varias plantas como entrada y cómo diseñar un modelo jerárquico de dos niveles para ello.
Presentación del proyecto de la materia de IAA de la UTPL.
Tema: Comparación de resultados en la convergencia de una red neuronal utilizando 1 y 2 capas ocultas respectivamente en el modelo del perceptrón multicapa utilizando el algoritmo BackPropagation al realizar el reconocimiento de señales de tránsito
Este documento describe el desarrollo de un modelo de predicción de tráfico basado en redes neuronales artificiales. Los datos de tráfico utilizados para entrenar la red neuronal se extrajeron de una red LAN Ethernet mediante el software Ethereal. La red neuronal de tres capas se modeló en MATLAB. Los resultados muestran que las redes neuronales pueden modelar el tráfico de una red Ethernet con flexibilidad y precisión si se dispone de suficientes muestras de tráfico para el entrenamiento. El documento concluye que las redes neuronales son una her
Existen muchos métodos o algoritmos para entrenar perceptron multicapas, sin embargo en este caso se mostrará la optimización de las respuestas al intentar entrenar una RNA Multicapa empleando el algoritmo de Simulated Annealing
Implementación de un módulo para el entrenamiento y evaluación de redes neuro...Adrián Palacios Corella
Este documento describe la implementación de un módulo para el entrenamiento y evaluación de redes neuronales mediante GPUs. El módulo mejora una implementación existente del algoritmo de retropropagación (BP) incluyendo una nueva versión en CUDA que permite la ejecución del algoritmo en GPUs. El documento detalla cuatro aportaciones clave del módulo: 1) mejoras en la implementación del BP para CPU, 2) una nueva formulación del BP en modo "bunch", 3) diseño del BP para ejecución en GPU, y 4) experimentación
Este documento presenta un método para analizar la granulometría de una pila de rocas fragmentadas usando el software de código abierto ImageJ. El método involucra importar una imagen de la pila, ajustar el brillo y contraste, segmentar las partículas usando algoritmos de erosión y relleno, y medir propiedades como el área. Los resultados se exportan a una hoja de cálculo para crear una curva granulométrica y analizar la distribución de tamaños de partícula. El método ofrece una alternativa al
Este documento presenta el diseño de un controlador PID digital para controlar un sistema de transferencia dada. Se analiza la estabilidad del sistema aplicando un filtro digital y hallando las raíces y polos. Luego se diseña el controlador PID usando el método de Ziegler-Nichols y se implementa en Simulink, ajustando los parámetros para lograr un buen seguimiento de la señal de entrada. Finalmente, se demuestra que el controlador PID ajustado mejora el comportamiento del sistema.
REDES NEURONALES Mapas con Características Autoorganizativas SomESCOM
1) El documento describe los mapas autoorganizativos de Kohonen (SOM), una técnica de redes neuronales no supervisada donde las neuronas se autoorganizan para clasificar datos de entrada. 2) Los SOM aprenden patrones en los datos y agrupan datos similares, mapeando su espacio de entrada a una grilla multidimensional. 3) Se entrenan presentando datos de entrada uno a uno, ajustando los pesos de la neurona ganadora y sus vecinas para que se parezcan más al patrón de entrada.
Este documento describe el uso de las funciones de activación purelin y poslin en redes neuronales. La función purelin devuelve directamente el valor de entrada, mientras que poslin devuelve 0 si la entrada es negativa y el valor de entrada si es positiva. El documento presenta ejemplos de redes neuronales que usan estas funciones para modificar un voltaje de entrada y variar la velocidad de un ventilador.
Este documento describe las partes principales de una red neuronal, incluyendo el perceptrón, que modela el comportamiento de una neurona biológica. Existen varios tipos de perceptrones como el perceptrón simple de dos capas y el perceptrón múltiple de más de cuatro capas. El algoritmo de retropropagación de errores se utiliza para entrenar redes neuronales multicapa minimizando el error mediante el descenso del gradiente.
Problema de Aplicación sobre la fertilidad en los hombres aplicando las Funci...Henry Quezada
Este documento describe el uso de funciones logsig y tansig en redes neuronales artificiales para resolver problemas relacionados con la fertilidad masculina en Matlab. Presenta conceptos básicos de redes neuronales y describe ejemplos de reconocimiento de dígitos y letras usando estas funciones de activación. Explica cómo el entrenamiento mejora la precisión de la red y muestra gráficas de los resultados.
Este informe de laboratorio describe el proceso de observar y analizar la ruta que toman los datos a través de las redes desde un dispositivo del usuario hasta un destino remoto utilizando las herramientas Tracert y Neotracert. Se explica el uso de estas herramientas y se muestran ejemplos de rastrear rutas a sitios como Google, YouTube y la Universidad Nacional Abierta y Virtual de Colombia. Adicionalmente, se discuten algunas consideraciones de seguridad relacionadas con la revelación de detalles técnicos sobre la infraestructura de
Este documento trata sobre un curso de procesamiento de imágenes satelitales dictado en 2008. Cubre temas como los fundamentos físicos de la teledetección, sistemas espaciales de teledetección, interpretación visual e interpretación digital básica y avanzada de imágenes satelitales. También incluye prácticas sobre visualización, correcciones y extracción de indicadores de imágenes, así como su georreferenciación e integración con sistemas de información geográfica.
Utp ia_2014-2_s10_redes de funciones de base radialjcbp_peru
Este documento presenta una sesión sobre redes de funciones de base radial. Explica la arquitectura de tres capas de estas redes, con una capa oculta que usa funciones de activación radiales como Gaussianas y una capa de salida lineal. También cubre el entrenamiento híbrido de estas redes y aplicaciones como clasificación, reconocimiento y predicción.
Este documento describe las redes neuronales artificiales y sus aplicaciones en el ámbito financiero. Brevemente explica cómo funcionan las redes neuronales, incluyendo su estructura, aprendizaje y tipos de funciones de activación. También resume algunos ejemplos de cómo se han utilizado las redes neuronales para la predicción de mercados financieros, la valoración de opciones y la optimización de carteras de inversión.
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIOAaronPleitez
linea de tiempo del antiguo testamento donde se detalla la cronología de todos los eventos, personas, sucesos, etc. Además se incluye una parte del periodo intertestamentario en orden cronológico donde se detalla todo lo que sucede en los 400 años del periodo del silencio. Basicamente es un resumen de todos los sucesos desde Abraham hasta Cristo
Este documento ha sido elaborado por el Observatorio Ciudadano de Seguridad Justicia y Legalidad de Irapuato siendo nuestro propósito conocer datos sociodemográficos en conjunto con información de incidencia delictiva de las 10 colonias y/o comunidades que del año 2020 a la fecha han tenido mayor incidencia.
Existen muchas más colonias que presentan cifras y datos en materia de seguridad, sin embargo, en este primer acercamiento lo que se prevées darle al lector una idea de como se encuentran las colonias analizadas, tomando como referencia los datos del INEGI 2020, datos del Secretariado Ejecutivo del Sistema Nacional de Seguridad Pública del 2020 al 2023 y las bases de datos propias que desde el 2017 el Observatorio Ciudadano ha recopilado de manera puntual con datos de las vıć timas de homicidio doloso, accidentes de tránsito, personas lesionadas por arma de fuego, entre otros indicadores.
Minería de Datos e IA Conceptos, Fundamentos y Aplicaciones.pdfMedTechBiz
Este libro ofrece una introducción completa y accesible a los campos de la minería de datos y la inteligencia artificial. Cubre todo, desde conceptos básicos hasta estudios de casos avanzados, con énfasis en la aplicación práctica utilizando herramientas como Python y R.
También aborda cuestiones críticas de ética y responsabilidad en el uso de estas tecnologías, discutiendo temas como la privacidad, el sesgo algorítmico y transparencia.
El objetivo es permitir al lector aplicar técnicas de minería de datos e inteligencia artificial a problemas reales, contribuyendo a la innovación y el progreso en su área de especialización.
1. Detección de exoplanetas con
redes neuronales usando la base
de datos de la misión TESS
Irene Delgado Borrego
Supervisor : Dr. César Augusto Guzmán Álvarez
8 de Julio de 2020
4. Estado del Arte- Exoplanetas(I)
¿Cómo se detectan?¿Qué son?
Exoplanetas
¿Por qué son relevantes?
5. Estado del Arte- Exoplanetas(II)
Figura 2. Representación artística entre el sistema solar interno y el sistema TRAPPIST-1
Fuente:Nasa’s Jet Propulsion Laboratory
• Planetas que orbitan estrellas
diferentes al Sol
¿Qué son?
6. Estado del Arte- Exoplanetas(III)
Velocidad radial
Microlensing
Tránsitos
Imagen directa
Otros
¿Cómo se detectan?
7. Estado del Arte- Exoplanetas(IV)
• Permite estudiar características de nuestros
propio sistema Solar
• Búsqueda de vida
• Zona de habitabilidad
¿Por qué son relevantes?
8. Estado del Arte- Misión TESS(I)
Figura 3. Imagen real del telescopio espacial TESS
(Transiting Exoplanet Survey Satellite) Fuente:
https://www.nasa.gov/content/tess-images
TESS: Transiting Exoplanet
Survey Satellite
Misión espacial
Utiliza el método de los
Tránsitos para la detección
9. Estado del Arte- Misión TESS(II)
Video 1. Animación por ordenador de un tránsito planetario. Fuente: Nasa
https://youtu.be/BFi4HBUdWkk
Método de los tránsitos
10. Estado del Arte- Misión TESS(II)
Video 1 Captura 1 Animación por ordenador de un tránsito planetario. Fuente: Nasa
https://youtu.be/BFi4HBUdWkk
Método de los tránsitos
11. Estado del Arte- Misión TESS(II)
Video 1 Captura 2 Animación por ordenador de un tránsito planetario. Fuente: Nasa
https://youtu.be/BFi4HBUdWkk
Método de los tránsitos
12. Estado del Arte- Misión TESS(II)
Video 1 Captura 3 Animación por ordenador de un tránsito planetario. Fuente: Nasa
https://youtu.be/BFi4HBUdWkk
Método de los tránsitos
13. Estado del Arte- Misión TESS(II)
Video 1 Captura 4 Animación por ordenador de un tránsito planetario. Fuente: Nasa
https://youtu.be/BFi4HBUdWkk
Método de los tránsitos
14. Estado del Arte- Aprendizaje Automático(I)
Figura 4. Esquema de los diferentes tipos de aprendizajes que existen y las técnicas
más representativas asociadas a ellos. Fuente: Universitat Oberta de Catalunya
15. Estado del Arte- Red Neuronal(I)
Figura 5. Representación de las partes de una neurona artificial. Fuente: (Brío y
Sanz, 1997
• Entradas: ത𝑋 = (𝑥1, 𝑥2, … , 𝑥 𝑛)
• Sinapsis: 𝑤𝑖𝑗
• Cuerpo celular: σ
• Umbral de activación: 𝜃1
• Función de activación: f( )
• Salida: 𝑦𝑖 = 𝑓 σ 𝑗 𝑤𝑖𝑗 𝑥 𝑛 − 𝜃1
16. Estado del Arte- Red Neuronal(II)
ConvolucionalRecurrente
• Todas las capas están conectadas entre si.
• El parámetro más importante es 𝑤𝑖𝑗
• Útiles en resolución de patrones temporales
• Red tridimensional
• Añaden dos tipos de capa extra; de
convolución y de pooling
• Útiles en procesamiento de audio e
imágenes
17. Estado del Arte- Estudios Previos(I)
• Backpropagation Applied to
Handwritten Zip Code Recognition,
LeCun 1989
• Identifying Exoplanets with Deep
Learning, Shallue 2018
• Rapid Classification of TESS Planet
Candidates with Convolutional
Neural Networks, Osborn 2019
Figura 6. Esquema de la CNN Exonet.Fuente: Osborn y col, 2019
20. Desarrollo– Adquisición de los datos(I)
• Fuente: La NASA
• Datos reales de la misión TESS
• Datos de exoplanetas confirmados
y falsos positivos
• Número de registros muy reducido
• Dos tipos diferentes de datos
Características
21. Desarrollo– Preproceso y limpieza de datos(I)
CSV de Parámetros Estelares
• Está en el formato adecuado
• Aplicamos criterio experto
• Aplicamos PCA y Correlaciones en BigML
Pasamos de 58 a 9 dimensiones
Pasamos de 9 a 6 dimensiones
Input de la red neuronal
22. Desarrollo– Preproceso y limpieza de datos(II)
Imagen de telescopio
Figura 10. Imagen .fits del exoplaneta "TOI 677.01".
• Imagen de la estrella anfitriona
• Píxeles de una cámara CCD
• Formato .fits
• Necesitamos la variación del flujo
de luz
Hay que procesarlo
23. Desarrollo– Preproceso y limpieza de datos(III)
Imagen de telescopio
• Se procesa en Python en Jupyter
Notebook
• Procesamos registros positivos y
negativos
• Nos basamos en el código recogido
en Shallue 2018→ Lo adaptamos a
los datos de TESS
Con el código conseguimos:
→ Extraer desde las imágenes la
curva de luz
→ Limpiar outliers
→ Normalizar y centrar el tránsito
→ Descargar los valores del flujo de
luz en formato CSV
24. Desarrollo– Preproceso y limpieza de datos(IV)
Figura 11. Representación gráfica del Global View exoplaneta
"TOI677.01.”
Figura 12. Representación gráfica del Local View exoplaneta
"TOI677.01.”
25. Desarrollo– Inputs(I)
- Hay 3 entradas diferentes en la red
- Valores numéricos en formato CSV
- Unificamos criterios y obtenemos
para cada Input:
33 muestras positivas
116 muestras negativas
26. Desarrollo- Implementación(I)
1ª Fase: Red recurrente:
• Más simple
• Solo usamos capas
conectadas
• Procesamos los inputs por
igual
• Estructura de las capas
conectadas de la red ExoNet
• Probamos el compartamiento
de la red y de las entradas
• Se realiza en BigML
2ª Fase: Red convolucional
• Más compleja
• Usamos capas
convolucionales, de pooling y
conectadas
• Cada input se procesa de
diferente forma en las capas
convolucionales
• Estructura completa de la red
ExoNet
• Se realiza mediante código en
python
27. Desarrollo– 1ªFase(I)
Realizamos pruebas al Local View y al
Global View por separado
Aplicamos tres tipos de arquitecturas
diferentes
Comparamos resultados con dos
métodos de validación
28. Desarrollo– 1ªFase(II)
Realizamos pruebas al Local View y al
Global View por separado
Aplicamos tres tipos de arquitecturas
diferentes
Comparamos resultados con dos
métodos de validación
Añadimos los parámetros estelares y
repetimos las pruebas
+ +
29. Desarrollo– 2ªFase(I)
● Utilizamos los tres Inputs
● Cada Input se procesa diferente:
-Local View: Procesamiento mediante capas convolucionales
-Global View: Procesamiento mediante capas convolucionales
-Parámetros : No se procesan en capas convolucionales
● Se concatenan los datos anteriores, que sirven como nuevo Input
para las capas conectadas.
● Innovaciones:
➢ Nueva estructura en la rama convolucional del Global View
➢ Modificación del umbral
➢ Modificación de la función de activación
➢ Modificación del algoritmo de optimización
Figura 13 Esquema de la red
neuronal convolucional
diseñada para este trabajo.
30. Resultados y Discusión– Introducción(I)
Figura 14 Ejemplo de una matriz de confusión para una clasificación
binaria
Para medir la eficacia de los modelos utilizaremos diferentes métricas basadas principamente
en la matriz de confusión:
31. Resultados y Discusión– Introducción(II)
Para medir la eficacia de los modelos utilizaremos diferentes métricas basadas principamente
en la matriz de confusión:
o Accuracy =
𝑇𝑃+𝑇𝑁
𝑇𝑃+𝑇𝑁+𝐹𝑃+𝐹𝑁
o Recall =
𝑇𝑃
𝑇𝑃+𝐹𝑁
o Precision =
𝑇𝑃
𝑇𝑃+𝐹𝑃
o F-measure = 2 x
𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 𝑥 𝑅𝑒𝑐𝑎𝑙𝑙
𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛+ 𝑅𝑒𝑐𝑎𝑙𝑙
o Curva ROC-AUC:
Figura 15 Posibles valores de curvas ROC
Fuente: UPO649 1112 prod-gom (2011)
32. Resultados y Discusión–1ªFase(I)
Sin parámetros Estelares:
Local View
Global View
Tabla 2 Resumen de los resultados obtenidos para el
dataset Global View en la plataforma BigML sin tener en
cuenta los parámetros estelares en la redes recurrentes
Tabla 1 Resumen de los resultados obtenidos para el dataset
Local View en la plataforma BigML sin tener en cuenta
los parámetros estelares en la redes recurrentes
33. Resultados y Discusión–1ªFase(II)
Con parámetros Estelares:
Local View
Global View
Tabla 4 Resumen de los resultados obtenidos para el
dataset Global View en la plataforma BigML teniendo en
cuenta los parámetros estelares en la redes recurrentes
Tabla 3 Resumen de los resultados obtenidos para el dataset
Local View en la plataforma BigML teniendo en cuenta
los parámetros estelares en la redes recurrentes
34. Resultados y Discusión–2ªFase(I)
● Recordamos las innovaciones introducidas:
➢ Nueva estructura en la rama convolucional del Global View
➢ Modificación del umbral
➢ Modificación de la función de activación
➢ Modificación del algoritmo de optimización
→Obtenemos diferentes resultados al ir aplicando las anteriores modificaciones
35. Resultados y Discusión–2ªFase(II)
➢ Estructura Semi-ExoNet con modificación de umbral
Validación Train/Test
Comparación con Umbral Óptimo
Tabla 5 Comparación de los resultados obtenidos
para la Red Neuronal Convolucional mediante el
umbral estándar y el umbral óptimo
Tabla 6 Comparación de resultados obtenidos en
las pruebasTrain/Test y Cross-Validationpara la red
convolucional SemiExonet
36. Resultados y Discusión–2ªFase(III)
➢ Estructura Semi-ExoNet con modificación de umbral
→Mejor resultado: Umbral Óptimo y Cross-Validation
Figura 16 Matriz de confusión obtenida para la CNN realizada
mediante Cross-Validation y valor óptim odel umbral
Figura 17 Curva ROC obtenida para la CNN realizada
medianteCross-Validation. El punto señalado en el gráfico muestra el
valor óptimodel umbra
37. Resultados y Discusión–2ªFase(IV)
➢ Nuevas configuraciones:
Modificación de la Función de Activación
Sigmoidea / Tanh
Modificación del Algoritmo de Optimización
Adam / AdaDelta
Tabla 7 Resumen de los resultados obtenidos para las diferentes pruebas llevadas a
cabo en la red convolucional
38. Resultados y Discusión–2ªFase(IV)
➢ Nuevas configuraciones:
→Mejor resultado :
Tanh /Adadelta
Figura 18 Comparación de las 4 curvas ROC para las
diferentes configuraciones de parámetros
39. Resultados y Discusión–2ªFase(V)
➢ Comparación de Inputs:
Figura 19 Comparación de las 3 curvas ROC para las diferentes combinaciones de inputs
Tabla 8 Resumen de los resultados obtenidos al combinar los diferentes inputs,
llevadas a cabo en la red convolucional
40. Resultados y Discusión–Otros trabajos(I)
Shallue 2018
Tabla 10 Resumen de los resultados obtenidos al combinar los diferentes inputs,
llevadas a cabo en la red convolucional
Osborn 2019
Tabla 9 Resumen de los resultados obtenidos al combinar los diferentes inputs,
llevadas a cabo en la red convolucional
• En Shallue no utilizan Parámetros
Estelares
• Mejores resultados generales en Shallue
2018→ Datos de Kepler y registros
negativos
• Resultados similares para los Inputs Local
View+ Parámetros Estelares
• Mejor resultado de Average Precision en
Osborn 2019→ Tenemos un dataset que
no esta balanceado
• Average Accuracy similares
• Recall Accuracy levemente mejor→
Nuestra arquitectura detecta más
exoplanetas
41. Conclusiones
La utilización de la red convolucional mejora notablemente el resultado:
Las redes convolucionales ofrecen gran rendimiento al gestionar y reducir
grandes volúmenes de datos perdiendo la mínima cantidad de información.
Los parámetros estelares no son determinantes en la red convolucional:
Al contrario que en las redes recurrentes, al procesar conjuntamente las dos curvas de luz los resultados
no son lo bastante buenos como para que los parámetros elegidos no ofrezcan una mejora significativa.
El dataset con el que se alcanzan resultados más veraces es el Local View:
Esto resulta especialmente interesante.
Al centrarnos en positivos y falsos positivos las curva de luz son muy similares, por tanto un menor
número de valores permiten descubrir con mayor facilidad las variaciones de las curvas de luz.
42. Trabajo Futuro
● Obtener un mayor número de muestras: Datos de otras misiones, datos simulados o esperar nuevos
datos de TESS
● Aplicar más conocimiento experto tanto en el preproceso como las dimensiones introducidas en la
red
● Profundizar en el aspecto matemático
● Desarrollo de nuevas arquitectura