SlideShare una empresa de Scribd logo
Redes Neuronales
Profundas
Convolucionales CNN ́s
● Acuña Carranza Carlos Enrique
● Rosario Vázquez José André
Table of contents
01
04
02
05
03
06
Definición Aplicaciones Ventajas
Desventajas Librerias Artículos
Definición
01
Red Neuronal
Una red neuronal es un método de la inteligencia
artificial que enseña a las computadoras a procesar
datos de una manera que está inspirada en la forma en
que lo hace el cerebro humano. Se trata de un tipo de
proceso de machine learning llamado aprendizaje
profundo, que utiliza los nodos o las neuronas
interconectados en una estructura de capas que se
parece al cerebro humano.
Función
Las células del cerebro humano, llamadas
neuronas, forman una red compleja y con un
alto nivel de interconexión y se envían señales
eléctricas entre sí para ayudar a los humanos
a procesar la información. De manera similar,
una red neuronal artificial está formada por
neuronas artificiales que trabajan juntas para
resolver un problema.
Las neuronas artificiales son módulos de
software, llamados nodos, y las redes
neuronales artificiales son programas de
software o algoritmos que, en esencia, utilizan
sistemas informáticos para resolver cálculos
matemáticos.
El cerebro como inspiración Neuronas artificiales
Redes Neuronales
Convolucionales
Es un tipo de red neuronal de retroalimentación que se
utiliza en tareas como análisis de imágenes, procesamiento
del lenguaje natural y otros problemas complejos de
clasificación de imágenes.
Arquitectura
Parte Convolucional
La imagen proporcionada de
entrada pasa a través de una
sucesión de filtros, creando a la
vez nuevas imágenes llamadas
tarjetas de convoluciones. Así
mismo, las tarjetas de
convoluciones obtenidas se
concatenan en un vector de
características llamado código
CNN.
La capa de salida proporciona el
resultado final de todo el
procesamiento de datos que
realiza la red neuronal artificial.
Puede tener uno o varios nodos.
Parte de clasificación
Al contrario que un modelo MLP (Multi Layers Perceptron) clásico que solo contiene una parte de clasificación,
la arquitectura de la Convolutional Neural Network dispone previamente de una parte convolucional y consta
por tanto de dos partes bien diferenciadas:
Parte Convolucional
Se define el tamaño de la ventana de
filtro situada en la parte superior
izquierda
La ventana de filtro, se desplaza de
izquierda a derecha un determinado
número de casillas definido
previamente (el paso) hasta llegar al
final de la imagen.
En cada porción de imagen que
encuentra, se efectúa el cálculo de
convolución permitiendo obtener en la
salida una tarjeta de activación o feature
map que indica dónde están localizadas
las features en la imagen
Parte de Clasificación
CONV: El papel de esta
primera capa es analizar las
imágenes proporcionadas en
la entrada y detectar la
presencia de un conjunto de
features.
POOL: Esta recibe en la
entrada las features maps y
su papel es reducir el
tamaño de las imágenes y, a
la vez, preservar sus
características más
esenciales.
ReLU: Esa capa sustituye
todos los valores negativos
recibidos en la entrada por
ceros. El interés es hacer
que el modelo sea no lineal y
por tanto, más complejo.
FC: la capa FC aplica
sucesivamente una
combinación lineal y una
función de activación con la
finalidad de clasificar el
input imagen
Finalmente en la salida devuelve un
vector de tamaño correspondiente
al número de clases en el que cada
componente representa la
probabilidad de que el input imagen
pertenezca a una clase.
Aplicaciones
02
Decodificación del
reconocimiento facial
Analizar
documentos
El reconocimiento facial se
divide mediante una red
neuronal convolucional en los
siguientes componentes:
● Identificando cada rostro
en la imagen.
● Centrándose en cada
rostro a pesar de
factores externos
● Identificar características
únicas
Las redes neuronales
convolucionales también se
pueden utilizar para el análisis
de documentos. Esto no sólo es
útil para el análisis de escritura a
mano, sino que también tiene un
gran interés en los
reconocedores.
Las CNN se pueden utilizar para
desempeñar un papel
importante en la lucha contra el
cambio climático,
especialmente para comprender
las razones por las que vemos
cambios tan drásticos y cómo
podríamos experimentar para
frenar el efecto.
Predicción del clima
Comprensión de
áreas grises
Publicidad
La introducción del área gris en
las CNN pretende proporcionar
una imagen mucho más realista
del mundo real.
Las CNN ya han aportado una
gran diferencia a la publicidad
con la introducción de la compra
programática y la publicidad
personalizada basada en datos.
Las CNN están a punto de ser el
futuro con su introducción en
automóviles sin conductor,
robots que pueden imitar el
comportamiento humano,
ayudas en proyectos de mapeo
del genoma humano, predicción
de terremotos y desastres
naturales y tal vez incluso
autodiagnósticos de problemas
médicos.
Otros temas de
interés
Ventajas
03
Estable ante
Desplazamientos de Entrada
Jerarquía de Características
La CNN puede reconocer
patrones independientemente
de su posición exacta en la
imagen.
Las capas más profundas
aprenden características más
abstractas y complejas basadas
en las extracciones de las capas
anteriores.
Las redes neuronales
convolucionales son altamente
eficientes para tareas de visión
como el reconocimiento de
objetos, detección de rostros y
segmentación semántica.
Nota: Se le considera su mayor
característica.
Eficiente en Tareas de Visión
por Computadora
Estable ante
Desplazamientos de Entrada
Jerarquía de Características
La CNN puede reconocer
patrones independientemente
de su posición exacta en la
imagen.
Las capas más profundas
aprenden características más
abstractas y complejas basadas
en las extracciones de las capas
anteriores.
Las redes neuronales
convolucionales son altamente
eficientes para tareas de visión
como el reconocimiento de
objetos, detección de rostros y
segmentación semántica.
Nota: Se le considera su mayor
característica.
Eficiente en Tareas de Visión
por Computadora
Transfer Learning Agrupación (Pooling)
Este proceso ahorra tiempo y
recursos de entrenamiento. La
CNN ya tiene aprendido las
características útiles en tareas
anteriores.
Por ejemplo, en conjuntos
grandes de datos se pueden
utilizar como puntos de partida
para tareas específicas.
Las capas de agrupación
reducen la dimensionalidad de
las representaciones mientras
preservan las características
más importantes.
Las CNN están diseñadas para
trabajar eficientemente con
datos en forma de cuadrícula,
donde pueden capturar patrones
espaciales.
Manejo de Datos de
Cuadrícula
Data Argumentation Aplicaciones
Proceso que permite aprender a
la red neuronal convolucional
reconocer patrones
independientemente de
pequeñas variaciones en la
posición, rotación o escala de
las imágenes.
Se puede aplicar en imágenes
para mejorar la generalización.
Las CNN su utilizan en una gran
variedad de aplicaciones. Son
versátiles en diversos campos,
convirtiéndolas en una
herramienta poderosa y
generalizada.
Desventajas
04
Desventajas
Para que la red neuronal
convolucional tenga un
rendimiento óptimo, a menudo
requieren conjuntos de datos
grandes y diversificados para el
entrenamiento.
Entrenar y ejecutar CNN puede ser
computacionalmente costoso,
especialmente si la red es grande
y se trabaja con conjuntos de
datos masivos.
Requiere Recursos
Computacionales
Necesitan Conjuntos de Datos
Grandes
Las CNN son modelos complejos
con millones de parámetros, lo
que hace que la interpretación de
cómo y por qué toman ciertas
decisiones sea difícil.
La opacidad puede ser un
problema en aplicaciones donde
la interpretabilidad del modelo es
crucial
Interpretación Opaca
Las CNN tienen varios
hiperparámetros que deben
ajustarse correctamente para
obtener el mejor rendimiento.
Hiperparámetro: Son
configuraciones externos a un
modelo de aprendizaje
automático que no se aprenden
del entrenamiento
El sobreajuste puede conducir a
un rendimiento deficiente en
datos no vistos, ya que el modelo
se ajusta demasiado a los
detalles específicos del conjunto
de datos de entrenamiento.
Propenso al Sobreajuste Ajuste en los Hiperparámetros
El entrenamiento supervisado de
las redes neuronales
convolucionales requiere grandes
cantidades de datos etiquetados
para cada clase. Por lo que, en
casos donde la obtención de
datos etiquetados es difícil o
costosa puede ser complicado
utilizar eficazmente la red.
Dependencia de Datos
Etiquetados
No Consideran Contexto
Global
No son Invariantes
Aunque las capas
características locales, las CNN
a veces pueden perder
información sobre el contexto
global de la imagen.
Esto puede ser problemático en
tareas donde la relación entre
características distantes es
crucial.
Las CNN pueden no ser
inherentes invariantes a
rotaciones y escalas extremas.
En casos donde la variaciones
de rotación y escala son
significativas, puede ser
necesario aplicar técnicas
adicionales.
Para modelos de redes
convolucionales grandes
pueden ocupar mucho espacio
en memoria y almacenamiento.
Por lo que, puede llegar a ser un
problema con dispositivos con
recursos limitados.
Tamaño de la Memoria
Dificultades en tareas no visuales
● Son excelentes para tareas visuales, pero no
pueden ser la mejor opción para todas las tareas
de aprendizaje automático.
● Pierden eficiencia al trabajar con datos que no
poseen una forma de cuadrícula.
● Para entradas que no necesariamente son visuales
es mejor optar por otras arquitecturas de redes
neuronales.
● La CNN no es muy flexible en tareas que
demandan otro tipo de representación de datos.
Librerías
05
Lenguajes que adoptan estrategias de Deep Learning
● TensorFlow
● Keras
● PyTorch
● Keras
● MXNet
● TensorFlow C++ API ● Deep Learning ToolBox
● DL4J (Deep Learning
for Java)
Python R Java
C++ MatLab
Deep Learning
ToolBox
Deep Learning: Es una rama de aprendizaje automático
que permite a las computadoras aprender de la
experiencia. Utiliza redes neuronales para extraer
características directamente de los datos, combinando
capas de procesamiento no lineal inspiradas en sistemas
nerviosos biológicos.
Deep Learning Toolbox proporciona comandos simples
de MATLAB para crear e interconectar las capas de una
red neuronal profunda. Los ejemplos y redes
preentrenadas facilitan el uso de MATLAB para deep
learning, incluso sin conocimientos de algoritmos
avanzados de visión artificial o sobre redes neuronales.
Flujos de Trabajo - Deep Learning ToolBox
Dominio Ejemplo
Clasificación, regresión y procesamiento
de imágenes
Permite identificar que tipo de imagen se está procesando. Por ejemplo, saber si es
una cara, un perro, etc.
Visión Artificial Se puede utilizar para la segmentación semántica y la detección de objetos.
Conducción Automática Se utiliza para la detección de vehículos y la segmentación semántica.
Procesamiento LiDAR
Permite la segmentación semántica y detección de objetos en datos de nubes de
puntos organizados en 3D
La librería de MatLab permite más aplicaciones con respecto al deep learning; pero estas únicamente se
centran en las redes neuronales profundas convolucionales. Este lenguaje nos permite entrenar y crear una
arquitectura de la CNN mucho más fácil que otras librerías.
Redes preentrenadas
Esta librería cuenta con redes preentrenadas, que nos
facilita la aplicación de ellas. Además, las redes poseen
una arquitectura estable para su implementación. Las
redes preentrenadas disponibles son:
Nota: Todas estas redes son convolucionales
● squeezenet
● googlenet
● inceptionv3
● densenet201
● mobilenetv2
● resenet50, resenet18
● xception
● nasnetlarge
● shufflenet
● darknet19, darknet53
● Vgg16, vgg19
Funciones Disponibles para la red CNN
Capas de entrada
Convolución y capas
totalmente conectadas
imageInputLayer Capa de entrada de Imagen
image3dInputLayer Capa de entrada de imagen
3D
convolution2dLayer Capa convolucional 2D
convolution3dLayer Capa convolucional 3D
groupedConvolution2dLayer Grupo de capas
convolucionales 2D
transposedConv2dLayer Capa covolucional
transpuesta 2D
transposedConv3dLayer Capa convolucional
transpuesta 3D
Capas de convolución
convolution1dLayer Capa convolucional 1D
transposedConv1dLayer Capa covolucional
transpuesta 1D
selfAttentionLayer Capa de auto-atención
fullyConnectedLayer Capa completamente
conectada
Reflexión
La elección de Deep Learning Toolbox para implementar
redes neuronales convolucionales simplifica y agiliza el
desarrollo de modelos en MATLAB. Esta herramienta
ofrece una interfaz intuitiva que facilita la creación y
entrenamiento de CNN, permitiéndonos enfocarnos en
estrategias efectivas para problemas específicos.
La integración con las funciones de MATLAB ofrece un
entorno completo para experimentación y análisis
detallado, contribuyendo a un desarrollo eficiente en
aprendizaje profundo.
PyTorch
Es una biblioteca de código abierto diseñada con
Python en mente y creada para proyectos de
aprendizaje automático. Se especializa en
diferenciación automática, cálculos de tensor y
aceleración de GPU. Esto lo hace especialmente
adecuado para aplicaciones de aprendizaje
automático de vanguardia como el Deep Learning.
Módulos Básicos en PyTorch para las CNN
Es un módulo fundamental para extraer
características de las imágenes de entrada
mediante la aplicación de filtros
convolucionales. Especificamos la cantidad
de canales de entrada y salida, el tamaño del
kernel, el paso y el relleno.
Módulo que realiza la operación de
agrupación máxima para reducir la dimensión
espacial de las representaciones.
Esta capa se utiliza para la clasificación
final. Conecta todas las neuronas de la capa
anterior con cada neurona de la capa actual,
transformando la información para la salida
final.
torch.nn.Conv2d: Capa de Convolución
torch.nn.Linear: Capa Completamente
Conectada
torch.nn.MaxPool2d: Operación de
Agrupación Máxima
Funciones de Activación y Normalización
La función ReLU introduce no
linealidad al activar todas las
salidas negativas a cero y
mantener las positivas.
Declaración:
torch.nn.functional.relu
Este módulo realiza la
normalización por lotes en las
activaciones de cada canal en
una capa. Estabiliza y acelera el
entrenamiento al normalizar
estadísticamente las salidas.
Declaración:
torch.nn.BatchNorm2d
El Dropout es una técnica de
regularización que ayuda a prevenir el
sobreajuste. Durante el
entrenamiento, aleatoriamente
"apaga" (pone a cero) un porcentaje
de unidades en cada paso para evitar
la dependencia excesiva de ciertas
neuronas.
Declaración:
torch.nn.Dropout
Rectified Linear Unit (ReLU) Normalización por Lotes Capa de Dropout
Reflexión
Implementar Redes Neuronales Convolucionales
(CNN) con la biblioteca PyTorch representa un paso
significativo hacia la eficacia y la versatilidad en el
desarrollo de modelos de aprendizaje profundo.
La flexibilidad y simplicidad de su API, respaldadas
por una dinámica computacional intuitiva, ofrecen a
los desarrolladores un entorno propicio para la
innovación y la experimentación.
La capacidad nativa de PyTorch para aprovechar el
cómputo en GPU mejora el rendimiento, mientras que
su vibrante comunidad y documentación robusta
brindan recursos esenciales.
Artículos
06
Convolutional neural network model by deep learning and
teaching robot in keyboard musical instrument teaching
En este estudio, se destaca el papel crucial
del teclado en la enseñanza musical. El
objetivo principal es investigar y mejorar la
enseñanza de estos instrumentos,
identificando desafíos existentes. El
artículo propone abordar deficiencias
mediante la integración de tecnología
inteligente, específicamente utilizando
robots docentes en la educación de
instrumentos de teclado.
Jidong Liu, Fang Fu. Octubre 2023
Proponiendo la integración de robots docentes respaldados por redes neuronales convolucionales
(CNN). Se destaca principalmente, la aplicación de CNN en el análisis de imágenes y movimientos de
estudiantes durante la interpretación musical, permitiendo enfoques de enseñanza personalizados.
Robots inteligentes en la docencia
Esto se va a lograr mediante la
implementación de LeNet-5 para el
reconocimiento de dígitos escritos a
mano.
El robot docente se caracteriza por su alta flexibilidad, facilitada
por su capacidad de utilizar varios sensores para la entrada y
salida de información. Su movilidad depende de su estructura
versátil, que le permite moverse libremente dentro del aula.
Se utilizó un robot docente con un modelo CNN en un navegador sin necesidad de conexión física. La
plataforma de desarrollo web permitió la interactividad y visualización en tiempo real de datos de
video capturados por la cámara del robot.
Pruebas y conclusión
Tras analizar los datos se concluyó que el
modelo de robot propuesto tiene un
potencial prometedor para impactar y
mejorar significativamente la enseñanza del
teclado. La extensa recopilación de datos
de rendimiento del teclado y su conversión
en secuencias de notas musicales han
establecido una sólida base de datos para
el modelo.
COVID-19 diagnosis using chest CT scans and deep convolutional
neural networks evolved by IP-based sine-cosine algorithm
Este estudio se centra en la optimización
de una estructura de red neuronal
convolucional profunda (DCNN) para
mejorar la precisión en el diagnóstico de
COVID-19 a partir de imágenes de
tomografía computarizada (TC) de los
pulmones. Se utiliza el algoritmo
seno-coseno (SCA) para optimizar la
estructura de la DCNN.
Binfeng Xu, Diego Martín, Mahammad Khishe, Reza Boostani. Agosto 2022
Se destaca la necesidad de un diagnóstico rápido y preciso de COVID-19, especialmente cuando la
prueba de reacción en cadena de la polimerasa (RT-PCR) resulta negativa pero hay problemas
respiratorios. Se subraya el papel crucial de las imágenes de tomografía computarizada (TC) en el
diagnóstico, pero se señala la dependencia de la interpretación experta.
Objetivo
El objetivo principal es desarrollar un modelo SCA
que automáticamente descubra estructuras de
DCNN adecuadas, con contribuciones adicionales
que incluyen un enfoque de codificación flexible y
una evaluación de aptitud más eficiente utilizando
un subconjunto de datos.
Experimentación
Se presentan los resultados de especificidad,
sensibilidad, precisión, exactitud y valor F para el
modelo propuesto DCNN-IPSCA y otros métodos
comparados como IPPSO, VLGA, VLNSGA-II, VLBSO,
IPMPSO, VLBBO y VLACO.
Los hallazgos indican que DCNN-IPSCA logra la
mejor puntuación de exactitud, con un 99.18% para
el conjunto de datos SARS-CoV-2 y un 98.22% para
el conjunto de datos COVID-CT.
Los hallazgos mostraron que nuestro modelo, que se desarrolló utilizando conjuntos de datos de
COVID-CT y SARS-CoV-2, tenía una buena generalización en términos de las imágenes de TC en las que
se entrenó. En los conjuntos de datos de SARS-CoV-2 y COVID-CT, el modelo propuesto arroja una
precisión final de (98,32% y 98,01%), la sensibilidad de (97,22% y 96,23%) y la especificidad de (96,77% y
96,44%). respectivamente.
Conclusión
In-Bed Posture Classification Using Deep Neural Network
En este estudio, se aborda la
monitorización de posturas en la cama
para reducir el riesgo de úlceras por
presión y mejorar la calidad del sueño. Se
proponen Redes Neuronales
Convolucionales 2D y 3D, entrenadas en
imágenes y videos de un conjunto de datos
de acceso abierto con mapas de calor
corporal
Lindsay Stern, Atena Roshan Ferk. Febrero 2023
Este estudio aborda la monitorización de posturas en la cama para reducir el riesgo de úlceras por
presión y mejorar la calidad del sueño. La presión constante en una región del cuerpo puede provocar
úlceras por presión. Los cuidadores y el personal hospitalario a menudo deben monitorear a los
pacientes con úlceras por presión, lo que puede ser laborioso y exigente para los recursos hospitalarios.
Objetivo
Se propone utilizar una red neuronal convolucional
(CNN) 3D para clasificar videos de mapas de calor
corporal en tres posturas principales (supina,
izquierda y derecha), comparándola con resultados
de clasificación de imágenes mediante cuatro
modelos CNN 2D.
Para el modelo 3D se utilizó un clasificador de vídeo de red neuronal convolucional (CNN) de dos flujos
previamente entrenado
Para los modelos 2D fueron evaluados AlexNet, ResNet-18, GoogleNet y ShuffleNet. Los cuatro modelos
fueron entrenados previamente en la base de datos ImageNet, compuesta por más de un millón de
imágenes y 1000 categorías de objetos.
Ambos fueron evaluados con LOSO y 5-fold
Pruebas
Resultados
Todos los modelos 2D fueron entre un 1% y un 2%
más precisos que el modelo I3D en validación
5-fold. Pero para comparar los algoritmos 2D y 3D,
los fotogramas exactos presentes en los datos 3D
se extrajeron como entradas de fotograma único
para los modelos CNN 2D. Esto llevó a que algunas
imágenes fueran muy similares entre sí en el
conjunto de datos. Por lo tanto, es más útil
comparar los resultados LOSO de los modelos 2D y
3D, ya que no hay posibilidad de fuga de datos.
Loso
5-Fold
El modelo ponderado logró los valores de precisión más altos de 98,90 ± 1,05 % y 97,80 ± 2,14 % para
5-Fold y LOSO, respectivamente. Para comparar el modelo 3D inflado, se utilizaron cuatro modelos de
aprendizaje profundo 2D previamente entrenados: AlexNet, ResNet-18, GoogleNet y ShuffleNet.
ResNet-18 logró la precisión más alta de 99,62 ± 0,37% para LOSO, para el modelo de muestreo
descendente. Sin embargo, para una comparación más precisa de los modelos ponderados, el algoritmo
ShuffleNet recibió la precisión más alta de 99,35 ± 0,43% para LOSO.
Conclusión
A convolutional neural network highlights mutations relevant to
antimicrobial resistance in Mycobacterium tuberculosis
La demora en el diagnóstico de resistencia a
antibióticos en M. tuberculosis y propone
soluciones mediante la secuenciación genómica
respaldada por aprendizaje automático. Introduce
dos redes neuronales convolucionales (MD-CNN y
SD-CNN) que predicen la resistencia a múltiples y a
un solo antibiótico, respectivamente. Estas CNN
muestran alta sensibilidad y especificidad,
identificando además sitios genómicos
previamente no asociados con resistencia.
Green, Ho Yoon, Chen, Ektefaie, Fina, Freschi. July 2022
El objetivo principal del artículo es abordar los
prolongados tiempos de espera en el diagnóstico
de resistencia a antibióticos en Mycobacterium
tuberculosis, proponiendo una solución a través
de la aplicación de la secuenciación del genoma
completo respaldada por modelos de aprendizaje
automático.
Objetivo
El enfoque se centra en la implementación de dos
redes neuronales convolucionales, MD-CNN y
SD-CNN, que buscan predecir la resistencia a
múltiples y a un solo antibiótico, respectivamente.
Estos modelos no solo exhiben un alto
rendimiento en términos de sensibilidad y
especificidad, sino que también identifican sitios
genómicos previamente no asociados con la
resistencia.
Pruebas
● Utilización de 10,201 aislados de M.
tuberculosis de ReSeqTB y la Red de
Laboratorios de Referencia
Supranacional de la OMS.
● Cada aislado tiene un fenotipo de
resistencia a al menos uno de los 13
fármacos antituberculosos.
Datos de Entrenamiento
MD-CNN (Red Neuronal Convolucional de
Múltiples Fármacos):
● Predice resistencia a los 13 fármacos
simultáneamente.
● Utiliza secuencias completas de 18 loci
genómicos.
SD-CNN (Redes Neuronales Convolucionales
de un Solo Fármaco):
● Predice resistencia a cada fármaco
individualmente.
● Se centra en loci con asociaciones
causales conocidas.
Diseño del modelo
● Evaluación mediante AUC, sensibilidad y
especificidad.
● Destacada eficacia de MD-CNN al
superar a la regresión L2 para fármacos
de segunda línea.
Métricas de rendimiento
Resultados y Conclusiones
Resultados:
● MD-CNN y SD-CNN presentan rendimiento
comparables al modelo WDNN de última
generación.
● MD-CNN y SD-CNN presentan rendimientos
comparables al modelo WDNN de última
generación.
Conclusiones:
● Los modelos de CNN ofrecen resultados precisos y
confiables.
● Se destaca la eficiencia de MD-CNN y la
interpretabilidad de ambos modelos en la
predicción de resistencia a antibióticos.
Dense optic nerve head deformation estimated using CNN as a
structural biomarker of glaucoma progression
La investigación presenta un nuevo biomarcador
estructural para la detección de la progresión del
glaucoma, enfocado en la transformación de la
región de la cabeza del nervio óptico (ONH) a lo
largo del tiempo. Utilizando métodos de aprendizaje
profundo y comparándolos con enfoques
computacionales tradicionales, se evalúa la eficacia
del biomarcador en escaneos longitudinales de ojos
normales y en progresión.
Salehi, Balasubramanian. June 2023
Se central es proponer esta herramienta como un medio efectivo, respaldado por métodos
avanzados de aprendizaje profundo, para evaluar la progresión del glaucoma y su detección
temprana.
Objetivo
Para desarrollar la herramienta se utilizaron métodos
avanzados de aprendizaje profundo, como DDCNet-Multires,
FlowNet2 y FlowNetCorrelation, junto con enfoques
computacionales tradicionales como análisis de cambios
topográficos (TCA) y descomposición ortogonal adecuada
(POD). Estos métodos se aplican para estimar la
deformación densa de la región de la cabeza del nervio
óptico a lo largo del tiempo. Además, se propone un
biomarcador candidato basado en la magnitud promedio de
esta deformación.
Métodos
La evaluación de la precisión diagnóstica se
lleva a cabo mediante el área bajo la curva ROC
(AUC), utilizando escaneos longitudinales de
ojos normales y en progresión. La comparación
de estos métodos busca destacar la eficacia de
las técnicas de aprendizaje profundo en la
detección y evaluación del glaucoma.
El Estudio Experimental de Glaucoma (LEGS), los AUC
fueron 0,83 para DDCNet-Multires, FlowNet2 y
correlación FlowNet, 0,94 para POD, y 0,86 para
métodos TCA. Para el Estudio de Innovaciones
Diagnósticas en Glaucoma de UCSD (DIGS), los AUC
fueron 0,89, 0,82, 0,93, 0,86 y 0,86 respectivamente. La
menor precisión de los métodos basados en
aprendizaje en el LEGS se atribuyó a errores de
alineación de imágenes.
Resultados
Los métodos de aprendizaje profundo para estimar la deformación genérica demostraron
una mayor precisión en la estimación de la deformación de ONH y ofrecieron una mayor
precisión diagnóstica. La validación del biomarcador en condiciones controladas respalda
su precisión diagnóstica en poblaciones clínicas.
Conclusión
CREDITS: This presentation template was created by Slidesgo, and
includes icons by Flaticon, and infographics & images by Freepik
Gracias!
Referencias
● https://la.mathworks.com/help/deeplearning/referencelist.html?type=function
● https://la.mathworks.com/help/deeplearning/ug/deep-learning-in-matlab.html
● https://aws.amazon.com/es/what-is/neural-network/
● https://datascientest.com/es/convolutional-neural-network-es
● https://developer.oracle.com/es/learn/technical-articles/1481879246309-134-what-is-pytorch
● https://www.flatworldsolutions.com/data-science/articles/7-applications-of-convolutional-neural-networ
ks.php
● https://www.ncbi.nlm.nih.gov/pmc/articles/PMC10602282/
● https://www.ncbi.nlm.nih.gov/pmc/articles/PMC9374292/
● https://www.ncbi.nlm.nih.gov/pmc/articles/PMC10007451/
● https://www.nature.com/articles/s41467-022-31236-0
● https://www.nature.com/articles/s41433-023-02623-8#Abs1
●

Más contenido relacionado

Similar a Redes Neuronales profundas convolucionales CNN ́s-1.pdf

UTILIZACIÓN DE LA TECNOLOGÍA DE REDES NEURONALES PARA LA RESOLUCIÓN DE PROBLE...
UTILIZACIÓN DE LA TECNOLOGÍA DE REDES NEURONALES PARA LA RESOLUCIÓN DE PROBLE...UTILIZACIÓN DE LA TECNOLOGÍA DE REDES NEURONALES PARA LA RESOLUCIÓN DE PROBLE...
UTILIZACIÓN DE LA TECNOLOGÍA DE REDES NEURONALES PARA LA RESOLUCIÓN DE PROBLE...
zeithy
 
Redes Neuronales Artificiales
Redes Neuronales ArtificialesRedes Neuronales Artificiales
Redes Neuronales Artificiales
Jose
 
Redes Neuronales
Redes NeuronalesRedes Neuronales
Redes Neuronales
mateog93
 
Redes Neuronales
Redes NeuronalesRedes Neuronales
Redes Neuronales
mateog93
 

Similar a Redes Neuronales profundas convolucionales CNN ́s-1.pdf (20)

Redes neuronales y sus aplicaciones
Redes neuronales y sus aplicacionesRedes neuronales y sus aplicaciones
Redes neuronales y sus aplicaciones
 
Deep Learning + R by Gabriel Valverde
Deep Learning + R by Gabriel ValverdeDeep Learning + R by Gabriel Valverde
Deep Learning + R by Gabriel Valverde
 
Sistemas neuronales
Sistemas neuronalesSistemas neuronales
Sistemas neuronales
 
SISTEMAS NEURONALES
SISTEMAS NEURONALESSISTEMAS NEURONALES
SISTEMAS NEURONALES
 
Redes Neuronales
Redes NeuronalesRedes Neuronales
Redes Neuronales
 
UTILIZACIÓN DE LA TECNOLOGÍA DE REDES NEURONALES PARA LA RESOLUCIÓN DE PROBLE...
UTILIZACIÓN DE LA TECNOLOGÍA DE REDES NEURONALES PARA LA RESOLUCIÓN DE PROBLE...UTILIZACIÓN DE LA TECNOLOGÍA DE REDES NEURONALES PARA LA RESOLUCIÓN DE PROBLE...
UTILIZACIÓN DE LA TECNOLOGÍA DE REDES NEURONALES PARA LA RESOLUCIÓN DE PROBLE...
 
Redes Neuronales: Aplicación en Venezuela
Redes Neuronales: Aplicación en VenezuelaRedes Neuronales: Aplicación en Venezuela
Redes Neuronales: Aplicación en Venezuela
 
Redes Neuronales Artificiales
Redes Neuronales ArtificialesRedes Neuronales Artificiales
Redes Neuronales Artificiales
 
Redes Neuronales
Redes NeuronalesRedes Neuronales
Redes Neuronales
 
Redes Neuronales
Redes NeuronalesRedes Neuronales
Redes Neuronales
 
Redes neuronales
Redes neuronalesRedes neuronales
Redes neuronales
 
Reconocimiento de patrones
Reconocimiento de patronesReconocimiento de patrones
Reconocimiento de patrones
 
3.1 Representación de conocimiento mediante reglas.pptx
3.1 Representación de conocimiento mediante reglas.pptx3.1 Representación de conocimiento mediante reglas.pptx
3.1 Representación de conocimiento mediante reglas.pptx
 
Presentacion inteligencia artificial tecnologica futurista azul y violeta.pptx
Presentacion inteligencia artificial tecnologica futurista azul y violeta.pptxPresentacion inteligencia artificial tecnologica futurista azul y violeta.pptx
Presentacion inteligencia artificial tecnologica futurista azul y violeta.pptx
 
Redes neuronales
Redes neuronalesRedes neuronales
Redes neuronales
 
Curso Big Data. Introducción a Deep Learning by Gabriel Valverde Castilla
Curso Big Data. Introducción a  Deep Learning by Gabriel Valverde CastillaCurso Big Data. Introducción a  Deep Learning by Gabriel Valverde Castilla
Curso Big Data. Introducción a Deep Learning by Gabriel Valverde Castilla
 
Proyecto. vision artificial
Proyecto. vision artificialProyecto. vision artificial
Proyecto. vision artificial
 
REDES NEURONALES.pptx
REDES NEURONALES.pptxREDES NEURONALES.pptx
REDES NEURONALES.pptx
 
Redes neuroales y como aplicarla en Venezuela
Redes neuroales y como aplicarla en Venezuela Redes neuroales y como aplicarla en Venezuela
Redes neuroales y como aplicarla en Venezuela
 
2024-T8-Redes_Neuronales_I.ppsx
2024-T8-Redes_Neuronales_I.ppsx2024-T8-Redes_Neuronales_I.ppsx
2024-T8-Redes_Neuronales_I.ppsx
 

Último

PRÁCTICAS DEL MÓDULO I Y II DE EDUCACIÓN Y SOCIEDAD.docx
PRÁCTICAS DEL MÓDULO I Y II DE EDUCACIÓN Y SOCIEDAD.docxPRÁCTICAS DEL MÓDULO I Y II DE EDUCACIÓN Y SOCIEDAD.docx
PRÁCTICAS DEL MÓDULO I Y II DE EDUCACIÓN Y SOCIEDAD.docx
encinasm992
 
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
vazquezgarciajesusma
 

Último (20)

Diagrama de flujo soporte técnico 5to semestre
Diagrama de flujo soporte técnico 5to semestreDiagrama de flujo soporte técnico 5to semestre
Diagrama de flujo soporte técnico 5to semestre
 
Herramientas informáticas. Sara Torres R.
Herramientas informáticas. Sara Torres R.Herramientas informáticas. Sara Torres R.
Herramientas informáticas. Sara Torres R.
 
3°ð_¦_â_¾ï¸_S34 PLAN DARUKEL DIDÃ_CTICA 23-24.docx
3°ð_¦_â_¾ï¸_S34 PLAN DARUKEL DIDÃ_CTICA 23-24.docx3°ð_¦_â_¾ï¸_S34 PLAN DARUKEL DIDÃ_CTICA 23-24.docx
3°ð_¦_â_¾ï¸_S34 PLAN DARUKEL DIDÃ_CTICA 23-24.docx
 
EduFlex, una educación accesible para quienes no entienden en clases
EduFlex, una educación accesible para quienes no entienden en clasesEduFlex, una educación accesible para quienes no entienden en clases
EduFlex, una educación accesible para quienes no entienden en clases
 
Trabajo Coding For kids 1 y 2 grado 9-4.pdf
Trabajo Coding For kids 1 y 2 grado 9-4.pdfTrabajo Coding For kids 1 y 2 grado 9-4.pdf
Trabajo Coding For kids 1 y 2 grado 9-4.pdf
 
lenguaje algebraico.pptx álgebra, trigonometria
lenguaje algebraico.pptx álgebra, trigonometrialenguaje algebraico.pptx álgebra, trigonometria
lenguaje algebraico.pptx álgebra, trigonometria
 
Gestión de concurrencia y bloqueos en SQL Server
Gestión de concurrencia y bloqueos en SQL ServerGestión de concurrencia y bloqueos en SQL Server
Gestión de concurrencia y bloqueos en SQL Server
 
¡Mira mi nuevo diseño hecho en Canva!.pdf
¡Mira mi nuevo diseño hecho en Canva!.pdf¡Mira mi nuevo diseño hecho en Canva!.pdf
¡Mira mi nuevo diseño hecho en Canva!.pdf
 
proyectos_social_y_socioproductivos _mapas_conceptuales
proyectos_social_y_socioproductivos _mapas_conceptualesproyectos_social_y_socioproductivos _mapas_conceptuales
proyectos_social_y_socioproductivos _mapas_conceptuales
 
herramientas informaticas mas utilizadas
herramientas informaticas mas utilizadasherramientas informaticas mas utilizadas
herramientas informaticas mas utilizadas
 
PRÁCTICAS DEL MÓDULO I Y II DE EDUCACIÓN Y SOCIEDAD.docx
PRÁCTICAS DEL MÓDULO I Y II DE EDUCACIÓN Y SOCIEDAD.docxPRÁCTICAS DEL MÓDULO I Y II DE EDUCACIÓN Y SOCIEDAD.docx
PRÁCTICAS DEL MÓDULO I Y II DE EDUCACIÓN Y SOCIEDAD.docx
 
Sistemas distribuidos de redes de computadores en un entorno virtual de apren...
Sistemas distribuidos de redes de computadores en un entorno virtual de apren...Sistemas distribuidos de redes de computadores en un entorno virtual de apren...
Sistemas distribuidos de redes de computadores en un entorno virtual de apren...
 
Unidad 1- Historia y Evolucion de las computadoras.pdf
Unidad 1- Historia y Evolucion de las computadoras.pdfUnidad 1- Historia y Evolucion de las computadoras.pdf
Unidad 1- Historia y Evolucion de las computadoras.pdf
 
3Redu: Responsabilidad, Resiliencia y Respeto
3Redu: Responsabilidad, Resiliencia y Respeto3Redu: Responsabilidad, Resiliencia y Respeto
3Redu: Responsabilidad, Resiliencia y Respeto
 
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
 
Índice del libro "Big Data: Tecnologías para arquitecturas Data-Centric" de 0...
Índice del libro "Big Data: Tecnologías para arquitecturas Data-Centric" de 0...Índice del libro "Big Data: Tecnologías para arquitecturas Data-Centric" de 0...
Índice del libro "Big Data: Tecnologías para arquitecturas Data-Centric" de 0...
 
HerramientasInformaticas ¿Que es? - ¿Para que sirve? - Recomendaciones - Comp...
HerramientasInformaticas ¿Que es? - ¿Para que sirve? - Recomendaciones - Comp...HerramientasInformaticas ¿Que es? - ¿Para que sirve? - Recomendaciones - Comp...
HerramientasInformaticas ¿Que es? - ¿Para que sirve? - Recomendaciones - Comp...
 
Estudio de la geometría analitica. Pptx.
Estudio de la geometría analitica. Pptx.Estudio de la geometría analitica. Pptx.
Estudio de la geometría analitica. Pptx.
 
Trabajo Coding For kids 1 y 2 grado 9-4.pdf
Trabajo Coding For kids 1 y 2 grado 9-4.pdfTrabajo Coding For kids 1 y 2 grado 9-4.pdf
Trabajo Coding For kids 1 y 2 grado 9-4.pdf
 
Inteligencia Artificial para usuarios nivel inicial
Inteligencia Artificial para usuarios nivel inicialInteligencia Artificial para usuarios nivel inicial
Inteligencia Artificial para usuarios nivel inicial
 

Redes Neuronales profundas convolucionales CNN ́s-1.pdf

  • 1. Redes Neuronales Profundas Convolucionales CNN ́s ● Acuña Carranza Carlos Enrique ● Rosario Vázquez José André
  • 2. Table of contents 01 04 02 05 03 06 Definición Aplicaciones Ventajas Desventajas Librerias Artículos
  • 4. Red Neuronal Una red neuronal es un método de la inteligencia artificial que enseña a las computadoras a procesar datos de una manera que está inspirada en la forma en que lo hace el cerebro humano. Se trata de un tipo de proceso de machine learning llamado aprendizaje profundo, que utiliza los nodos o las neuronas interconectados en una estructura de capas que se parece al cerebro humano.
  • 5. Función Las células del cerebro humano, llamadas neuronas, forman una red compleja y con un alto nivel de interconexión y se envían señales eléctricas entre sí para ayudar a los humanos a procesar la información. De manera similar, una red neuronal artificial está formada por neuronas artificiales que trabajan juntas para resolver un problema. Las neuronas artificiales son módulos de software, llamados nodos, y las redes neuronales artificiales son programas de software o algoritmos que, en esencia, utilizan sistemas informáticos para resolver cálculos matemáticos. El cerebro como inspiración Neuronas artificiales
  • 6. Redes Neuronales Convolucionales Es un tipo de red neuronal de retroalimentación que se utiliza en tareas como análisis de imágenes, procesamiento del lenguaje natural y otros problemas complejos de clasificación de imágenes.
  • 7. Arquitectura Parte Convolucional La imagen proporcionada de entrada pasa a través de una sucesión de filtros, creando a la vez nuevas imágenes llamadas tarjetas de convoluciones. Así mismo, las tarjetas de convoluciones obtenidas se concatenan en un vector de características llamado código CNN. La capa de salida proporciona el resultado final de todo el procesamiento de datos que realiza la red neuronal artificial. Puede tener uno o varios nodos. Parte de clasificación Al contrario que un modelo MLP (Multi Layers Perceptron) clásico que solo contiene una parte de clasificación, la arquitectura de la Convolutional Neural Network dispone previamente de una parte convolucional y consta por tanto de dos partes bien diferenciadas:
  • 8. Parte Convolucional Se define el tamaño de la ventana de filtro situada en la parte superior izquierda La ventana de filtro, se desplaza de izquierda a derecha un determinado número de casillas definido previamente (el paso) hasta llegar al final de la imagen. En cada porción de imagen que encuentra, se efectúa el cálculo de convolución permitiendo obtener en la salida una tarjeta de activación o feature map que indica dónde están localizadas las features en la imagen
  • 9. Parte de Clasificación CONV: El papel de esta primera capa es analizar las imágenes proporcionadas en la entrada y detectar la presencia de un conjunto de features. POOL: Esta recibe en la entrada las features maps y su papel es reducir el tamaño de las imágenes y, a la vez, preservar sus características más esenciales. ReLU: Esa capa sustituye todos los valores negativos recibidos en la entrada por ceros. El interés es hacer que el modelo sea no lineal y por tanto, más complejo. FC: la capa FC aplica sucesivamente una combinación lineal y una función de activación con la finalidad de clasificar el input imagen Finalmente en la salida devuelve un vector de tamaño correspondiente al número de clases en el que cada componente representa la probabilidad de que el input imagen pertenezca a una clase.
  • 11. Decodificación del reconocimiento facial Analizar documentos El reconocimiento facial se divide mediante una red neuronal convolucional en los siguientes componentes: ● Identificando cada rostro en la imagen. ● Centrándose en cada rostro a pesar de factores externos ● Identificar características únicas Las redes neuronales convolucionales también se pueden utilizar para el análisis de documentos. Esto no sólo es útil para el análisis de escritura a mano, sino que también tiene un gran interés en los reconocedores. Las CNN se pueden utilizar para desempeñar un papel importante en la lucha contra el cambio climático, especialmente para comprender las razones por las que vemos cambios tan drásticos y cómo podríamos experimentar para frenar el efecto. Predicción del clima
  • 12. Comprensión de áreas grises Publicidad La introducción del área gris en las CNN pretende proporcionar una imagen mucho más realista del mundo real. Las CNN ya han aportado una gran diferencia a la publicidad con la introducción de la compra programática y la publicidad personalizada basada en datos. Las CNN están a punto de ser el futuro con su introducción en automóviles sin conductor, robots que pueden imitar el comportamiento humano, ayudas en proyectos de mapeo del genoma humano, predicción de terremotos y desastres naturales y tal vez incluso autodiagnósticos de problemas médicos. Otros temas de interés
  • 14. Estable ante Desplazamientos de Entrada Jerarquía de Características La CNN puede reconocer patrones independientemente de su posición exacta en la imagen. Las capas más profundas aprenden características más abstractas y complejas basadas en las extracciones de las capas anteriores. Las redes neuronales convolucionales son altamente eficientes para tareas de visión como el reconocimiento de objetos, detección de rostros y segmentación semántica. Nota: Se le considera su mayor característica. Eficiente en Tareas de Visión por Computadora
  • 15. Estable ante Desplazamientos de Entrada Jerarquía de Características La CNN puede reconocer patrones independientemente de su posición exacta en la imagen. Las capas más profundas aprenden características más abstractas y complejas basadas en las extracciones de las capas anteriores. Las redes neuronales convolucionales son altamente eficientes para tareas de visión como el reconocimiento de objetos, detección de rostros y segmentación semántica. Nota: Se le considera su mayor característica. Eficiente en Tareas de Visión por Computadora
  • 16. Transfer Learning Agrupación (Pooling) Este proceso ahorra tiempo y recursos de entrenamiento. La CNN ya tiene aprendido las características útiles en tareas anteriores. Por ejemplo, en conjuntos grandes de datos se pueden utilizar como puntos de partida para tareas específicas. Las capas de agrupación reducen la dimensionalidad de las representaciones mientras preservan las características más importantes. Las CNN están diseñadas para trabajar eficientemente con datos en forma de cuadrícula, donde pueden capturar patrones espaciales. Manejo de Datos de Cuadrícula
  • 17. Data Argumentation Aplicaciones Proceso que permite aprender a la red neuronal convolucional reconocer patrones independientemente de pequeñas variaciones en la posición, rotación o escala de las imágenes. Se puede aplicar en imágenes para mejorar la generalización. Las CNN su utilizan en una gran variedad de aplicaciones. Son versátiles en diversos campos, convirtiéndolas en una herramienta poderosa y generalizada.
  • 19. Desventajas Para que la red neuronal convolucional tenga un rendimiento óptimo, a menudo requieren conjuntos de datos grandes y diversificados para el entrenamiento. Entrenar y ejecutar CNN puede ser computacionalmente costoso, especialmente si la red es grande y se trabaja con conjuntos de datos masivos. Requiere Recursos Computacionales Necesitan Conjuntos de Datos Grandes Las CNN son modelos complejos con millones de parámetros, lo que hace que la interpretación de cómo y por qué toman ciertas decisiones sea difícil. La opacidad puede ser un problema en aplicaciones donde la interpretabilidad del modelo es crucial Interpretación Opaca
  • 20. Las CNN tienen varios hiperparámetros que deben ajustarse correctamente para obtener el mejor rendimiento. Hiperparámetro: Son configuraciones externos a un modelo de aprendizaje automático que no se aprenden del entrenamiento El sobreajuste puede conducir a un rendimiento deficiente en datos no vistos, ya que el modelo se ajusta demasiado a los detalles específicos del conjunto de datos de entrenamiento. Propenso al Sobreajuste Ajuste en los Hiperparámetros El entrenamiento supervisado de las redes neuronales convolucionales requiere grandes cantidades de datos etiquetados para cada clase. Por lo que, en casos donde la obtención de datos etiquetados es difícil o costosa puede ser complicado utilizar eficazmente la red. Dependencia de Datos Etiquetados
  • 21. No Consideran Contexto Global No son Invariantes Aunque las capas características locales, las CNN a veces pueden perder información sobre el contexto global de la imagen. Esto puede ser problemático en tareas donde la relación entre características distantes es crucial. Las CNN pueden no ser inherentes invariantes a rotaciones y escalas extremas. En casos donde la variaciones de rotación y escala son significativas, puede ser necesario aplicar técnicas adicionales. Para modelos de redes convolucionales grandes pueden ocupar mucho espacio en memoria y almacenamiento. Por lo que, puede llegar a ser un problema con dispositivos con recursos limitados. Tamaño de la Memoria
  • 22. Dificultades en tareas no visuales ● Son excelentes para tareas visuales, pero no pueden ser la mejor opción para todas las tareas de aprendizaje automático. ● Pierden eficiencia al trabajar con datos que no poseen una forma de cuadrícula. ● Para entradas que no necesariamente son visuales es mejor optar por otras arquitecturas de redes neuronales. ● La CNN no es muy flexible en tareas que demandan otro tipo de representación de datos.
  • 24. Lenguajes que adoptan estrategias de Deep Learning ● TensorFlow ● Keras ● PyTorch ● Keras ● MXNet ● TensorFlow C++ API ● Deep Learning ToolBox ● DL4J (Deep Learning for Java) Python R Java C++ MatLab
  • 25. Deep Learning ToolBox Deep Learning: Es una rama de aprendizaje automático que permite a las computadoras aprender de la experiencia. Utiliza redes neuronales para extraer características directamente de los datos, combinando capas de procesamiento no lineal inspiradas en sistemas nerviosos biológicos. Deep Learning Toolbox proporciona comandos simples de MATLAB para crear e interconectar las capas de una red neuronal profunda. Los ejemplos y redes preentrenadas facilitan el uso de MATLAB para deep learning, incluso sin conocimientos de algoritmos avanzados de visión artificial o sobre redes neuronales.
  • 26. Flujos de Trabajo - Deep Learning ToolBox Dominio Ejemplo Clasificación, regresión y procesamiento de imágenes Permite identificar que tipo de imagen se está procesando. Por ejemplo, saber si es una cara, un perro, etc. Visión Artificial Se puede utilizar para la segmentación semántica y la detección de objetos. Conducción Automática Se utiliza para la detección de vehículos y la segmentación semántica. Procesamiento LiDAR Permite la segmentación semántica y detección de objetos en datos de nubes de puntos organizados en 3D La librería de MatLab permite más aplicaciones con respecto al deep learning; pero estas únicamente se centran en las redes neuronales profundas convolucionales. Este lenguaje nos permite entrenar y crear una arquitectura de la CNN mucho más fácil que otras librerías.
  • 27. Redes preentrenadas Esta librería cuenta con redes preentrenadas, que nos facilita la aplicación de ellas. Además, las redes poseen una arquitectura estable para su implementación. Las redes preentrenadas disponibles son: Nota: Todas estas redes son convolucionales ● squeezenet ● googlenet ● inceptionv3 ● densenet201 ● mobilenetv2 ● resenet50, resenet18 ● xception ● nasnetlarge ● shufflenet ● darknet19, darknet53 ● Vgg16, vgg19
  • 28. Funciones Disponibles para la red CNN Capas de entrada Convolución y capas totalmente conectadas imageInputLayer Capa de entrada de Imagen image3dInputLayer Capa de entrada de imagen 3D convolution2dLayer Capa convolucional 2D convolution3dLayer Capa convolucional 3D groupedConvolution2dLayer Grupo de capas convolucionales 2D transposedConv2dLayer Capa covolucional transpuesta 2D transposedConv3dLayer Capa convolucional transpuesta 3D Capas de convolución convolution1dLayer Capa convolucional 1D transposedConv1dLayer Capa covolucional transpuesta 1D selfAttentionLayer Capa de auto-atención fullyConnectedLayer Capa completamente conectada
  • 29. Reflexión La elección de Deep Learning Toolbox para implementar redes neuronales convolucionales simplifica y agiliza el desarrollo de modelos en MATLAB. Esta herramienta ofrece una interfaz intuitiva que facilita la creación y entrenamiento de CNN, permitiéndonos enfocarnos en estrategias efectivas para problemas específicos. La integración con las funciones de MATLAB ofrece un entorno completo para experimentación y análisis detallado, contribuyendo a un desarrollo eficiente en aprendizaje profundo.
  • 30. PyTorch Es una biblioteca de código abierto diseñada con Python en mente y creada para proyectos de aprendizaje automático. Se especializa en diferenciación automática, cálculos de tensor y aceleración de GPU. Esto lo hace especialmente adecuado para aplicaciones de aprendizaje automático de vanguardia como el Deep Learning.
  • 31. Módulos Básicos en PyTorch para las CNN Es un módulo fundamental para extraer características de las imágenes de entrada mediante la aplicación de filtros convolucionales. Especificamos la cantidad de canales de entrada y salida, el tamaño del kernel, el paso y el relleno. Módulo que realiza la operación de agrupación máxima para reducir la dimensión espacial de las representaciones. Esta capa se utiliza para la clasificación final. Conecta todas las neuronas de la capa anterior con cada neurona de la capa actual, transformando la información para la salida final. torch.nn.Conv2d: Capa de Convolución torch.nn.Linear: Capa Completamente Conectada torch.nn.MaxPool2d: Operación de Agrupación Máxima
  • 32. Funciones de Activación y Normalización La función ReLU introduce no linealidad al activar todas las salidas negativas a cero y mantener las positivas. Declaración: torch.nn.functional.relu Este módulo realiza la normalización por lotes en las activaciones de cada canal en una capa. Estabiliza y acelera el entrenamiento al normalizar estadísticamente las salidas. Declaración: torch.nn.BatchNorm2d El Dropout es una técnica de regularización que ayuda a prevenir el sobreajuste. Durante el entrenamiento, aleatoriamente "apaga" (pone a cero) un porcentaje de unidades en cada paso para evitar la dependencia excesiva de ciertas neuronas. Declaración: torch.nn.Dropout Rectified Linear Unit (ReLU) Normalización por Lotes Capa de Dropout
  • 33. Reflexión Implementar Redes Neuronales Convolucionales (CNN) con la biblioteca PyTorch representa un paso significativo hacia la eficacia y la versatilidad en el desarrollo de modelos de aprendizaje profundo. La flexibilidad y simplicidad de su API, respaldadas por una dinámica computacional intuitiva, ofrecen a los desarrolladores un entorno propicio para la innovación y la experimentación. La capacidad nativa de PyTorch para aprovechar el cómputo en GPU mejora el rendimiento, mientras que su vibrante comunidad y documentación robusta brindan recursos esenciales.
  • 35. Convolutional neural network model by deep learning and teaching robot in keyboard musical instrument teaching En este estudio, se destaca el papel crucial del teclado en la enseñanza musical. El objetivo principal es investigar y mejorar la enseñanza de estos instrumentos, identificando desafíos existentes. El artículo propone abordar deficiencias mediante la integración de tecnología inteligente, específicamente utilizando robots docentes en la educación de instrumentos de teclado. Jidong Liu, Fang Fu. Octubre 2023
  • 36. Proponiendo la integración de robots docentes respaldados por redes neuronales convolucionales (CNN). Se destaca principalmente, la aplicación de CNN en el análisis de imágenes y movimientos de estudiantes durante la interpretación musical, permitiendo enfoques de enseñanza personalizados. Robots inteligentes en la docencia Esto se va a lograr mediante la implementación de LeNet-5 para el reconocimiento de dígitos escritos a mano. El robot docente se caracteriza por su alta flexibilidad, facilitada por su capacidad de utilizar varios sensores para la entrada y salida de información. Su movilidad depende de su estructura versátil, que le permite moverse libremente dentro del aula.
  • 37. Se utilizó un robot docente con un modelo CNN en un navegador sin necesidad de conexión física. La plataforma de desarrollo web permitió la interactividad y visualización en tiempo real de datos de video capturados por la cámara del robot. Pruebas y conclusión Tras analizar los datos se concluyó que el modelo de robot propuesto tiene un potencial prometedor para impactar y mejorar significativamente la enseñanza del teclado. La extensa recopilación de datos de rendimiento del teclado y su conversión en secuencias de notas musicales han establecido una sólida base de datos para el modelo.
  • 38. COVID-19 diagnosis using chest CT scans and deep convolutional neural networks evolved by IP-based sine-cosine algorithm Este estudio se centra en la optimización de una estructura de red neuronal convolucional profunda (DCNN) para mejorar la precisión en el diagnóstico de COVID-19 a partir de imágenes de tomografía computarizada (TC) de los pulmones. Se utiliza el algoritmo seno-coseno (SCA) para optimizar la estructura de la DCNN. Binfeng Xu, Diego Martín, Mahammad Khishe, Reza Boostani. Agosto 2022
  • 39. Se destaca la necesidad de un diagnóstico rápido y preciso de COVID-19, especialmente cuando la prueba de reacción en cadena de la polimerasa (RT-PCR) resulta negativa pero hay problemas respiratorios. Se subraya el papel crucial de las imágenes de tomografía computarizada (TC) en el diagnóstico, pero se señala la dependencia de la interpretación experta. Objetivo El objetivo principal es desarrollar un modelo SCA que automáticamente descubra estructuras de DCNN adecuadas, con contribuciones adicionales que incluyen un enfoque de codificación flexible y una evaluación de aptitud más eficiente utilizando un subconjunto de datos.
  • 40. Experimentación Se presentan los resultados de especificidad, sensibilidad, precisión, exactitud y valor F para el modelo propuesto DCNN-IPSCA y otros métodos comparados como IPPSO, VLGA, VLNSGA-II, VLBSO, IPMPSO, VLBBO y VLACO. Los hallazgos indican que DCNN-IPSCA logra la mejor puntuación de exactitud, con un 99.18% para el conjunto de datos SARS-CoV-2 y un 98.22% para el conjunto de datos COVID-CT.
  • 41. Los hallazgos mostraron que nuestro modelo, que se desarrolló utilizando conjuntos de datos de COVID-CT y SARS-CoV-2, tenía una buena generalización en términos de las imágenes de TC en las que se entrenó. En los conjuntos de datos de SARS-CoV-2 y COVID-CT, el modelo propuesto arroja una precisión final de (98,32% y 98,01%), la sensibilidad de (97,22% y 96,23%) y la especificidad de (96,77% y 96,44%). respectivamente. Conclusión
  • 42. In-Bed Posture Classification Using Deep Neural Network En este estudio, se aborda la monitorización de posturas en la cama para reducir el riesgo de úlceras por presión y mejorar la calidad del sueño. Se proponen Redes Neuronales Convolucionales 2D y 3D, entrenadas en imágenes y videos de un conjunto de datos de acceso abierto con mapas de calor corporal Lindsay Stern, Atena Roshan Ferk. Febrero 2023
  • 43. Este estudio aborda la monitorización de posturas en la cama para reducir el riesgo de úlceras por presión y mejorar la calidad del sueño. La presión constante en una región del cuerpo puede provocar úlceras por presión. Los cuidadores y el personal hospitalario a menudo deben monitorear a los pacientes con úlceras por presión, lo que puede ser laborioso y exigente para los recursos hospitalarios. Objetivo Se propone utilizar una red neuronal convolucional (CNN) 3D para clasificar videos de mapas de calor corporal en tres posturas principales (supina, izquierda y derecha), comparándola con resultados de clasificación de imágenes mediante cuatro modelos CNN 2D.
  • 44. Para el modelo 3D se utilizó un clasificador de vídeo de red neuronal convolucional (CNN) de dos flujos previamente entrenado Para los modelos 2D fueron evaluados AlexNet, ResNet-18, GoogleNet y ShuffleNet. Los cuatro modelos fueron entrenados previamente en la base de datos ImageNet, compuesta por más de un millón de imágenes y 1000 categorías de objetos. Ambos fueron evaluados con LOSO y 5-fold Pruebas
  • 45. Resultados Todos los modelos 2D fueron entre un 1% y un 2% más precisos que el modelo I3D en validación 5-fold. Pero para comparar los algoritmos 2D y 3D, los fotogramas exactos presentes en los datos 3D se extrajeron como entradas de fotograma único para los modelos CNN 2D. Esto llevó a que algunas imágenes fueran muy similares entre sí en el conjunto de datos. Por lo tanto, es más útil comparar los resultados LOSO de los modelos 2D y 3D, ya que no hay posibilidad de fuga de datos. Loso 5-Fold
  • 46. El modelo ponderado logró los valores de precisión más altos de 98,90 ± 1,05 % y 97,80 ± 2,14 % para 5-Fold y LOSO, respectivamente. Para comparar el modelo 3D inflado, se utilizaron cuatro modelos de aprendizaje profundo 2D previamente entrenados: AlexNet, ResNet-18, GoogleNet y ShuffleNet. ResNet-18 logró la precisión más alta de 99,62 ± 0,37% para LOSO, para el modelo de muestreo descendente. Sin embargo, para una comparación más precisa de los modelos ponderados, el algoritmo ShuffleNet recibió la precisión más alta de 99,35 ± 0,43% para LOSO. Conclusión
  • 47. A convolutional neural network highlights mutations relevant to antimicrobial resistance in Mycobacterium tuberculosis La demora en el diagnóstico de resistencia a antibióticos en M. tuberculosis y propone soluciones mediante la secuenciación genómica respaldada por aprendizaje automático. Introduce dos redes neuronales convolucionales (MD-CNN y SD-CNN) que predicen la resistencia a múltiples y a un solo antibiótico, respectivamente. Estas CNN muestran alta sensibilidad y especificidad, identificando además sitios genómicos previamente no asociados con resistencia. Green, Ho Yoon, Chen, Ektefaie, Fina, Freschi. July 2022
  • 48. El objetivo principal del artículo es abordar los prolongados tiempos de espera en el diagnóstico de resistencia a antibióticos en Mycobacterium tuberculosis, proponiendo una solución a través de la aplicación de la secuenciación del genoma completo respaldada por modelos de aprendizaje automático. Objetivo El enfoque se centra en la implementación de dos redes neuronales convolucionales, MD-CNN y SD-CNN, que buscan predecir la resistencia a múltiples y a un solo antibiótico, respectivamente. Estos modelos no solo exhiben un alto rendimiento en términos de sensibilidad y especificidad, sino que también identifican sitios genómicos previamente no asociados con la resistencia.
  • 49. Pruebas ● Utilización de 10,201 aislados de M. tuberculosis de ReSeqTB y la Red de Laboratorios de Referencia Supranacional de la OMS. ● Cada aislado tiene un fenotipo de resistencia a al menos uno de los 13 fármacos antituberculosos. Datos de Entrenamiento MD-CNN (Red Neuronal Convolucional de Múltiples Fármacos): ● Predice resistencia a los 13 fármacos simultáneamente. ● Utiliza secuencias completas de 18 loci genómicos. SD-CNN (Redes Neuronales Convolucionales de un Solo Fármaco): ● Predice resistencia a cada fármaco individualmente. ● Se centra en loci con asociaciones causales conocidas. Diseño del modelo ● Evaluación mediante AUC, sensibilidad y especificidad. ● Destacada eficacia de MD-CNN al superar a la regresión L2 para fármacos de segunda línea. Métricas de rendimiento
  • 50. Resultados y Conclusiones Resultados: ● MD-CNN y SD-CNN presentan rendimiento comparables al modelo WDNN de última generación. ● MD-CNN y SD-CNN presentan rendimientos comparables al modelo WDNN de última generación. Conclusiones: ● Los modelos de CNN ofrecen resultados precisos y confiables. ● Se destaca la eficiencia de MD-CNN y la interpretabilidad de ambos modelos en la predicción de resistencia a antibióticos.
  • 51. Dense optic nerve head deformation estimated using CNN as a structural biomarker of glaucoma progression La investigación presenta un nuevo biomarcador estructural para la detección de la progresión del glaucoma, enfocado en la transformación de la región de la cabeza del nervio óptico (ONH) a lo largo del tiempo. Utilizando métodos de aprendizaje profundo y comparándolos con enfoques computacionales tradicionales, se evalúa la eficacia del biomarcador en escaneos longitudinales de ojos normales y en progresión. Salehi, Balasubramanian. June 2023
  • 52. Se central es proponer esta herramienta como un medio efectivo, respaldado por métodos avanzados de aprendizaje profundo, para evaluar la progresión del glaucoma y su detección temprana. Objetivo
  • 53. Para desarrollar la herramienta se utilizaron métodos avanzados de aprendizaje profundo, como DDCNet-Multires, FlowNet2 y FlowNetCorrelation, junto con enfoques computacionales tradicionales como análisis de cambios topográficos (TCA) y descomposición ortogonal adecuada (POD). Estos métodos se aplican para estimar la deformación densa de la región de la cabeza del nervio óptico a lo largo del tiempo. Además, se propone un biomarcador candidato basado en la magnitud promedio de esta deformación. Métodos La evaluación de la precisión diagnóstica se lleva a cabo mediante el área bajo la curva ROC (AUC), utilizando escaneos longitudinales de ojos normales y en progresión. La comparación de estos métodos busca destacar la eficacia de las técnicas de aprendizaje profundo en la detección y evaluación del glaucoma.
  • 54. El Estudio Experimental de Glaucoma (LEGS), los AUC fueron 0,83 para DDCNet-Multires, FlowNet2 y correlación FlowNet, 0,94 para POD, y 0,86 para métodos TCA. Para el Estudio de Innovaciones Diagnósticas en Glaucoma de UCSD (DIGS), los AUC fueron 0,89, 0,82, 0,93, 0,86 y 0,86 respectivamente. La menor precisión de los métodos basados en aprendizaje en el LEGS se atribuyó a errores de alineación de imágenes. Resultados
  • 55. Los métodos de aprendizaje profundo para estimar la deformación genérica demostraron una mayor precisión en la estimación de la deformación de ONH y ofrecieron una mayor precisión diagnóstica. La validación del biomarcador en condiciones controladas respalda su precisión diagnóstica en poblaciones clínicas. Conclusión
  • 56. CREDITS: This presentation template was created by Slidesgo, and includes icons by Flaticon, and infographics & images by Freepik Gracias!
  • 57. Referencias ● https://la.mathworks.com/help/deeplearning/referencelist.html?type=function ● https://la.mathworks.com/help/deeplearning/ug/deep-learning-in-matlab.html ● https://aws.amazon.com/es/what-is/neural-network/ ● https://datascientest.com/es/convolutional-neural-network-es ● https://developer.oracle.com/es/learn/technical-articles/1481879246309-134-what-is-pytorch ● https://www.flatworldsolutions.com/data-science/articles/7-applications-of-convolutional-neural-networ ks.php ● https://www.ncbi.nlm.nih.gov/pmc/articles/PMC10602282/ ● https://www.ncbi.nlm.nih.gov/pmc/articles/PMC9374292/ ● https://www.ncbi.nlm.nih.gov/pmc/articles/PMC10007451/ ● https://www.nature.com/articles/s41467-022-31236-0 ● https://www.nature.com/articles/s41433-023-02623-8#Abs1 ●