SlideShare una empresa de Scribd logo
Agreement
 If you plan to share these slides or to use the content in these slides for
your own work, please include the following reference:
 Si tu intención es compartir esta presentación, o usar su contenido para tu
propio trabajo, por favor, incluye la siguiente referencia:
Tejero-de-Pablos, A. (2022) “Inteligencia artificial, visión por ordenador,
y datos multimodales”. ACE Japón Webinar Series.
Inteligencia artificial,
visión por ordenador,
y datos multimodales
ACE JAPÓN WEBINAR SERIES
ANTONIO TEJERO DE PABLOS
6 DE ABRIL DE 2022
Image from oracle.com
Índice
2
Sobre mí
Inteligencia artificial y visión por ordenador
Mi tema de investigación: Datos multimodales y
heterogéneos
El futuro de la inteligencia artificial
Sobre mí
Página web - https://antonio-t.github.io/
Sobre mí
 Universidad de Valladolid (~2012)
 Ingeniero de Telecomunicaciones
 Máster en Tecnologías de la Información y Comunicaciones
 Instituto de Ciencia y Tecnología de Nara (~2017)
 Doctorado en ingeniería (ciencias de la información)
 Universidad de Tokio – Instituto RIKEN (~2021)
 Investigador
 CyberAgent AI Lab (Actualidad)
 Científico investigador
4
Inteligencia artificial
y visión por
ordenador
Qué es la inteligencia
artificial
¿Robots?
¿Una réplica digital del
cerebro humano?
6
Image from analyticsinsight.net
Qué es la inteligencia artificial 7
La inteligencia artificial no es robótica
No siempre intenta imitar el cerebro del ser humano
 Pero es fácil de ejemplificar mediante el comportamiento de un robot
Inteligencia artificial vs. aprendizaje máquina
 Reconocimiento de patrones
Image from medium.com
Aprendizaje máquina 8
Reconocimiento de patrones
 Aportar datos (secuencias numéricas, imágenes, etc.) a un
algoritmo de aprendizaje que encuentra similitudes entre ellos a
la hora de realizar una tarea
 Implementado en un programa de ordenador
El reconocimiento de patrones permite:
 Predecir cambios en la población y otras estadísticas
 Traducir textos de un idioma a otro
 Reconocer caras para identificar usuarios
Image from simplilearn.com
Visión por ordenador
Los ojos (?) del robot
Reconocimiento de patrones en imágenes
Múltiples aplicaciones
 Medicina, automóviles, etc.
9
Image from IrisVision.com
Cámara
Fotos/
vídeos
Algoritmo de
aprendizaje
Image from shutterstock.com
Representación
latente
(características)
Visión por ordenador: Inicios
El humano determina qué ”características” aprender
 Limitado en cuanto a precisión y dificultad de la tarea
¿Qué es una red neuronal?
 Redes neuronales pequeñas en sus inicios
10
Image from wikipedia.org
Image from analyticsvidhya.org
Red neuronal
・Coche
・Persona
・…
Representación
mediante contornos
Visión por ordenador: Actualidad
Aprendizaje profundo
 Aumento exponencial del número de parámetros (~175 billones)
 La red neuronal determina las características a aprender de forma óptima
 Reconocimiento de patrones más complejos, tareas más complicadas
11
Image from researchgate.net
…
Aprendizaje profundo: Ejemplo 1
 Segmentación semántica
12
Image from nanonets.com
Aprendizaje profundo: Ejemplo 2
 Generación de imagen
No todo es ideal
 Se requieren grandes cantidades de datos (millones)
13
Image from twitter.com/charles2m
Mi tema de investigación:
Datos multimodales
y heterogéneos
El poder de los datos multimodales
El mundo es multimodal: imagen, video, audio, texto, etc.
Hay tareas que requieren más de un sentido
 Conducción: Imagen de la carretera + Voces de niños
 Diagnóstico: Imagen del corazon + Señal ECG
15
Image from aare.edu.au
El poder de los datos multimodales
Las redes neuronales pueden procesar distintos tipos de información
 Pero no es trivial en qué punto, y cómo han de mezclarse
16
・Coche
・Coche
Opción 1 Opción 2, etc.
Datos heterogéneos
El aprendizaje profundo requiere reunir grandes cantidades de datos
17
Images from wikipedia.org
Durante el
aprendizaje:
Una vez desplegado
el sistema:
Datos heterogéneos
El problema de generalización
 Una red neuronal ”naïve” sólo conoce los datos que ha visto
18
Image from Out-of-distribution Generalization and Its Applications for Multimedia (Wang et al.)
Algunos de mis resultados
Resumen automático de vídeo deportivo (detección de mejores momentos)
 Uso de datos multimodales (imagen y sensores)
Diagnóstico automático de imagen cardiaca
 Uso de datos heterogéneos debido a la escasez de pacientes
19
CNN
(VGG-M)
FV
Linear
SVM
CNN
(VGG-M)
FV
Linear
SVM
CNN
(VGG-M)
FV
Linear
SVM MEAN
MAX
…
Input view
images
Feature
extractor
Encoder Classifier Probabilities Final
decision
(ensemble)
N
N
(a)
(b)
(c)
CPR volume
segment
(192×192×N
voxels)
CNN
(VGG-M)
FV
Linear
SVM
CNN
(VGG-M)
FV
Linear
SVM
CNN
(VGG-M)
FV
Linear
SVM
CNN
(VGG-M)
FV
Linear
SVM
CNN
(VGG-M)
FV
Linear
SVM
MEAN
MAX
…
Input view
images
Feature
extractor
Encoder Classifier Probabilities Final
decision
(ensemble)
N
N
(a)
(b)
(c)
(d)
(e)
CPR volume
segment
(192×192×N
voxels)
CNN
(VGG-M)
CNN
(VGG-M)
CNN
(VGG-M)
CNN
(VGG-M)
Input view
images
Feature
extractor
N
(a)
(b)
(c)
(d)
CPR volume
segment
(192×192×N
voxels)
CNN
(VGG-M)
FV
Linear
SVM
CNN
(VGG-M)
FV
Linear
SVM
CNN
(VGG-M)
FV
Linear
SVM
CNN
(VGG-M)
FV
Linear
SVM
CNN
(VGG-M)
FV
Linear
SVM
…
Input view
images
Feature
extractor
Encoder Classifier Probab
N
N
(a)
(b)
(c)
(d)
(e)
CPR volume
segment
(192×192×N
voxels)
Aprendizaje
Paciente 1
Scanner A
Despliegue
Paciente 2
Scanner B
+
El futuro de la
inteligencia artificial
El futuro cercano de la IA
¿Va a quitarnos la inteligencia artificial el trabajo?
 Posiblemente, con trabajos simples y repetitivos
 El ser humano centrado en la creación. Colaboración IA-humano.
Principal problema
 El individuo ”de a pie” no tiene fundamentos de ciencia / tecnología
21
Image from espsciencetime.org
El futuro lejano de la
inteligencia artificial
¿Va a reemplazar la inteligencia artificial al cerebro
humano?
 No con la tecnología actual
 Cerebro humano ≠ inteligencia
 La humanidad también evoluciona
 Idealmente, la inteligencia artificial será una ayuda
Todo esto es ciencia ficción
 Objetivos realistas a corto plazo
22
Image from bernardmarr.com
¡GRACIAS POR SU
ATENCIÓN!

Más contenido relacionado

Similar a Inteligencia artificial, visión por ordenador, y datos multimodales - ACE Japón Webinar Series (2022/04/06)

Enrique Blanco & Pablo González - Autoencoders, GANS y otros chicos del montó...
Enrique Blanco & Pablo González - Autoencoders, GANS y otros chicos del montó...Enrique Blanco & Pablo González - Autoencoders, GANS y otros chicos del montó...
Enrique Blanco & Pablo González - Autoencoders, GANS y otros chicos del montó...
RootedCON
 
Foro atica-gsi-noviembre2010 3
Foro atica-gsi-noviembre2010 3Foro atica-gsi-noviembre2010 3
Foro atica-gsi-noviembre2010 3
Ulises Cortés
 
Raspberry jam Bogota 2016 - Sistema de visión artificial aplicados a procesos...
Raspberry jam Bogota 2016 - Sistema de visión artificial aplicados a procesos...Raspberry jam Bogota 2016 - Sistema de visión artificial aplicados a procesos...
Raspberry jam Bogota 2016 - Sistema de visión artificial aplicados a procesos...
javiertecteos
 
U2 inteligencia artificial y programación funcional
U2 inteligencia artificial y programación funcionalU2 inteligencia artificial y programación funcional
U2 inteligencia artificial y programación funcional
rafael366138
 
Tema 1 Inteligencia Artificial.pptx
Tema 1  Inteligencia  Artificial.pptxTema 1  Inteligencia  Artificial.pptx
Tema 1 Inteligencia Artificial.pptx
IES Eugenio frutos
 
Patrones
PatronesPatrones
Patrones
Ruben Sanchez
 
La nueva revolución Industrial: Inteligencia Artificial & IoT Edge
La nueva revolución Industrial: Inteligencia Artificial & IoT EdgeLa nueva revolución Industrial: Inteligencia Artificial & IoT Edge
La nueva revolución Industrial: Inteligencia Artificial & IoT Edge
Plain Concepts
 
Innovación en el tratamiento de la información desde la Ingeniería del Conoc...
Innovación en el tratamiento de la información desde la  Ingeniería del Conoc...Innovación en el tratamiento de la información desde la  Ingeniería del Conoc...
Innovación en el tratamiento de la información desde la Ingeniería del Conoc...
Joaquín Borrego-Díaz
 
"Educación y datos masivos (Big Data)" - Fernando Santamaria
"Educación y datos masivos (Big Data)" - Fernando Santamaria"Educación y datos masivos (Big Data)" - Fernando Santamaria
"Educación y datos masivos (Big Data)" - Fernando Santamaria
Nivel 7
 
Educación y datos masivos (Big Data)
Educación y datos masivos (Big Data)Educación y datos masivos (Big Data)
Educación y datos masivos (Big Data)
Fernando Santamaría
 
"Educación y datos masivos (Big Data)" - Fernando Santamaria
"Educación y datos masivos (Big Data)" - Fernando Santamaria"Educación y datos masivos (Big Data)" - Fernando Santamaria
"Educación y datos masivos (Big Data)" - Fernando Santamaria
Nivel 7
 
Clasificación de acciones sociales usando computer vision
Clasificación de acciones sociales usando computer visionClasificación de acciones sociales usando computer vision
Clasificación de acciones sociales usando computer vision
Software Guru
 
Visión por computador
Visión por computadorVisión por computador
Visión por computador
Andrew Bernard
 
Algoritmo de Reconocimiento de Objetos en Escenas Complejas para Aplicaciones...
Algoritmo de Reconocimiento de Objetos en Escenas Complejas para Aplicaciones...Algoritmo de Reconocimiento de Objetos en Escenas Complejas para Aplicaciones...
Algoritmo de Reconocimiento de Objetos en Escenas Complejas para Aplicaciones...
CIMAT
 
Inteligencia artificial
Inteligencia artificialInteligencia artificial
Inteligencia artificial
progamacioneis
 
Trabajo danis.pdf
Trabajo danis.pdfTrabajo danis.pdf
Trabajo danis.pdf
adaura
 
INTELIGÈNCIA I PERCEPCIÓ ARTIFICIAL
INTELIGÈNCIA I PERCEPCIÓ ARTIFICIALINTELIGÈNCIA I PERCEPCIÓ ARTIFICIAL
INTELIGÈNCIA I PERCEPCIÓ ARTIFICIAL
adaura
 
Unidad 1: Informatica
Unidad 1: InformaticaUnidad 1: Informatica
Unidad 1: Informatica
Nombre Apellidos
 
Redes Bayesianas
Redes BayesianasRedes Bayesianas
Redes Bayesianas
Alvaro Marin
 
tomografias.pptx
tomografias.pptxtomografias.pptx
tomografias.pptx
DanielAlexanderCruzR
 

Similar a Inteligencia artificial, visión por ordenador, y datos multimodales - ACE Japón Webinar Series (2022/04/06) (20)

Enrique Blanco & Pablo González - Autoencoders, GANS y otros chicos del montó...
Enrique Blanco & Pablo González - Autoencoders, GANS y otros chicos del montó...Enrique Blanco & Pablo González - Autoencoders, GANS y otros chicos del montó...
Enrique Blanco & Pablo González - Autoencoders, GANS y otros chicos del montó...
 
Foro atica-gsi-noviembre2010 3
Foro atica-gsi-noviembre2010 3Foro atica-gsi-noviembre2010 3
Foro atica-gsi-noviembre2010 3
 
Raspberry jam Bogota 2016 - Sistema de visión artificial aplicados a procesos...
Raspberry jam Bogota 2016 - Sistema de visión artificial aplicados a procesos...Raspberry jam Bogota 2016 - Sistema de visión artificial aplicados a procesos...
Raspberry jam Bogota 2016 - Sistema de visión artificial aplicados a procesos...
 
U2 inteligencia artificial y programación funcional
U2 inteligencia artificial y programación funcionalU2 inteligencia artificial y programación funcional
U2 inteligencia artificial y programación funcional
 
Tema 1 Inteligencia Artificial.pptx
Tema 1  Inteligencia  Artificial.pptxTema 1  Inteligencia  Artificial.pptx
Tema 1 Inteligencia Artificial.pptx
 
Patrones
PatronesPatrones
Patrones
 
La nueva revolución Industrial: Inteligencia Artificial & IoT Edge
La nueva revolución Industrial: Inteligencia Artificial & IoT EdgeLa nueva revolución Industrial: Inteligencia Artificial & IoT Edge
La nueva revolución Industrial: Inteligencia Artificial & IoT Edge
 
Innovación en el tratamiento de la información desde la Ingeniería del Conoc...
Innovación en el tratamiento de la información desde la  Ingeniería del Conoc...Innovación en el tratamiento de la información desde la  Ingeniería del Conoc...
Innovación en el tratamiento de la información desde la Ingeniería del Conoc...
 
"Educación y datos masivos (Big Data)" - Fernando Santamaria
"Educación y datos masivos (Big Data)" - Fernando Santamaria"Educación y datos masivos (Big Data)" - Fernando Santamaria
"Educación y datos masivos (Big Data)" - Fernando Santamaria
 
Educación y datos masivos (Big Data)
Educación y datos masivos (Big Data)Educación y datos masivos (Big Data)
Educación y datos masivos (Big Data)
 
"Educación y datos masivos (Big Data)" - Fernando Santamaria
"Educación y datos masivos (Big Data)" - Fernando Santamaria"Educación y datos masivos (Big Data)" - Fernando Santamaria
"Educación y datos masivos (Big Data)" - Fernando Santamaria
 
Clasificación de acciones sociales usando computer vision
Clasificación de acciones sociales usando computer visionClasificación de acciones sociales usando computer vision
Clasificación de acciones sociales usando computer vision
 
Visión por computador
Visión por computadorVisión por computador
Visión por computador
 
Algoritmo de Reconocimiento de Objetos en Escenas Complejas para Aplicaciones...
Algoritmo de Reconocimiento de Objetos en Escenas Complejas para Aplicaciones...Algoritmo de Reconocimiento de Objetos en Escenas Complejas para Aplicaciones...
Algoritmo de Reconocimiento de Objetos en Escenas Complejas para Aplicaciones...
 
Inteligencia artificial
Inteligencia artificialInteligencia artificial
Inteligencia artificial
 
Trabajo danis.pdf
Trabajo danis.pdfTrabajo danis.pdf
Trabajo danis.pdf
 
INTELIGÈNCIA I PERCEPCIÓ ARTIFICIAL
INTELIGÈNCIA I PERCEPCIÓ ARTIFICIALINTELIGÈNCIA I PERCEPCIÓ ARTIFICIAL
INTELIGÈNCIA I PERCEPCIÓ ARTIFICIAL
 
Unidad 1: Informatica
Unidad 1: InformaticaUnidad 1: Informatica
Unidad 1: Informatica
 
Redes Bayesianas
Redes BayesianasRedes Bayesianas
Redes Bayesianas
 
tomografias.pptx
tomografias.pptxtomografias.pptx
tomografias.pptx
 

Más de Antonio Tejero de Pablos

ECCV2022 paper reading - MultiMAE: Multi-modal Multi-task Masked Autoencoders...
ECCV2022 paper reading - MultiMAE: Multi-modal Multi-task Masked Autoencoders...ECCV2022 paper reading - MultiMAE: Multi-modal Multi-task Masked Autoencoders...
ECCV2022 paper reading - MultiMAE: Multi-modal Multi-task Masked Autoencoders...
Antonio Tejero de Pablos
 
CVPR2022 paper reading - Balanced multimodal learning - All Japan Computer Vi...
CVPR2022 paper reading - Balanced multimodal learning - All Japan Computer Vi...CVPR2022 paper reading - Balanced multimodal learning - All Japan Computer Vi...
CVPR2022 paper reading - Balanced multimodal learning - All Japan Computer Vi...
Antonio Tejero de Pablos
 
WakateMIRU2022 (グループ8) ディープワークによる時間管理
WakateMIRU2022 (グループ8) ディープワークによる時間管理WakateMIRU2022 (グループ8) ディープワークによる時間管理
WakateMIRU2022 (グループ8) ディープワークによる時間管理
Antonio Tejero de Pablos
 
VAEs for multimodal disentanglement
VAEs for multimodal disentanglementVAEs for multimodal disentanglement
VAEs for multimodal disentanglement
Antonio Tejero de Pablos
 
Machine Learning Fundamentals IEEE
Machine Learning Fundamentals IEEEMachine Learning Fundamentals IEEE
Machine Learning Fundamentals IEEE
Antonio Tejero de Pablos
 
Presentation Skills Up! Seminar - Harada Ushiku Lab (English)
Presentation Skills Up! Seminar - Harada Ushiku Lab (English)Presentation Skills Up! Seminar - Harada Ushiku Lab (English)
Presentation Skills Up! Seminar - Harada Ushiku Lab (English)
Antonio Tejero de Pablos
 
プレゼンスキルアップ!講座 原田・牛久研究室(日本語)
プレゼンスキルアップ!講座 原田・牛久研究室(日本語)プレゼンスキルアップ!講座 原田・牛久研究室(日本語)
プレゼンスキルアップ!講座 原田・牛久研究室(日本語)
Antonio Tejero de Pablos
 

Más de Antonio Tejero de Pablos (7)

ECCV2022 paper reading - MultiMAE: Multi-modal Multi-task Masked Autoencoders...
ECCV2022 paper reading - MultiMAE: Multi-modal Multi-task Masked Autoencoders...ECCV2022 paper reading - MultiMAE: Multi-modal Multi-task Masked Autoencoders...
ECCV2022 paper reading - MultiMAE: Multi-modal Multi-task Masked Autoencoders...
 
CVPR2022 paper reading - Balanced multimodal learning - All Japan Computer Vi...
CVPR2022 paper reading - Balanced multimodal learning - All Japan Computer Vi...CVPR2022 paper reading - Balanced multimodal learning - All Japan Computer Vi...
CVPR2022 paper reading - Balanced multimodal learning - All Japan Computer Vi...
 
WakateMIRU2022 (グループ8) ディープワークによる時間管理
WakateMIRU2022 (グループ8) ディープワークによる時間管理WakateMIRU2022 (グループ8) ディープワークによる時間管理
WakateMIRU2022 (グループ8) ディープワークによる時間管理
 
VAEs for multimodal disentanglement
VAEs for multimodal disentanglementVAEs for multimodal disentanglement
VAEs for multimodal disentanglement
 
Machine Learning Fundamentals IEEE
Machine Learning Fundamentals IEEEMachine Learning Fundamentals IEEE
Machine Learning Fundamentals IEEE
 
Presentation Skills Up! Seminar - Harada Ushiku Lab (English)
Presentation Skills Up! Seminar - Harada Ushiku Lab (English)Presentation Skills Up! Seminar - Harada Ushiku Lab (English)
Presentation Skills Up! Seminar - Harada Ushiku Lab (English)
 
プレゼンスキルアップ!講座 原田・牛久研究室(日本語)
プレゼンスキルアップ!講座 原田・牛久研究室(日本語)プレゼンスキルアップ!講座 原田・牛久研究室(日本語)
プレゼンスキルアップ!講座 原田・牛久研究室(日本語)
 

Último

OPERACIONPLANTA_CLASE14_CLASE15_BOMBAS_FLOTACIONSELECTIVA.pdf
OPERACIONPLANTA_CLASE14_CLASE15_BOMBAS_FLOTACIONSELECTIVA.pdfOPERACIONPLANTA_CLASE14_CLASE15_BOMBAS_FLOTACIONSELECTIVA.pdf
OPERACIONPLANTA_CLASE14_CLASE15_BOMBAS_FLOTACIONSELECTIVA.pdf
AlejandroContreras470286
 
Material magnetismo.pdf material del electromagnetismo con fórmulas
Material magnetismo.pdf material del electromagnetismo con fórmulasMaterial magnetismo.pdf material del electromagnetismo con fórmulas
Material magnetismo.pdf material del electromagnetismo con fórmulas
michiotes33
 
380378757-velocidades-maximas-y-minimas-en-los-canales.pdf
380378757-velocidades-maximas-y-minimas-en-los-canales.pdf380378757-velocidades-maximas-y-minimas-en-los-canales.pdf
380378757-velocidades-maximas-y-minimas-en-los-canales.pdf
DiegoAlexanderChecaG
 
DIAGRAMA SIPOC INGENIERIA INDUSTRIAL HERRAMIENTA
DIAGRAMA SIPOC INGENIERIA INDUSTRIAL HERRAMIENTADIAGRAMA SIPOC INGENIERIA INDUSTRIAL HERRAMIENTA
DIAGRAMA SIPOC INGENIERIA INDUSTRIAL HERRAMIENTA
MayDaniel2
 
1. Introduccion a las excavaciones subterraneas (1).pdf
1. Introduccion a las excavaciones subterraneas (1).pdf1. Introduccion a las excavaciones subterraneas (1).pdf
1. Introduccion a las excavaciones subterraneas (1).pdf
raulnilton2018
 
MECÁNICA DE SUELOS I - Comportamiento suelos granulares
MECÁNICA DE SUELOS I - Comportamiento suelos granularesMECÁNICA DE SUELOS I - Comportamiento suelos granulares
MECÁNICA DE SUELOS I - Comportamiento suelos granulares
Fernando878837
 
NOM-001-SEDE-2012.pdf instalación eléctrica
NOM-001-SEDE-2012.pdf instalación eléctricaNOM-001-SEDE-2012.pdf instalación eléctrica
NOM-001-SEDE-2012.pdf instalación eléctrica
gabyp22
 
AUTOCAD 2D - UA1 DE NIVEL INTERMEDIO CON
AUTOCAD 2D - UA1 DE NIVEL INTERMEDIO CONAUTOCAD 2D - UA1 DE NIVEL INTERMEDIO CON
AUTOCAD 2D - UA1 DE NIVEL INTERMEDIO CON
FreddyJuniorOrtechoC
 
Cargas de Cálculos Estructurales de un Puente
Cargas de Cálculos Estructurales de un PuenteCargas de Cálculos Estructurales de un Puente
Cargas de Cálculos Estructurales de un Puente
jemifermelgarejoaran1
 
Infografía operaciones básicas construcción .pdf
Infografía operaciones básicas construcción .pdfInfografía operaciones básicas construcción .pdf
Infografía operaciones básicas construcción .pdf
Carlos Pulido
 
Aletas de Transferencia de Calor o Superficies Extendidas.pdf
Aletas de Transferencia de Calor o Superficies Extendidas.pdfAletas de Transferencia de Calor o Superficies Extendidas.pdf
Aletas de Transferencia de Calor o Superficies Extendidas.pdf
JuanAlbertoLugoMadri
 
ascensor o elevador​ es un sistema de transporte vertical u oblicuo, diseñado...
ascensor o elevador​ es un sistema de transporte vertical u oblicuo, diseñado...ascensor o elevador​ es un sistema de transporte vertical u oblicuo, diseñado...
ascensor o elevador​ es un sistema de transporte vertical u oblicuo, diseñado...
LuisLobatoingaruca
 
Medicion-Del-Agua-de-Riego-Aforo 2023.pptx
Medicion-Del-Agua-de-Riego-Aforo 2023.pptxMedicion-Del-Agua-de-Riego-Aforo 2023.pptx
Medicion-Del-Agua-de-Riego-Aforo 2023.pptx
MONICADELROCIOMUNZON1
 
INFORME DE LABORATORIO MECANICA DE FLUIDOS (1).docx
INFORME DE LABORATORIO MECANICA DE FLUIDOS (1).docxINFORME DE LABORATORIO MECANICA DE FLUIDOS (1).docx
INFORME DE LABORATORIO MECANICA DE FLUIDOS (1).docx
LuzdeFatimaCarranzaG
 
tipos de energias: la Energía Radiante.pdf
tipos de energias: la Energía Radiante.pdftipos de energias: la Energía Radiante.pdf
tipos de energias: la Energía Radiante.pdf
munozvanessa878
 
INGLES_LISTA_DE_VOCABULARIO una lista completa
INGLES_LISTA_DE_VOCABULARIO una lista completaINGLES_LISTA_DE_VOCABULARIO una lista completa
INGLES_LISTA_DE_VOCABULARIO una lista completa
JaimmsArthur
 
Sesión 03 universidad cesar vallejo 2024
Sesión 03 universidad cesar vallejo 2024Sesión 03 universidad cesar vallejo 2024
Sesión 03 universidad cesar vallejo 2024
FantasticVideo1
 
ilovepdf_merged (2) (1)-4-51.pdfORLANDOMARTIN
ilovepdf_merged (2) (1)-4-51.pdfORLANDOMARTINilovepdf_merged (2) (1)-4-51.pdfORLANDOMARTIN
ilovepdf_merged (2) (1)-4-51.pdfORLANDOMARTIN
OrlandoRomanEcheandi
 
OPERACIONES BÁSICAS (INFOGRAFIA) DOCUMENTO
OPERACIONES BÁSICAS (INFOGRAFIA) DOCUMENTOOPERACIONES BÁSICAS (INFOGRAFIA) DOCUMENTO
OPERACIONES BÁSICAS (INFOGRAFIA) DOCUMENTO
GERARDO GONZALEZ
 
muros de contencion, diseño y generalidades
muros de contencion, diseño y generalidadesmuros de contencion, diseño y generalidades
muros de contencion, diseño y generalidades
AlejandroArturoGutie1
 

Último (20)

OPERACIONPLANTA_CLASE14_CLASE15_BOMBAS_FLOTACIONSELECTIVA.pdf
OPERACIONPLANTA_CLASE14_CLASE15_BOMBAS_FLOTACIONSELECTIVA.pdfOPERACIONPLANTA_CLASE14_CLASE15_BOMBAS_FLOTACIONSELECTIVA.pdf
OPERACIONPLANTA_CLASE14_CLASE15_BOMBAS_FLOTACIONSELECTIVA.pdf
 
Material magnetismo.pdf material del electromagnetismo con fórmulas
Material magnetismo.pdf material del electromagnetismo con fórmulasMaterial magnetismo.pdf material del electromagnetismo con fórmulas
Material magnetismo.pdf material del electromagnetismo con fórmulas
 
380378757-velocidades-maximas-y-minimas-en-los-canales.pdf
380378757-velocidades-maximas-y-minimas-en-los-canales.pdf380378757-velocidades-maximas-y-minimas-en-los-canales.pdf
380378757-velocidades-maximas-y-minimas-en-los-canales.pdf
 
DIAGRAMA SIPOC INGENIERIA INDUSTRIAL HERRAMIENTA
DIAGRAMA SIPOC INGENIERIA INDUSTRIAL HERRAMIENTADIAGRAMA SIPOC INGENIERIA INDUSTRIAL HERRAMIENTA
DIAGRAMA SIPOC INGENIERIA INDUSTRIAL HERRAMIENTA
 
1. Introduccion a las excavaciones subterraneas (1).pdf
1. Introduccion a las excavaciones subterraneas (1).pdf1. Introduccion a las excavaciones subterraneas (1).pdf
1. Introduccion a las excavaciones subterraneas (1).pdf
 
MECÁNICA DE SUELOS I - Comportamiento suelos granulares
MECÁNICA DE SUELOS I - Comportamiento suelos granularesMECÁNICA DE SUELOS I - Comportamiento suelos granulares
MECÁNICA DE SUELOS I - Comportamiento suelos granulares
 
NOM-001-SEDE-2012.pdf instalación eléctrica
NOM-001-SEDE-2012.pdf instalación eléctricaNOM-001-SEDE-2012.pdf instalación eléctrica
NOM-001-SEDE-2012.pdf instalación eléctrica
 
AUTOCAD 2D - UA1 DE NIVEL INTERMEDIO CON
AUTOCAD 2D - UA1 DE NIVEL INTERMEDIO CONAUTOCAD 2D - UA1 DE NIVEL INTERMEDIO CON
AUTOCAD 2D - UA1 DE NIVEL INTERMEDIO CON
 
Cargas de Cálculos Estructurales de un Puente
Cargas de Cálculos Estructurales de un PuenteCargas de Cálculos Estructurales de un Puente
Cargas de Cálculos Estructurales de un Puente
 
Infografía operaciones básicas construcción .pdf
Infografía operaciones básicas construcción .pdfInfografía operaciones básicas construcción .pdf
Infografía operaciones básicas construcción .pdf
 
Aletas de Transferencia de Calor o Superficies Extendidas.pdf
Aletas de Transferencia de Calor o Superficies Extendidas.pdfAletas de Transferencia de Calor o Superficies Extendidas.pdf
Aletas de Transferencia de Calor o Superficies Extendidas.pdf
 
ascensor o elevador​ es un sistema de transporte vertical u oblicuo, diseñado...
ascensor o elevador​ es un sistema de transporte vertical u oblicuo, diseñado...ascensor o elevador​ es un sistema de transporte vertical u oblicuo, diseñado...
ascensor o elevador​ es un sistema de transporte vertical u oblicuo, diseñado...
 
Medicion-Del-Agua-de-Riego-Aforo 2023.pptx
Medicion-Del-Agua-de-Riego-Aforo 2023.pptxMedicion-Del-Agua-de-Riego-Aforo 2023.pptx
Medicion-Del-Agua-de-Riego-Aforo 2023.pptx
 
INFORME DE LABORATORIO MECANICA DE FLUIDOS (1).docx
INFORME DE LABORATORIO MECANICA DE FLUIDOS (1).docxINFORME DE LABORATORIO MECANICA DE FLUIDOS (1).docx
INFORME DE LABORATORIO MECANICA DE FLUIDOS (1).docx
 
tipos de energias: la Energía Radiante.pdf
tipos de energias: la Energía Radiante.pdftipos de energias: la Energía Radiante.pdf
tipos de energias: la Energía Radiante.pdf
 
INGLES_LISTA_DE_VOCABULARIO una lista completa
INGLES_LISTA_DE_VOCABULARIO una lista completaINGLES_LISTA_DE_VOCABULARIO una lista completa
INGLES_LISTA_DE_VOCABULARIO una lista completa
 
Sesión 03 universidad cesar vallejo 2024
Sesión 03 universidad cesar vallejo 2024Sesión 03 universidad cesar vallejo 2024
Sesión 03 universidad cesar vallejo 2024
 
ilovepdf_merged (2) (1)-4-51.pdfORLANDOMARTIN
ilovepdf_merged (2) (1)-4-51.pdfORLANDOMARTINilovepdf_merged (2) (1)-4-51.pdfORLANDOMARTIN
ilovepdf_merged (2) (1)-4-51.pdfORLANDOMARTIN
 
OPERACIONES BÁSICAS (INFOGRAFIA) DOCUMENTO
OPERACIONES BÁSICAS (INFOGRAFIA) DOCUMENTOOPERACIONES BÁSICAS (INFOGRAFIA) DOCUMENTO
OPERACIONES BÁSICAS (INFOGRAFIA) DOCUMENTO
 
muros de contencion, diseño y generalidades
muros de contencion, diseño y generalidadesmuros de contencion, diseño y generalidades
muros de contencion, diseño y generalidades
 

Inteligencia artificial, visión por ordenador, y datos multimodales - ACE Japón Webinar Series (2022/04/06)

  • 1. Agreement  If you plan to share these slides or to use the content in these slides for your own work, please include the following reference:  Si tu intención es compartir esta presentación, o usar su contenido para tu propio trabajo, por favor, incluye la siguiente referencia: Tejero-de-Pablos, A. (2022) “Inteligencia artificial, visión por ordenador, y datos multimodales”. ACE Japón Webinar Series.
  • 2. Inteligencia artificial, visión por ordenador, y datos multimodales ACE JAPÓN WEBINAR SERIES ANTONIO TEJERO DE PABLOS 6 DE ABRIL DE 2022 Image from oracle.com
  • 3. Índice 2 Sobre mí Inteligencia artificial y visión por ordenador Mi tema de investigación: Datos multimodales y heterogéneos El futuro de la inteligencia artificial
  • 4. Sobre mí Página web - https://antonio-t.github.io/
  • 5. Sobre mí  Universidad de Valladolid (~2012)  Ingeniero de Telecomunicaciones  Máster en Tecnologías de la Información y Comunicaciones  Instituto de Ciencia y Tecnología de Nara (~2017)  Doctorado en ingeniería (ciencias de la información)  Universidad de Tokio – Instituto RIKEN (~2021)  Investigador  CyberAgent AI Lab (Actualidad)  Científico investigador 4
  • 7. Qué es la inteligencia artificial ¿Robots? ¿Una réplica digital del cerebro humano? 6 Image from analyticsinsight.net
  • 8. Qué es la inteligencia artificial 7 La inteligencia artificial no es robótica No siempre intenta imitar el cerebro del ser humano  Pero es fácil de ejemplificar mediante el comportamiento de un robot Inteligencia artificial vs. aprendizaje máquina  Reconocimiento de patrones Image from medium.com
  • 9. Aprendizaje máquina 8 Reconocimiento de patrones  Aportar datos (secuencias numéricas, imágenes, etc.) a un algoritmo de aprendizaje que encuentra similitudes entre ellos a la hora de realizar una tarea  Implementado en un programa de ordenador El reconocimiento de patrones permite:  Predecir cambios en la población y otras estadísticas  Traducir textos de un idioma a otro  Reconocer caras para identificar usuarios Image from simplilearn.com
  • 10. Visión por ordenador Los ojos (?) del robot Reconocimiento de patrones en imágenes Múltiples aplicaciones  Medicina, automóviles, etc. 9 Image from IrisVision.com Cámara Fotos/ vídeos Algoritmo de aprendizaje Image from shutterstock.com Representación latente (características)
  • 11. Visión por ordenador: Inicios El humano determina qué ”características” aprender  Limitado en cuanto a precisión y dificultad de la tarea ¿Qué es una red neuronal?  Redes neuronales pequeñas en sus inicios 10 Image from wikipedia.org Image from analyticsvidhya.org Red neuronal ・Coche ・Persona ・… Representación mediante contornos
  • 12. Visión por ordenador: Actualidad Aprendizaje profundo  Aumento exponencial del número de parámetros (~175 billones)  La red neuronal determina las características a aprender de forma óptima  Reconocimiento de patrones más complejos, tareas más complicadas 11 Image from researchgate.net …
  • 13. Aprendizaje profundo: Ejemplo 1  Segmentación semántica 12 Image from nanonets.com
  • 14. Aprendizaje profundo: Ejemplo 2  Generación de imagen No todo es ideal  Se requieren grandes cantidades de datos (millones) 13 Image from twitter.com/charles2m
  • 15. Mi tema de investigación: Datos multimodales y heterogéneos
  • 16. El poder de los datos multimodales El mundo es multimodal: imagen, video, audio, texto, etc. Hay tareas que requieren más de un sentido  Conducción: Imagen de la carretera + Voces de niños  Diagnóstico: Imagen del corazon + Señal ECG 15 Image from aare.edu.au
  • 17. El poder de los datos multimodales Las redes neuronales pueden procesar distintos tipos de información  Pero no es trivial en qué punto, y cómo han de mezclarse 16 ・Coche ・Coche Opción 1 Opción 2, etc.
  • 18. Datos heterogéneos El aprendizaje profundo requiere reunir grandes cantidades de datos 17 Images from wikipedia.org Durante el aprendizaje: Una vez desplegado el sistema:
  • 19. Datos heterogéneos El problema de generalización  Una red neuronal ”naïve” sólo conoce los datos que ha visto 18 Image from Out-of-distribution Generalization and Its Applications for Multimedia (Wang et al.)
  • 20. Algunos de mis resultados Resumen automático de vídeo deportivo (detección de mejores momentos)  Uso de datos multimodales (imagen y sensores) Diagnóstico automático de imagen cardiaca  Uso de datos heterogéneos debido a la escasez de pacientes 19 CNN (VGG-M) FV Linear SVM CNN (VGG-M) FV Linear SVM CNN (VGG-M) FV Linear SVM MEAN MAX … Input view images Feature extractor Encoder Classifier Probabilities Final decision (ensemble) N N (a) (b) (c) CPR volume segment (192×192×N voxels) CNN (VGG-M) FV Linear SVM CNN (VGG-M) FV Linear SVM CNN (VGG-M) FV Linear SVM CNN (VGG-M) FV Linear SVM CNN (VGG-M) FV Linear SVM MEAN MAX … Input view images Feature extractor Encoder Classifier Probabilities Final decision (ensemble) N N (a) (b) (c) (d) (e) CPR volume segment (192×192×N voxels) CNN (VGG-M) CNN (VGG-M) CNN (VGG-M) CNN (VGG-M) Input view images Feature extractor N (a) (b) (c) (d) CPR volume segment (192×192×N voxels) CNN (VGG-M) FV Linear SVM CNN (VGG-M) FV Linear SVM CNN (VGG-M) FV Linear SVM CNN (VGG-M) FV Linear SVM CNN (VGG-M) FV Linear SVM … Input view images Feature extractor Encoder Classifier Probab N N (a) (b) (c) (d) (e) CPR volume segment (192×192×N voxels) Aprendizaje Paciente 1 Scanner A Despliegue Paciente 2 Scanner B +
  • 21. El futuro de la inteligencia artificial
  • 22. El futuro cercano de la IA ¿Va a quitarnos la inteligencia artificial el trabajo?  Posiblemente, con trabajos simples y repetitivos  El ser humano centrado en la creación. Colaboración IA-humano. Principal problema  El individuo ”de a pie” no tiene fundamentos de ciencia / tecnología 21 Image from espsciencetime.org
  • 23. El futuro lejano de la inteligencia artificial ¿Va a reemplazar la inteligencia artificial al cerebro humano?  No con la tecnología actual  Cerebro humano ≠ inteligencia  La humanidad también evoluciona  Idealmente, la inteligencia artificial será una ayuda Todo esto es ciencia ficción  Objetivos realistas a corto plazo 22 Image from bernardmarr.com

Notas del editor

  1. Ojo humano: 576 megapíxeles Cámaras HD actuales: 61 megapíxeles Ese montón de señales el cerebro las interpreta. Tu comida favorita, empiezas a salivar. Dotar a una máquina la habilidad de reconocer el mundo, nos da aplicaciones como la navegación autónoma. Yo estuve trabajando en diagnóstico automático de imagen médica hasta hace un año, y luego cambié a mi tema de investigación actual
  2. ¿Cómo hacemos una red neuronal más profunda? El tema es mucho más complejo. Hay muchos mas tipos de redes neuronales y operaciones.
  3. Estas personas no son investigadores en vision por Sin embargo, esta ”inteligencia artificial” que hemos creado, no sabe ni que esto es una persona, ni que debajo de la cabeza tiene un cuerpo, etc.
  4. Hay tareas, que requieren de más de un sentido. - Volviendo a las aplicaciones anteriores
  5. Voy a hablar de uno de las limitaciones del las tecnologías actuales, que es el de generalizar
  6. La información no tiene una representación única.