La inteligencia artificial (AI) está a la orden del día, pero ¿qué es realmente? ¿Cómo es capaz una máquina de percibir el mundo real? Diseñadas inicialmente para reconocer patrones sencillos en imágenes, las redes neuronales artificiales han incrementado su complejidad hasta obtener en la actualidad una precisión equivalente a la del ser humano. Esto ha permitido su aplicación en una gran variedad de sectores, desde el médico hasta el automovilístico. Esta charla sirve de introducción a mi campo dentro de la AI, la visión por ordenador, y a mi tema de investigación actual, el aprendizaje de datos multimodales.
En la charla realizada por Néstor Campos de Metric Arts (https://metricarts.com/), nos presentaron su producto Video Analytics y cómo utilizan Algoritmos de Machine Learning, junto a procesos y modelamientos de Visual Computing para poder realizar seguimiento de objetos y personas a través de video.
Este documento presenta una revisión de las principales tendencias y técnicas utilizadas actualmente en inteligencia artificial, incluyendo algoritmos genéticos, redes neuronales artificiales, agentes inteligentes y máquinas superinteligentes. También describe ejemplos del uso de estas técnicas en áreas como la medicina, ingeniería y entretenimiento, como la detección de objetos en tiempo real utilizando algoritmos genéticos y la clasificación de imágenes satelitales mediante redes neuronales. Finalmente, discute lenguajes de programación
Cómputo Consciente del Contexto: Cognición Aumentada mediante Interfaz Cerebr...Gabriel Gonzalez Serna
Este documento presenta una agenda para una charla sobre cómputo consciente del contexto y cognición aumentada. Se describe brevemente el Centro Nacional de Investigación y Desarrollo Tecnológico de México y sus líneas de investigación, incluyendo cómputo consciente del contexto, cognición aumentada e interacción humano-computadora. Luego se explican conceptos como cómputo consciente del contexto, cognición aumentada e interfaces cerebro-computadora, y se mencionan algunas tecnologías como EEG que se usan para estas áreas
Desarrollo y evaluación de sistemas de inteligencia ambiental con UbikSimEmilio Serrano
Este documento resume una presentación sobre el desarrollo y evaluación del simulador social UbikSim para sistemas de inteligencia ambiental. UbikSim utiliza simulación multiagente para probar sistemas de inteligencia ambiental antes de su implementación, permitiendo la detección temprana de fallos. El documento describe los componentes de código abierto de UbikSim, incluidos MASON, SweetHome3D y Slick2D, y cómo se han utilizado para investigaciones sobre temas como la gestión de emergencias, la elección social y las aplicaciones de
Inteligencia artificial, sistemas expertos, robótica y redes neuronales.Rodrigo Ramírez
Este documento resume cuatro temas principales de la tecnología actual: la inteligencia artificial, los sistemas expertos, la robótica y las redes neuronales. Explica brevemente cada uno de estos temas, incluyendo sus definiciones, aplicaciones y características clave. El documento concluye que estos avances tecnológicos buscan emular la inteligencia humana y que es importante considerar los efectos éticos del desarrollo de la tecnología.
El documento describe un sistema modular para visualizar imágenes médicas desarrollado por Odei Maiz Barandiaran. El sistema permite cargar y visualizar imágenes DICOM en 2D y 3D, y mostrar órganos segmentados en 3D. Se utilizaron las herramientas ITK, VTK y CMake. El sistema cumple los objetivos de arquitectura modular, carga de imágenes DICOM, visualización 2D y 3D, y muestra información sobre las imágenes.
En la charla realizada por Néstor Campos de Metric Arts (https://metricarts.com/), nos presentaron su producto Video Analytics y cómo utilizan Algoritmos de Machine Learning, junto a procesos y modelamientos de Visual Computing para poder realizar seguimiento de objetos y personas a través de video.
Este documento presenta una revisión de las principales tendencias y técnicas utilizadas actualmente en inteligencia artificial, incluyendo algoritmos genéticos, redes neuronales artificiales, agentes inteligentes y máquinas superinteligentes. También describe ejemplos del uso de estas técnicas en áreas como la medicina, ingeniería y entretenimiento, como la detección de objetos en tiempo real utilizando algoritmos genéticos y la clasificación de imágenes satelitales mediante redes neuronales. Finalmente, discute lenguajes de programación
Cómputo Consciente del Contexto: Cognición Aumentada mediante Interfaz Cerebr...Gabriel Gonzalez Serna
Este documento presenta una agenda para una charla sobre cómputo consciente del contexto y cognición aumentada. Se describe brevemente el Centro Nacional de Investigación y Desarrollo Tecnológico de México y sus líneas de investigación, incluyendo cómputo consciente del contexto, cognición aumentada e interacción humano-computadora. Luego se explican conceptos como cómputo consciente del contexto, cognición aumentada e interfaces cerebro-computadora, y se mencionan algunas tecnologías como EEG que se usan para estas áreas
Desarrollo y evaluación de sistemas de inteligencia ambiental con UbikSimEmilio Serrano
Este documento resume una presentación sobre el desarrollo y evaluación del simulador social UbikSim para sistemas de inteligencia ambiental. UbikSim utiliza simulación multiagente para probar sistemas de inteligencia ambiental antes de su implementación, permitiendo la detección temprana de fallos. El documento describe los componentes de código abierto de UbikSim, incluidos MASON, SweetHome3D y Slick2D, y cómo se han utilizado para investigaciones sobre temas como la gestión de emergencias, la elección social y las aplicaciones de
Inteligencia artificial, sistemas expertos, robótica y redes neuronales.Rodrigo Ramírez
Este documento resume cuatro temas principales de la tecnología actual: la inteligencia artificial, los sistemas expertos, la robótica y las redes neuronales. Explica brevemente cada uno de estos temas, incluyendo sus definiciones, aplicaciones y características clave. El documento concluye que estos avances tecnológicos buscan emular la inteligencia humana y que es importante considerar los efectos éticos del desarrollo de la tecnología.
El documento describe un sistema modular para visualizar imágenes médicas desarrollado por Odei Maiz Barandiaran. El sistema permite cargar y visualizar imágenes DICOM en 2D y 3D, y mostrar órganos segmentados en 3D. Se utilizaron las herramientas ITK, VTK y CMake. El sistema cumple los objetivos de arquitectura modular, carga de imágenes DICOM, visualización 2D y 3D, y muestra información sobre las imágenes.
Enrique Blanco & Pablo González - Autoencoders, GANS y otros chicos del montó...RootedCON
Enrique Blanco & Pablo González - Autoencoders, GANS y otros chicos del montón: La IA al servicio de la Ciberseguridad (en lo bueno y en lo malo) [rooted2019]
Este documento describe un grupo de investigación en sistemas inteligentes de la Universidad de Santiago de Compostela. El grupo está compuesto por 42 miembros que investigan aplicaciones de sistemas inteligentes. En el período 2006-2010, el grupo obtuvo más de 1,5 millones de euros en financiación para proyectos y ha publicado 42 artículos en revistas científicas. Las líneas de investigación del grupo incluyen aprendizaje automático, robótica móvil, monitorización inteligente y recomendación.
Raspberry jam Bogota 2016 - Sistema de visión artificial aplicados a procesos...javiertecteos
Este documento describe el desarrollo de una herramienta basada en Raspberry Pi para identificar el estado de madurez de granadillas a través de técnicas de visión artificial. Se capturaron imágenes de granadillas en diferentes estados y se aplicaron técnicas de preprocesamiento, segmentación y clasificación para distinguir entre granadillas maduras, verdes y pintonas con un 97.5% de precisión.
U2 inteligencia artificial y programación funcionalrafael366138
Este documento proporciona una introducción a la inteligencia artificial, incluyendo definiciones, conceptos clave, línea de tiempo histórica y ejemplos de sistemas expertos. Explica que la inteligencia artificial simula la inteligencia humana mediante técnicas como el aprendizaje automático y el aprendizaje profundo. También describe lenguajes de programación como Prolog que se usan comúnmente para crear sistemas expertos.
El documento introduce el tema de la inteligencia artificial (IA) y resume algunos de sus conceptos clave. Explica las definiciones de IA, aplicaciones como los automóviles autónomos y la recomendación de contenidos, y campos relacionados como el aprendizaje automático, la ciencia de datos y el aprendizaje profundo. También introduce conceptos filosóficos como el test de Turing y el argumento de la habitación China.
Este documento describe un proyecto de reconocimiento de figuras utilizando visión artificial. Presenta el diagrama general del programa, que incluye la entrada de imágenes, filtrado, conversión de color, umbralización, preselección, correlación de plantillas y decisión de salida. Explica cada bloque y los algoritmos utilizados como correlación de plantillas. El objetivo es reconocer figuras mediante el análisis de imágenes y proporcionar una salida de acción.
La nueva revolución Industrial: Inteligencia Artificial & IoT EdgePlain Concepts
¿Te has preguntado alguna vez que podríamos hacer con toda la telemetría que se recoge en fábricas y empresas? Durante esta sesión veremos como aplicar distintas técnicas de Inteligencia Artificial en el sector industrial para mejorar la seguridad y el rendimiento de nuestras instalaciones. Además, veremos una demo en vivo donde podremos observar como nuestro dispositivo IoT puede analizar los datos que recibe y ser capaz de predecir posibles fallos futuros en distintos componentes.
Innovación en el tratamiento de la información desde la Ingeniería del Conoc...Joaquín Borrego-Díaz
2ª parte de la charla que impartí en el Sistemas de Información Avanzados (Comercio electrónico)
Máster de estudios avanzados en dirección de empresas de la U. de Sevilla en Febrero de 2012
"Educación y datos masivos (Big Data)" - Fernando SantamariaNivel 7
En esta conferencia haremos un repaso de las características de los datos masivos, de sus conceptos emergentes que surgen alrededor, de sus ventajas y desventajas, de los efectos y consecuencias que tendrá sobre los sistemas educativos y de los peligros vistos desde nuestra estructura mental y social que es de pre-datos masivos.
Los datos masivos (Big Data) están cambiando la forma de acceder, comprender, planificar y también la forma de vivir. Este nuevo paradigma están entrando de lleno en todos los ámbitos sociales. El mundo académico y de aprendizaje no va ser menos. La analítica del aprendizaje y académico está focalizado en la educación. En esta presentación (en beta) presentamos en MoodleMoot 2014 Colombia para dar a conocer todo este ecosistema del dato.
"Educación y datos masivos (Big Data)" - Fernando SantamariaNivel 7
En esta conferencia haremos un repaso de las características de los datos masivos, de sus conceptos emergentes que surgen alrededor, de sus ventajas y desventajas, de los efectos y consecuencias que tendrá sobre los sistemas educativos y de los peligros vistos desde nuestra estructura mental y social que es de pre-datos masivos.
Clasificación de acciones sociales usando computer visionSoftware Guru
En esta charla presentaré un proyecto surgido de la observación del proceso realizado para la evaluación de proyectos de impacto social.
Presentado por Ludim Sanchez
El documento describe las propiedades y aplicaciones de la visión por computador. Explica que la visión por computador intenta reproducir algunas capacidades de la visión humana para permitir que las máquinas vean y reconozcan imágenes. Luego detalla algunas aplicaciones comunes como la seguridad, interfaces humano-computadora y automatización en diversas industrias.
Algoritmo de Reconocimiento de Objetos en Escenas Complejas para Aplicaciones...CIMAT
Salvador Ruiz Correa (https://www.cimat.mx/~src/), Jean Bernard Hayet (https://www.cimat.mx/~jbhayet/) and Diego Jiménez Badillo (http://archaeology.asu.edu/tm/Pages/equipodiego.html).
Resumen:
La capacidad de reconocer objetos en tiempo real es de gran utilidad en aplicaciones en visión computacional. Por ejemplo en aplicaciones de Realidad
Aumentada, la cual estudia las técnicas que permiten integrar, en tiempo real, contenido virtual con el mundo real, a través de un
dispositivo, como una computadora portátil o un dispositivo móvil.
El presente trabajo propone una metodología para el reconocimiento de objetos, utilizando descriptores SIFT para representar a un objeto y un
esquema de vecino más cercano para clasificar aquellos puntos sobresalientes en una escena que correspondan a un objeto, para posteriormente estimar la ubicación del mismo.
Al conocer una estimación de la ubicación del objeto, podemos crear diferentes aplicaciones que utilicen la ubicación estimada para realizar alguna
acción. En particular desarrollamos un sistema de Realidad Aumentada como parte de nuestro trabajo de investigación. Este sistema funge de asistencia a visitantes de museos, particularmente el Museo del Templo Mayor de la Ciudad de México.
El sistema diseñado cuenta con una interfaz gráfica, la cual utiliza la ubicación del objeto para dibujar sobre su contorno un polígono complejo
para señalizar que el objeto ha sido reconocido. De esta forma la interacción del usuario con el sistema es natural y dinámica.
La interacción se da cuando el usuario selecciona al objeto, en ese momento se despliega información acerca del objeto a través de una
página web que contiene elementos multimedia, mapas satelitales, visión de calle y vídeos.
Como parte de nuestros resultados generamos diferentes vídeos donde se muestra el funcionamiento del sistema, estos se pueden consultar en la
siguiente dirección web (http://mariocanulku.awardspace.info/).
Este documento trata sobre la inteligencia artificial. Define la inteligencia artificial como la capacidad de modelar la inteligencia humana en sistemas computacionales. Explora brevemente la historia de la inteligencia artificial y algunas de sus aplicaciones principales como la gestión, fabricación, educación e ingeniería. También discute el futuro potencial de la inteligencia artificial en áreas como el control del hogar y la conversación.
Este documento trata sobre la percepción e inteligencia artificial. Explica que la inteligencia artificial es la capacidad de razonar de agentes no vivos como máquinas y robots, mientras que la percepción artificial es la capacidad de recibir información del entorno a través de sensores. Luego describe algunas aplicaciones comerciales de la inteligencia artificial como el diagnóstico médico, análisis de datos, planificación financiera y diseño asistido por computadora.
Este documento trata sobre la percepción e inteligencia artificial. Explica que la inteligencia artificial es la capacidad de razonar de un agente no vivo, mientras que la percepción artificial es la capacidad de recibir información del entorno a través de sensores. Luego describe algunas aplicaciones comerciales de la inteligencia artificial, como la configuración, el diagnóstico y las interfaces inteligentes. Finalmente, señala que los principales desafíos futuros son la facilidad de uso, la flexibilidad de la infraestructura computacional y la disponibil
Definición de Informática- Informática: Ciencia y Técnica- Datos e Información- Cualidades de la Información- Impacto de los Computadores -Informática y sociedad
El documento presenta una charla sobre sistemas expertos, redes bayesianas y sus aplicaciones. La charla cubrirá la introducción a la inteligencia artificial y sistemas expertos, conceptos estadísticos básicos, redes bayesianas, cadenas de Markov, el proyecto ESIDE-DEPIAN, la aplicación HUGIN y la programación con openPNL.
Este documento describe el desarrollo de un modelo de aprendizaje profundo para la segmentación de tejidos en tomografías de rodilla. Primero se aplican técnicas de procesamiento de imágenes como la conversión de formato y adecuación de histograma. Luego, se entrena un algoritmo K-means para etiquetar los tejidos y una red convolucional U-Net para segmentar las imágenes con precisión del 90%. Finalmente, se propone trabajar con un conjunto de datos que clasifique la osteoartritis por grado de gravedad.
CVPR2022 paper reading - Balanced multimodal learning - All Japan Computer Vi...Antonio Tejero de Pablos
Introduction of the CVPR2022 paper: Balanced multimodal learning via on-the-fly gradient modulation @ The All Japan Computer Vision Study Group (2022/08/07)
Más contenido relacionado
Similar a Inteligencia artificial,visión por ordenador,y datos multimodales - ACE Japón Webinar Series (2022/04/06)
Enrique Blanco & Pablo González - Autoencoders, GANS y otros chicos del montó...RootedCON
Enrique Blanco & Pablo González - Autoencoders, GANS y otros chicos del montón: La IA al servicio de la Ciberseguridad (en lo bueno y en lo malo) [rooted2019]
Este documento describe un grupo de investigación en sistemas inteligentes de la Universidad de Santiago de Compostela. El grupo está compuesto por 42 miembros que investigan aplicaciones de sistemas inteligentes. En el período 2006-2010, el grupo obtuvo más de 1,5 millones de euros en financiación para proyectos y ha publicado 42 artículos en revistas científicas. Las líneas de investigación del grupo incluyen aprendizaje automático, robótica móvil, monitorización inteligente y recomendación.
Raspberry jam Bogota 2016 - Sistema de visión artificial aplicados a procesos...javiertecteos
Este documento describe el desarrollo de una herramienta basada en Raspberry Pi para identificar el estado de madurez de granadillas a través de técnicas de visión artificial. Se capturaron imágenes de granadillas en diferentes estados y se aplicaron técnicas de preprocesamiento, segmentación y clasificación para distinguir entre granadillas maduras, verdes y pintonas con un 97.5% de precisión.
U2 inteligencia artificial y programación funcionalrafael366138
Este documento proporciona una introducción a la inteligencia artificial, incluyendo definiciones, conceptos clave, línea de tiempo histórica y ejemplos de sistemas expertos. Explica que la inteligencia artificial simula la inteligencia humana mediante técnicas como el aprendizaje automático y el aprendizaje profundo. También describe lenguajes de programación como Prolog que se usan comúnmente para crear sistemas expertos.
El documento introduce el tema de la inteligencia artificial (IA) y resume algunos de sus conceptos clave. Explica las definiciones de IA, aplicaciones como los automóviles autónomos y la recomendación de contenidos, y campos relacionados como el aprendizaje automático, la ciencia de datos y el aprendizaje profundo. También introduce conceptos filosóficos como el test de Turing y el argumento de la habitación China.
Este documento describe un proyecto de reconocimiento de figuras utilizando visión artificial. Presenta el diagrama general del programa, que incluye la entrada de imágenes, filtrado, conversión de color, umbralización, preselección, correlación de plantillas y decisión de salida. Explica cada bloque y los algoritmos utilizados como correlación de plantillas. El objetivo es reconocer figuras mediante el análisis de imágenes y proporcionar una salida de acción.
La nueva revolución Industrial: Inteligencia Artificial & IoT EdgePlain Concepts
¿Te has preguntado alguna vez que podríamos hacer con toda la telemetría que se recoge en fábricas y empresas? Durante esta sesión veremos como aplicar distintas técnicas de Inteligencia Artificial en el sector industrial para mejorar la seguridad y el rendimiento de nuestras instalaciones. Además, veremos una demo en vivo donde podremos observar como nuestro dispositivo IoT puede analizar los datos que recibe y ser capaz de predecir posibles fallos futuros en distintos componentes.
Innovación en el tratamiento de la información desde la Ingeniería del Conoc...Joaquín Borrego-Díaz
2ª parte de la charla que impartí en el Sistemas de Información Avanzados (Comercio electrónico)
Máster de estudios avanzados en dirección de empresas de la U. de Sevilla en Febrero de 2012
"Educación y datos masivos (Big Data)" - Fernando SantamariaNivel 7
En esta conferencia haremos un repaso de las características de los datos masivos, de sus conceptos emergentes que surgen alrededor, de sus ventajas y desventajas, de los efectos y consecuencias que tendrá sobre los sistemas educativos y de los peligros vistos desde nuestra estructura mental y social que es de pre-datos masivos.
Los datos masivos (Big Data) están cambiando la forma de acceder, comprender, planificar y también la forma de vivir. Este nuevo paradigma están entrando de lleno en todos los ámbitos sociales. El mundo académico y de aprendizaje no va ser menos. La analítica del aprendizaje y académico está focalizado en la educación. En esta presentación (en beta) presentamos en MoodleMoot 2014 Colombia para dar a conocer todo este ecosistema del dato.
"Educación y datos masivos (Big Data)" - Fernando SantamariaNivel 7
En esta conferencia haremos un repaso de las características de los datos masivos, de sus conceptos emergentes que surgen alrededor, de sus ventajas y desventajas, de los efectos y consecuencias que tendrá sobre los sistemas educativos y de los peligros vistos desde nuestra estructura mental y social que es de pre-datos masivos.
Clasificación de acciones sociales usando computer visionSoftware Guru
En esta charla presentaré un proyecto surgido de la observación del proceso realizado para la evaluación de proyectos de impacto social.
Presentado por Ludim Sanchez
El documento describe las propiedades y aplicaciones de la visión por computador. Explica que la visión por computador intenta reproducir algunas capacidades de la visión humana para permitir que las máquinas vean y reconozcan imágenes. Luego detalla algunas aplicaciones comunes como la seguridad, interfaces humano-computadora y automatización en diversas industrias.
Algoritmo de Reconocimiento de Objetos en Escenas Complejas para Aplicaciones...CIMAT
Salvador Ruiz Correa (https://www.cimat.mx/~src/), Jean Bernard Hayet (https://www.cimat.mx/~jbhayet/) and Diego Jiménez Badillo (http://archaeology.asu.edu/tm/Pages/equipodiego.html).
Resumen:
La capacidad de reconocer objetos en tiempo real es de gran utilidad en aplicaciones en visión computacional. Por ejemplo en aplicaciones de Realidad
Aumentada, la cual estudia las técnicas que permiten integrar, en tiempo real, contenido virtual con el mundo real, a través de un
dispositivo, como una computadora portátil o un dispositivo móvil.
El presente trabajo propone una metodología para el reconocimiento de objetos, utilizando descriptores SIFT para representar a un objeto y un
esquema de vecino más cercano para clasificar aquellos puntos sobresalientes en una escena que correspondan a un objeto, para posteriormente estimar la ubicación del mismo.
Al conocer una estimación de la ubicación del objeto, podemos crear diferentes aplicaciones que utilicen la ubicación estimada para realizar alguna
acción. En particular desarrollamos un sistema de Realidad Aumentada como parte de nuestro trabajo de investigación. Este sistema funge de asistencia a visitantes de museos, particularmente el Museo del Templo Mayor de la Ciudad de México.
El sistema diseñado cuenta con una interfaz gráfica, la cual utiliza la ubicación del objeto para dibujar sobre su contorno un polígono complejo
para señalizar que el objeto ha sido reconocido. De esta forma la interacción del usuario con el sistema es natural y dinámica.
La interacción se da cuando el usuario selecciona al objeto, en ese momento se despliega información acerca del objeto a través de una
página web que contiene elementos multimedia, mapas satelitales, visión de calle y vídeos.
Como parte de nuestros resultados generamos diferentes vídeos donde se muestra el funcionamiento del sistema, estos se pueden consultar en la
siguiente dirección web (http://mariocanulku.awardspace.info/).
Este documento trata sobre la inteligencia artificial. Define la inteligencia artificial como la capacidad de modelar la inteligencia humana en sistemas computacionales. Explora brevemente la historia de la inteligencia artificial y algunas de sus aplicaciones principales como la gestión, fabricación, educación e ingeniería. También discute el futuro potencial de la inteligencia artificial en áreas como el control del hogar y la conversación.
Este documento trata sobre la percepción e inteligencia artificial. Explica que la inteligencia artificial es la capacidad de razonar de agentes no vivos como máquinas y robots, mientras que la percepción artificial es la capacidad de recibir información del entorno a través de sensores. Luego describe algunas aplicaciones comerciales de la inteligencia artificial como el diagnóstico médico, análisis de datos, planificación financiera y diseño asistido por computadora.
Este documento trata sobre la percepción e inteligencia artificial. Explica que la inteligencia artificial es la capacidad de razonar de un agente no vivo, mientras que la percepción artificial es la capacidad de recibir información del entorno a través de sensores. Luego describe algunas aplicaciones comerciales de la inteligencia artificial, como la configuración, el diagnóstico y las interfaces inteligentes. Finalmente, señala que los principales desafíos futuros son la facilidad de uso, la flexibilidad de la infraestructura computacional y la disponibil
Definición de Informática- Informática: Ciencia y Técnica- Datos e Información- Cualidades de la Información- Impacto de los Computadores -Informática y sociedad
El documento presenta una charla sobre sistemas expertos, redes bayesianas y sus aplicaciones. La charla cubrirá la introducción a la inteligencia artificial y sistemas expertos, conceptos estadísticos básicos, redes bayesianas, cadenas de Markov, el proyecto ESIDE-DEPIAN, la aplicación HUGIN y la programación con openPNL.
Este documento describe el desarrollo de un modelo de aprendizaje profundo para la segmentación de tejidos en tomografías de rodilla. Primero se aplican técnicas de procesamiento de imágenes como la conversión de formato y adecuación de histograma. Luego, se entrena un algoritmo K-means para etiquetar los tejidos y una red convolucional U-Net para segmentar las imágenes con precisión del 90%. Finalmente, se propone trabajar con un conjunto de datos que clasifique la osteoartritis por grado de gravedad.
Similar a Inteligencia artificial,visión por ordenador,y datos multimodales - ACE Japón Webinar Series (2022/04/06) (20)
CVPR2022 paper reading - Balanced multimodal learning - All Japan Computer Vi...Antonio Tejero de Pablos
Introduction of the CVPR2022 paper: Balanced multimodal learning via on-the-fly gradient modulation @ The All Japan Computer Vision Study Group (2022/08/07)
Slides presented in the All Japan Computer Vision Study Group on May 15, 2022. Methods for disentangling the relationship between multimodal data are discussed.
Presentation Seminar - Harada Ushiku Lab - The University of Tokyo (in English)
(日本語版:https://www.slideshare.net/AntonioTejerodePablo/presentation-skills-up-seminar-harada-ushiku-lab)
1. Introduccion a las excavaciones subterraneas (1).pdfraulnilton2018
Cuando las excavaciones subterráneas son desarrolladas de manera artesanal, se conceptúa a la excavación como el “ que es una labor efectuada con la mínima sección posible de excavación, para permitir el tránsito del hombre o de
cémilas para realizar la extracción del material desde el
frontón hasta la superficie
Cuando las excavaciones se ejecutan controlando la sección de excavación, de manera que se disturbe lo menos posible la
roca circundante considerando la vida útil que se debe dar a la roca, es cuando aparece el
concepto de “ que abarca,
globalmente, al proceso de excavación, control de la periferia, sostenimiento, revestimiento y consolidación de la excavación
Los puentes son estructuras esenciales en la infraestructura de transporte, permitiendo la conexión entre diferentes
puntos geográficos y facilitando el flujo de bienes y personas.
Aletas de Transferencia de Calor o Superficies Extendidas.pdfJuanAlbertoLugoMadri
Se hablara de las aletas de transferencia de calor y superficies extendidas ya que son muy importantes debido a que son estructuras diseñadas para aumentar el calor entre un fluido, un sólido y en qué sitio son utilizados estos materiales en la vida cotidiana
ascensor o elevador es un sistema de transporte vertical u oblicuo, diseñado...LuisLobatoingaruca
Un ascensor o elevador es un sistema de transporte vertical u oblicuo, diseñado para mover principalmente personas entre diferentes niveles de un edificio o estructura. Cuando está destinado a trasladar objetos grandes o pesados, se le llama también montacargas.
La energía radiante es una forma de energía que
se transmite en forma de ondas
electromagnéticas esta energía se propaga a
través del vacío y de ciertos medios materiales y
es fundamental en una variedad naturales y
tecnológicos
ESPERAMOS QUE ESTA INFOGRAFÍA SEA UNA HERRAMIENTA ÚTIL Y EDUCATIVA QUE INSPIRE A MÁS PERSONAS A ADENTRARSE EN EL APASIONANTE CAMPO DE LA INGENIERÍA CIVIŁ. ¡ACOMPAÑANOS EN ESTE VIAJE DE APRENDIZAJE Y DESCUBRIMIENTO
Inteligencia artificial,visión por ordenador,y datos multimodales - ACE Japón Webinar Series (2022/04/06)
1. Agreement
If you plan to share these slides or to use the content in these slides for
your own work, please include the following reference:
Si tu intención es compartir esta presentación, o usar su contenido para tu
propio trabajo, por favor, incluye la siguiente referencia:
Tejero-de-Pablos, A. (2022) “Inteligencia artificial, visión por ordenador,
y datos multimodales”. ACE Japón Webinar Series.
2. Inteligencia artificial,
visión por ordenador,
y datos multimodales
ACE JAPÓN WEBINAR SERIES
ANTONIO TEJERO DE PABLOS
6 DE ABRIL DE 2022
Image from oracle.com
5. Sobre mí
Universidad de Valladolid (~2012)
Ingeniero de Telecomunicaciones
Máster en Tecnologías de la Información y Comunicaciones
Instituto de Ciencia y Tecnología de Nara (~2017)
Doctorado en ingeniería (ciencias de la información)
Universidad de Tokio – Instituto RIKEN (~2021)
Investigador
CyberAgent AI Lab (Actualidad)
Científico investigador
4
7. Qué es la inteligencia
artificial
¿Robots?
¿Una réplica digital del
cerebro humano?
6
Image from analyticsinsight.net
8. Qué es la inteligencia artificial 7
La inteligencia artificial no es robótica
No siempre intenta imitar el cerebro del ser humano
Pero es fácil de ejemplificar mediante el comportamiento de un robot
Inteligencia artificial vs. aprendizaje máquina
Reconocimiento de patrones
Image from medium.com
9. Aprendizaje máquina 8
Reconocimiento de patrones
Aportar datos (secuencias numéricas, imágenes, etc.) a un
algoritmo de aprendizaje que encuentra similitudes entre ellos a
la hora de realizar una tarea
Implementado en un programa de ordenador
El reconocimiento de patrones permite:
Predecir cambios en la población y otras estadísticas
Traducir textos de un idioma a otro
Reconocer caras para identificar usuarios
Image from simplilearn.com
10. Visión por ordenador
Los ojos (?) del robot
Reconocimiento de patrones en imágenes
Múltiples aplicaciones
Medicina, automóviles, etc.
9
Image from IrisVision.com
Cámara
Fotos/
vídeos
Algoritmo de
aprendizaje
Image from shutterstock.com
Representación
latente
(características)
11. Visión por ordenador: Inicios
El humano determina qué ”características” aprender
Limitado en cuanto a precisión y dificultad de la tarea
¿Qué es una red neuronal?
Redes neuronales pequeñas en sus inicios
10
Image from wikipedia.org
Image from analyticsvidhya.org
Red neuronal
・Coche
・Persona
・…
Representación
mediante contornos
12. Visión por ordenador: Actualidad
Aprendizaje profundo
Aumento exponencial del número de parámetros (~175 billones)
La red neuronal determina las características a aprender de forma óptima
Reconocimiento de patrones más complejos, tareas más complicadas
11
Image from researchgate.net
…
14. Aprendizaje profundo: Ejemplo 2
Generación de imagen
No todo es ideal
Se requieren grandes cantidades de datos (millones)
13
Image from twitter.com/charles2m
15. Mi tema de investigación:
Datos multimodales
y heterogéneos
16. El poder de los datos multimodales
El mundo es multimodal: imagen, video, audio, texto, etc.
Hay tareas que requieren más de un sentido
Conducción: Imagen de la carretera + Voces de niños
Diagnóstico: Imagen del corazon + Señal ECG
15
Image from aare.edu.au
17. El poder de los datos multimodales
Las redes neuronales pueden procesar distintos tipos de información
Pero no es trivial en qué punto, y cómo han de mezclarse
16
・Coche
・Coche
Opción 1 Opción 2, etc.
18. Datos heterogéneos
El aprendizaje profundo requiere reunir grandes cantidades de datos
17
Images from wikipedia.org
Durante el
aprendizaje:
Una vez desplegado
el sistema:
19. Datos heterogéneos
El problema de generalización
Una red neuronal ”naïve” sólo conoce los datos que ha visto
18
Image from Out-of-distribution Generalization and Its Applications for Multimedia (Wang et al.)
20. Algunos de mis resultados
Resumen automático de vídeo deportivo (detección de mejores momentos)
Uso de datos multimodales (imagen y sensores)
Diagnóstico automático de imagen cardiaca
Uso de datos heterogéneos debido a la escasez de pacientes
19
CNN
(VGG-M)
FV
Linear
SVM
CNN
(VGG-M)
FV
Linear
SVM
CNN
(VGG-M)
FV
Linear
SVM MEAN
MAX
…
Input view
images
Feature
extractor
Encoder Classifier Probabilities Final
decision
(ensemble)
N
N
(a)
(b)
(c)
CPR volume
segment
(192×192×N
voxels)
CNN
(VGG-M)
FV
Linear
SVM
CNN
(VGG-M)
FV
Linear
SVM
CNN
(VGG-M)
FV
Linear
SVM
CNN
(VGG-M)
FV
Linear
SVM
CNN
(VGG-M)
FV
Linear
SVM
MEAN
MAX
…
Input view
images
Feature
extractor
Encoder Classifier Probabilities Final
decision
(ensemble)
N
N
(a)
(b)
(c)
(d)
(e)
CPR volume
segment
(192×192×N
voxels)
CNN
(VGG-M)
CNN
(VGG-M)
CNN
(VGG-M)
CNN
(VGG-M)
Input view
images
Feature
extractor
N
(a)
(b)
(c)
(d)
CPR volume
segment
(192×192×N
voxels)
CNN
(VGG-M)
FV
Linear
SVM
CNN
(VGG-M)
FV
Linear
SVM
CNN
(VGG-M)
FV
Linear
SVM
CNN
(VGG-M)
FV
Linear
SVM
CNN
(VGG-M)
FV
Linear
SVM
…
Input view
images
Feature
extractor
Encoder Classifier Probab
N
N
(a)
(b)
(c)
(d)
(e)
CPR volume
segment
(192×192×N
voxels)
Aprendizaje
Paciente 1
Scanner A
Despliegue
Paciente 2
Scanner B
+
22. El futuro cercano de la IA
¿Va a quitarnos la inteligencia artificial el trabajo?
Posiblemente, con trabajos simples y repetitivos
El ser humano centrado en la creación. Colaboración IA-humano.
Principal problema
El individuo ”de a pie” no tiene fundamentos de ciencia / tecnología
21
Image from espsciencetime.org
23. El futuro lejano de la
inteligencia artificial
¿Va a reemplazar la inteligencia artificial al cerebro
humano?
No con la tecnología actual
Cerebro humano ≠ inteligencia
La humanidad también evoluciona
Idealmente, la inteligencia artificial será una ayuda
Todo esto es ciencia ficción
Objetivos realistas a corto plazo
22
Image from bernardmarr.com
Ojo humano: 576 megapíxeles
Cámaras HD actuales: 61 megapíxeles
Ese montón de señales el cerebro las interpreta. Tu comida favorita, empiezas a salivar.
Dotar a una máquina la habilidad de reconocer el mundo, nos da aplicaciones como la navegación autónoma.
Yo estuve trabajando en diagnóstico automático de imagen médica hasta hace un año, y luego cambié a mi tema de investigación actual
¿Cómo hacemos una red neuronal más profunda?
El tema es mucho más complejo. Hay muchos mas tipos de redes neuronales y operaciones.
Estas personas no son investigadores en vision por
Sin embargo, esta ”inteligencia artificial” que hemos creado, no sabe ni que esto es una persona, ni que debajo de la cabeza tiene un cuerpo, etc.
Hay tareas, que requieren de más de un sentido.
- Volviendo a las aplicaciones anteriores
Voy a hablar de uno de las limitaciones del las tecnologías actuales, que es el de generalizar