SlideShare una empresa de Scribd logo
1 de 35
Descargar para leer sin conexión
Per Mª Pia Muñoz Trallero
Tutors:
Xavier Giró
Xavier Vives
Escola d’Enginyeria de Terrassa (EET) – Juny 2010
 Introducció
 Requeriments
 Estat de l’art
 Disseny i resultats
 Eina global
 Digitrace
 Entorn de desenvolupament
 Conclusions
Índex
2Índex / 31
Digitalització
Emmagatzematge
Recuperació
Introducció
3
Continguts audiovisuals
Cerques
textuals ?
Proposta: tècniques de processat de la imatge
Introducció / 31
Introducció
4
Precedent:
Ramon Salla 2009, Aplicació Rica d’Internet per a la consulta amb text i imatge
al repositori de vídeos de la Corporació Catalana de Mitjans Audiovisuals
Idea principal:
“Recuperació d’imatges a partir d’una idea”
Projecte universitat – empresa situat en el marc d’un projecte estatal:
Introducció / 31
Requeriments:
5
els continguts audiovisuals
s’emmagatzemen formant
assets
Requeriments
els keyframes són imatges clau
que s’extreuen del vídeo
/ 31
Requeriments
Eines precedents: Digition
6
Material
audiovisual
digitalitzat
Cerca
d’assets
Descriptors
textuals
/ 31
Eines precedents: Digimatge
7Requeriments
Consultes
textuals
Consultes
per imatges
similars
Cerca
d’assets i
imatges
Ramon Salla, 2009
/ 31
Requeriments
Eines precedent:
Detector de text
8
Cerca de text a dins d’una imatge
/ 31
Requeriments
Integració i millores:
La CCMA demana una eina multimodal que integri les funcionalitats presentades:
9
Detecció
de text
Consultes
mitjançant
imatge
Consultes
textuals
Cerca d’imatges
mitjançant
regions
Digition
Digimatge Detector
de text
Incorporació
d’una nova
eina
/ 31
Requeriments
Integració i millores:
10
Digimatge:
Aquest projecte neix amb la finalitat d’assolir
les mancances del Digimatge i estendre les
cerques per imatge a cerques per regió
UPSeek:
L’eina s’ha de comunicar amb el mòdul de la
UPC que s’encarrega del processat de la
imatge i de retornar els resultats de la cerca.
Descriptors:
L’eina ha de permetre configurar els pesos de
cadascun dels descriptors visuals en les
cerques tant per imatge global com per regió.
/ 31
Objectius
11Requeriments
Digition:
Integració d’una
interfície multimodal
Digitrace:
Interfície Gràfica d’Usuari
per a la cerca d’imatges
mitjançant regions
/ 31
Estat de l’art
12Estat de l’art
Consultes mitjançant exemple - Content-based Image Retrieval
Imatge exemple:
Estudi del
contingut visual
Sistema CBIR:
Comparació
contra la
base de dades
Resultat:
Imatges
similars
/ 31
Sistema CBIR: Eines
13Estat de l’art
Indexador: Cercador:
• Analitza tota la col·lecció
d’imatges i vídeos
• Ingesta metadades a la
base de dades
• Interfície gràfica d’usuari
• Permet navegar i fer
consultes sobre la col·lecció
/ 31
Cercadors que incorporen consultes
basades en el contingut visual
IMARS CALIPH & EMIR
Eina comercial proposada per IBM Projecte de codi lliure
ACM Multimedia Open Soure
Competition 2009
14Estat de l’art / 31
Sistema CBIR per consultes amb regions
15Estat de l’art / 31
Entorn web Entorn d’escriptori
Accessible Instal·lació prèvia
Segmentació manual Segmentació asistida
Segmentació interactiva: Interfícies
16Estat de l’art
IST:
GIMP:
Squigl:
Label
Me:
/ 31
Segmentació interactiva:
17Estat de l’art
Nom de la tècnica SRG1 SIOX2 BPT3
Grau d'interacció Alt Mitjà Baix
Descriptor Color Color Color, textura, dispersió, ...
Comparativa de tècniques de segmentació asistida
1. Adams i Bischof - Adobe Photoshop
2. Gerald Friedland - GIMP
3. Luis Garrido, UPC - Clients UPSeek (GAT i GOS)
/ 31
Disseny
Disseny: eina global
18
S’ha decidit fer una integració jeràrquica de totes les eines a l’entorn del Digition
Digition
Mòdul de visualització de keyframes
Digimatge
Cerca
per
imatge
Cerca
per
regió
Detecció
de
text
Descriptors
visuals
Descriptors
visuals
/ 31
Disseny
Digitrace: Interfície gràfica
19
Mòdul principal
Menú
de
mode
Menú
de
configuració
Imatge
+
màscara
Botó
de
cerca
*
Menú
de
marcadors
Menú
d’edició
Mòdul secundari
Colors Configuració Ajuda
1. Marcadors
2. Màscara
1. Descriptors
2. Pinzell
1. Inici
2. Modes
/ 31
Disseny
Digitrace: Segmentació interactiva
20
Mode
rectangle:
1. Rectangle: Objecte
2. Punts: selecció o deselecció de regions
Elecció dels marcadors:
1. Traces objecte
2. Traces fons * *Opcional
Mode
traça:
/ 31
Disseny
Digitrace: Segmentació interactiva
21
Proposta per arbres binaris de particions (BPT):
/ 31
Disseny
Digitrace: Segmentació interactiva
22
• Punt fort: marcadors únicament d’objecte.
• Distingim dos criteris de propagació de fulles:
Criteri sense expansió Criteri amb expansió
Per a cada node objecte, seleccionarem el seu pare sempre i quan el subarbre del seu
germà tingui, com a mínim, un node seleccionat i no en tingui cap node fons.
/ 31
Disseny
Digitrace: Definició de modes
23
Rectangle sense expansió Rectangle amb expansió
Traça sense expansió Traça amb expansió
/ 31
Arquitectura modular
Cloud computing
Protocol HTTP
Entorn de desenvolupament
Entorn de desenvolupament:
24 / 31
Entorn de desenvolupament
Crides: Consultes per regió
25
Crida getQbE Mètode HTTP Paràmetres
d'entrada
Paràmetres
de sortida
Mode rectangle:
Obtenció de màscara
GET assetId
timeCode
coordenades
Màscara
Mode rectangle:
Obtenció de resultats
GET assetId
timeCode
coordenades
descriptors
Keyframes resultants
Mode traça:
Obtenció de màscara
POST assetId
timeCode
label
Imatge
bpt_neg
bpt_pos
Màscara
bpt_neg
bpt_pos
Mode traça:
Obtenció de resultats
GET assetId
timeCode
bpt_neg
bpt_pos
descriptors
Keyframes resultants
/ 31
Entorn de desenvolupament
Entorn de desenvolupament:
 Marc de desenvolupament: Adobe Flex
 Llenguatges de programació: MXML i ActionScript
• Aplicació web : Rich Internet Application
26
Usabilitat
Rapidesa
Interacció
Capacitats
multimèdia
Atractiu
/ 31
Disseny de les
interfícies:
- Digitrace
- Mòdul keyframes
Implementació
amb Flex de les
interfícies
Disseny dels
modes de
segmentació
interactiva
Disseny de les
crides HTTP
Conclusions
Conclusions:Treball realitzat
27 / 31
Conclusions
Conclusions:
28
 Requeriments assolits:
 Interfície multimodal
 Integració del Digitrace
 Descriptors visuals
 Comunicació amb l’UPSeek
 Punts forts de la interfície:
 Comparteix les qualitats de les interfícies d’escriptori i les
interfícies web.
 Originalitat de la proposta de segmentació interactiva: garantia
de resultats coherents amb marcadors únicament d’objecte.
/ 31
Conclusions
Conclusions:
29
 Conclusions de l’avaluació dels modes de segmentació proposats:
 El mode traça resulta útil per a imatges homogènies amb un
esforç mínim.
 El mode rectangle és aconsellable, en canvi, per a imatges amb
molts colors i contorns.
 Conclusions personals:
 Experiència de treball en equip
 Mediació entre la universitat i la empresa
 Continuïtat de l’eina
/ 31
Conclusions
Treball futur:
30
 A curt termini:
 Incorporació de la màscara utilitzada en la cerca i dels resultats
 Dinamitzar el mòdul de metadades del Digition
 Agrupament dels resultats
 A llarg termini:
 Millorar la interacció de l’usuari amb els pesos dels descriptors
 Eficiència de la cerca
 Incorporar consultes textuals a partir del Detector de text
/ 31
Gràcies per la
vostra atenció
Alguna
pregunta?
Conclusions
Exemples:
32
Millores al Digimatge:
Mòdul de keyframes del Digition
33Resultats
Millores al Digimatge:
Detector de text i Descriptors visuals
34Resultats
Millores al Digimatge: Digitrace
35Resultats

Más contenido relacionado

Similar a Extensió d'una interfície de cerca d'imatges a les consultes amb regions

Presentació del projecte COFRE: repositori de preservació digital de la Bibli...
Presentació del projecte COFRE: repositori de preservació digital de la Bibli...Presentació del projecte COFRE: repositori de preservació digital de la Bibli...
Presentació del projecte COFRE: repositori de preservació digital de la Bibli...Biblioteca de Catalunya
 
Introducció a la metodologia BIM, by DDV Arquitectura ©
Introducció a la metodologia BIM, by DDV Arquitectura ©Introducció a la metodologia BIM, by DDV Arquitectura ©
Introducció a la metodologia BIM, by DDV Arquitectura ©David Delgado Vendrell
 
El disseny 3d amb tinkercad
El disseny 3d amb tinkercadEl disseny 3d amb tinkercad
El disseny 3d amb tinkercadXarxa Punt TIC
 
UF0323 Presentacions gràfiques PowerPoint 2016
UF0323 Presentacions gràfiques PowerPoint 2016UF0323 Presentacions gràfiques PowerPoint 2016
UF0323 Presentacions gràfiques PowerPoint 2016Antonio Carrasco Vidal
 
Què són els nous mitjans?
Què són els nous mitjans?Què són els nous mitjans?
Què són els nous mitjans?jvalenting
 
Uei low costproductivity-20101027-granollers
Uei low costproductivity-20101027-granollersUei low costproductivity-20101027-granollers
Uei low costproductivity-20101027-granollersRamon Costa i Pujol
 
somUPC: Integració de les intranets de la UPC
somUPC: Integració de les intranets de la UPCsomUPC: Integració de les intranets de la UPC
somUPC: Integració de les intranets de la UPCinLabFIB
 
Qüestionaris interactius i signatura
Qüestionaris interactius i signaturaQüestionaris interactius i signatura
Qüestionaris interactius i signaturaLocalret
 
Sessió 2: Tecnologies de la informació i la comunicació aplicades al patrimon...
Sessió 2: Tecnologies de la informació i la comunicació aplicades al patrimon...Sessió 2: Tecnologies de la informació i la comunicació aplicades al patrimon...
Sessió 2: Tecnologies de la informació i la comunicació aplicades al patrimon...dgr1976
 
Introducció a Ms Project
Introducció a Ms ProjectIntroducció a Ms Project
Introducció a Ms ProjectAlex Araujo
 
Enginyeria del software, especificació amb UML.pdf
Enginyeria del software, especificació amb UML.pdfEnginyeria del software, especificació amb UML.pdf
Enginyeria del software, especificació amb UML.pdfJeysonMendozaJimenez1
 
Jordi Cirera | Ajuntament de Barcelona | Smart Cities
Jordi Cirera | Ajuntament de Barcelona | Smart CitiesJordi Cirera | Ajuntament de Barcelona | Smart Cities
Jordi Cirera | Ajuntament de Barcelona | Smart CitiesSmash Tech
 
El programari lliure a la Generalitat de Catalunya
El programari lliure a la Generalitat de CatalunyaEl programari lliure a la Generalitat de Catalunya
El programari lliure a la Generalitat de Catalunyaframbla
 
Programació formativa ACTIC nivell bàsic
Programació formativa ACTIC nivell bàsicProgramació formativa ACTIC nivell bàsic
Programació formativa ACTIC nivell bàsicCiberteka
 
Valoració projecte Digitalització Administració Pública Grup 3.pdf
Valoració projecte Digitalització Administració Pública Grup 3.pdfValoració projecte Digitalització Administració Pública Grup 3.pdf
Valoració projecte Digitalització Administració Pública Grup 3.pdfPilarLopezMolina
 

Similar a Extensió d'una interfície de cerca d'imatges a les consultes amb regions (20)

UF0323 Apunts
UF0323 ApuntsUF0323 Apunts
UF0323 Apunts
 
Presentació del projecte COFRE: repositori de preservació digital de la Bibli...
Presentació del projecte COFRE: repositori de preservació digital de la Bibli...Presentació del projecte COFRE: repositori de preservació digital de la Bibli...
Presentació del projecte COFRE: repositori de preservació digital de la Bibli...
 
Introducció a la metodologia BIM, by DDV Arquitectura ©
Introducció a la metodologia BIM, by DDV Arquitectura ©Introducció a la metodologia BIM, by DDV Arquitectura ©
Introducció a la metodologia BIM, by DDV Arquitectura ©
 
El disseny 3d amb tinkercad
El disseny 3d amb tinkercadEl disseny 3d amb tinkercad
El disseny 3d amb tinkercad
 
Presentacio Eprojectes Web
Presentacio Eprojectes WebPresentacio Eprojectes Web
Presentacio Eprojectes Web
 
UF0323 Presentacions gràfiques PowerPoint 2016
UF0323 Presentacions gràfiques PowerPoint 2016UF0323 Presentacions gràfiques PowerPoint 2016
UF0323 Presentacions gràfiques PowerPoint 2016
 
Què són els nous mitjans?
Què són els nous mitjans?Què són els nous mitjans?
Què són els nous mitjans?
 
Uei low costproductivity-20101027-granollers
Uei low costproductivity-20101027-granollersUei low costproductivity-20101027-granollers
Uei low costproductivity-20101027-granollers
 
somUPC: Integració de les intranets de la UPC
somUPC: Integració de les intranets de la UPCsomUPC: Integració de les intranets de la UPC
somUPC: Integració de les intranets de la UPC
 
Qüestionaris interactius i signatura
Qüestionaris interactius i signaturaQüestionaris interactius i signatura
Qüestionaris interactius i signatura
 
Masters universitaris en informàtica, multimèdia i telecomunicació de la Univ...
Masters universitaris en informàtica, multimèdia i telecomunicació de la Univ...Masters universitaris en informàtica, multimèdia i telecomunicació de la Univ...
Masters universitaris en informàtica, multimèdia i telecomunicació de la Univ...
 
Sessió 2: Tecnologies de la informació i la comunicació aplicades al patrimon...
Sessió 2: Tecnologies de la informació i la comunicació aplicades al patrimon...Sessió 2: Tecnologies de la informació i la comunicació aplicades al patrimon...
Sessió 2: Tecnologies de la informació i la comunicació aplicades al patrimon...
 
Introducció a Ms Project
Introducció a Ms ProjectIntroducció a Ms Project
Introducció a Ms Project
 
Sesión Informativa Grados Universitarios. Facultad de Informática, Multimedi...
Sesión Informativa Grados Universitarios. Facultad  de Informática, Multimedi...Sesión Informativa Grados Universitarios. Facultad  de Informática, Multimedi...
Sesión Informativa Grados Universitarios. Facultad de Informática, Multimedi...
 
Enginyeria del software, especificació amb UML.pdf
Enginyeria del software, especificació amb UML.pdfEnginyeria del software, especificació amb UML.pdf
Enginyeria del software, especificació amb UML.pdf
 
Jordi Cirera | Ajuntament de Barcelona | Smart Cities
Jordi Cirera | Ajuntament de Barcelona | Smart CitiesJordi Cirera | Ajuntament de Barcelona | Smart Cities
Jordi Cirera | Ajuntament de Barcelona | Smart Cities
 
Bloc3 1
Bloc3 1Bloc3 1
Bloc3 1
 
El programari lliure a la Generalitat de Catalunya
El programari lliure a la Generalitat de CatalunyaEl programari lliure a la Generalitat de Catalunya
El programari lliure a la Generalitat de Catalunya
 
Programació formativa ACTIC nivell bàsic
Programació formativa ACTIC nivell bàsicProgramació formativa ACTIC nivell bàsic
Programació formativa ACTIC nivell bàsic
 
Valoració projecte Digitalització Administració Pública Grup 3.pdf
Valoració projecte Digitalització Administració Pública Grup 3.pdfValoració projecte Digitalització Administració Pública Grup 3.pdf
Valoració projecte Digitalització Administració Pública Grup 3.pdf
 

Más de Universitat Politècnica de Catalunya

The Transformer in Vision | Xavier Giro | Master in Computer Vision Barcelona...
The Transformer in Vision | Xavier Giro | Master in Computer Vision Barcelona...The Transformer in Vision | Xavier Giro | Master in Computer Vision Barcelona...
The Transformer in Vision | Xavier Giro | Master in Computer Vision Barcelona...Universitat Politècnica de Catalunya
 
Towards Sign Language Translation & Production | Xavier Giro-i-Nieto
Towards Sign Language Translation & Production | Xavier Giro-i-NietoTowards Sign Language Translation & Production | Xavier Giro-i-Nieto
Towards Sign Language Translation & Production | Xavier Giro-i-NietoUniversitat Politècnica de Catalunya
 
Learning Representations for Sign Language Videos - Xavier Giro - NIST TRECVI...
Learning Representations for Sign Language Videos - Xavier Giro - NIST TRECVI...Learning Representations for Sign Language Videos - Xavier Giro - NIST TRECVI...
Learning Representations for Sign Language Videos - Xavier Giro - NIST TRECVI...Universitat Politècnica de Catalunya
 
Generation of Synthetic Referring Expressions for Object Segmentation in Videos
Generation of Synthetic Referring Expressions for Object Segmentation in VideosGeneration of Synthetic Referring Expressions for Object Segmentation in Videos
Generation of Synthetic Referring Expressions for Object Segmentation in VideosUniversitat Politècnica de Catalunya
 
Learn2Sign : Sign language recognition and translation using human keypoint e...
Learn2Sign : Sign language recognition and translation using human keypoint e...Learn2Sign : Sign language recognition and translation using human keypoint e...
Learn2Sign : Sign language recognition and translation using human keypoint e...Universitat Politècnica de Catalunya
 
Convolutional Neural Networks - Xavier Giro - UPC TelecomBCN Barcelona 2020
Convolutional Neural Networks - Xavier Giro - UPC TelecomBCN Barcelona 2020Convolutional Neural Networks - Xavier Giro - UPC TelecomBCN Barcelona 2020
Convolutional Neural Networks - Xavier Giro - UPC TelecomBCN Barcelona 2020Universitat Politècnica de Catalunya
 
Self-Supervised Audio-Visual Learning - Xavier Giro - UPC TelecomBCN Barcelon...
Self-Supervised Audio-Visual Learning - Xavier Giro - UPC TelecomBCN Barcelon...Self-Supervised Audio-Visual Learning - Xavier Giro - UPC TelecomBCN Barcelon...
Self-Supervised Audio-Visual Learning - Xavier Giro - UPC TelecomBCN Barcelon...Universitat Politècnica de Catalunya
 
Attention for Deep Learning - Xavier Giro - UPC TelecomBCN Barcelona 2020
Attention for Deep Learning - Xavier Giro - UPC TelecomBCN Barcelona 2020Attention for Deep Learning - Xavier Giro - UPC TelecomBCN Barcelona 2020
Attention for Deep Learning - Xavier Giro - UPC TelecomBCN Barcelona 2020Universitat Politècnica de Catalunya
 
Generative Adversarial Networks GAN - Xavier Giro - UPC TelecomBCN Barcelona ...
Generative Adversarial Networks GAN - Xavier Giro - UPC TelecomBCN Barcelona ...Generative Adversarial Networks GAN - Xavier Giro - UPC TelecomBCN Barcelona ...
Generative Adversarial Networks GAN - Xavier Giro - UPC TelecomBCN Barcelona ...Universitat Politècnica de Catalunya
 
Q-Learning with a Neural Network - Xavier Giró - UPC Barcelona 2020
Q-Learning with a Neural Network - Xavier Giró - UPC Barcelona 2020Q-Learning with a Neural Network - Xavier Giró - UPC Barcelona 2020
Q-Learning with a Neural Network - Xavier Giró - UPC Barcelona 2020Universitat Politècnica de Catalunya
 
Language and Vision with Deep Learning - Xavier Giró - ACM ICMR 2020 (Tutorial)
Language and Vision with Deep Learning - Xavier Giró - ACM ICMR 2020 (Tutorial)Language and Vision with Deep Learning - Xavier Giró - ACM ICMR 2020 (Tutorial)
Language and Vision with Deep Learning - Xavier Giró - ACM ICMR 2020 (Tutorial)Universitat Politècnica de Catalunya
 
Image Segmentation with Deep Learning - Xavier Giro & Carles Ventura - ISSonD...
Image Segmentation with Deep Learning - Xavier Giro & Carles Ventura - ISSonD...Image Segmentation with Deep Learning - Xavier Giro & Carles Ventura - ISSonD...
Image Segmentation with Deep Learning - Xavier Giro & Carles Ventura - ISSonD...Universitat Politècnica de Catalunya
 

Más de Universitat Politècnica de Catalunya (20)

Deep Generative Learning for All - The Gen AI Hype (Spring 2024)
Deep Generative Learning for All - The Gen AI Hype (Spring 2024)Deep Generative Learning for All - The Gen AI Hype (Spring 2024)
Deep Generative Learning for All - The Gen AI Hype (Spring 2024)
 
Deep Generative Learning for All
Deep Generative Learning for AllDeep Generative Learning for All
Deep Generative Learning for All
 
The Transformer in Vision | Xavier Giro | Master in Computer Vision Barcelona...
The Transformer in Vision | Xavier Giro | Master in Computer Vision Barcelona...The Transformer in Vision | Xavier Giro | Master in Computer Vision Barcelona...
The Transformer in Vision | Xavier Giro | Master in Computer Vision Barcelona...
 
Towards Sign Language Translation & Production | Xavier Giro-i-Nieto
Towards Sign Language Translation & Production | Xavier Giro-i-NietoTowards Sign Language Translation & Production | Xavier Giro-i-Nieto
Towards Sign Language Translation & Production | Xavier Giro-i-Nieto
 
The Transformer - Xavier Giró - UPC Barcelona 2021
The Transformer - Xavier Giró - UPC Barcelona 2021The Transformer - Xavier Giró - UPC Barcelona 2021
The Transformer - Xavier Giró - UPC Barcelona 2021
 
Learning Representations for Sign Language Videos - Xavier Giro - NIST TRECVI...
Learning Representations for Sign Language Videos - Xavier Giro - NIST TRECVI...Learning Representations for Sign Language Videos - Xavier Giro - NIST TRECVI...
Learning Representations for Sign Language Videos - Xavier Giro - NIST TRECVI...
 
Open challenges in sign language translation and production
Open challenges in sign language translation and productionOpen challenges in sign language translation and production
Open challenges in sign language translation and production
 
Generation of Synthetic Referring Expressions for Object Segmentation in Videos
Generation of Synthetic Referring Expressions for Object Segmentation in VideosGeneration of Synthetic Referring Expressions for Object Segmentation in Videos
Generation of Synthetic Referring Expressions for Object Segmentation in Videos
 
Discovery and Learning of Navigation Goals from Pixels in Minecraft
Discovery and Learning of Navigation Goals from Pixels in MinecraftDiscovery and Learning of Navigation Goals from Pixels in Minecraft
Discovery and Learning of Navigation Goals from Pixels in Minecraft
 
Learn2Sign : Sign language recognition and translation using human keypoint e...
Learn2Sign : Sign language recognition and translation using human keypoint e...Learn2Sign : Sign language recognition and translation using human keypoint e...
Learn2Sign : Sign language recognition and translation using human keypoint e...
 
Intepretability / Explainable AI for Deep Neural Networks
Intepretability / Explainable AI for Deep Neural NetworksIntepretability / Explainable AI for Deep Neural Networks
Intepretability / Explainable AI for Deep Neural Networks
 
Convolutional Neural Networks - Xavier Giro - UPC TelecomBCN Barcelona 2020
Convolutional Neural Networks - Xavier Giro - UPC TelecomBCN Barcelona 2020Convolutional Neural Networks - Xavier Giro - UPC TelecomBCN Barcelona 2020
Convolutional Neural Networks - Xavier Giro - UPC TelecomBCN Barcelona 2020
 
Self-Supervised Audio-Visual Learning - Xavier Giro - UPC TelecomBCN Barcelon...
Self-Supervised Audio-Visual Learning - Xavier Giro - UPC TelecomBCN Barcelon...Self-Supervised Audio-Visual Learning - Xavier Giro - UPC TelecomBCN Barcelon...
Self-Supervised Audio-Visual Learning - Xavier Giro - UPC TelecomBCN Barcelon...
 
Attention for Deep Learning - Xavier Giro - UPC TelecomBCN Barcelona 2020
Attention for Deep Learning - Xavier Giro - UPC TelecomBCN Barcelona 2020Attention for Deep Learning - Xavier Giro - UPC TelecomBCN Barcelona 2020
Attention for Deep Learning - Xavier Giro - UPC TelecomBCN Barcelona 2020
 
Generative Adversarial Networks GAN - Xavier Giro - UPC TelecomBCN Barcelona ...
Generative Adversarial Networks GAN - Xavier Giro - UPC TelecomBCN Barcelona ...Generative Adversarial Networks GAN - Xavier Giro - UPC TelecomBCN Barcelona ...
Generative Adversarial Networks GAN - Xavier Giro - UPC TelecomBCN Barcelona ...
 
Q-Learning with a Neural Network - Xavier Giró - UPC Barcelona 2020
Q-Learning with a Neural Network - Xavier Giró - UPC Barcelona 2020Q-Learning with a Neural Network - Xavier Giró - UPC Barcelona 2020
Q-Learning with a Neural Network - Xavier Giró - UPC Barcelona 2020
 
Language and Vision with Deep Learning - Xavier Giró - ACM ICMR 2020 (Tutorial)
Language and Vision with Deep Learning - Xavier Giró - ACM ICMR 2020 (Tutorial)Language and Vision with Deep Learning - Xavier Giró - ACM ICMR 2020 (Tutorial)
Language and Vision with Deep Learning - Xavier Giró - ACM ICMR 2020 (Tutorial)
 
Image Segmentation with Deep Learning - Xavier Giro & Carles Ventura - ISSonD...
Image Segmentation with Deep Learning - Xavier Giro & Carles Ventura - ISSonD...Image Segmentation with Deep Learning - Xavier Giro & Carles Ventura - ISSonD...
Image Segmentation with Deep Learning - Xavier Giro & Carles Ventura - ISSonD...
 
Curriculum Learning for Recurrent Video Object Segmentation
Curriculum Learning for Recurrent Video Object SegmentationCurriculum Learning for Recurrent Video Object Segmentation
Curriculum Learning for Recurrent Video Object Segmentation
 
Deep Self-supervised Learning for All - Xavier Giro - X-Europe 2020
Deep Self-supervised Learning for All - Xavier Giro - X-Europe 2020Deep Self-supervised Learning for All - Xavier Giro - X-Europe 2020
Deep Self-supervised Learning for All - Xavier Giro - X-Europe 2020
 

Extensió d'una interfície de cerca d'imatges a les consultes amb regions