SlideShare a Scribd company logo
1 of 24
Taal- en Spraaktechnologie  voor het ontsluiten van  gesproken archieven Peter van der Maas NIOD, Amsterdam Willemijn Heeren & Arjan van Hessen Human Media Interaction Universiteit Twente
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Inhoud Achtergrond Probleemstelling Oplossingen Voorbeelden Conclusie Inhoud
Kennis Autom. spraakherkenning Concept -> Spraak Semantische netwerken Intelligent zoeken Dialoogvoering  Vraag & Antwoord systemen Beeldherkenning … … Toepassing Omroepen Archieven Gezondheidszorg Onderwijs Justitie Projecten DRUID ECHO CHORAL MultimediaN IMIX StoryTeller SAFIR MESH MediaCampaign AMIDA Inhoud Achtergrond Probleemstelling Oplossingen Voorbeelden Conclusie Achtergrond
[object Object],[object Object],[object Object],[object Object],Buchenwald ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Achtergrond
Groningen Maastricht ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Gedistribueerde verzamelingen
Buchenwald ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Buchenwald Gedigitaliseerde  (historische) collecties H.M. Koningin Wilhelmina Digitaal opgenomen collecties Probleemstelling
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Probleemstelling
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Probleemstelling
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Oplossingen vanuit  taal- & spraaktechnologie
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Oplossingen vanuit  taal- & spraaktechnologie
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Inhoud Achtergrond Probleem Oplossingen - Ontsluiting -  Toegang Voorbeelden Conclusie Oplossingen vanuit  taal- & spraaktechnologie
Ontsluiten van collecties: genereren van metadata/index Toegang tot collecties:  Zoeken - Information Retrieval Toegang tot collecties:  User interface Inhoud Achtergrond Probleem Oplossingen Voorbeelden Conclusie Geïntegreerd multimedia-zoeksysteem: ontsluiting + toegang Oplossingen vanuit  taal- & spraaktechnologie onderzoekers archivarissen doorsnee gebruiker producenten van nieuwe content multimediale “index” zoeken - data mining automatische metadata-extractie robuuste  spraak herkenning muziek/spraak  detectie spreker segmentatie multimedia archief metadata gebruikers  groepen
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Voorbeeldproject ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],CHoral
Online toegankelijk en doorzoekbaar maken van toespraken van H.M. Koningin Wilhelmina, gericht aan het Nederlandse volk tijdens de Tweede Wereldoorlog en uitgezonden vanuit Londen, Engeland.  Zowel de audio als de teksten zijn bewaard gebleven, én gedigitaliseerd (door het Nederlands Instituut voor Oorlogsdocumentatie in samenwerking met het Nederlands Instituut voor Beeld en Geluid). ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Radio Oranje
Index genereren door “Oplijning” Index:  wat  wordt  waar  gezegd ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Radio Oranje beginframe eindframe uiting 00000 54400 -stilte- 54400 65280 wonende 65280 69120 in 69120 73600 alle 73600 79520 deelen 79520 81280 van  81280 84800 het 84800 90560 rijk 90560 96800 -stilte- Getypte tekst: Landgenooten  waar ik enkele  Optical Landgenooten  waar  ik  enkele G2P l A n t x@n o t @ n  w a  r  I k  ENk@l@ Akoestisch Model Spraak
User Interface:  zoeken ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Zoeken op term(en) (+datum) of alle toespraken tonen Radio Oranje
[object Object],[object Object],[object Object],[object Object],[object Object],Semi-automatisch geselecteerd  uit NIOD fotodatabase  (> 120.000 foto’s) ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Radio Oranje
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Materiaal:  37 gefilmde interviews (60 uur) van mannen die in Buchenwald gezeten hebben. Korte samenvattingen per interview zijn beschikbaar Ieder interview duurt minimaal één uur: veel te lang dus! Combineren van onderdelen van de interviews die min of meer over dezelfde informatie gaan (zelfde clusters) maakt het thematisch “aanbieden van”  en “zoeken naar” eenvoudig mogelijk. Buchenwald
Akoestisch model Taal-model Transcript Uitspraak-woordenboek Index genereren door “Spraakherkenning” Feature extractie Spraakherkenning 60 uur audio 250-500 M woorden Buchenwald Het transcript hoeft niet perfect te zijn om als index te dienen
Index genereren door “Spraakherkenning” Akoestisch model Taal-model Uitspraak-woordenboek Transcript Opname-condities Spontane spraak ,[object Object],[object Object],[object Object],Verschuiving in uitspraak Buchenwald Feature extractie Spraakherkenning
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Erfgoed van de Oorlog In Nederland is veel erfgoedmateriaal aanwezig uit de Tweede Wereldoorlog en materiaal dat betrekking heeft op deze periode. Dit erfgoed bestaat bijvoorbeeld uit archieven, foto’s, film en geluidsopnamen, voorwerpen en sporen in het landschap. Het programma Erfgoed van de Oorlog is erop gericht dit erfgoedmateriaal te traceren en te inventariseren. VWS zorgt ervoor dat eigenaars en beheerders van erfgoed deze materialen goed kunnen bewaren en zo veel mogelijk toegankelijk kunnen maken. De Tweede Wereldoorlog is een belangrijke periode in de Nederlandse geschiedenis.  Nederland bevindt zich in een nieuwe fase in de naoorlogse geschiedenis. Er zijn steeds minder mensen die de oorlog zelf hebben meegemaakt. Het levend houden van de herinnering aan de oorlog en de betekenis ervan voor onze samenleving is een belangrijk onderdeel van het programma Erfgoed van de Oorlog. Het is de ambitie van VWS deze periode meer te laten zijn dan een passage in een geschiedenisboek. Het is daarom belangrijk dat de jaren '40-45' en de nasleep ervan goed wordt gedocumenteerd. Het actief gebruiken van erfgoedmateriaal draagt hieraan bij.
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Inhoud Achtergrond Probleem Oplossingen Voorbeelden Conclusie  Conclusie
Vragen

More Related Content

Viewers also liked

Webinar-1: Why Advocacy Marketing is important in today’s digital world?
Webinar-1: Why Advocacy Marketing is important in today’s digital world?Webinar-1: Why Advocacy Marketing is important in today’s digital world?
Webinar-1: Why Advocacy Marketing is important in today’s digital world?SOCXO
 
4 compelling reasons why brands should invest in advocacy marketing.
4 compelling reasons why brands should invest in advocacy marketing.4 compelling reasons why brands should invest in advocacy marketing.
4 compelling reasons why brands should invest in advocacy marketing.SOCXO
 
Presentatie workshop Augmented Reality & ErfgoedBeacons
Presentatie workshop Augmented Reality & ErfgoedBeaconsPresentatie workshop Augmented Reality & ErfgoedBeacons
Presentatie workshop Augmented Reality & ErfgoedBeaconsFARO
 
How Full Monty Storytelling Can Drive Your Agency New Business
How Full Monty Storytelling Can Drive Your Agency New BusinessHow Full Monty Storytelling Can Drive Your Agency New Business
How Full Monty Storytelling Can Drive Your Agency New BusinessFuel Lines Business Development
 
Improving Access and Exploitation of 3D Cultural Heritage Data | Anthony Corns
Improving Access and Exploitation of 3D Cultural Heritage Data | Anthony CornsImproving Access and Exploitation of 3D Cultural Heritage Data | Anthony Corns
Improving Access and Exploitation of 3D Cultural Heritage Data | Anthony CornsFARO
 
Green Manufacturing
Green ManufacturingGreen Manufacturing
Green Manufacturingananya0122
 
Steven Boyle Graphic Design
Steven Boyle Graphic DesignSteven Boyle Graphic Design
Steven Boyle Graphic DesignSteven Boyle
 

Viewers also liked (9)

Resume_Sita_Ramadas_akkineni
Resume_Sita_Ramadas_akkineniResume_Sita_Ramadas_akkineni
Resume_Sita_Ramadas_akkineni
 
Webinar-1: Why Advocacy Marketing is important in today’s digital world?
Webinar-1: Why Advocacy Marketing is important in today’s digital world?Webinar-1: Why Advocacy Marketing is important in today’s digital world?
Webinar-1: Why Advocacy Marketing is important in today’s digital world?
 
4 compelling reasons why brands should invest in advocacy marketing.
4 compelling reasons why brands should invest in advocacy marketing.4 compelling reasons why brands should invest in advocacy marketing.
4 compelling reasons why brands should invest in advocacy marketing.
 
Presentatie workshop Augmented Reality & ErfgoedBeacons
Presentatie workshop Augmented Reality & ErfgoedBeaconsPresentatie workshop Augmented Reality & ErfgoedBeacons
Presentatie workshop Augmented Reality & ErfgoedBeacons
 
How Full Monty Storytelling Can Drive Your Agency New Business
How Full Monty Storytelling Can Drive Your Agency New BusinessHow Full Monty Storytelling Can Drive Your Agency New Business
How Full Monty Storytelling Can Drive Your Agency New Business
 
Improving Access and Exploitation of 3D Cultural Heritage Data | Anthony Corns
Improving Access and Exploitation of 3D Cultural Heritage Data | Anthony CornsImproving Access and Exploitation of 3D Cultural Heritage Data | Anthony Corns
Improving Access and Exploitation of 3D Cultural Heritage Data | Anthony Corns
 
Green Manufacturing
Green ManufacturingGreen Manufacturing
Green Manufacturing
 
Diploma and Certification
Diploma and CertificationDiploma and Certification
Diploma and Certification
 
Steven Boyle Graphic Design
Steven Boyle Graphic DesignSteven Boyle Graphic Design
Steven Boyle Graphic Design
 

Similar to CHORAL

Mies Langelaar - Gemeente Archief Rotterdam - Choral+
Mies Langelaar - Gemeente Archief Rotterdam - Choral+Mies Langelaar - Gemeente Archief Rotterdam - Choral+
Mies Langelaar - Gemeente Archief Rotterdam - Choral+KVANdagen
 
Haalbaarheidsstudie MMLAB en MICT
Haalbaarheidsstudie MMLAB en MICTHaalbaarheidsstudie MMLAB en MICT
Haalbaarheidsstudie MMLAB en MICTFARO
 
Themabijeenkomst multimedia in de repository
Themabijeenkomst multimedia in de repositoryThemabijeenkomst multimedia in de repository
Themabijeenkomst multimedia in de repositorypsuijker
 
Content & context in het audiovisuele erfgoeddomein
Content & context in het audiovisuele erfgoeddomeinContent & context in het audiovisuele erfgoeddomein
Content & context in het audiovisuele erfgoeddomeinErwin Verbruggen
 
MEDEAnet workshop - Viaa - Leen de Bruyn
MEDEAnet workshop - Viaa - Leen de BruynMEDEAnet workshop - Viaa - Leen de Bruyn
MEDEAnet workshop - Viaa - Leen de BruynMEDEA Awards
 
NDE Termennetwerk
NDE TermennetwerkNDE Termennetwerk
NDE Termennetwerkvoginip
 
Erfgoed- en beeldbanken: voorbeelden en kansen voor de Demervallei
Erfgoed- en beeldbanken: voorbeelden en kansen voor de DemervalleiErfgoed- en beeldbanken: voorbeelden en kansen voor de Demervallei
Erfgoed- en beeldbanken: voorbeelden en kansen voor de DemervalleiHeemkunde Vlaanderen
 
VIAA tussen idee en oprichting - Brecht Declercq
VIAA tussen idee en oprichting - Brecht DeclercqVIAA tussen idee en oprichting - Brecht Declercq
VIAA tussen idee en oprichting - Brecht DeclercqBrecht Declercq
 

Similar to CHORAL (10)

Mies Langelaar - Gemeente Archief Rotterdam - Choral+
Mies Langelaar - Gemeente Archief Rotterdam - Choral+Mies Langelaar - Gemeente Archief Rotterdam - Choral+
Mies Langelaar - Gemeente Archief Rotterdam - Choral+
 
Haalbaarheidsstudie MMLAB en MICT
Haalbaarheidsstudie MMLAB en MICTHaalbaarheidsstudie MMLAB en MICT
Haalbaarheidsstudie MMLAB en MICT
 
Themabijeenkomst multimedia in de repository
Themabijeenkomst multimedia in de repositoryThemabijeenkomst multimedia in de repository
Themabijeenkomst multimedia in de repository
 
Bi Bdag09 Presentatie
Bi Bdag09 PresentatieBi Bdag09 Presentatie
Bi Bdag09 Presentatie
 
Content & context in het audiovisuele erfgoeddomein
Content & context in het audiovisuele erfgoeddomeinContent & context in het audiovisuele erfgoeddomein
Content & context in het audiovisuele erfgoeddomein
 
MEDEAnet workshop - Viaa - Leen de Bruyn
MEDEAnet workshop - Viaa - Leen de BruynMEDEAnet workshop - Viaa - Leen de Bruyn
MEDEAnet workshop - Viaa - Leen de Bruyn
 
Sadan Presentatie2007
Sadan Presentatie2007Sadan Presentatie2007
Sadan Presentatie2007
 
NDE Termennetwerk
NDE TermennetwerkNDE Termennetwerk
NDE Termennetwerk
 
Erfgoed- en beeldbanken: voorbeelden en kansen voor de Demervallei
Erfgoed- en beeldbanken: voorbeelden en kansen voor de DemervalleiErfgoed- en beeldbanken: voorbeelden en kansen voor de Demervallei
Erfgoed- en beeldbanken: voorbeelden en kansen voor de Demervallei
 
VIAA tussen idee en oprichting - Brecht Declercq
VIAA tussen idee en oprichting - Brecht DeclercqVIAA tussen idee en oprichting - Brecht Declercq
VIAA tussen idee en oprichting - Brecht Declercq
 

More from FARO

Tips voor verbindende gesprekken
Tips voor verbindende gesprekkenTips voor verbindende gesprekken
Tips voor verbindende gesprekkenFARO
 
Workshop ErfgoedApp maart 2020
Workshop ErfgoedApp maart 2020Workshop ErfgoedApp maart 2020
Workshop ErfgoedApp maart 2020FARO
 
Digitale collectieregistratie: Eeperon d'Or
 Digitale collectieregistratie: Eeperon d'Or Digitale collectieregistratie: Eeperon d'Or
Digitale collectieregistratie: Eeperon d'OrFARO
 
Digitale collectieregistratie: Museum Passchendaele
 Digitale collectieregistratie: Museum Passchendaele Digitale collectieregistratie: Museum Passchendaele
Digitale collectieregistratie: Museum PasschendaeleFARO
 
Digitale collectieregistratie: STAM
Digitale collectieregistratie: STAMDigitale collectieregistratie: STAM
Digitale collectieregistratie: STAMFARO
 
Digitale collectieregistratie: Museum M
Digitale collectieregistratie: Museum MDigitale collectieregistratie: Museum M
Digitale collectieregistratie: Museum MFARO
 
Digitale collectieregistratie: Mu.Zee
Digitale collectieregistratie: Mu.ZeeDigitale collectieregistratie: Mu.Zee
Digitale collectieregistratie: Mu.ZeeFARO
 
Digitale collectieregistratie: Huis van Alijn
Digitale collectieregistratie: Huis van AlijnDigitale collectieregistratie: Huis van Alijn
Digitale collectieregistratie: Huis van AlijnFARO
 
Digitale collectieregistratie: Texture
Digitale collectieregistratie: TextureDigitale collectieregistratie: Texture
Digitale collectieregistratie: TextureFARO
 
Digitale collectieregistratie: KADOC
Digitale collectieregistratie: KADOCDigitale collectieregistratie: KADOC
Digitale collectieregistratie: KADOCFARO
 
Digitale collectieregistratie: Mijn museum
Digitale collectieregistratie: Mijn museumDigitale collectieregistratie: Mijn museum
Digitale collectieregistratie: Mijn museumFARO
 
Digitale collectieregistratie: Bokrijk
Digitale collectieregistratie: BokrijkDigitale collectieregistratie: Bokrijk
Digitale collectieregistratie: BokrijkFARO
 
Digitale collectieregistratie: Speelgoedmuseum
Digitale collectieregistratie: SpeelgoedmuseumDigitale collectieregistratie: Speelgoedmuseum
Digitale collectieregistratie: SpeelgoedmuseumFARO
 
Digitale collectieregistratie: ModeMuseum Antwerpen
Digitale collectieregistratie: ModeMuseum AntwerpenDigitale collectieregistratie: ModeMuseum Antwerpen
Digitale collectieregistratie: ModeMuseum AntwerpenFARO
 
Digitale collectieregistratie: Gallo-Romeins Museum Tongeren
Digitale collectieregistratie: Gallo-Romeins Museum TongerenDigitale collectieregistratie: Gallo-Romeins Museum Tongeren
Digitale collectieregistratie: Gallo-Romeins Museum TongerenFARO
 
Digitale collectieregistratie: Liberas
Digitale collectieregistratie: LiberasDigitale collectieregistratie: Liberas
Digitale collectieregistratie: LiberasFARO
 
Digitale collectieregistratie: Museum Dr.Guislain Gent
Digitale collectieregistratie: Museum Dr.Guislain GentDigitale collectieregistratie: Museum Dr.Guislain Gent
Digitale collectieregistratie: Museum Dr.Guislain GentFARO
 
Digitale collectieregistratie: Musea en Erfgoed Antwerpen
Digitale collectieregistratie: Musea en Erfgoed AntwerpenDigitale collectieregistratie: Musea en Erfgoed Antwerpen
Digitale collectieregistratie: Musea en Erfgoed AntwerpenFARO
 
Digitale collectieregistratie: Middelheim
Digitale collectieregistratie: MiddelheimDigitale collectieregistratie: Middelheim
Digitale collectieregistratie: MiddelheimFARO
 
Digitale collectieregistratie: DIVA
Digitale collectieregistratie: DIVADigitale collectieregistratie: DIVA
Digitale collectieregistratie: DIVAFARO
 

More from FARO (20)

Tips voor verbindende gesprekken
Tips voor verbindende gesprekkenTips voor verbindende gesprekken
Tips voor verbindende gesprekken
 
Workshop ErfgoedApp maart 2020
Workshop ErfgoedApp maart 2020Workshop ErfgoedApp maart 2020
Workshop ErfgoedApp maart 2020
 
Digitale collectieregistratie: Eeperon d'Or
 Digitale collectieregistratie: Eeperon d'Or Digitale collectieregistratie: Eeperon d'Or
Digitale collectieregistratie: Eeperon d'Or
 
Digitale collectieregistratie: Museum Passchendaele
 Digitale collectieregistratie: Museum Passchendaele Digitale collectieregistratie: Museum Passchendaele
Digitale collectieregistratie: Museum Passchendaele
 
Digitale collectieregistratie: STAM
Digitale collectieregistratie: STAMDigitale collectieregistratie: STAM
Digitale collectieregistratie: STAM
 
Digitale collectieregistratie: Museum M
Digitale collectieregistratie: Museum MDigitale collectieregistratie: Museum M
Digitale collectieregistratie: Museum M
 
Digitale collectieregistratie: Mu.Zee
Digitale collectieregistratie: Mu.ZeeDigitale collectieregistratie: Mu.Zee
Digitale collectieregistratie: Mu.Zee
 
Digitale collectieregistratie: Huis van Alijn
Digitale collectieregistratie: Huis van AlijnDigitale collectieregistratie: Huis van Alijn
Digitale collectieregistratie: Huis van Alijn
 
Digitale collectieregistratie: Texture
Digitale collectieregistratie: TextureDigitale collectieregistratie: Texture
Digitale collectieregistratie: Texture
 
Digitale collectieregistratie: KADOC
Digitale collectieregistratie: KADOCDigitale collectieregistratie: KADOC
Digitale collectieregistratie: KADOC
 
Digitale collectieregistratie: Mijn museum
Digitale collectieregistratie: Mijn museumDigitale collectieregistratie: Mijn museum
Digitale collectieregistratie: Mijn museum
 
Digitale collectieregistratie: Bokrijk
Digitale collectieregistratie: BokrijkDigitale collectieregistratie: Bokrijk
Digitale collectieregistratie: Bokrijk
 
Digitale collectieregistratie: Speelgoedmuseum
Digitale collectieregistratie: SpeelgoedmuseumDigitale collectieregistratie: Speelgoedmuseum
Digitale collectieregistratie: Speelgoedmuseum
 
Digitale collectieregistratie: ModeMuseum Antwerpen
Digitale collectieregistratie: ModeMuseum AntwerpenDigitale collectieregistratie: ModeMuseum Antwerpen
Digitale collectieregistratie: ModeMuseum Antwerpen
 
Digitale collectieregistratie: Gallo-Romeins Museum Tongeren
Digitale collectieregistratie: Gallo-Romeins Museum TongerenDigitale collectieregistratie: Gallo-Romeins Museum Tongeren
Digitale collectieregistratie: Gallo-Romeins Museum Tongeren
 
Digitale collectieregistratie: Liberas
Digitale collectieregistratie: LiberasDigitale collectieregistratie: Liberas
Digitale collectieregistratie: Liberas
 
Digitale collectieregistratie: Museum Dr.Guislain Gent
Digitale collectieregistratie: Museum Dr.Guislain GentDigitale collectieregistratie: Museum Dr.Guislain Gent
Digitale collectieregistratie: Museum Dr.Guislain Gent
 
Digitale collectieregistratie: Musea en Erfgoed Antwerpen
Digitale collectieregistratie: Musea en Erfgoed AntwerpenDigitale collectieregistratie: Musea en Erfgoed Antwerpen
Digitale collectieregistratie: Musea en Erfgoed Antwerpen
 
Digitale collectieregistratie: Middelheim
Digitale collectieregistratie: MiddelheimDigitale collectieregistratie: Middelheim
Digitale collectieregistratie: Middelheim
 
Digitale collectieregistratie: DIVA
Digitale collectieregistratie: DIVADigitale collectieregistratie: DIVA
Digitale collectieregistratie: DIVA
 

CHORAL

  • 1. Taal- en Spraaktechnologie voor het ontsluiten van gesproken archieven Peter van der Maas NIOD, Amsterdam Willemijn Heeren & Arjan van Hessen Human Media Interaction Universiteit Twente
  • 2.
  • 3. Kennis Autom. spraakherkenning Concept -> Spraak Semantische netwerken Intelligent zoeken Dialoogvoering Vraag & Antwoord systemen Beeldherkenning … … Toepassing Omroepen Archieven Gezondheidszorg Onderwijs Justitie Projecten DRUID ECHO CHORAL MultimediaN IMIX StoryTeller SAFIR MESH MediaCampaign AMIDA Inhoud Achtergrond Probleemstelling Oplossingen Voorbeelden Conclusie Achtergrond
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.
  • 12. Ontsluiten van collecties: genereren van metadata/index Toegang tot collecties: Zoeken - Information Retrieval Toegang tot collecties: User interface Inhoud Achtergrond Probleem Oplossingen Voorbeelden Conclusie Geïntegreerd multimedia-zoeksysteem: ontsluiting + toegang Oplossingen vanuit taal- & spraaktechnologie onderzoekers archivarissen doorsnee gebruiker producenten van nieuwe content multimediale “index” zoeken - data mining automatische metadata-extractie robuuste spraak herkenning muziek/spraak detectie spreker segmentatie multimedia archief metadata gebruikers groepen
  • 13.
  • 14.
  • 15.
  • 16.
  • 17.
  • 18.
  • 19. Akoestisch model Taal-model Transcript Uitspraak-woordenboek Index genereren door “Spraakherkenning” Feature extractie Spraakherkenning 60 uur audio 250-500 M woorden Buchenwald Het transcript hoeft niet perfect te zijn om als index te dienen
  • 20.
  • 21.
  • 22.
  • 23.