SlideShare una empresa de Scribd logo
1 de 32
Descargar para leer sin conexión
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 1
MAB and Unicode
• Reinhold Heuvelmann
• Die Deutsche Bibliothek, Dept. IT,
Office for Data Formats
• heuvelmann@dbf.ddb.de
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 2
MAB and Unicode:
Overview
• MAB
• Relationship of MAB and Unicode
• History of MAB and Unicode
• Multiscript Records
• Field 671 „Alternate Graphic Representation“
• Character Set Concordance MAB2 – Unicode
• The German Umlaut and Unicode
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 3
MAB
• „Maschinelles Austauschformat für Bibliotheken“
= machine-readable exchange format for libraries
[in Germany and Austria]
• „fount-case“ („Setzkasten“) for the tranport of
bibliographic data
• „MAB-Auschuss“ = MAB committee
• http://www.ddb.de/professionell/mab_e.htm
• http://www.ddb.de/professionell/mab.htm
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 4
Relationship of MAB and Unicode
• standards
• different levels:
bibliographic exchange format (higher level)
character set (lower level)
• different frames:
MAB: national / German language
Unicode: internationalization
• MAB uses Unicode (like other standards:
IS0 646 + 5426; 639, 3166, 8601, DIN 1506 ...)
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 5
History of MAB and Unicode (~)
• 1999: CJK Libraries
• 2000: Unicode in MAB
• 2001: Character Set Concordance
Original Script and
Transliteration
• 2002: Original Script and
Transliteration: Field 671
• 2003+: Umlaut
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 6
• 030 CODIERTE ANGABEN ZUM DATENSATZ
• Position 2: Zeichenvorrat
– 1 = MAB-Zeichenvorrat
– 3 = DIN 31628, Stufe 1
– 5 = DIN 31628, Stufe 2
– 7 = DIN 31628, Stufe 3
– z = Sonstiger Zeichenvorrat
• Position 3: Zeichencode
– a = DIN 66003-DRV
– b = DIN 66003-IRV
– c = DIN 66003 + DIN 31624
– d = ISO 646 (IRV) + ISO 5426
– i = Industriestandard IBM-PC 850 („Diskette“)
– u = Unicode / ISO 10646 (UTF 8)
– z = Sonstiger Zeichencode
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 7
• 030 CODIERTE ANGABEN ZUM DATENSATZ
• Position 7: Transliteration/Transkription
– a= Transliteration
– b= Transkription
– z = keine Angabe
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 8
• 001 965633713
• 004 20021211
• 030 a|1uar|z|||37
• 036aDE
• 050 ||||||||a|||||
• 051 nk||z||
• 070a292
• 100bBurkhardt, Hans
• 102a101292023
• 200bECCV <5, 1998, Freiburg, Breisgau>
• 202a2170402-8
• 331 Computer vision
• 334 Elektronische Ressource
• 335 proceedings
Example 1
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 9
Example 1 (continued)
• 359 ECCV '98, 5th European Conference on
Computer Vision, Freiburg, Germany, June
1998. H. Burkhardt ... (ed.)
• 410 Berlin ; Heidelberg
• 412 Springer
• 501 Lizenzpflichtig
• 653 $aOnline-Ressourcen
• 700 |28
• 700d|30
• 902s 4129594-8 Maschinelles Sehen
• 902f11|Kongress
• 902g11|Freiburg <Breisgau, 1998>
• 902f11|Online-Publikation
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 10
• 00552nM2.01200024 h
• 001 965383385
• 004 20030930
• 030 g|1uar|z|||17
• 036aXA-DE
• 037bger
• 050 a|b|||||||||||
• 051 m|||z|||
• 070a292
• 100 Moxter, Adolf
• 102a119195186
• 331 ¬¬¬¬Die¬¬¬¬ Grundsätze ordnungsgemäßer Rechnungslegung
• 359 von Adolf Moxter
• 410 Düsseldorf
• 412 IDW-Verl.
Example 2
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 11
• 425 2003
• 425a2003
• 433 XXIX, 350 S.
• 435 23 cm
• 540aISBN 3-8021-1026-9 Pp. : EUR 58.00
• 544aDBL#2003 A 2317
• 544aDBF#2003 A 2317
• 568 02,N44,0131
• 574 03,A42,0404
• 700 |17
• 700 |19
• 700d|10.11f;7.10a/XA-DE
• 902g 4011882-4 Deutschland
• 902s1 4069454-9 Bilanzierungsgrundsätze
• 903 21
Example 2 (continued)
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 12
Multiscript Records
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 13
• 00467nM2.01200024 h
• 001 968543774
• 030 g|1daz|a|||17
• 036aXA-DE-NW
• 037brus
• 100 Giesbrecht, Agnes
• 102a122352548
• 331 Echo ljubvi
• 335 stichi
• 359 Agnes Gizbrecht
Example 3a
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 14
• 403 1. Aufl.
• 410 Lage-Hörst
• 412 BMV-Verl. Burau
• 425a2003
• 540aISBN 3-935000-34-0 kart. : EUR 9.90
• 700 |59
Example 3a (continued)
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 15
• 00467nM2.01200024 h
• 001 968543774
• 030 g|zuaz|z|||17
• 037brus
• 100 Giesbrecht, Agnes
• 102a122352548
• 331 [Main title „Echo ljubvi“ in cyrillic
script]
• 335 [Subtitle „stichi“ in cyrillic script]
• 359 [Statement of responsibility „Agnes
Gizbrecht“ in cyrillic script]
Example 3b
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 16
• 403 1. Aufl.
• 410 Lage-Hörst
• 412 BMV-Verl. Burau
• 425a2003
• 540aISBN 3-935000-34-0 kart. : EUR 9.90
• 700 |59
Example 3b (continued)
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 17
• 00467nM2.01200024 h
• 001 968543774
• 030 g|zuaz|a|||17
• 037brus
• 100 Giesbrecht, Agnes
• 102a122352548
• 331 Echo ljubvi
• 335 stichi
• 359 Agnes Gizbrecht
• 370a[Main title 331 in cyrillic script]
• 370a[Subtitle 335 in cyrillic script]
Example 3c
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 18
• 403 1. Aufl.
• 410 Lage-Hörst
• 412 BMV-Verl. Burau
• 425a2003
• 540aISBN 3-935000-34-0 kart. : EUR 9.90
• 700 |59
Example 3c (continued)
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 19
• 00467nM2.01200024 h
• 001 968543774
• 030 g|zuaz|a|||17
• 037brus
• 100 Giesbrecht, Agnes
• 102a122352548
• 331 [Main title „Echo ljubvi“ in cyrillic
script]
• 335 [Subtitle „stichi“ in cyrillic script]
• 359 [Statement of responsibility „Agnes
Gizbrecht“ in cyrillic script]
• 370aEcho ljubvi
• 370aStichi
Example 3d
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 20
• 403 1. Aufl.
• 410 Lage-Hörst
• 412 BMV-Verl. Burau
• 425a2003
• 540aISBN 3-935000-34-0 kart. : EUR 9.90
• 700 |59
Example 3d (continued)
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 21
Field 671 „Alternate Graphic Representation“
1
• http://www.ddb.de/professionell/pdf/mab-671.pdf
• all information in one record
• field-to-field relationship original script <=>
transliteration / transscription
• suitable for each part of MAB (title, authorities,
holdings, adresses)
• MARC21 Field 880 as a model
(„embedded field technique“)
• cf. UNIMARC and OCLC|PICA: pairs of fields
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 22
Field 671 „Alternate Graphic Representation“
2
• fixed part:
fieldnumber + indicator + occurence of linked field
codes for script + orientation of this field 671
codes for script + orientation of linked field
• variable content
• Script Code ISO 15924: ~ 100 scripts
(http://www.evertype.com/standards/iso15924/
document/fdis15924.pdf)
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 23
Example 3e
• 00467nM2.01200024 h
• 001 968543774
• 030 g|zuaz|a|||17
• 036aXA-DE-NW
• 037brus
• 100 Giesbrecht, Agnes
• 102a122352548
• 331 Echo ljubvi
• 335 stichi
• 359 Agnes Gizbrecht
• 403 1. Aufl.
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 24
Example 3e (continued)
• 540aISBN 3-935000-34-0 kart. : EUR 9.90
• 671 331 01CyrllLatnl[Main title 331 in
cyrillic script]
• 671 335 01CyrllLatnl[Subtitle 335 in
cyrillic script]
• 671 359 01CyrllLatnl[Statement of
responsibility 359
in cyrillic script]
• 700 |59
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 25
Example 3f
• 00467nM2.01200024 h
• 001 968543774
• 030 g|zuaz|a|||17
• 037brus
• 100 Giesbrecht, Agnes
• 102a122352548
• 331 [Main title „Echo ljubvi“ in
cyrillic script]
• 335 [Subtitle „stichi“ in cyrillic
script]
• 359 [Statement of responsibility „Agnes
Gizbrecht“ in cyrillic script]
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 26
Example 3f (continued)
• 540aISBN 3-935000-34-0 kart. : EUR 9.90
• 671 331 01LatnlCyrll [Version of main title
331 in roman script]
• 671 335 01LatnlCyrll [Version of subtitle
335 in roman script]
• 671 359 01LatnlCyrll [Version of statement
of responsibility 359
in roman script]
• 700 |59
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 27
Example 4
• 00242nM2.01200024 p
• 001 121873331
• 002a20000306
• 003 20001212
• 004 20020926
• 030 |azu|||||||||
• 065 a|||
• 070 1240
• 070a292
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 28
Example 4 (continued)
• 671 800 01JpanlLatnl[Version of heading
800 in japanese
script]
• 671 830 01JpanlLatnl[Version of
pseudonym 830
in japanese script]
• 800 Yamamoto, Tsunetomo
• 801 LoC-NA
• 814iSamurai, Zen-Mönch
• 815a1659-1719
• 830 Furumaru ¬¬¬¬[Pseud.]¬¬¬¬
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 29
Character Set Concordance MAB2 – Unicode
• 1:1-relationship of character positions in
– ISO 646 (IRV) + ISO 5426-1983
– Unicode / ISO 10646
• ... if possible
• no precombination: „Ó => „A“ + „~“
only single diacritics: „~“
• http://www.ddb.de/professionell/pdf/
mab_unic.pdf
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 30
The German Umlaut and Unicode
• U+0308: COMBINING DIAERESIS
= double dot above, umlaut
= Greek dialytika
= double derivative
• Double indexing
• German way
– precombination
– postcombination
• Proposal to ISO / Unicode
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 31
What next?
• Bibliographic Exchange Formats
~ ok
• Cataloguing, Typing
• Transliteration, Transscription
• Storing, Formatting, Converting
• Indexing, Sorting
• Searching, Finding
• Presenting, Printing
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 32
The End
• Thank you for your attention and
patience

Más contenido relacionado

Destacado

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by HubspotMarius Sescu
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTExpeed Software
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsPixeldarts
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthThinkNow
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfmarketingartwork
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 

Destacado (20)

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 

MAB and Unicode

  • 1. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 1 MAB and Unicode • Reinhold Heuvelmann • Die Deutsche Bibliothek, Dept. IT, Office for Data Formats • heuvelmann@dbf.ddb.de
  • 2. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 2 MAB and Unicode: Overview • MAB • Relationship of MAB and Unicode • History of MAB and Unicode • Multiscript Records • Field 671 „Alternate Graphic Representation“ • Character Set Concordance MAB2 – Unicode • The German Umlaut and Unicode
  • 3. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 3 MAB • „Maschinelles Austauschformat für Bibliotheken“ = machine-readable exchange format for libraries [in Germany and Austria] • „fount-case“ („Setzkasten“) for the tranport of bibliographic data • „MAB-Auschuss“ = MAB committee • http://www.ddb.de/professionell/mab_e.htm • http://www.ddb.de/professionell/mab.htm
  • 4. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 4 Relationship of MAB and Unicode • standards • different levels: bibliographic exchange format (higher level) character set (lower level) • different frames: MAB: national / German language Unicode: internationalization • MAB uses Unicode (like other standards: IS0 646 + 5426; 639, 3166, 8601, DIN 1506 ...)
  • 5. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 5 History of MAB and Unicode (~) • 1999: CJK Libraries • 2000: Unicode in MAB • 2001: Character Set Concordance Original Script and Transliteration • 2002: Original Script and Transliteration: Field 671 • 2003+: Umlaut
  • 6. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 6 • 030 CODIERTE ANGABEN ZUM DATENSATZ • Position 2: Zeichenvorrat – 1 = MAB-Zeichenvorrat – 3 = DIN 31628, Stufe 1 – 5 = DIN 31628, Stufe 2 – 7 = DIN 31628, Stufe 3 – z = Sonstiger Zeichenvorrat • Position 3: Zeichencode – a = DIN 66003-DRV – b = DIN 66003-IRV – c = DIN 66003 + DIN 31624 – d = ISO 646 (IRV) + ISO 5426 – i = Industriestandard IBM-PC 850 („Diskette“) – u = Unicode / ISO 10646 (UTF 8) – z = Sonstiger Zeichencode
  • 7. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 7 • 030 CODIERTE ANGABEN ZUM DATENSATZ • Position 7: Transliteration/Transkription – a= Transliteration – b= Transkription – z = keine Angabe
  • 8. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 8 • 001 965633713 • 004 20021211 • 030 a|1uar|z|||37 • 036aDE • 050 ||||||||a||||| • 051 nk||z|| • 070a292 • 100bBurkhardt, Hans • 102a101292023 • 200bECCV <5, 1998, Freiburg, Breisgau> • 202a2170402-8 • 331 Computer vision • 334 Elektronische Ressource • 335 proceedings Example 1
  • 9. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 9 Example 1 (continued) • 359 ECCV '98, 5th European Conference on Computer Vision, Freiburg, Germany, June 1998. H. Burkhardt ... (ed.) • 410 Berlin ; Heidelberg • 412 Springer • 501 Lizenzpflichtig • 653 $aOnline-Ressourcen • 700 |28 • 700d|30 • 902s 4129594-8 Maschinelles Sehen • 902f11|Kongress • 902g11|Freiburg <Breisgau, 1998> • 902f11|Online-Publikation
  • 10. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 10 • 00552nM2.01200024 h • 001 965383385 • 004 20030930 • 030 g|1uar|z|||17 • 036aXA-DE • 037bger • 050 a|b||||||||||| • 051 m|||z||| • 070a292 • 100 Moxter, Adolf • 102a119195186 • 331 ¬¬¬¬Die¬¬¬¬ Grundsätze ordnungsgemäßer Rechnungslegung • 359 von Adolf Moxter • 410 Düsseldorf • 412 IDW-Verl. Example 2
  • 11. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 11 • 425 2003 • 425a2003 • 433 XXIX, 350 S. • 435 23 cm • 540aISBN 3-8021-1026-9 Pp. : EUR 58.00 • 544aDBL#2003 A 2317 • 544aDBF#2003 A 2317 • 568 02,N44,0131 • 574 03,A42,0404 • 700 |17 • 700 |19 • 700d|10.11f;7.10a/XA-DE • 902g 4011882-4 Deutschland • 902s1 4069454-9 Bilanzierungsgrundsätze • 903 21 Example 2 (continued)
  • 12. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 12 Multiscript Records
  • 13. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 13 • 00467nM2.01200024 h • 001 968543774 • 030 g|1daz|a|||17 • 036aXA-DE-NW • 037brus • 100 Giesbrecht, Agnes • 102a122352548 • 331 Echo ljubvi • 335 stichi • 359 Agnes Gizbrecht Example 3a
  • 14. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 14 • 403 1. Aufl. • 410 Lage-Hörst • 412 BMV-Verl. Burau • 425a2003 • 540aISBN 3-935000-34-0 kart. : EUR 9.90 • 700 |59 Example 3a (continued)
  • 15. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 15 • 00467nM2.01200024 h • 001 968543774 • 030 g|zuaz|z|||17 • 037brus • 100 Giesbrecht, Agnes • 102a122352548 • 331 [Main title „Echo ljubvi“ in cyrillic script] • 335 [Subtitle „stichi“ in cyrillic script] • 359 [Statement of responsibility „Agnes Gizbrecht“ in cyrillic script] Example 3b
  • 16. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 16 • 403 1. Aufl. • 410 Lage-Hörst • 412 BMV-Verl. Burau • 425a2003 • 540aISBN 3-935000-34-0 kart. : EUR 9.90 • 700 |59 Example 3b (continued)
  • 17. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 17 • 00467nM2.01200024 h • 001 968543774 • 030 g|zuaz|a|||17 • 037brus • 100 Giesbrecht, Agnes • 102a122352548 • 331 Echo ljubvi • 335 stichi • 359 Agnes Gizbrecht • 370a[Main title 331 in cyrillic script] • 370a[Subtitle 335 in cyrillic script] Example 3c
  • 18. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 18 • 403 1. Aufl. • 410 Lage-Hörst • 412 BMV-Verl. Burau • 425a2003 • 540aISBN 3-935000-34-0 kart. : EUR 9.90 • 700 |59 Example 3c (continued)
  • 19. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 19 • 00467nM2.01200024 h • 001 968543774 • 030 g|zuaz|a|||17 • 037brus • 100 Giesbrecht, Agnes • 102a122352548 • 331 [Main title „Echo ljubvi“ in cyrillic script] • 335 [Subtitle „stichi“ in cyrillic script] • 359 [Statement of responsibility „Agnes Gizbrecht“ in cyrillic script] • 370aEcho ljubvi • 370aStichi Example 3d
  • 20. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 20 • 403 1. Aufl. • 410 Lage-Hörst • 412 BMV-Verl. Burau • 425a2003 • 540aISBN 3-935000-34-0 kart. : EUR 9.90 • 700 |59 Example 3d (continued)
  • 21. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 21 Field 671 „Alternate Graphic Representation“ 1 • http://www.ddb.de/professionell/pdf/mab-671.pdf • all information in one record • field-to-field relationship original script <=> transliteration / transscription • suitable for each part of MAB (title, authorities, holdings, adresses) • MARC21 Field 880 as a model („embedded field technique“) • cf. UNIMARC and OCLC|PICA: pairs of fields
  • 22. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 22 Field 671 „Alternate Graphic Representation“ 2 • fixed part: fieldnumber + indicator + occurence of linked field codes for script + orientation of this field 671 codes for script + orientation of linked field • variable content • Script Code ISO 15924: ~ 100 scripts (http://www.evertype.com/standards/iso15924/ document/fdis15924.pdf)
  • 23. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 23 Example 3e • 00467nM2.01200024 h • 001 968543774 • 030 g|zuaz|a|||17 • 036aXA-DE-NW • 037brus • 100 Giesbrecht, Agnes • 102a122352548 • 331 Echo ljubvi • 335 stichi • 359 Agnes Gizbrecht • 403 1. Aufl.
  • 24. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 24 Example 3e (continued) • 540aISBN 3-935000-34-0 kart. : EUR 9.90 • 671 331 01CyrllLatnl[Main title 331 in cyrillic script] • 671 335 01CyrllLatnl[Subtitle 335 in cyrillic script] • 671 359 01CyrllLatnl[Statement of responsibility 359 in cyrillic script] • 700 |59
  • 25. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 25 Example 3f • 00467nM2.01200024 h • 001 968543774 • 030 g|zuaz|a|||17 • 037brus • 100 Giesbrecht, Agnes • 102a122352548 • 331 [Main title „Echo ljubvi“ in cyrillic script] • 335 [Subtitle „stichi“ in cyrillic script] • 359 [Statement of responsibility „Agnes Gizbrecht“ in cyrillic script]
  • 26. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 26 Example 3f (continued) • 540aISBN 3-935000-34-0 kart. : EUR 9.90 • 671 331 01LatnlCyrll [Version of main title 331 in roman script] • 671 335 01LatnlCyrll [Version of subtitle 335 in roman script] • 671 359 01LatnlCyrll [Version of statement of responsibility 359 in roman script] • 700 |59
  • 27. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 27 Example 4 • 00242nM2.01200024 p • 001 121873331 • 002a20000306 • 003 20001212 • 004 20020926 • 030 |azu||||||||| • 065 a||| • 070 1240 • 070a292
  • 28. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 28 Example 4 (continued) • 671 800 01JpanlLatnl[Version of heading 800 in japanese script] • 671 830 01JpanlLatnl[Version of pseudonym 830 in japanese script] • 800 Yamamoto, Tsunetomo • 801 LoC-NA • 814iSamurai, Zen-Mönch • 815a1659-1719 • 830 Furumaru ¬¬¬¬[Pseud.]¬¬¬¬
  • 29. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 29 Character Set Concordance MAB2 – Unicode • 1:1-relationship of character positions in – ISO 646 (IRV) + ISO 5426-1983 – Unicode / ISO 10646 • ... if possible • no precombination: „Ó => „A“ + „~“ only single diacritics: „~“ • http://www.ddb.de/professionell/pdf/ mab_unic.pdf
  • 30. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 30 The German Umlaut and Unicode • U+0308: COMBINING DIAERESIS = double dot above, umlaut = Greek dialytika = double derivative • Double indexing • German way – precombination – postcombination • Proposal to ISO / Unicode
  • 31. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 31 What next? • Bibliographic Exchange Formats ~ ok • Cataloguing, Typing • Transliteration, Transscription • Storing, Formatting, Converting • Indexing, Sorting • Searching, Finding • Presenting, Printing
  • 32. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 32 The End • Thank you for your attention and patience