IC-SDV 2018: Manfred Hauer (AGI - Information Management Consultants) AI Technologies in Practice at Libraries

Artificial Intelligence
in practice at libraries
Digitization, Indexing, Translation, Retrieval, Sharing
Dipl.-Inf.wiss. Manfred Hauer M.A.

1. Retrieval in dandelon.com
https://www.agi-imc.de/dandelonXR.nsf

E1: Mauern einschaliger Baukörper - XR

E1: mauern einschaliger Baukörper - CAI
• Author Batran, Balder Bläsi, Herbert Frey, Volker Hillberger, Gerd Hühn, Klaus Köhler, Klaus Kraus, Eduard Rothacher, Günter Stumm, Kai-Michael
• Title Lernfeld Bautechnik
• AGI Unique ID AT001250D99AAAB612A9FC1258250002E3EFF
• Library Keywords Bautechnik; Lehrbücher; Einführungen; +TEN 050; TEN; f3/LEHRB
• Descriptors Schnittholz[100]; Holzbau[93]; Holzschraube[88]; Kalksandstein[35]; Feld[32]; Stahlbetonbau[28]; Mörtel[26]; zylindrischer Körper[21]; Leichtbeton[20]; Baustahl[18]; Kunststein[18]; Wärmedämmung[18]; Estrich[15]; Schallschutz[14]; Konstruktion[14];
Bauplanung[13]; Blei[13]; Kupfer[13]; Korrosionsschutz[13]; Fußboden[12]; Schraubverbindung[12]; Duroplast[11]; Elastomere[11]; Säure[11]; Thermoplast[11]; Wärmespeicherung[11]; Metallverbindung[11]; Nietverbindung[11]; Schweißverbindung[11]; Aufbau[10];
Datenschutz[10]; Kohäsion[9]; Asphalt[9]; Dämmstoff[9]; Wärmemenge[9]; Fliese[9]; Abdichten[8]; Maßeinheit[8]; Aluminium[7]; Maßzahl[7]; Brandwand[7]; Entwässerung[7]; Schalung[7]; Grobkeramik[6]; Zeichnung[6]; Adhäsion[6]; Dachstuhl[6]; Geschichte[6]; Klassifikation[6];
Abwicklung[5]; Anforderung[5]; Berechnung[5]; Hardware[5]; Gewichtskraft[5]; Sicherung[5]
• Free Descriptors Lernfeld[32]; Baukörper[12]; Mauerstein[9]; Holzschutz[6]; Stahlbetonbauteil[6]; Bauzeichnung[5]; Außenputz[4]; Baukalk[4]; Baurundholz[4]; Bauschnittholz[4]; Brettschichtholz[4]; Grundstufe[4]; Holzverbindung[4]; Innenputz[4]; Mauermörtel[4];
Nadelschnittholz[4]; Wandtrockenputz[4]; Arbeitsgerüst[3]; Bauabsteckung[3]; Baugrubensicherung[3]; Baustellensicherung[3]; Blechformteilverbindung[3]; Bodenklinkerplatte[3]; Bolzendübelverbindung[3]; Dachkonstruktion[3]; Gesteinskörnung[3]; Grundkonstruktion[3];
Grundleitung[3]; Hausgrundstücksentwässerung[3]; Holzkonstruktion[3]; Holztrocknung[3]; Ingenieurholzbau[3]; Maueranschluss[3]; Maßlinienbegrenzung[3]; Maßordnung[3]; Mörtelbereitung[3]; Mörtelmischung[3]; Porenbetonstein[3]; Projektbeschreibung[3];
Randeinfassung[3]; Roheisengewinnung[3]; Schalungselement[3]; Schalungskonstruktion[3]; Schnurgerüst[3]; Stahlgewinnung[3]; Tabellenanhang[3]; Teilstein[3]; Wasserhaltung[3]; Baustelleneinrichtungsplanung[2]; Fachwerkwand[2]; Massenermittlung[2]; Maßeintragung[2];
Mengenermittlung[2]; Parallelprojektion[2]; Produktlinienanalyse[2]; Streckenteilung[2]; Verkehrsfläche[2]; Winkelteilung[2]; Wärmeschallschutz[2]; Bauschaden[1]; Baustelleneinrichtungsplan[1]; Bauzeitenplan[1]; Bewehrungsplan[1]; Dichtungsbahn[1]; Dreisatzrechnen[1];
Dämmschicht[1]; Entwässerungsplan[1]; Fundamentplan[1]; Holzschraubenverbindung[1]; Mauerschicht[1]; Mauerverband[1]; Mörtelfuge[1]; Nagelverbindung[1]; Prozentrechnen[1]; Schalungsplan[1]; Wachstumsfehler[1]; Wärmeausbreitung[1]; Anreißgerät[0];
Anwendungsbeispiel[0]; Baufachleute[0]; Baunennmaß[0]; Baurichtmaß[0]; Baustoffbedarf[0]; Bewehrungsarbeit[0]; Bildquellenverzeichnis[0]; Bodenart[0]; Branchensoftware[0]; Estricharbeit[0]; Evaprinzip[0]; Fußweg[0]; Gründungsart[0]; Handelsform[0]; Hinweislinie[0];
Holzart[0]; Holzbearbeitungswerkzeug[0]; Holzbedarf[0]; Holzliste[0]; Holzschädling[0]; KaiMichael[0]; Linienart[0]; Mauerecke[0]; Mauermaß[0]; Maßhilfslinie[0]; Mörtelgruppe[0]; Nadelbaum[0]; Normschrift[0]; Pfettendachstuhl[0]; Quellverhalten[0]; Sachwortverzeichnis[0];
Schaltechnik[0]; Schrägbildart[0]; Schrägbilder[0]; Sortierklasse[0]; Stahlliste[0]; Stemmwerkzeug[0]; Verbandsart[0]; Vermessungsarbeit[0]; Wandart[0]; Wandbodenbelag[0]; Zeichenregel[0]; Überbindemaß[0]
• Noun Phrases gepresste Fliese; innerer Aufbau; projektbezogene Aufgabe; zahlreiche Abbildung; äußerer Aufbau; allgemeine Eigenschaft; aussteifende Wand; bindemittelgebundene Platte; bitumenhaltiger Stoff; chemischer Aufbau; chemischer Holzschutz; chemische
Korrosion; einschaliger Baukörper; elektrisches Betriebsmittel; elektrochemische Korrosion; ergänzende Information; europäischer Laubbaum; europäischer Nadelbaum; geometrische Grundkonstruktion; geschichtliche Entwicklung;
handlungsorientierte Aufgabe; kegelförmiger Körper; keramische Fliese; künstlicher Mauerstein; künstlicher Stein; makroskopischer Aufbau; mehrfarbige Abbildung; mikroskopischer Aufbau; nichttragende Wand; offene Wasserhaltung; prismatischer Körper; projektbezogene
Aufgabe; pyramidenförmiger Körper; rechter Winkel; rechtwinklige Parallelprojektion; regelmäßiges Vieleck; schräge Parallelprojektion; senkrechtes Lot; stranggepresste Platte; technische Eigenschaft; tragende Wand; umweltfreundlicher Bau; unregelmäßiges Vieleck;
unterkellertes Gebäude; vieler Versuch; wichtige Holzart; zeichnerische Darstellung; zerstörendes Insekt; zerstörender Pilz; zimmermannsmäßige Holzverbindung
• Countries Deutschland C4EUGE

E1: einschaliger Baukörper - LMS ALEPH

E2: digitalisierte Automobilindustrie - CAI
• Author Winkelhake, Uwe
• Title The digital transformation of the automotive industry
• AGI Unique ID AT001FBE1DC95177B89C0C1258250002DE121
• Descriptors Analog-Digital-Umsetzung[100]; Automobilindustrie[64]; mathematische Transformation[52]; Dienst[47]; Vertrieb[44]; Informationstechnik[27];
Geschäftsprozess[22]; Entwicklung[20]; Fahrplan[19]; Markt[18]; Service[15]; Unternehmenskultur[15]; strategische Unternehmensplanung[14]; Mobilität[13];
Wissensmanagement[12]; Änderungsmanagement[12]; Elektroantrieb[10]; Anpassung[10]; Erfahrung[10]; Erwartung[10]; Ausstattung[9]; Führung[9]; Konsolidierung[9];
Projektmanagement[9]; Verkauf[9]; Verteilung[9]; Nanotechnologie[8]; Sicherheit[8]; Kunden[6]; Bildung[5]; Exponentialfunktion[5]; Innovation[5]; Kommunikation[5];
Organisation[5]
• Free Descriptors Mobilitätsdienst[16]; Digitalisierungslösung[5]; Digitalisierungsprojekt[5]; Fahrzeugausstattung[5]; Infrastrukturflexibilisierung[5];
Multichannelverteilung[5]; Transformationsprojekt[5]; Kundenerfahrung[4]; Anwendungsentwicklung[2]; Designdenken[2]; Kundenerwartung[2]; Marktverschiebung[2];
Digitalisierungssituation[1]; Elektromobilität[1]; Fahrzeugmobilität[1]; Nutzentransparenz[1]; Robotik[1]; After[0]; Arbeitsmodell[0]; Automobilbank[0]; Automobilmarkt[0];
Datensee[0]; Enterprise[0]; Fahrzeugeigentum[0]; Geschäftsmodell[0]; Karrieremodell[0]; Kohlenstoffnanoröhre[0]; Kooperationsform[0]; Marktpotenzial[0];
Projektmanagementmethode[0]; Quantencomputer[0]; Sicherheitsstrategie[0]
• Noun Phrases prototypfreie Entwicklung; zentral ITArchitektur; agile Projektmanagementmethode; allgemeiner Motor; automatisierter Geschäftsprozess;
autonomes Fahren; businessorientierte Sicherheitsstrategie; definierte Umgebung; digitale Bildung; digitaler Lebensstil; digitaler Nomade; digitales Produkt; digitale
Transformation; digitalisierte Automobilbank; digitalisierte Automobilindustrie; effizienter Prozess; eingebettet ITArchitektur; erweiterte Realität; exponentielles
Wachstum; flexible Produktionsstruktur; großes Daten; heißes Thema; innovatives Arbeitsmodell; innovatives Digitalisierungsprojekt; innovativer Prozess; internetbasierte
Multichannelverteilung; kognitives Rechnen; leistungsstarkes Netzwerk; maschinelles Lernen; microservicebasierte Anwendungsentwicklung; mobile Anwendung; mobile
Strategie; mobile Wirtschaft; mobiles Ökosystem; nachhaltige Digitalisierung; neues Berufsprofil; neuer Weg; neuronales Netz; offene Innovation; organisatorischer Aspekt;
persönliches Daten; prozessbasierte Entwicklung; technologische Singularität; verbundener Dienst; zukünftige Kundenerwartung; zukünftiger Mitarbeiter

1 x german + 1 x english source documents
https://serveragi11.agi-imc.de/dandelon-
download/attachments/dandelon/ids/AT001FBE1DC95177B89C0C1258
250002DE121.PDF?contentDisposition=inline#search=AT001FBE1DC95
177B89C0C1258250002DE121&pagemode=thumbs
https://serveragi11.agi-imc.de/dandelon-
download/attachments/dandelon/ids/DEAGID984CFF9842FD48DC125
81F10031617F.PDF?contentDisposition=inline#search=vision%20digital
isierte%20automobilindustrie%202030&pagemode=thumbs

UB St. Gallen intelligentCAPTURE

E3: Seven lingual indexing
• Author De Concini, Ennio (VerfasserIn) Polia, Mario (VerfasserIn)
• Title Il paradiso del diavolo
• AGI Unique ID DE02771662BB971034335C12581BC0036A03F
• Descriptors Dämon[64]; Magie[48]; Hammer[24]; Messer[24]; Fee[20]; Kräuter[16];
Teufel[16]; Anatomie[14]; Mädchen[12]; Berg[10]; Christentum[10]; Dokument[10]; Reise[10];
Religiosität[10]; Wasser[10]
• Free Descriptors Stockdämon[8]; Bastelmesser[6]; Kräutermagie[6]
• Noun Phrases böser Blick; klein Grimoire; magisches Bastelmesser; mittler Guerin; traditionelles
Christentum; traditionelle Religiosität; tägliche Magie
• Countries Italien C4EUIT
• Names of Persons and Organisations Armando Zauberer; Baculus Daemonum; Concini;
Daemonum Malleus Hammer; Mario POLIA PARADISE; Teufel Paradies Ennio De

Title in French: "Le paradis du diable"
•

Library keywords in Portuguese

2.1. Production: paper documents via
scanning

2.2 Production via background shells

3. T1 Optical Character Recognition (OCR) -
with Abbyy FineReader Engine
• 1. Document structure - where is text and in which way it is sorted (text, tables, images)
• 2. Narrowing down to character level and comparing patterns
• 3. Building probabilistic hypothesis about words and lines
• 4. Comparison with word patterns and dictionaries in 48 languages
• 5. Final decisions and export of text, font, graphics, layout in multiple formats
• Principles: Integrity, Purposefulness and Adaptability
• The principle of integrity says that the observed object must always be considered as a “whole” consisting of many interrelated
parts. The principle of purposefulness supposes that any interpretation of data must always serve some purpose. And the principle
of adaptability means that the program must be capable of self-learning.

3. T3 Text Analytics (IAI Autoindex / CAI-Engine)
Linguistic and Statistic (German)
• 1. Document heuristic - first part and last part is more important than long part between.
• 2. Finding words, sentences, paragraphs
• 3. Analyzing each word, word variant, compound words, word types (60.000 German words with
grammar rules)
• 4. Term weight according to word type, position in sentence, structure of sentences, number of
occurrences, knowledge domain
• 5. Extraction of nouns, compound words, noun phrases, names (people, places), unknown words
• 6. Increase term weight if term is known in the build in 220.000 word thesaurus

3. T3. Translation - with Google Translation
API
• Statistical model + since 2016 neural network model
Learning from bilingual text corpora
• Final translation: source language -> English -> target language
• https://en.wikipedia.org/wiki/Google_Translate
• https://en.wikipedia.org/wiki/Google_Neural_Machine_Translation

3. T4 Semantic query expansion (millions of
word-word relations)
• Apache Lucene document index with build in terminology index from
different domain thesauri (Lucene is embedded in IBM Domino)
• Personal collection of thesauri from 30 years of development

AGI - Information Management Consultants
Dipl.-Inf.wiss. Manfred Hauer M.A.
Mandelring 238 b
67433 Neustadt an der Weinstrasse
Germany
Tel +49 (0) 6321 / 9635-10
https://www.agi-imc.de
https://www.agi-imc.de/dandelonXR.nsf
Manfred.Hauer@agi-imc.de
Google Maps

IC-SDV 2018: Manfred Hauer (AGI - Information Management Consultants) AI Technologies in Practice at Libraries

Recomendados

Recomendados

Más contenido relacionado

Más de Dr. Haxel Consult

Más de Dr. Haxel Consult (20)

IC-SDV 2018: Manfred Hauer (AGI - Information Management Consultants) AI Technologies in Practice at Libraries