SlideShare una empresa de Scribd logo
1 de 21
Termextraktion auf Basis von Wörterbuchdaten
tekom Jahrestagung 2014
TERM6 – Fachvortrag
Franz Kaufmann
Wer spricht da?
Seite 2
> Tätigkeit:
Consultant für Technische Kommunikation / Marketing
bei der Acolada GmbH
> Geschäftsfelder der Acolada GmbH:
Software, Consulting und IT-Dienstleistungen u.a. aus
den Bereichen Terminologie und Content Management
für XML
> Persönlicher Fokus:
Herausarbeiten der Anforderungen, Features und
Arbeitsweisen, die man wirklich braucht.
You
are
here
Worum geht es gleich?
Seite 3
> Was ist Terminologie? / Warum ist sie wichtig?
> Vergleich von Terminologiesoftware
> Die Bedeutung der Termextraktion
> Übliche Techniken der Termextraktion
(Prinzip / Vorteile / Nachteile)
> Nutzung von Wörterbuchdaten zur Termextraktion
TERMEXTRAKTION…
Seite 4
…ist die Basis aller Terminologie.
Seite 5
Termextraktion
in der Ausgangs-
sprache
Terminologie
der Fremd-
sprachen
Übersetzungs-
projekte ohne
ständige
Nachfragen
Terminologie
der Ausgangs-
sprache
ÜBLICHE TECHNIKEN (1/2):
MANUELLE TERMEXTRAKTION
Seite 6
Manuelle Termextraktion
Seite 7
Testprinzip:
Was ein Terminus ist, entscheidet ein Mensch.
Testergebnis:
Ein subjektiver Eindruck des Prüfers
Vorteile:
> Flexibilität
> Rückgriff auf Fachwissen
Nachteile:
> Fehleranfälligkeit
> Subjektiv statt objektiv
> Oft fehlt mindestens eine Voraussetzung.
> Ohne genug Zeit zum Scheitern verurteilt.
Manuelle
Termextraktion
Zeit
Übung
Stilgefühl
Fach-
wissen
Terminologisches
Grundwissen
ÜBLICHE TECHNIKEN (2/2):
AUTOMATISIERTE TERMEXTRAKTION
Seite 8
Automatisierte Termextraktion
Seite 9
Testprinzip:
> Wörter eines Texts werden in einer
Vergleichsliste nachgeschlagen.
> Unbekannte Wörter sind
potenzielle Termini.
Testergebnis:
Eine Liste potenzieller Termini
Vorteile:
> Hoher Durchsatz / hohe Geschwindigkeit
Nachteile:
> Die Ergebnisliste hat einen
minimalen Informationsgehalt.
> Etablierte Zusatztechniken
haben eigene Nachteile.
Automatisierte
Termextraktion
Wortlistenvergleich
Stemming
Häufigkeitsanalyse
Lemmatisierung
Wortlistenvergleich…
Seite 10
1. …liefert keine Warnungen bei Fehlern
oder Mängeln in der Ausgangssprache:
a. Obsoleszenz
b. falsches Fachgebiet
c. falsche Sprachebene
d. falscher Sprachraum
e. Polysemie
f. Übertragene Bedeutung
2. …liefert keine Zuordnung von
Synonymen und Abkürzungen
3. …liefert weniger Information,
als ein Terminologie-Eintrag braucht:
Fehlende Information (Wortart,
Synonyme usw.) ist manuell einzutragen.
Beispiele:
„Term“ ist im Fachgebiet „Linguistik“ obsolet,
im Fachgebiet „Mathematik“ aber nicht (1a/1b).
„kaputt“ (umgangssprachlich)/„defekt“ (1c)
„abeisen“ ist österreichisch-deutsch
für „abtauen“ oder „enteisen“ (1d)
„Zug“ als „Eisenbahn“, obwohl „Rauchkanal“,
„Zugbeanspruchung“ oder „Drahtzug“
gemeint ist. (1e)
„Katze“ im Sinne von „Laufkatze“
„Arm“ im Sinne von „Kranarm“ (1f)
„abrichten“ als Synonym von „justieren“
„abrichten“ als Synonym von „schärfen“ (2)
„CMS“ / „Content Management System“ (2)
Zusatztechniken…
Seite 11
…lösen zwar ein Problem…
> Häufigkeitsanalyse findet übertragen
verwendete Benennungen als Terminus.
> Stemming ordnet Treffer einander zu
und verkleinert die Trefferliste.
…verursachen aber andere Probleme:
> Übertragene Verwendung sollte nicht geben,
und wenn, sollte es eine Warnung geben.
> Man braucht einen Textkorpus
(meist nur für Englisch frei erhältlich) oder
ein Frequenzwörterbuch (gibt es nicht frei).
> Stemming kann sich auch irren:
Beispiel: „Schütze“, den Plural von
„Schütz“, irrtümlich auf „Schutz“ oder
„schützen“ reduzieren.
> Orthografische Varianten und Komposita
sollten in der Ergebnisliste enthalten sein:
Beispiel: „Schutzmechanismen“/
„Schutz-Mechanismen“.
WÖRTERBUCHDATEN ZUR
TERMEXTRAKTION NUTZEN
Seite 12
Wörterbücher als Wissensquellen (1/2)
Seite 13
Professionelle Wörterbücher
> …sind umfangreich
(mehrere zehn- bis hunderttausend Einträge)
> …sind fachlich vertrauenswürdig
(Verlage engagieren als Autoren Experten)
> …sind terminologisch eindeutig
(Fachwörterbücher sind begriffsorientiert)
> …enthalten Wissen über Wörter
(Angaben zu Fachgebieten,
Sprachebene, Wortart usw.)
> …enthalten Wissen über
Beziehungen zwischen Wörtern
(Synonyme und Abkürzungen)
{
Aufbau eines Wörterbuch-Datensatzes
Seite 14
Technisch (2 Beispiele aus einem Rechtswörterbuch)Konzeptionelle Struktur
Begriff
> Sprache
> Benennungen des gleichen Begriffs
(= Synonyme / Abkürzungen)
pro Benennung (wenn relevant):
> Fachgebiet
> Sprachebene
> obsolet ja/nein
> Sprachraum
> Wortart
> Übersetzungen
…
<Basis>
<LO lan="DE">
<ME>Mieter</ME>
<Wortart>m</Wortart>
</LO>
<LO lan="DE">
<ME>Bestandnehmer</ME>
<Wortart>m</Wortart>
<Aequivalenz>ähnlich</Aequivalenz>
<Sprachraum>A</Sprachraum>
</LO>
<LO lan="FR">
<ME>locataire</ME>
<HomNr>1</HomNr>
<Nest>
<Stichwort>locataire</Stichwort>
<WortartSW>m</WortartSW>
</Nest>
<Gebiet>
<Rechtsgebiet>SchuldR</Rechtsgebiet>
<Rechtskontext>
preneur du bail
</Rechtskontext>
</Gebiet>
</LO>
</Basis>
<Basis>
<LO lan="DE">
<ME>
Rauschgiftdezernat
und Sittenpolizei
</ME>
</LO>
<LO lan="DE">
<ME>die Sitte</ME>
<Wortart>m</Wortart>
<Sprachebene>umg</Sprachebene>
</LO>
<LO lan="FR">
<ME>brigade des stupéfiants
et du proxénétisme</ME>
<Abkuerzung>BSP</Abkuerzung>
<Gebiet>
<Rechtsgebiet>
PolizeiR
</Rechtsgebiet>
</Gebiet>
</LO>
</Basis>
Testprinzipien
Seite 15
1. Nachschlagen in zwei „Listen“:
bisherige Wortliste des Wortlistenvergleichs
+ 1 fachsprachliches Wörterbuch
2. Potenzielle Termini werden bewertet:
> semantisch
> fachlich (Obsoleszenz / Fachgebiet)
> sprachlich (Sprachraum / Sprachebene)
3. Die Menge der tatsächlichen Synonyme
und Abkürzungen wird ermittelt
4. Das Ergebnis ist nicht nur eine Wortliste:
> mindestens: Nicht nur Termini, sondern
auch Infos oder Korrekturhinweise.
> auch denkbar:
Dialog zur Wahl zwischen mehreren
Bedeutungen und zur Übernahme der
Wörterbuchdaten der Ausgangs- und
Fremdsprachen
Semantische Bewertung (1/2)
(im Beispiel: technisches Fachwörterbuch)
Seite 16
herkömmliche
Wortliste
Fachwörterbuch Interpretation Beispiel
potenz.
Terminus?
Ausgangssprache
korrigieren?
Treffer —
rein allgemeinsprachliche
Benennung
—
—
—
—
— —
Firmenspezifische
Benennung (oder unübliche
Verwendung)
Supermaster,
enteisen
X (X)
— ein Treffer Fachspezifische Benennung Hutschiene, entölen X
— mehrere Treffer
Fachspezifische, aber
polyseme Benennung
Oxid X
X
(weil mehrdeutig)
Treffer Treffer
Hinweis auf übertragene
Bedeutung / Polysem /
Generalisierung
Arm, Zug, Katze (X)
X
(weil ungenau
oder mehrdeutig)
Fachlich-sprachliche Bewertung (2/2)
Seite 17
Fachliche Bewertung
> fachlich obsolet?
> falsches Fachgebiet?
Sprachliche Bewertung
> umgangssprachlich?
> falscher Sprachraum?
Bewertung anhand:
Begriff
> Sprache
> Benennungen des gleichen Begriffs
(= Synonyme / Abkürzungen)
pro Benennung:
> Fachgebiet
> Sprachebene
> obsolet ja/nein
> Sprachraum
…
Synonyme und Abkürzungen
Seite 18
Fachliche Bewertung
> Welche der möglichen Synonyme
potenzieller Termini kommen vor?
> Für welche potenziellen Termini
kommen auch Abkürzungen vor?
Suche der möglichen Synonyme
und Abkürzungen anhand:
Begriff
> Sprache
> Benennungen des gleichen Begriffs
(= Synonyme / Abkürzungen)
pro Benennung:
> Fachgebiet
> Sprachebene
> obsolet ja/nein
> Sprachraum
…
Fazit: Wörterbuchvergleich…
Seite 19
1. …liefert schon im ersten Schritt
qualifizierte Information:
> Eindeutiger oder mutmaßlicher Terminus?
> Hinweise auf Fehler der Ausgangssprache
Bsp.: Obsoleszenz, falsches Fachgebiet
oder falsche Sprachebene
> Hinweise auf ungenaue oder
mehrdeutige Termini
Bsp.: Erkennung von übertragener Bedeutung,
Polysemie und Generalisierung.
> Welche Synonyme und Abkürzungen
werden tatsächlich verwendet?
2. …hilft dabei, Fehler und Mängel in
der Ausgangssprache zu beseitigen.
3. …hilft beim Finden von Vorzugsbenennungen
4. Direkte Übernahme von Daten in die
Terminologiedatenbank ist denkbar
(auch für die Fremdsprache).
5. …kann mit Zusatztechniken kombiniert werden:
> z. B. mit Lemmatisierung
(Analyse grammatischer Varianten ohne Stemming)
> z. B. mit Morphemanalyse
(Suche nach mehrteiligen oder diskontinuierlichen Termini)
FRAGEN?
Seite 20
Ihre Meinung ist uns wichtig!
Sagen Sie uns bitte, wie Ihnen der Vortrag gefallen hat.
Wir freuen uns auf Ihr Feedback per Smartphone
oder Tablet unter
http://TERM6.honestly.de
oder scannen Sie den QR-Code
Acolada GmbH
Wallensteinstraße 61 - 63
90431 Nürnberg / Deutschland
Telefon: +49 (0)911 / 37 66 75 - 0
Fax: +49 (0)911 / 37 66 75 - 29
E-Mail: info@acolada.de
Sirius CMS
XML/SGML-
Content
Management
UniTerm
Terminologie-
Management
UniLex
Mehrsprachige
Wörterbücher
SIMQIN Editor
Word-ähnlicher
XML-Editor
mit einfacher
Bedienung
myFabulous Agent
Automatische
XML-Verarbeitung
in Adobe InDesign
Das Bewertungstool steht Ihnen auch noch nach der Tagung zur Verfügung!

Más contenido relacionado

Destacado

ThèSe Vivier F P91 319 Pages
ThèSe Vivier F P91 319 PagesThèSe Vivier F P91 319 Pages
ThèSe Vivier F P91 319 PagesKanakavardhan YV
 
H Entre Voisins Gu V
H Entre Voisins Gu VH Entre Voisins Gu V
H Entre Voisins Gu Vguest59b08b
 
Pflegeversicherung - Zusatz und gesetzliche
Pflegeversicherung - Zusatz und gesetzlichePflegeversicherung - Zusatz und gesetzliche
Pflegeversicherung - Zusatz und gesetzlicheMöller Claudia
 
Bloggen - Liken - Taggen. Einführung in die Möglichkeiten des Web 2.0 für die...
Bloggen - Liken - Taggen. Einführung in die Möglichkeiten des Web 2.0 für die...Bloggen - Liken - Taggen. Einführung in die Möglichkeiten des Web 2.0 für die...
Bloggen - Liken - Taggen. Einführung in die Möglichkeiten des Web 2.0 für die...BastianGillner
 
E commerce template List
E commerce template ListE commerce template List
E commerce template Listvijay patil
 
Les Droits De Lhomme
Les Droits De LhommeLes Droits De Lhomme
Les Droits De Lhommemariajmiguelg
 
Presentacion de informatica
Presentacion de informaticaPresentacion de informatica
Presentacion de informaticaShadowgts1
 
Miguel. son frère
Miguel. son frèreMiguel. son frère
Miguel. son frèreSchool
 
A C T I V I TÉ S P R A T I Q U E S Et B T
A C T I V I TÉ S  P R A T I Q U E S Et  B TA C T I V I TÉ S  P R A T I Q U E S Et  B T
A C T I V I TÉ S P R A T I Q U E S Et B Tyouri59490
 
Paloma. sa soeur
Paloma. sa soeurPaloma. sa soeur
Paloma. sa soeurSchool
 
La cité des dieux sauvages. alberto
La cité des dieux sauvages. albertoLa cité des dieux sauvages. alberto
La cité des dieux sauvages. albertoSchool
 
Instructivo aprobado 2011 2
Instructivo aprobado 2011 2Instructivo aprobado 2011 2
Instructivo aprobado 2011 2Leonardo Mamani
 
Metodos técnicas estrategias
Metodos técnicas estrategiasMetodos técnicas estrategias
Metodos técnicas estrategiasJavier Sanchez
 
FORAG - Social Trends 2012 - Nachhaltigkeit
FORAG - Social Trends 2012 - NachhaltigkeitFORAG - Social Trends 2012 - Nachhaltigkeit
FORAG - Social Trends 2012 - NachhaltigkeitBurdaForward Advertising
 
Competencias genericas
Competencias genericasCompetencias genericas
Competencias genericasasewq
 

Destacado (20)

ThèSe Vivier F P91 319 Pages
ThèSe Vivier F P91 319 PagesThèSe Vivier F P91 319 Pages
ThèSe Vivier F P91 319 Pages
 
Les 10 1
Les 10 1Les 10 1
Les 10 1
 
H Entre Voisins Gu V
H Entre Voisins Gu VH Entre Voisins Gu V
H Entre Voisins Gu V
 
Pflegeversicherung - Zusatz und gesetzliche
Pflegeversicherung - Zusatz und gesetzlichePflegeversicherung - Zusatz und gesetzliche
Pflegeversicherung - Zusatz und gesetzliche
 
Bloggen - Liken - Taggen. Einführung in die Möglichkeiten des Web 2.0 für die...
Bloggen - Liken - Taggen. Einführung in die Möglichkeiten des Web 2.0 für die...Bloggen - Liken - Taggen. Einführung in die Möglichkeiten des Web 2.0 für die...
Bloggen - Liken - Taggen. Einführung in die Möglichkeiten des Web 2.0 für die...
 
E commerce template List
E commerce template ListE commerce template List
E commerce template List
 
Activités de réduction des risques : Groupe de travail sur le mercure
Activités de réduction des risques : Groupe de travail sur le mercureActivités de réduction des risques : Groupe de travail sur le mercure
Activités de réduction des risques : Groupe de travail sur le mercure
 
HERGET Fliesen & Naturstein Imagebroschüre
HERGET Fliesen & Naturstein ImagebroschüreHERGET Fliesen & Naturstein Imagebroschüre
HERGET Fliesen & Naturstein Imagebroschüre
 
Les Droits De Lhomme
Les Droits De LhommeLes Droits De Lhomme
Les Droits De Lhomme
 
Presentacion de informatica
Presentacion de informaticaPresentacion de informatica
Presentacion de informatica
 
FORAG - Social Trends 2013 - Finanzen
FORAG - Social Trends 2013 - FinanzenFORAG - Social Trends 2013 - Finanzen
FORAG - Social Trends 2013 - Finanzen
 
Miguel. son frère
Miguel. son frèreMiguel. son frère
Miguel. son frère
 
A C T I V I TÉ S P R A T I Q U E S Et B T
A C T I V I TÉ S  P R A T I Q U E S Et  B TA C T I V I TÉ S  P R A T I Q U E S Et  B T
A C T I V I TÉ S P R A T I Q U E S Et B T
 
Paloma. sa soeur
Paloma. sa soeurPaloma. sa soeur
Paloma. sa soeur
 
La cité des dieux sauvages. alberto
La cité des dieux sauvages. albertoLa cité des dieux sauvages. alberto
La cité des dieux sauvages. alberto
 
Instructivo aprobado 2011 2
Instructivo aprobado 2011 2Instructivo aprobado 2011 2
Instructivo aprobado 2011 2
 
Metodos técnicas estrategias
Metodos técnicas estrategiasMetodos técnicas estrategias
Metodos técnicas estrategias
 
FORAG - Social Trends 2012 - Nachhaltigkeit
FORAG - Social Trends 2012 - NachhaltigkeitFORAG - Social Trends 2012 - Nachhaltigkeit
FORAG - Social Trends 2012 - Nachhaltigkeit
 
Xavier Monteys
Xavier MonteysXavier Monteys
Xavier Monteys
 
Competencias genericas
Competencias genericasCompetencias genericas
Competencias genericas
 

Más de acolada_gmbh

Klare Terminologie durch Finalyser TERM CHECK und UniTerm
Klare Terminologie durch Finalyser TERM CHECK und UniTermKlare Terminologie durch Finalyser TERM CHECK und UniTerm
Klare Terminologie durch Finalyser TERM CHECK und UniTermacolada_gmbh
 
Produktinformationen in Sirius CMS verwalten (PIM)
Produktinformationen in Sirius CMS verwalten (PIM)Produktinformationen in Sirius CMS verwalten (PIM)
Produktinformationen in Sirius CMS verwalten (PIM)acolada_gmbh
 
Warum man für Wörterbücher immer noch Geld ausgeben sollte
Warum man für Wörterbücher immer noch Geld ausgeben sollteWarum man für Wörterbücher immer noch Geld ausgeben sollte
Warum man für Wörterbücher immer noch Geld ausgeben sollteacolada_gmbh
 
Information about Sirius CMS from Acolada
Information about Sirius CMS from AcoladaInformation about Sirius CMS from Acolada
Information about Sirius CMS from Acoladaacolada_gmbh
 
Information zu Sirius CMS von Acolada
Information zu Sirius CMS von AcoladaInformation zu Sirius CMS von Acolada
Information zu Sirius CMS von Acoladaacolada_gmbh
 
XML ohne technische Kenntnisse mit dem word-ähnlichen XML-Editor SIQMIN von A...
XML ohne technische Kenntnisse mit dem word-ähnlichen XML-Editor SIQMIN von A...XML ohne technische Kenntnisse mit dem word-ähnlichen XML-Editor SIQMIN von A...
XML ohne technische Kenntnisse mit dem word-ähnlichen XML-Editor SIQMIN von A...acolada_gmbh
 

Más de acolada_gmbh (6)

Klare Terminologie durch Finalyser TERM CHECK und UniTerm
Klare Terminologie durch Finalyser TERM CHECK und UniTermKlare Terminologie durch Finalyser TERM CHECK und UniTerm
Klare Terminologie durch Finalyser TERM CHECK und UniTerm
 
Produktinformationen in Sirius CMS verwalten (PIM)
Produktinformationen in Sirius CMS verwalten (PIM)Produktinformationen in Sirius CMS verwalten (PIM)
Produktinformationen in Sirius CMS verwalten (PIM)
 
Warum man für Wörterbücher immer noch Geld ausgeben sollte
Warum man für Wörterbücher immer noch Geld ausgeben sollteWarum man für Wörterbücher immer noch Geld ausgeben sollte
Warum man für Wörterbücher immer noch Geld ausgeben sollte
 
Information about Sirius CMS from Acolada
Information about Sirius CMS from AcoladaInformation about Sirius CMS from Acolada
Information about Sirius CMS from Acolada
 
Information zu Sirius CMS von Acolada
Information zu Sirius CMS von AcoladaInformation zu Sirius CMS von Acolada
Information zu Sirius CMS von Acolada
 
XML ohne technische Kenntnisse mit dem word-ähnlichen XML-Editor SIQMIN von A...
XML ohne technische Kenntnisse mit dem word-ähnlichen XML-Editor SIQMIN von A...XML ohne technische Kenntnisse mit dem word-ähnlichen XML-Editor SIQMIN von A...
XML ohne technische Kenntnisse mit dem word-ähnlichen XML-Editor SIQMIN von A...
 

Verbesserte Termextraktion auf Basis von Wörterbuchdaten

  • 1. Termextraktion auf Basis von Wörterbuchdaten tekom Jahrestagung 2014 TERM6 – Fachvortrag
  • 2. Franz Kaufmann Wer spricht da? Seite 2 > Tätigkeit: Consultant für Technische Kommunikation / Marketing bei der Acolada GmbH > Geschäftsfelder der Acolada GmbH: Software, Consulting und IT-Dienstleistungen u.a. aus den Bereichen Terminologie und Content Management für XML > Persönlicher Fokus: Herausarbeiten der Anforderungen, Features und Arbeitsweisen, die man wirklich braucht.
  • 3. You are here Worum geht es gleich? Seite 3 > Was ist Terminologie? / Warum ist sie wichtig? > Vergleich von Terminologiesoftware > Die Bedeutung der Termextraktion > Übliche Techniken der Termextraktion (Prinzip / Vorteile / Nachteile) > Nutzung von Wörterbuchdaten zur Termextraktion
  • 5. …ist die Basis aller Terminologie. Seite 5 Termextraktion in der Ausgangs- sprache Terminologie der Fremd- sprachen Übersetzungs- projekte ohne ständige Nachfragen Terminologie der Ausgangs- sprache
  • 6. ÜBLICHE TECHNIKEN (1/2): MANUELLE TERMEXTRAKTION Seite 6
  • 7. Manuelle Termextraktion Seite 7 Testprinzip: Was ein Terminus ist, entscheidet ein Mensch. Testergebnis: Ein subjektiver Eindruck des Prüfers Vorteile: > Flexibilität > Rückgriff auf Fachwissen Nachteile: > Fehleranfälligkeit > Subjektiv statt objektiv > Oft fehlt mindestens eine Voraussetzung. > Ohne genug Zeit zum Scheitern verurteilt. Manuelle Termextraktion Zeit Übung Stilgefühl Fach- wissen Terminologisches Grundwissen
  • 9. Automatisierte Termextraktion Seite 9 Testprinzip: > Wörter eines Texts werden in einer Vergleichsliste nachgeschlagen. > Unbekannte Wörter sind potenzielle Termini. Testergebnis: Eine Liste potenzieller Termini Vorteile: > Hoher Durchsatz / hohe Geschwindigkeit Nachteile: > Die Ergebnisliste hat einen minimalen Informationsgehalt. > Etablierte Zusatztechniken haben eigene Nachteile. Automatisierte Termextraktion Wortlistenvergleich Stemming Häufigkeitsanalyse Lemmatisierung
  • 10. Wortlistenvergleich… Seite 10 1. …liefert keine Warnungen bei Fehlern oder Mängeln in der Ausgangssprache: a. Obsoleszenz b. falsches Fachgebiet c. falsche Sprachebene d. falscher Sprachraum e. Polysemie f. Übertragene Bedeutung 2. …liefert keine Zuordnung von Synonymen und Abkürzungen 3. …liefert weniger Information, als ein Terminologie-Eintrag braucht: Fehlende Information (Wortart, Synonyme usw.) ist manuell einzutragen. Beispiele: „Term“ ist im Fachgebiet „Linguistik“ obsolet, im Fachgebiet „Mathematik“ aber nicht (1a/1b). „kaputt“ (umgangssprachlich)/„defekt“ (1c) „abeisen“ ist österreichisch-deutsch für „abtauen“ oder „enteisen“ (1d) „Zug“ als „Eisenbahn“, obwohl „Rauchkanal“, „Zugbeanspruchung“ oder „Drahtzug“ gemeint ist. (1e) „Katze“ im Sinne von „Laufkatze“ „Arm“ im Sinne von „Kranarm“ (1f) „abrichten“ als Synonym von „justieren“ „abrichten“ als Synonym von „schärfen“ (2) „CMS“ / „Content Management System“ (2)
  • 11. Zusatztechniken… Seite 11 …lösen zwar ein Problem… > Häufigkeitsanalyse findet übertragen verwendete Benennungen als Terminus. > Stemming ordnet Treffer einander zu und verkleinert die Trefferliste. …verursachen aber andere Probleme: > Übertragene Verwendung sollte nicht geben, und wenn, sollte es eine Warnung geben. > Man braucht einen Textkorpus (meist nur für Englisch frei erhältlich) oder ein Frequenzwörterbuch (gibt es nicht frei). > Stemming kann sich auch irren: Beispiel: „Schütze“, den Plural von „Schütz“, irrtümlich auf „Schutz“ oder „schützen“ reduzieren. > Orthografische Varianten und Komposita sollten in der Ergebnisliste enthalten sein: Beispiel: „Schutzmechanismen“/ „Schutz-Mechanismen“.
  • 13. Wörterbücher als Wissensquellen (1/2) Seite 13 Professionelle Wörterbücher > …sind umfangreich (mehrere zehn- bis hunderttausend Einträge) > …sind fachlich vertrauenswürdig (Verlage engagieren als Autoren Experten) > …sind terminologisch eindeutig (Fachwörterbücher sind begriffsorientiert) > …enthalten Wissen über Wörter (Angaben zu Fachgebieten, Sprachebene, Wortart usw.) > …enthalten Wissen über Beziehungen zwischen Wörtern (Synonyme und Abkürzungen) {
  • 14. Aufbau eines Wörterbuch-Datensatzes Seite 14 Technisch (2 Beispiele aus einem Rechtswörterbuch)Konzeptionelle Struktur Begriff > Sprache > Benennungen des gleichen Begriffs (= Synonyme / Abkürzungen) pro Benennung (wenn relevant): > Fachgebiet > Sprachebene > obsolet ja/nein > Sprachraum > Wortart > Übersetzungen … <Basis> <LO lan="DE"> <ME>Mieter</ME> <Wortart>m</Wortart> </LO> <LO lan="DE"> <ME>Bestandnehmer</ME> <Wortart>m</Wortart> <Aequivalenz>ähnlich</Aequivalenz> <Sprachraum>A</Sprachraum> </LO> <LO lan="FR"> <ME>locataire</ME> <HomNr>1</HomNr> <Nest> <Stichwort>locataire</Stichwort> <WortartSW>m</WortartSW> </Nest> <Gebiet> <Rechtsgebiet>SchuldR</Rechtsgebiet> <Rechtskontext> preneur du bail </Rechtskontext> </Gebiet> </LO> </Basis> <Basis> <LO lan="DE"> <ME> Rauschgiftdezernat und Sittenpolizei </ME> </LO> <LO lan="DE"> <ME>die Sitte</ME> <Wortart>m</Wortart> <Sprachebene>umg</Sprachebene> </LO> <LO lan="FR"> <ME>brigade des stupéfiants et du proxénétisme</ME> <Abkuerzung>BSP</Abkuerzung> <Gebiet> <Rechtsgebiet> PolizeiR </Rechtsgebiet> </Gebiet> </LO> </Basis>
  • 15. Testprinzipien Seite 15 1. Nachschlagen in zwei „Listen“: bisherige Wortliste des Wortlistenvergleichs + 1 fachsprachliches Wörterbuch 2. Potenzielle Termini werden bewertet: > semantisch > fachlich (Obsoleszenz / Fachgebiet) > sprachlich (Sprachraum / Sprachebene) 3. Die Menge der tatsächlichen Synonyme und Abkürzungen wird ermittelt 4. Das Ergebnis ist nicht nur eine Wortliste: > mindestens: Nicht nur Termini, sondern auch Infos oder Korrekturhinweise. > auch denkbar: Dialog zur Wahl zwischen mehreren Bedeutungen und zur Übernahme der Wörterbuchdaten der Ausgangs- und Fremdsprachen
  • 16. Semantische Bewertung (1/2) (im Beispiel: technisches Fachwörterbuch) Seite 16 herkömmliche Wortliste Fachwörterbuch Interpretation Beispiel potenz. Terminus? Ausgangssprache korrigieren? Treffer — rein allgemeinsprachliche Benennung — — — — — — Firmenspezifische Benennung (oder unübliche Verwendung) Supermaster, enteisen X (X) — ein Treffer Fachspezifische Benennung Hutschiene, entölen X — mehrere Treffer Fachspezifische, aber polyseme Benennung Oxid X X (weil mehrdeutig) Treffer Treffer Hinweis auf übertragene Bedeutung / Polysem / Generalisierung Arm, Zug, Katze (X) X (weil ungenau oder mehrdeutig)
  • 17. Fachlich-sprachliche Bewertung (2/2) Seite 17 Fachliche Bewertung > fachlich obsolet? > falsches Fachgebiet? Sprachliche Bewertung > umgangssprachlich? > falscher Sprachraum? Bewertung anhand: Begriff > Sprache > Benennungen des gleichen Begriffs (= Synonyme / Abkürzungen) pro Benennung: > Fachgebiet > Sprachebene > obsolet ja/nein > Sprachraum …
  • 18. Synonyme und Abkürzungen Seite 18 Fachliche Bewertung > Welche der möglichen Synonyme potenzieller Termini kommen vor? > Für welche potenziellen Termini kommen auch Abkürzungen vor? Suche der möglichen Synonyme und Abkürzungen anhand: Begriff > Sprache > Benennungen des gleichen Begriffs (= Synonyme / Abkürzungen) pro Benennung: > Fachgebiet > Sprachebene > obsolet ja/nein > Sprachraum …
  • 19. Fazit: Wörterbuchvergleich… Seite 19 1. …liefert schon im ersten Schritt qualifizierte Information: > Eindeutiger oder mutmaßlicher Terminus? > Hinweise auf Fehler der Ausgangssprache Bsp.: Obsoleszenz, falsches Fachgebiet oder falsche Sprachebene > Hinweise auf ungenaue oder mehrdeutige Termini Bsp.: Erkennung von übertragener Bedeutung, Polysemie und Generalisierung. > Welche Synonyme und Abkürzungen werden tatsächlich verwendet? 2. …hilft dabei, Fehler und Mängel in der Ausgangssprache zu beseitigen. 3. …hilft beim Finden von Vorzugsbenennungen 4. Direkte Übernahme von Daten in die Terminologiedatenbank ist denkbar (auch für die Fremdsprache). 5. …kann mit Zusatztechniken kombiniert werden: > z. B. mit Lemmatisierung (Analyse grammatischer Varianten ohne Stemming) > z. B. mit Morphemanalyse (Suche nach mehrteiligen oder diskontinuierlichen Termini)
  • 21. Ihre Meinung ist uns wichtig! Sagen Sie uns bitte, wie Ihnen der Vortrag gefallen hat. Wir freuen uns auf Ihr Feedback per Smartphone oder Tablet unter http://TERM6.honestly.de oder scannen Sie den QR-Code Acolada GmbH Wallensteinstraße 61 - 63 90431 Nürnberg / Deutschland Telefon: +49 (0)911 / 37 66 75 - 0 Fax: +49 (0)911 / 37 66 75 - 29 E-Mail: info@acolada.de Sirius CMS XML/SGML- Content Management UniTerm Terminologie- Management UniLex Mehrsprachige Wörterbücher SIMQIN Editor Word-ähnlicher XML-Editor mit einfacher Bedienung myFabulous Agent Automatische XML-Verarbeitung in Adobe InDesign Das Bewertungstool steht Ihnen auch noch nach der Tagung zur Verfügung!