Medizinische Berichte werden meistens als Freitext erstellt, da dies schnell geht und in jeder Situation eine hohe Flexibilität hat. Werden allerdings Daten oder Dokumente in medizinischen Systemen zwischen mehreren Partnern geteilt kann auch eine maschinelle Auswertung helfen, vor allen wenn es um sehr große Datenmengen geht. Auch standardisierte Benutzung von Abkürzungen und generellen Begriffen kann die Verständlichkeit der Texte erhöhen.
In der Radiologie ist die RadLex Terminologie vor allem für das Schreiben von Radiologieberichten erstellt worden. RadLex hilft, die benutzen Worte verschiedenen Personen vergleichbarer zu machen und sowohl Synonyme als auch andere Verwandtschaften von Begriffen analysieren zu können. RadLex existiert in Englisch und Deutsch, es können also damit auch deutsche Begriffe benutzt werden, um z.B. in englischen Dokumenten zu suchen. Durch templates im DICOM structured reporting kann RadLex auch helfen Abläufe effizienter zu machen und Strukturen der Texte kontextbezogen wiederzubenutzen.
Ergebnisse des Forschungsprojektes Khresmoi (http://www.khresmoi.eu/) werden präsentiert und auch weitere Ideen für die Entwicklung von generellen Suchwerkzeugen in medizinischen Daten, vor allem in visuellen Daten, wie Suche nach visuell ähnlichen volumes of interest oder die Suche nach wissenschaftlichen Artikeln, die thematisch zu einem bearbeiteten Fall passen.
2. Motivation: Datenwachstum, Komplexität
• Exponentielles Wachstum der
Anzahl der Bilder
• 30% weltweiter Speicherkapazität
ist medical imaging
• Nach Schätzungen der EU
• Komplexität der Bildgebung steigt
• Bilder sind in allen Abteilungen
verfügbar
• Alle klinischen Daten auch
• Integration vieler Daten ist notwendig
2
3. Was ist Semantik?
• Semantik (von Altgriechisch
sēmaínein ‚
bezeichnen‘, ‚zum Zeichen
gehörig‘), auch Bedeutungslehre, nennt man
die Theorie oder Wissenschaft von der
Bedeutung der Zeichen.
• Zeichen können in diesem Fall Wörter,
Phrasen oder Symbole sein.
• Die Semantik beschäftigt sich typischerweise
mit den Beziehungen zwischen Zeichen und
Bedeutungen dieser Zeichen
3
4. Semantik in der Medizin
• MeSH – Medical Subject headings
• UMLS – unified medical language system
• Methathesaurus verschiedener Terminologien
• Kostenlose, und nicht freie Terminologien
• SNOMED – Systemized Nomenclature in
Medicine
• Teuer, da kommerziell gepflegt
• Teilweise kaufen Länder die gesamte Terminologie
• LinkedLifeData
• Offen, freie Basis, 10 Mia Fakten
4
5. RadLex
• Nicht Teil von UMLS
• Teilweise basiert auf anderen Terminologien
• Deutsche Version existiert
• Wird aber (meines Wissens) nicht mehr upgedated
5
6. Khresmoi Projekt
• Mix von mehrsprachigen Ressourcen mit
multimedia Daten für verschiedene Benutzer
• Fokus auf 2D und 3D Bildsuche
6
7. Wo helfen Terminologien & Semantik?
• Beschreibung von Inhalten in eindeutiger Form
• Synonyme, Bedeutungshierarchien, Abkürzungen
• Interoperabilität oder Austausch von Daten
• Innerhalb und außerhalb der Institution
• Mehrsprachige Dokumentation und Suche
• Structured reporting und Wiederbenutzung
von Templates
• Effizienzgewinn
• Verlinken von Text und visuellen Inhalten
7
8. Wo gibt es Probleme mit Semantik?
• Standardisierte Beschreibung ist häufig
weniger ausdruckstark
• Vielleicht Freitext zusätzlich zu Terminologien?
• Automatische Auswahl nach Freitexteintrag
• Sehr große Terminologien sind nicht einfach
zu lernen
• SNOMED in Dänemark, langfristige Sicht ist notwendig
• Eindeutige Kodierung ist nicht unbedingt gegeben
• Am Anfang mehr Aufwand, später potentielle
Zeitgewinne
8
9. Eindeutige Beschreibung
• Herzinfarkt, Myokardinfarkt, Herzmuskelinfarkt,
…
• Viele Synonyme
• ICD10-I20: MI, STEMI, NSTEMI, ACS
• Viele Abkürzungen, die man lokal versteht, aber die
nicht Standard sind
• Auch “visuelle” Terminologien sind nicht
eindeutig
• Ground glass, Fibrosen, … mit Beispielen
9
10. Interoperabilität
• Mehr Patienten wechseln
den Arzt
• Generell mehr Mobilität
• Elektronische Daten
können einfacher
ausgetauscht werden
• Personal health records
• Vollständige Patientenakte
hat viele Vorteile
• eHealth Strategien in vielen Ländern
10
11. Mehrsprachigkeit
• Vor allem in der Schweiz ein wichtiges Thema!
• Literatur ist englisch, klinische Dokumente
deutsch/französisch/italienisch, …
• Teaching files in vielen Sprachen
• In RadLex/MeSH ist jeder Begriff in allen
Sprachen derselbe
11
(EN) x-ray of a tibia
with a fracture
(DE) Röntgenbilder
einer gebrochenen Tibia
(FR) Radiographies du
tibia avec fracture
14. Klassifizieren von Journal Figuren
• Bilder in Artikeln sind
zum Grossteil nicht
klinische Bilder
• Caption erlaubt es
häufig nicht, den Typ zu
bestimmen
• Visuelle Information kann
helfen
• Typen auf RadLex/MeSH gemapped, ganze
Struktur kann eingesetzt werden
• Benutzung auch in Goldminer, um relevante Artikel
zu finden 14
19. • Automatische Identifikation von Organen und
Landmarks im Körper (etwa 50 Strukturen,
15 landmarks, RadLex terms)
• Benchmark für die Bildverarbeitungscommunity
• Vergleichen von Algorithmen auf 10-40 TB Daten
• Gold standard und silver standard für Organe
19
20. Big data
• Sehr große Datenmengen müssen
automatisiert analysiert werden (>150 TB)
• Ähnlich wie Google im Web mit Billionen Webseiten
• Man findet immer “ähnliche” Fälle
• Auch für seltene Krankheiten
• Selbes Alter und ähnliche co-Morbiditäten
• Ähnliche CT und MR Generation, ähnliche Protokolle
• Auch normale Fälle als Vergleich
• Anonymisierung und Konfidentialität sind sehr
wichtig, aber das Potential ist enorm
20
21. Nächste Schritte
• Extraktion von einfacher Semantik aus Bildern
• Inhaltsbasierte Suche in Regionen
• Manuell annotierte Datenbanken sind nötig
• Auch Kommentare und social bookmarking
• Verbinden von 2D, 3D, 4D
• Visuelle Verbindung und über klinische Daten
• Klinische Bilder, Teaching files und die medizinische
Literatur
• Einsatz in Klinik, Forschung und Lehre
• Suche wie in Google in ähnliche Fällen
• Visualisierung von Beziehungen 21
22. Fazit
• Radiologie produziert immer mehr und immer
komplexere Bilder
• Semantik kann helfen die Fälle zu beschreiben
und Fälle später wiederzufinden
• Statistiken und Vergleiche können automatisiert werden
wenn gut annotiert wird
• Austausch von Daten zwischen Klinikern wird einfacher
• Visuelle Analyse kann helfen Semantik in Bildern
zu finden
• Lokale Bildanalyse ist notwendig
• Automatisches Messen und Finden ähnliche ROIs 22
23. Kontakt und mehr Information
• Mehr informationen unter:
• http://khresmoi.eu/
• http://visceral.eu/
• http://medgift.hevs.ch/
• http://publications.hevs.ch/
• Kontakt:
• Henning.mueller@hevs.ch
23