Automatische Extraktion semantischer Relationen für die Ontologieerstellung aus Textgliederungsstrukturen : Ein SBCG-Ansatz

Bok av Mariana Hebborn
Die wissenschaftliche Disziplin, die sich mit der Verarbeitung unstrukturierter Daten befasst, wird aufgrund ihres Untersuchungsgegenstands als Texttechnologie bezeichnet. Ihr Forschungsschwerpunkt bildet "die Entwicklung von Verfahren, die präzise und deshalb algorithmisierbar sind und die auf Texte als semistrukturierte Daten angewendet werden". Trotz der intensiven Forschung in diesem Bereich und der Versuche, mittels fortgeschrittener semantisch und statistisch basierter Technologien die Bedeutung natürlichsprachlicher Ausdrücke zu erfassen, bleibt der ,intelligente Computer', der ebenso wie der Mensch mit natürlicher Sprache umgehen kann, für dieses Forschungsgebiet immer noch eine große Herausforderung. Die Bezeichnung "unstrukturierte Daten" wird hier als Gegenteil von "strukturierten Daten" benutzt, die sich auf die Darstellung der Daten in computerbasierten Datenbanken beziehen. Ohne auf die Diskussion weiter einzugehen, wird in dieser Arbeit davon ausgegangen, dass Texttechnologie eine selbständigeWissenschaftsdisziplin darstellt. Daher wird der Versuch unternommen, einen neuen konstruktionsgrammatischen Ansatz zu entwickeln, der eine solide theoretische Grundlage zur rechnerbasierten Ableitung von Wissen aus Überschriften wissenschaftlicher Einführungsbücher auf der Basis der Interaktion ihrer spezifischen Sprachmerkmale bietet. Der Kern der Untersuchung ist auf die Identifikation und formale Beschreibung von semantischen Relationen zwischen bedeutungsrelevanten Begriffen fokussiert. Wiissenschaftliche Überschriften werden als Konstruktionen im Sinne der Konstruktionsgrammatik analysiert und für digitaleUmgebungen formal mit dem Formalismus der Sign-Based Construction Grammar (SBCG) beschrieben und erschlossen. Es soll sowohl ein theoretisches Konzept zur Operationalisierung der computergestützten Bedeutungsanalyse für wissenschaftliche Einführungsbücher erarbeitet als auch eine entsprechende funktionstüchtige Implementierung realisiert und evaluiert werden.