Semantisches Clustering Durch Ein Web-Mining-Basiertes Verfahren Zur Gruppierung Von Begriffen

Bok av Peter Schal
Bachelorarbeit aus dem Jahr 2009 im Fachbereich Informatik - Internet, neue Technologien, Note: 1,3, Universitt Paderborn, Sprache: Deutsch, Abstract: Beim Card-Sorting-Experiment werden Begriffe in Gruppen eingeteilt. Fr dieses Clustering der Begriffe werden Versuchspersonen bentigt. Diese Arbeit schlgt ein Verfahren vor, welches Begriffe nach ihrer semantischen hnlichkeit automatisch gruppiert. Hierdurch soll ein hnliches Ergebnis wie bei einem Card-Sorting-Experiment erreicht werden. Das Verfahren bezieht dabei Worthufigkeiten aus dem Web, um anschlieend aus den Hufigkeiten die Beziehungsstrken der Begriffe mittels Assoziationsmae zu berechnen. Aus den berechneten Beziehungsstrken wird ein Graph generiert. Auf diesen Graphen erfolgt ein Clustering, durch das die Gruppen gebildet werden. In der Arbeit werden verschiedene Assoziationsmae und Datengrundlagen verwendet und die Qualitt ihrer Ergebnisse miteinander verglichen. Durch die Berechnung der hnlichkeit von Begriffsvektoren, soll ein besseres Ergebnis erreicht werden. Zur Evaluation werden die Gruppierungen des Verfahrens denen eines Card-Sorting-Experimentes gegenbergestellt. Die Evaluationsergebnisse zeigen, das durch das Verfahren hnliche Gruppierungen, wie die bei einem Card-Sorting-Experiment, erreicht werden knnen. Dabei spielt das gewhlte Assoziationsma, sowie die Datengrundlage eine wichtige Rolle.