Quantitative Untersuchungen zu den bosnischen, kroatischen und serbischen Texten mit Hilfe der Computerlinguistik und der Texttechnologie

Bok av Ernest Plivac
Diplomarbeit aus dem Jahr 2004 im Fachbereich Russistik / Slavistik, Note: 1,0, Universitt Wien (Institut fr Slawistik), Sprache: Deutsch, Abstract: In dieser Studie werden die computeruntersttzten Korpusanalysen mit der zu diesem Zweck erstellten und frei zugnglichen Webapplikation plivac.net/linguistik" behandelt. Der Schwerpunkt liegt in den quantitativen Untersuchungen eines ber 3 Millionen Zeichen groen Textkorpus, der gleichmig bosnische, kroatische und serbische Texte umfasst. Mithilfe der Webapplikation wurden verschiedene quantitative Untersuchungen durchgefhrt und ausgewertet. Die Arbeit umfasst fnf Hauptkapitel. Im ersten wird die Webapplikation vorgestellt und ihre Funktionsweise anhand eines konkreten Beispiels unter die Lupe genommen. Im Kapitel Phonetik werden die Phoneme des Gesamtkorpus nach akustischen und artikulatorischen Merkmalen untersucht und die Ergebnisse graphisch dargestellt und erlutert. Drei weitere Kapitel die Phonemhufigkeit, die Wortlnge und die Satzlnge befassen sich mit den Verteilungen nach verschiedenen Textarten und nach dem Jat-Reflex, wonach die ijekawischen und ekawischen Texte untereinander verglichen werden. Die gewonnenen Erkenntnisse bekrftigen die These ber die Existenz einer Sprache der serbokroatischen oder der kroatoserbischen, die infolge der Staatsbildungsprozesse nach dem Zerfall Jugoslawiens und der Dominanz der politischen gegenber linguistischen Kriterien zur Spaltung dieser in vier nationale Sprachen Bosnisch, Kroatisch, Serbisch und zuletzt auch Montenegrinisch fhrte. Anhand der Untersuchungsergebnisse lsst sich eine Schlussfolgerung ziehen, dass die sprachlichen Unterschiede der Textkorpora vielmehr von der Textsorte abhngen als von der geographischen Lage ihres Ursprungs.