Liknande böcker
Entwicklung Eines Tabellenmodells : Analyse und Entwurf eines Konzepts zur Abbildung von strukturierten Daten aus Dokumenten
Bok av Zintgraf Fabian
Tabellen finden sich in fast jedem Medium wieder. In Zeitungen, Bchern, Rechnungen oder in elektronischen Medien vermitteln sie dem Leser Daten in strukturierter Form, die aus bloem Text weitaus schwieriger ersichtlich sind. Wie die Tabellen reprsentiert werden, ist fr den Menschen irrelevant - denn nahezu ohne Schwierigkeiten ist er in der Lage, deren Strukturen zu erkennen und aufzunehmen. Automatische Prozesse mssen sich hingegen mhsam an verschiedenen Informationsquellen bedienen, um die Datenstruktur verstehen zu knnen. Die Menge an verschiedenen Dokumententypen und die verschiedenen Arten von Tabellenlayouts erschweren den Prozess einer automatischen Tabellenerkennung zustzlich. Ein formatbergreifender Austausch von tabellarischen Strukturen, selbst bei den gngigsten Dokumentarten, wird nicht untersttzt. Insbesondere der Transfer von Tabellen aus pixelbasierten Dokumente fehlt. Eine besondere Herausforderung besteht folglich darin, Tabellen aus verschiedenen Dokumentarten einheitlich abzulegen. Diese Arbeit beschreibt die Entwicklung eines Modells, worin tabellenfrmige Daten dokumentbergreifend abgelegt werden knnen.