Datenbank

Nach dem Auszeichnen des Wörterbuchtextes wurden die Wörterbuchdaten in eine relationale Datenbank importiert, wobei jede Wortstrecke des Wörterbuchs als eigenständiges XML-Dokument behandelt wurde. Unter Berücksichtigung des zugehörigen TEI-Schemas zur Codierung von Wörterbüchern wurden die Dokumente mit einem XML-Parser validiert. Sofern valide, wurde intern eine hierarchische Repräsentation der Dokumente aufgebaut. Diese Repräsentation gibt im Wesentlichen die Top-Down-Gliederung des XML-Markups wieder, d.h. das gesamte XML-Dokument liegt in einer hierarchisch eindeutigen Beschreibung vor, die mit Hilfe von definierten Zugriffsmechanismen systematisch abgesucht werden kann. So können auf oberster Ebene etwa alle Wörterbuchartikel und auf der nächst tieferen Ebene alle Lemmata abgerufen werden. Solche Zugriffsmechanismen bildeten die Grundlage zur Entwicklung von Transformations- und Importroutinen, mittels deren das Wörterbuch in einer relationalen MySQL-Datenbank gespeichert wird. Die Datenbank soll dabei im Wesentlichen zwei Aufgaben erfüllen: Erstens werden in ihr die Inhalte so gespeichert, dass jeder einzelne Artikel zur Anzeige im Browser daraus wieder rekonstruiert werden kann, es wird also neben den einzelnen Wörtern der Artikel auch die Information über ihre Zugehörigkeit zu den Mikrostrukturen des Artikels (Lemma, Verszitat etc.) gespeichert. Zweitens dient die Datenbank als Grundlage für die Suchmaschine, mit der die Bestandteile der Artikel separat abgefragt werden können. Diese beiden Funktionen der Datenbank unterstützen zusätzliche Mechanismen wie beispielsweise die Markierung der Fundstellen in den angezeigten Suchergebnissen.