Datenverarbeitung mit Ausblick

Konstanzer Steinbeis-Transferzentrum unterstützt mit XML-Dienstleistungen

Datenbanken sind omnipräsent und als Kernkomponenten einer modernen Systemlandschaft nicht mehr wegzudenken. Die Verwaltung klar strukturierter Daten ist die Spezialität klassischer, relationaler Datenbanksysteme. BaseX steht für ein Open-Source- und Forschungsprojekt der Universität Konstanz, mit dem ein natives XMLDatenbanksystem entwickelt wurde. Das Steinbeis-Transferzentrum Processing, Querying and Visualization of Very Large Datasets bietet auf Basis von BaseX Dienstleistungen für datenbezogene Problemstellungen an.

Gerade in hochdynamischen Geschäftsfeldern, in denen sich Geschäftsprozesse und die zu verarbeitenden Daten häufig ändern und angepasst werden müssen, stoßen klassische Lösungen oft an ihre Grenzen. Um die Architektur der schwerfälligen Datenbanksysteme nicht ständig an die sich ändernden Bedingungen und Datenformate anpassen zu müssen, hat sich das Datenaustauschformat XML durchgesetzt. XML, die eXtensible Markup Language, ist ein einfaches, sehr flexibles Textformat, das Daten unterschiedlichster Art sowohl für Menschen als auch für Programme les- und verarbeitbar abbildet. Es ist gängige Praxis, Daten aus relationalen Datenbanken herauszulesen und diese, angepasst an die sich ändernden Geschäftsprozesse, im XML-Format weiter zu verarbeiten. Dieses Vorgehen, gepaart mit der Eigenschaft von XML als plattformunabhängiges Datenaustauschfomat, hat zu einem enormen Anstieg von XML-Daten in Unternehmen geführt. Softwaresysteme produzieren von sich aus ihre Resultate im XML-Format und erwarten ihre Eingaben in selbigem. Es liegt auf der Hand, dass sich für diese Fälle Datenbanklösungen anbieten, die direkt und ohne Umwege mit XML-Daten operieren können.

Ein Beispiel für ein solches natives XML-Datenbanksystem ist BaseX. Die Wurzeln von BaseX liegen an der Universität Konstanz, am Lehrstuhl für Datenbank- und Informationssysteme unter der Leitung von Prof. Dr. Marc H. Scholl. Motiviert durch die Herausforderung, XML im Datenbankkontext optimal zu unterstützen und die Hürden zu meistern, die semi-strukturierte (d. h. XML-) Daten mit sich bringen, hat sich das Projekt zu einem vollwertigen Produkt entwickelt und erfreut sich großer Beliebtheit auf dem internationalen Parkett. Der Fokus bei der Produktentwicklung lag zum einen auf einer schlanken Architektur und höchstmöglicher Effizienz und zum anderen auf einer hohen Benutzerfreundlichkeit – ein für Datenbanksysteme seltenes Attribut. Das Projekt wurde 2007 von Dr. Christian Grün initiiert und wird seitdem von einem mehrköpfigen Entwicklerteam gepflegt und weiterentwickelt. Das Gesamtsystem umfasst den robusten Datenbankkern, die interaktive Benutzeroberfläche, zahlreiche Programmierschnittstellen und eine umfassende Dokumentation. Die grundlegende Idee hinter der Technologie von BaseX war, keine neue Technologie zu erfinden, sondern die jahrzehntelangen Forschungsergebnisse der klassischen, relationalen Datenbankarchitektur für das neue dynamische Datenformat nutzbar zu machen. So wird die hierarchische Baumstruktur, die jedem XML-Format innewohnt, auf eine relationale Repräsentation übertragen. Es wird jedoch kein trivialer Ansatz verfolgt und keine relationale Datenbank zur Speicherung eingesetzt. Vielmehr wird auf eine maßgeschneiderte Art der Kodierung zurückgegriffen, auf deren Grundlage auch XML-Anfragesprachen effizient arbeiten können. Die vom W3C definierte Anfragesprache für XML nennt sich XQuery. BaseX unterstützt als eine von wenigen Implementierungen alle offiziellen Features und Erweiterungen dieser Sprache.

Als Teil der NoSQL-Bewegung stehen XMLDatenbanken heute vor einer neuen Renaissance: In vielen Anwendungsdomänen wird noch an relationalen Datenbanksystemen festgehalten und semi-strukturierte (XML) Daten in ein relationales Schema gepresst. Solche Lösungen stellen sich immer öfter als unflexibel heraus. BaseX setzt sich zum Ziel, diese Prozesse zu vereinheitlichen. Die Experten am Steinbeis-Transferzentrum bieten rund um BaseX professionelle Beratung, Individualprogrammierung, Systemintegration und Schulungen im XML-Umfeld.

Kontakt

Dr. Christian Grün
Steinbeis-Transferzentrum Processing, Querying and Visualization of Very Large Datasets (Konstanz)

Seite teilen