Sections: Hintergrund | Ziel | Aufgabenstellung | Realisierung | Alternative Talend | Weblinks |

GeoKettle - Extending A Data Integration Tool With Geodata

Siehe auch:

Hintergrund ^

Die Integration von Daten in Unternehmen, Organisationen und der öffentlichen Verwaltung ist trotz Fortschritten in der IT immer noch ein aufwändiges Unterfangen. In machen Projekten kann der Zeit- oder Kostenanteil zur Beschaffung von Daten bis zu Hälfte des Budgets ausmachen. Dieses Problem trifft ganz sicher auf Geoinformationen zu, die typischerweise von verschiedenen Datenquellen stammen, namentlich von Geo-Informationssystemen (GIS). Dabei ist oft - aber nicht nur - das Ziel, ein Data Warehouse oder ein Datenmarkt aufzubauen. In diesem Zusammenhang haben sich die Lösungsschritte 'Extract, Transform, and Load' (ETL) bewährt.

Auf dem Markt gibt es teure Software-Suiten, die sich für diese Art der sog. 'Enterprise Information Integration' (EII) eignen. Mit KETTLE ('Kessel') wurde kürzlich eine umfangreiche Software in Open Source überführtund mit dem Zusatznamen "Pentaho Data Integration"-Projekt versehen. KETTLE ist ein Akronym für 'Kettle E.T.T.L. Environment'. ETTL ist eine Variante von ETL und steht für "Extraction, Transformation, Transportation and Loading Data". Damit ergibt sich eine gute Gelegenheit, diesen Lösungsansatz zu untersuchen.

Ziel ^

Die Ziele dieser Arbeit sind a) Erfahrungen mit einem solchen Werkzeug zu dokumentieren (insbes. Vergleich mit 'State-of-the-Art' kommerziell/Open Source sowie Schema-Mapping-Ansätze), b) KETTLE um GIS-Formate und Geo-Datenbanken-Zugriff zu erweitern sowie c) das Ganze mit einem durchgängigen Beispiel zu demonstrieren.

Aufgabenstellung ^

Realisierung ^

Implementations-Aspekte:

Alternative Talend ^

Weblinks:

Weblinks ^