ETL-Prozesse sind ein wesentlicher Bestandteil bei der Datenintegration und -verarbeitung. Sie spielen z.B. eine wichtige Rolle bei der Erstellung und dem Betrieb von Data Warehouses. Zudem sollen sie die Qualität und Zuverlässigkeit von Daten sicherstellen. Die Prozessschritte sind:
Extraktion (Extract): Sammeln von Daten aus untersch. Quellen wie Datenbanken, Dateien oder anderen IT-Systemen. Definition von Verbindungsarten und Übertragungsarten sowie der zeitlichen Abläufe, in denen Daten aktualisiert werden.
Transformation (Transform): Umwandlung und Bereinigung der extrahierten Daten in ein einheitliches Format. Dieses soll sich für die Analyse oder Weiterverwendung eignen. Fehlerhafte oder unvollständige Daten werden korrigiert, Datentypen angepasst und redundante Daten entfernt.
Laden (Load): Integration der transformierten Daten in ein Zielsystem (z.B. ein Data Warehouse) oder eine zentrale Datenbank.