Treten Sie der Warteliste bei und erhalten Sie Sublim Business 3 Monate kostenlos  Angebot sichern

Daten & Technologie

ETL: Definition, Funktionsweise und Rolle in der Daten-Analytics

Guillaume Sallé
Guillaume Sallé
Leiter Analytics-Content & Glossar

Aktualisiert am February 22, 2026

Kurzdefinition

Das ETL (Extract, Transform, Load) ist ein Datenintegrationsprozess, bei dem Daten aus heterogenen Quellen extrahiert, transformiert (normalisiert und angereichert nach einem Zielschema) und schliesslich in ein Zielsystem wie ein Data Warehouse für die Analyse und das Reporting geladen werden. Das ETL ist die Pipeline, die die Analytics-Dashboards einer Organisation mit konsolidierten und zuverlässigen Daten versorgt.

Wie es funktioniert

Das ETL besteht aus drei voneinander abhängigen Phasen. Das Extract (Extraktion) besteht darin, Rohdaten aus verschiedenen Quellen abzurufen: relationale Datenbanken (MySQL, PostgreSQL), REST-APIs, CSV/Excel-Dateien, SaaS-Tools (CRM Salesforce, Analytics Google oder Sublim, ERP), Streaming-Flüsse (Kafka). Diese Phase verwaltet die Verbindung zu den Quellen, die Authentifizierung und das Abrufen der Daten in einer definierten Frequenz (stündlicher, täglicher Batch oder Echtzeit-Streaming). Das Transform (Transformation) ist die komplexeste Phase: Sie wandelt Rohdaten in nutzbare Daten um. Sie umfasst die Bereinigung (Entfernen von Duplikaten, Behandlung von Null-Werten), die Normalisierung (Standardisierung von Datumsformaten, Währung, Ländercode), die Anreicherung (Hinzufügen berechneter Dimensionen wie Quartal, Kundensegment, Akquisitionskanal), die Deduplizierung und die Identitätsabgleichung (Zusammenführen eines CRM-Datensatzes mit einem Analytics-Ereignis für denselben Nutzer). Das Load (Laden) fügt die transformierten Daten in das Zielsystem ein: Data Warehouse (BigQuery, Snowflake, Redshift), Data Lakehouse (Databricks, Delta Lake) oder analytische Datenbank (ClickHouse für Echtzeit-Metriken). Moderne ETL-Tools umfassen dbt (SQL-Transformation), Fivetran und Airbyte (schlüsselfertige ELT-Konnektoren), Apache Airflow (Orchestrierung), Talend und Informatica (Enterprise-ETL). Man unterscheidet ETL (Transformation vor dem Laden) und ELT (zuerst Laden, dann Transformation im Warehouse), wobei letzteres mit modernen Cloud-Data-Warehouses bevorzugt wird.

Warum es wichtig ist

Das ETL ist die unsichtbare Grundlage, die jegliches konsolidierte Analytics-Reporting in einer Organisation ermöglicht. Ohne zuverlässige ETL-Pipeline bleiben Daten in unterschiedlichen Silos fragmentiert, was jegliche Cross-Channel- oder Cross-System-Analyse unmöglich macht. Für ein SaaS ermöglicht ein gut konzipiertes ETL die Konsolidierung von Webanalytics-, Produktereignis-, CRM- und Finanztransaktionsdaten in einem einzigen Data Warehouse, der Wahrheitsquelle für alle Entscheidungs-Dashboards.

Wie verbessern oder nutzen

Um Ihre ETL-Pipelines zu verbessern, dokumentieren Sie zunächst alle Ihre Datenquellen und deren Schemas. Übernehmen Sie konsistente Namenskonventionen und ein gemeinsames Datenglossar. Implementieren Sie Datenqualitätsprüfungen (Data Quality Checks) in jeder Phase: Zeilenzählung, Wertvalidierung, Anomalieerkennung. Verwenden Sie ein Orchestrierungstool wie Airflow, um Runs zu überwachen und bei Fehlern zu alerten. Bevorzugen Sie den ELT-Ansatz mit dbt für versionierte und testbare SQL-Transformationen.

Mit Sublim

Sublim bietet eine REST-API, mit der Sie Ihre Analytics-Daten über automatisierte ETL/ELT-Prozesse in Ihr Data Warehouse extrahieren können. Sie können Sitzungsmetriken, benutzerdefinierte Ereignisse und Conversion-Daten in der gewünschten Granularität (stündlich, täglich) abrufen, um sie in BigQuery, Snowflake oder ClickHouse zu integrieren und mit Ihren CRM- und Finanzdaten für fortgeschrittene Kohorten- und LTV-Analysen zu kombinieren.

Häufig gestellte Fragen

Was ist der Unterschied zwischen ETL und ELT?

Bei ETL werden die Daten vor dem Laden ins Warehouse transformiert (Transformation in einer dedizierten Engine). Bei ELT werden die Rohdaten zunächst ins Warehouse geladen und anschliessend mit SQL direkt im Warehouse transformiert (dank seiner Rechenleistung). ELT wird mit modernen Cloud-Warehouses (BigQuery, Snowflake) bevorzugt, da es flexibler und skalierbarer ist.

Sind Fivetran und Airbyte ETL- oder ELT-Tools?

Fivetran und Airbyte sind EL-Tools (Extract and Load): Sie extrahieren Daten aus den Quellen und laden sie roh in Ihr Warehouse, ohne fachliche Transformation. Die Transformation erfolgt anschliessend im Warehouse, oft mit dbt. Sie werden manchmal als ELT-Tools bezeichnet. Sie bieten Hunderte von einsatzbereiten Konnektoren, die das Datenladen aus SaaS-Tools vereinfachen.

Wie häufig sollte eine Analytics-ETL-Pipeline ausgeführt werden?

Die Frequenz hängt von Ihrem Bedarf an Datenfrische ab. Für tägliche Steuerungs-Dashboards reicht eine nächtliche Extraktion. Für operative Alerts oder Echtzeit-Dashboards ist eine stündliche Extraktion oder Streaming notwendig. Für Finanzdaten zum Monatsabschluss kann eine monatliche Extraktion ausreichen. Passen Sie die Frequenz an die Verarbeitungskosten und den tatsächlichen geschäftlichen Bedarf an.

Verwandte Begriffe

ETL: Definition, Funktionsweise und Rolle in der Daten-Analytics, Sublim | Sublim Analytics