Gemälde im Stil von Frida Kahlo von zwei Frauen auf einer Bank, mit Laptops in der Hand

Data Engineer vs. Data Scientist (Aufgaben, Gehalt & Einstellungschancen 2024)

10.10.2024data science

TLDR

Data Engineer vs Data Scientist – die Hauptunterschiede:

  • Aufgaben & Tools:
    • Data Engineers machen Daten auswertbar, indem sie die Dateninfrastruktur aufsetzen und die Daten aufbereiten (Toolkit: SQL, Python, Datenbanken, Cloud (AWS/Azure/GCP)
    • Data Scientists analysieren sie mit modernen statistische Methoden (Toolkit: Python (Pandas, Jupiter Notebook), Excel, SQL, Apache Superset/Tableau/Power BI, ML).
  • Gehalt: $ Data Scientist > $ Data Engineer
  • Karrieremöglichkeiten:
    • junior --> senior --> staff
    • Speziell in Big Tech: IC oder Management Track

Was macht ein:e Data Engineer?

Data Engineers sind für die Dateninfrastruktur eines Unternehmen verantwortlich, also für Systeme, die Daten ziehen, speichern und ordnen. Sie bauen Daten-Pipelines und managen Datenbanken, oft in der Cloud. Außerdem breiten sie Daten so auf, dass andere Data Expert:innen oder Reporting Tools sie auswerten können (Stichwort: Data Transformation). Die "Love Language" der Data Engineers ist SQL.

Was macht ein:e Data Scientist?

Data Scientists entwickeln datenbasierte Lösungen für komplexe Problemstellungen (z.B. Nachfrageprognosen oder personalisierte Empfehlung). Dabei wenden sie moderne statistische Methoden an, programmiert in Python. Um ihre Ergebnisse mit anderen zu teilen, erstellen Data Scientist Reports oder sie bauen interaktive Dashboards.

Kompetenzen: Data Scientist vs Data Engineer

Radar-Diagramm der Kompetenzen von Data Engineer und Data Scientist. (6 Dimensionen: statistics, software engineering, data transformation, data modeling, data visualization, domain knowledge). Der Schwerpunkt von Data Scientists liegt auf der Analyse von Daten und der Suche nach geeigneten Methoden und Modellen. Wichtige Bestandteile ihres Skill Sets sind deshalb statistische Theorie, aber auch Programmiersprachen. Data Engineers verbringen in der Regel mehr Zeit mit Programmieren als Data Scientists. Umgekehrt spielt statistische Methodik für sie keine so große Rolle wie für Data Scientists.

Data Engineer vs Data Scientist: Aufgaben & Toolkit

Data Engineers schreiben Python-Skripte, um Daten automatisiert in Datenbanken zu laden. Innerhalb der Datenbanken transformieren und aggregieren sie Daten per SQL, um sie so zu ordnen, dass alle Data Workers flexibel und effizient auf die Daten zugreifen können.

What's new? Während Data Engineers vor zehn Jahren noch auf unternehmenseigenen Servern gearbeitet haben, ist es heute üblich Cloud-Services in Anspruch zu nehmen. Dementsprechend macht sich Erfahrung mit Cloud-Umgebungen super im CV von Data Engineers.

Data Scientists importieren Excel-Dateien oder ganze Datenbanken mit SQL und führen dann mit Pandas und Jupiter Notebook (also Python Packages und Environments) komplexe statistische Auswertungen durch (von linearer Regression bis KNN-Klassifikation).

What's new? Ähnlich wie bei Data Engineers, sind auch die Anforderungen and Data Scientists gestiegen. Spätestens seit dem KI-Boom 2023 erwarten viele Unternehmen, dass Data Scientists nicht nur klassische Data Science Mehtoden beherrschen, sondern sich auch mit Machine Learning, am besten auch noch Deep Learning, auskennen.

Wer verdient mehr? Gehaltsvergleich Data Engineer vs Data Scientists

Als Data Scientist verdient man in Deutschland ca. 78.000 € brutto (im Median), als Data Engineer ca. 71.000 €. Für Junior Data Scientists und Junior Data Engineers liegt das Median-Gehalt bei ca. 61.000 €.

Welches Studium passt zu Data Engineer und Data Scientist Jobs?

Für Data Scientist eignen sich Studiengänge, die statistische Inhalte abdecken und/oder Programmierkenntnisse vermitteln. Gute Studienfächer für Data Scientist wären zum Beispiel: Data Science, Statistik oder Informatik, aber auch andere MINT-Fächer, Soziologie, Psychologie, VWL oder BWL.

Diese Fächer wären auch für Data Engineers kein schlechter Fit. Weil die Data Engineering aber sehr programmierlastig ist und keine komplexe Statistik anfällt, passen Informatik-Studiengänge am besten.

Wo arbeiten Data Engineers? Und wo Data Scientists?

Alle Tech-Firmen beschäftigen Data Engineers. Und Unternehmen, die es mit ihren Analytics-Vorhaben ernst meinen, auch (denn ohne solide Daten-Infrastruktur ist Datenanalyse nur in sehr begrenztem Rahmen möglich).

Vor allem Data Scientists werden eher in Unternehmen mit höherem Digitalisierungsgrad eingestellt. In Deutschland sind das meist Großunternehmen oder Start-ups (mittelständische Betriebe schließen langsam auf).

Einstellungschancen 2024: Data Scientist vs Data Engineer

Deutsche Unternehmen wollen (und müssen) data-driven werden. Ohne Data Scientists und Data Engineers wird das nicht gehen. Als Data Scientist oder Data Engineer hast du deshalb schon 2024 beste Einstellungschancen, und daran wird sich so schnell nichts ändern. Die Nachfrage nach Data Engineers wird gerade durch die zunehmende Nutzung der Cloud weiter anheizen.

Wie unterscheiden sich die Karrierewege von Data Engineers und Data Scientists?

In den meisten Unternehmen gibt es Senior- und Juniorpositionen für Data Engineers und Data Scientists. Welche Karrierechancen man darüberhinaus hat, ist unternehmensspezifisch: Hat das Unternehmen eine eigene Data-Abteilung oder arbeitet man als Datenspezialist:in z.B. in der Marketing-Abteilung? Wie groß ist das Unternehmen? Wie wichtig nimmt die Geschäftsleitung die Datenanalyse?

In großen Tech-Unternehmen können sowohl Data Engineers als auch Data Scientists entweder im Management Track oder im Individual Contributor Track (weniger Personalverantwortung, mehr technische Verantwortung) Karriere machen.

Kann man zwischen Data Engineer und Data Scientist Jobs wechseln?

Data Scientist rutschen manchmal in die Rolle von Data Engineers. Wenn Unternehmen Data Scientists anstellen, aber keine Data Engineers, übernehmen oft Data Scientists Aufgaben wie das Bauen und Managen von Datenbanken. Sie bilden sich praktisch on-the-job zum Data Engineer weiter. Auch der Wechsel in die andere Richtung ist möglich, wenn Data Engineers mehr Aufgaben im Bereich Datenauswertung übernehmen. Für diejenigen, die die Fähigkeiten von Data Scientists und Data Engineers in sich vereinen, gibt es übrigens seit eis, zwei Jahren eine eigene Berufsbezeichnung: das sind Analytics Engineers.

P.S. Die Grenze zwischen Data Engineer und Data Scientist ist fließend

Was genau man als Data Scientist oder Data Engineer macht, hängt vom Unternehmen ab. Die Unterscheidungen, die wir in diesem Post getroffen haben, treffen auf einen Großteil der Data Engineers und Data Scientists zu. Aber nicht jedes Unternehmen in Deutschland verwendet die Berufsbezeichnungen trennscharf. Wenn's im Unternehmen keine Data Engineers gibt, müssen halt die Data Scientists Pipelines bauen.