Kakadu Labs
Schreib uns!
Zurück zur Übersicht
Fortgeschritten

Data-Engineering für Data-Scientists

Data-Pipelines für Analytics und Machine Learning

Dieses Training vermittelt die Grundlagen professionellen Data Engineerings. Du lernst, wie stabile Data Pipelines entstehen und Daten zuverlässig für Analytics und Machine Learning bereitgestellt werden.

Dauer2 Tage
LevelFortgeschritten
FormatPräsenz & Online
Preis2.495 €

Lernziele

  • Professionelle Softwareentwicklung
  • CI/CD, Cloud-Native, GitOps
  • High-Performance Query Engines
  • Daten-Architektur
  • Technologieauswahl
  • Data-Management und Organisation

Module

Modul 1: Grundlagen und Data-Engineering

  • Vorstellung und Diskussion moderner Data-Plattformen
  • Requirements-Engineering
  • Charakteristiken von Data-Projekten

Modul 2: Cloud-Native Software Engineering (deployment auch on-prem)

  • Testgetriebene Softwareentwicklung
  • Containerieiserung
  • CI/CD
  • Effiziente Datentransformationen mit Python und Rust
  • Apache Arrow Datafusion

Modul 3: Echtzeit Datenverarbeitung

  • Vorstellung der Anforderungen und Diskussion
  • Entwufsmuster
  • Ausfallsicherheit

Modul 4: Batch-Data Engineering

  • Vorstellung der Anforderungen und Diskussion
  • Batch Data-Engineering Softwarearchitektur
  • Vorstellung und Hands-on Projekt Apache Airflow

Voraussetzungen

  • Grundlagen Softwareentwicklung
  • Grundlagen SQL