Zurück zur Übersicht
Fortgeschritten
Data-Engineering für Data-Scientists
Data-Pipelines für Analytics und Machine Learning
Dieses Training vermittelt die Grundlagen professionellen Data Engineerings. Du lernst, wie stabile Data Pipelines entstehen und Daten zuverlässig für Analytics und Machine Learning bereitgestellt werden.
Dauer2 Tage
LevelFortgeschritten
FormatPräsenz & Online
Preis2.495 €
Lernziele
- •Professionelle Softwareentwicklung
- •CI/CD, Cloud-Native, GitOps
- •High-Performance Query Engines
- •Daten-Architektur
- •Technologieauswahl
- •Data-Management und Organisation
Module
Modul 1: Grundlagen und Data-Engineering
- ›Vorstellung und Diskussion moderner Data-Plattformen
- ›Requirements-Engineering
- ›Charakteristiken von Data-Projekten
Modul 2: Cloud-Native Software Engineering (deployment auch on-prem)
- ›Testgetriebene Softwareentwicklung
- ›Containerieiserung
- ›CI/CD
- ›Effiziente Datentransformationen mit Python und Rust
- ›Apache Arrow Datafusion
Modul 3: Echtzeit Datenverarbeitung
- ›Vorstellung der Anforderungen und Diskussion
- ›Entwufsmuster
- ›Ausfallsicherheit
Modul 4: Batch-Data Engineering
- ›Vorstellung der Anforderungen und Diskussion
- ›Batch Data-Engineering Softwarearchitektur
- ›Vorstellung und Hands-on Projekt Apache Airflow
Voraussetzungen
- •Grundlagen Softwareentwicklung
- •Grundlagen SQL