# Data Engineer
Sluit aan bij ons groeiende data platform team en neem volledige eigenaarschap van het ontwerpen, bouwen en schalen van de fundamentele data-infrastructuur die analytics, machine learning en zakelijke besluitvorming in het hele bedrijf ondersteunt.
## Belangrijkste verantwoordelijkheden
- Eigenaarschap van het ontwerp, ontwikkeling en oplevering van schaalbare data pipelines en platform-componenten gebouwd op Databricks en Airflow — van requirements tot productie — met duidelijke verantwoordelijkheid voor betrouwbaarheid, prestaties en onderhoudbaarheid.
- Voer prestatiemonitoring en optimalisatie van data workflows uit: identificeer proactief knelpunten, diagnosticeer oorzaken en implementeer verbeteringen zelfstandig.
- Leid design- en code reviews, en stel normen voor codekwaliteit, testbaarheid en engineering standards in het data engineering werk van het team.
- Neem onafhankelijke technische besluiten over pipeline-architectuur, datamodellering en tooling trade-offs, gegrond in schaalbaarheid, kostenefficiëntie en operationele eenvoud.
- Zorg voor operationele uitmuntendheid van batch- en near-real-time pipelines in productie: bouw en onderhoud monitoring, alerting en runbooks, en leid incident response en postmortems.
- Bouw en onderhoud uitgebreide documentatie voor pipelines, datamodellen en platform workflows die kennisdeling en onboarding van het team ondersteunen.
- Werk samen met analytics, data science en engineering teams om gebruik van platform-mogelijkheden te bevorderen, data governance standards af te dwingen en roadmap-verplichtingen na te komen.
- Mentor junior engineers door pairing, code review feedback en technische begeleiding — draag actief bij aan de groei van engineering vakmanschap in het team.
## Minimale vereisten
- 3+ jaar ervaring met Apache Airflow of een vergelijkbaar orchestration platform, inclusief het bouwen en onderhouden van DAGs voor production workloads, met sterke kennis van retries, scheduling, dependencies en sensor patterns.
- 3+ jaar ervaring in Python-ontwikkeling, schrijven van leesbare, testbare en onderhoudbare code in een data engineering context.
- 3+ jaar ervaring met Databricks of een vergelijkbaar gedistribueerd data platform, inclusief het ontwerpen en opleveren van ETL/ELT pipelines met Delta Lake of vergelijkbare technologieën, en onafhankelijk optimaliseren van compute- en query-prestaties.
- Aangetoonde mogelijkheid om end-to-end data systemen te ontwerpen en in eigenaarschap te nemen met focus op schaalbaarheid, betrouwbaarheid en operationele observeerbaarheid.
- Solide ervaring in cloud environments (AWS, Azure of GCP), inclusief cloud storage, IAM en managed services, met goed begrip van veilige data access patterns.
- Ervaring met infrastructure as code (Terraform bij voorkeur) en mogelijkheid om platform infrastructure deployments zelfstandig te beheren en uit te breiden.
- Vaardigheid in Git-gebaseerde workflows en CI/CD practices zoals toegepast in data en platform engineering.
- Sterke engineering judgment bij het navigeren van ambigue technische problemen.
## Gewenste kwalificaties
- Ervaring met het mentoren van junior engineers of het leiden van technische initiatieven in een data engineering team.
- Vertrouwdheid met data quality, observability of lineage tools (bijvoorbeeld Monte Carlo, Datafold).
- Ervaring met dbt en duidelijk begrip van hoe transformation layers passen in een modern data stack.
- Blootstelling aan data governance, privacy of compliance practices.
- Ervaring met ondersteuning van BI, analytics of data science teams in een platform of infrastructure capaciteit.