Ga naar content
Zoek op onderwerpen, blogs, diensten etc.

Building a Data Lakehouse with Databricks

€ 999,- (excl. BTW) Nederlands 2 dagen Utrecht

Omschrijving

In de training "Building a Data Lakehouse with Databricks" gaan we twee dagen lang aan de slag met Databricks om een Data Lakehouse te bouwen. Het hele spectrum komt hierin voorbij: architectuur en ontwerp, inrichting van Databricks, Implementatie van transformaties, orchestratie van je taken, versiebeheer en alles wat er meer nodig is voor je Data Lakehouse. Aan het eind van de training ben je in staat om zelfstandig een Data Lakehouse op te zetten binnen Databricks.

Voor wie is de training Building a Data Lakehouse with Databricks?

Deze training is primair gericht op Data Engineers en Data Warehouse-ontwikkelaars of -beheerders die ervaring hebben met Data Warehousing of andere vormen van (batch) data processing. Deelnemers weten dat zij zich meer willen verdiepen in Databricks en het bouwen van een Data Lakehouse. De meeste deelnemers hebben al wel enige ervaring met cloudomgevingen, maar het is niet verplicht: ook wanneer je bijvoorbeeld van een on-premises Data Warehouse de stap aan het maken bent naar een Data Lakehouse sluit deze training goed aan.

Doelstellingen

Na afloop van deze training:

  • Weet je hoe de architectuur van een Data Lakehouse eruit ziet en werkt
  • Snap je de principes van Databricks, Data Lakehouses en Delta Lake
  • Kun je Databricks zelfstandig inrichten t.b.v. een Data Lakehouse
  • Begrijp je hoe Delta Lake Storage werkt en hoe het een Data Lakehouse mogelijk maakt
  • Kun je bestanden in je Data Lake beheren met behulp van Databricks
  • Kun je orchestratie binnen Databricks doen met behulp van jobs
  • Weet je welke lagen er in een Data Lakehouse bestaan en hoe je data uit jouw praktijk hier kunt laten landen
  • Kun je transformatie en integratie op de data doen in Databricks met behulp van PySpark en SparkSQL
  • Weet je hoe om te gaan met schema's en schema evolutie

Voorkennis om de training Azure DevOps voor Data Engineers te volgen

Binnen Databricks is Python een belangrijke taal. Als minimum moet je om kunnen gaan met modules (libraries), data kunnen inlezen en eenvoudige bewerkingen op de data uit kunnen voeren. Een goede voorbereiding kan dan de training "Python voor data-analyse" zijn. Ook is het belangrijk dat je de fundamentals van Azure op datagebied scherp hebt. En moet je de principes van Data Warehousing goed snappen. Ten slotte is het handig om iets over Git te weten, zodat je ook het versiebeheer leert inrichten. De training "Git voor Data Engineers" is daar een nuttige start voor.

Python Fundamentals voor Data Engineers
Building a Data Lakehouse with Databricks
Azure Data Fundamentals (DP-900)
Building a Data Lakehouse with Databricks

Onderwerpen

  • Data Lakes en Data Warehouses
  • Data Lakehouse architecuur
  • Delta Lake opslag
  • Databricks inrichten voor een Data Lakehouse
  • Dbfs: het DataBricks File System
  • Beheren van je Data Lake vanuit Databricks
  • Data transformeren in een Data Lakehouse met behulp van PySpark
  • Databricks tables: managed en unmanaged
  • Hive Metastore
  • Versiebeheer in Databricks
  • Time travel
  • Schema enforcement
  • Schema evolution

Studiemateriaal

In de training "Building a Data Lakehouse with Databricks"" gebruiken we materiaal dat we bij Wortell Smart Learning zelf ontwikkeld hebben. Wij zorgen ervoor dat je al het benodigde materiaal op tijd ontvangt.

Beschikbare datums

Begint op
Eindigt op
Locatie
Prijs (excl. BTW)
Prijs (incl. BTW)
Inschrijven
Acties
Begint op:
Eindigt op:
Locatie: Utrecht
Prijs (excl. BTW): € 999,-
Prijs (incl. BTW): € 1.208,79