DP-3011 Implement a data lakehouse analytics solution with Azure Databricks

790  + ALV

Valitse päivämäärä ilmoittautumista varten

Koulutus tarjoaa käytännönläheisen näkymän siihen, miten Azure Databricksin ja Apache Sparkin avulla rakennetaan tehokkaita ja skaalautuvia data-analytiikkaratkaisuja Azure-ympäristössä. Sen aikana opitaan käsittelemään, jalostamaan ja analysoimaan suuria datamassoja niin, että ne muuttuvat raakadatan sijaan arvokkaaksi, päätöksentekoa tukevaksi tiedoksi. Kokonaisuus avaa modernin data-arkkitehtuurin parhaat käytännöt, kuten ETL-prosessit, Delta-taulut ja hallitut data-alustat, jotka muodostavat perustan nykyaikaiselle pilvipohjaiselle analytiikalle.

Tavoite

Tavoitteena on oppia käyttämään Azure Databricks -ympäristöä datan käsittelyyn ja analysointiin Spark-työkaluilla (Spark DataFrames, Spark SQL ja PySpark). Koulutuksessa perehdytään myös ETL-putkien rakentamiseen, datan laadun hallintaan, Delta Lake -ratkaisuihin sekä työkuormien orkestrointiin ja hallintaan osana tuotantovalmiita data-ympäristöjä.

Kenelle

Koulutus on suunnattu data-asiantuntijoille, data-analyytikoille ja data-engineereille, jotka työskentelevät suurten datamäärien käsittelyn ja analytiikan parissa Azure-ympäristössä. Koulutukseen osallistujalla on suositeltavaa olla perustason osaamista Pythonista ja SQL:stä sekä ymmärrystä datan käsittelyn peruskäsitteistä ja Azure-palveluista.

Koulutuksen sisältö

  • Explore Azure Databricks
  • Perform data analysis with Azure Databricks
  • Use Apache Spark in Azure Databricks
  • Manage data with Delta Lake
  • Build Lakeflow Declarative Pipelines
  • Deploy workloads with Lakeflow Jobs

Avainsanat

Applied Skills, Azure Databricks, Apache Spark, Delta Lake, Data Lakehouse, Data Pipeline, Analytiikka, Pilvipalvelut, Microsoft Azure, Data Engineering, Data Science​, Authorized Lab Hoster (AHL)

Paikka

Päivämäärä