Koulutus tarjoaa käytännönläheisen näkymän siihen, miten Azure Databricksin ja Apache Sparkin avulla rakennetaan tehokkaita ja skaalautuvia data-analytiikkaratkaisuja Azure-ympäristössä. Sen aikana opitaan käsittelemään, jalostamaan ja analysoimaan suuria datamassoja niin, että ne muuttuvat raakadatan sijaan arvokkaaksi, päätöksentekoa tukevaksi tiedoksi. Kokonaisuus avaa modernin data-arkkitehtuurin parhaat käytännöt, kuten ETL-prosessit, Delta-taulut ja hallitut data-alustat, jotka muodostavat perustan nykyaikaiselle pilvipohjaiselle analytiikalle.
Tavoite
Tavoitteena on oppia käyttämään Azure Databricks -ympäristöä datan käsittelyyn ja analysointiin Spark-työkaluilla (Spark DataFrames, Spark SQL ja PySpark). Koulutuksessa perehdytään myös ETL-putkien rakentamiseen, datan laadun hallintaan, Delta Lake -ratkaisuihin sekä työkuormien orkestrointiin ja hallintaan osana tuotantovalmiita data-ympäristöjä.
Kenelle
Koulutus on suunnattu data-asiantuntijoille, data-analyytikoille ja data-engineereille, jotka työskentelevät suurten datamäärien käsittelyn ja analytiikan parissa Azure-ympäristössä. Koulutukseen osallistujalla on suositeltavaa olla perustason osaamista Pythonista ja SQL:stä sekä ymmärrystä datan käsittelyn peruskäsitteistä ja Azure-palveluista.
Koulutuksen sisältö
- Explore Azure Databricks
- Perform data analysis with Azure Databricks
- Use Apache Spark in Azure Databricks
- Manage data with Delta Lake
- Build Lakeflow Declarative Pipelines
- Deploy workloads with Lakeflow Jobs
Avainsanat
Applied Skills, Azure Databricks, Apache Spark, Delta Lake, Data Lakehouse, Data Pipeline, Analytiikka, Pilvipalvelut, Microsoft Azure, Data Engineering, Data Science, Authorized Lab Hoster (AHL)


English