Tämä Applied Skills -koulutus tarjoaa syvällisen katsauksen siihen, miten Azure Databricks -alustalla voidaan rakentaa tehokkaita ja skaalautuvia Data Lakehouse -analytiikkaratkaisuja hyödyntäen Apache Sparkia ja Delta Lakea. Koulutuksessa perehdytään muun muassa tiedon analysointiin, tietoputkien rakentamiseen ja työkuormien hallintaan pilvessä.
Opi rakentamaan ratkaisuja, jotka eivät vain vastaa tämän päivän tarpeisiin – vaan myös luovat pohjan tulevaisuuden datainnovaatioille.
Tavoite
Koulutuksen tavoitteena on antaa osallistujille käytännön valmiudet suunnitella, toteuttaa ja hallita Data Lakehouse -ratkaisuja Azure Databricks -ympäristössä. Osallistujat oppivat hyödyntämään Apache Sparkia ja Delta Lakea suurten tietomäärien käsittelyssä ja analysoinnissa.
Kenelle
Koulutus on suunnattu data-asiantuntijoille, analyytikoille, insinööreille ja kehittäjille, jotka työskentelevät Data Lakehouse -ratkaisujen, analytiikan ja pilvipohjaisten data-alustojen parissa Azure Databricks -ympäristössä.
Koulutukseen osallistujilta ei edellytetä aiempaa kokemusta Azure Databricksistä tai Apache Sparkista.
Koulutuksen sisältö
Explore Azure Databricks
- Provision an Azure Databricks workspace
- Identify core workloads for Azure Databricks
- Use Data Governance tools Unity Catalog and Microsoft Purview
- Describe key concepts of an Azure Databricks solution
Perform data analysis with Azure Databricks
- Ingest data using Azure Databricks.
- Using the different data exploration tools in Azure Databricks.
- Analyze data with DataFrame APIs.
Use Apache Spark in Azure Databricks
- Describe key elements of the Apache Spark architecture.
- Create and configure a Spark cluster.
- Describe use cases for Spark.
- Use Spark to process and analyze data stored in files.
- Use Spark to visualize data.
Manage data with Delta Lake
- What Delta Lake is
- How to manage ACID transactions using Delta Lake
- How to use schema versioning and time travel in Delta Lake
- How to maintain data integrity with Delta Lake
Build data pipelines with Delta Live Tables
- Describe Delta Live Tables
- Ingest data into Delta Live Tables
- Use Data Pipelines for real time data processing
Deploy workloads with Azure Databricks Workflows
- What Azure Databricks Workflows are
- The key components and benefits of Azure Databricks Workflows
- How to deploy workloads using Azure Databricks Workflows
Avainsanat
Applied Skills, Azure Databricks, Apache Spark, Delta Lake, Data Lakehouse, Data Pipeline, Analytiikka, Pilvipalvelut, Microsoft Azure, Data Engineering, Data Science