Tämä Applied Skills -koulutus tarjoaa syvällisen katsauksen siihen, miten Azure Databricks -alustalla voidaan toteuttaa koneoppimisratkaisuja suurella skaalalla. Koulutuksessa opitaan muun muassa tiedon esikäsittelyä, mallien kouluttamista, hyperparametrien optimointia ja syväoppimismallien rakentamista käyttäen Apache Sparkia, MLflow’ta ja AutoML:ää.
Vie koneoppimisen osaamisesi uudelle tasolle – opi taitoja, joita tarvitaan nyt ja tulevaisuudessa datan ja teknologian maailmassa.
Tavoite
Koulutuksen tavoitteena on antaa osallistujille käytännön valmiudet suunnitella, toteuttaa ja hallita koneoppimisratkaisuja Azure Databricks -ympäristössä. Osallistujat oppivat hyödyntämään MLflow’ta mallien hallintaan, AutoML:ää mallien automatisointiin ja Hyperoptia hyperparametrien optimointiin. Lisäksi koulutuksessa käsitellään syväoppimismallien rakentamista ja kouluttamista.
Kenelle
Koulutus on suunnattu erityisesti data scientist -asiantuntijoille, koneoppimisen insinööreille ja ohjelmistokehittäjille, jotka haluavat syventää osaamistaan koneoppimisratkaisujen toteuttamisessa Azure Databricks -ympäristössä.
Koulutukseen osallistujalla on suositeltavaa olla kokemusta Python -ohjelmoinnista sekä tuntemusta yleisistä avoimen lähdekoodin koneoppimiskehyksistä, kuten Scikit-Learn, PyTorch ja TensorFlow. Aiempi kokemus Azure Databricksistä on myös hyödyksi.
Koulutuksen sisältö
Explore Azure Databricks
- Provision an Azure Databricks workspace.
- Identify core workloads and personas for Azure Databricks.
- Use Data Governance tools Unity Catalog and Microsoft Purview
- Describe key concepts of an Azure Databricks solution
Use Apache Spark in Azure Databricks
- Describe key elements of the Apache Spark architecture
- Create and configure a Spark cluster
- Describe use cases for Spark.
- Use Spark to process and analyze data stored in files.
- Use Spark to visualize data.
Train a machine learning model in Azure Databricks
- Prepare data for machine learning
- Train a machine learning model
- Evaluate a machine learning model
Use MLflow in Azure Databricks
- Use MLflow to log parameters, metrics, and other details from experiment runs
- Use MLflow to manage and deploy trained models
Tune hyperparameters in Azure Databricks
- Use the Hyperopt library to optimize hyperparameters
- Distribute hyperparameter tuning across multiple worker nodes
Use AutoML in Azure Databricks
- Use the AutoML user interface in Azure Databricks
- Use the AutoML API in Azure Databricks
Train deep learning models in Azure Databricks
- Train a deep learning model in Azure Databricks
- Distribute deep learning training by using the Horovod library
Manage machine learning in production with Azure Databricks
- Automate feature engineering and data pipelines
- Model development and training
- Model deployment strategies
- Model versioning and lifecycle management
Avainsanat
Applied Skills, Azure Databricks, Koneoppiminen, MLflow, AutoML, Hyperopt, Apache Spark, Python, Scikit-Learn, PyTorch, TensorFlow, Datatiede, Tekoäly, Microsoft Azure