Chia Sẻ Khóa Học Azure Databricks Và Spark SQL (Python) [Update Tháng 3-2023] [Khóa 7449 A]
Khóa học thực hành tập trung vào data engineering và analysis trên Azure Databricks sử dụng Spark SQL (DP203).
Bạn sẽ học được gì:
- ✓ Azure Databricks.
- ✓ Data Lakehouse.
- ✓ Delta Lakes.
- ✓ Spark SQL.
- ✓ PySpark.
- ✓ Big Data.
- ✓ Các kịch bản thế giới thực.
Databricks là một trong những công cụ big data được yêu cầu nhiều nhất. Đây là một big data analytics service dựa trên Spark nhanh, dễ dàng và mang tính cộng tác được thiết kế cho data science, ML và data engineering workflow.
Khóa học bao gồm các bài giảng, code cùng và các phần thử thách dành riêng. Điều này là quá đủ để giữ cho bạn tham gia và học tập! Như một phần thưởng bổ sung, bạn cũng sẽ có quyền truy cập trọn đời vào tất cả các bài giảng… và tôi đã cung cấp notebooks chi tiết dưới dạng một asset có thể tải xuống, notebooks sẽ chứa tài liệu từng bước với các tài nguyên và liên kết bổ sung.
Tôi đảm bảo rằng việc cung cấp khóa học hấp dẫn và ngắn gọn, chương trình giảng dạy được mở rộng nhưng được cung cấp một cách hiệu quả. Khóa học sẽ cung cấp cho bạn đào tạo thực hành bằng cách sử dụng nhiều bộ dữ liệu khác nhau.
Khóa học nhằm mục đích dạy cho bạn PySpark, Spark SQL trong Python và Databricks Lakehouse Architecture.
Bạn sẽ chủ yếu sử dụng Databricks trên Microsoft Azure ngoài các dịch vụ khác như Azure Data Lake Storage Gen 2.
Khóa học sẽ bao gồm nhiều lĩnh vực bao gồm:
- ✓ Thiết lập và Tổng quan.
- ✓ Azure Databricks Notebooks.
- ✓ Spark SQL.
- ✓ Đọc và ghi dữ liệu.
- ✓ Phân tích và chuyển đổi dữ liệu với Spark SQL trong Python.
- ✓ Charts và Dashboards trong Databricks Notebooks.
- ✓ Databricks Medallion Architecture.
- ✓ Truy cập dữ liệu trong Cloud Object Storage.
- ✓ Hive Metastore.
- ✓ Databases, Tables và Views trong Databricks.
- ✓ Delta Lake / Databricks Lakehouse Architecture.
Mục lục:
- ✓ 01 - Tổng quan về khóa học / Giới thiệu về Spark và Databricks.
- ✓ 02 - Thiết lập Azure và Databricks.
- ✓ 03 - Đọc và ghi dữ liệu.
- ✓ 04 - Phân tích và chuyển đổi dữ liệu với SparkSQL.
- ✓ 05 - Sử dụng Medallion Architecture trong Databricks.
- ✓ 06 - Phần Challenge: Customer Orders.
- ✓ 07 - Visualizations và Dashboards.
- ✓ 08 - Truy cập dữ liệu từ Azure Data Lake Storage (ADLS) với Databricks.
- ✓ 09 - Hive Metastore, Databases, Tables và Views.
- ✓ 10 - Phần Challenge: Employees.
- ✓ 11 - Databricks Data Lakehouse / Delta Lake.
- ✓ 12 - Modularize Code và Link Notebooks.
- ✓ 13 - Phần Challenge: Health Updates.
- ✓ 14 - Spark Structured Streaming và Auto Loader.
- ✓ 15 - Delta Live Tables.
Khóa học này dành cho ai:
- ✓ Bất cứ ai muốn làm việc với Big Data và Spark.
- ✓ Bất cứ ai muốn làm việc với Databricks.
- ✓ Bất kỳ ai quan tâm đến việc làm việc với các nền tảng đám mây.
NHẬN GET EBOOK TRÊN AMAZON THEO YÊU CẦU