Chia Sẻ Khóa Học Làm Chủ Big Data Realtime Streaming [Khóa 6486 A]
Tìm hiểu các khái niệm cốt lõi của Big data Realtime Streaming Analytics cũng như làm việc với các ví dụ thực hành.
Những gì bạn sẽ học được:
- ✓ Tìm hiểu cách thiết kế một Real-time Streaming pipeline từ đầu đến cuối cho Big Data bằng các công nghệ mới nhất.
- ✓ Hiểu các component khác nhau trong Big Data streaming pipeline.
- ✓ Sử dụng Kafka làm công cụ kết nối giữa các ETL component trong real-time streaming pipeline.
- ✓ Sử dụng Apache Flink, Spark Streaming và Kafka Streams để thực hiện nhiều transformation và aggregation khác nhau.
- ✓ Sử dụng Druid và Pinot làm các công nghệ OLAP trong streaming pipeline.
- ✓ Sử dụng Superset để trực quan hóa real-time incoming data stream nhằm khám phá và trực quan hóa transformed data.
- ✓ Thực hành thực tế giúp bạn xây dựng tất cả các component và hình thành một pipeline hoàn chỉnh từ đầu đến cuối.
- ✓ Tìm hiểu nhiều công nghệ được sử dụng trong các Real-time Streaming pipeline và bạn có thể sử dụng công nghệ phù hợp nhất với trường hợp sử dụng của mình.
Việc có được các insight theo thời gian thực từ khối lượng dữ liệu khổng lồ là rất quan trọng đối với phần lớn các công ty hiện nay.
Big data Real-time streaming được sử dụng bởi một số công ty lớn nhất thế giới như các công ty thương mại điện tử, các công ty Video streaming, ngân hàng, các công ty về Ride-hailing, v.v.
Việc hiểu biết về các khái niệm realtime streaming và các công nghệ realtime streaming khác nhau sẽ là sự bổ sung tuyệt vời cho bộ kỹ năng của bạn và cho phép bạn xây dựng một số giải pháp tiên tiến nhất hiện nay.
Chúng tôi đã tạo ra Khóa học thực hành này để bạn hiểu rõ hơn về cách xây dựng các hệ thống realtime streaming.
Khóa học này sẽ đảm bảo rằng bạn có được kinh nghiệm thực tế với Apache Kafka, Apache Flink, Spark Streaming, Kafka Streams, Apache Pinot, Apache Druid và Apache Superset.
Khóa học này bao gồm các chủ đề sau:
- ✓ Giới thiệu về Kafka với thiết lập Kafka thực hành.
- ✓ Hiểu các transformation và aggregation cơ bản có thể được thực hiện trong một real time system.
- ✓ Tìm hiểu cách thực hiện transformation và aggregation bằng Apache Flink với các bài tập coding thực hành.
- ✓ Tìm hiểu cách thực hiện transformation và aggregation bằng cách sử dụng Spark streaming với các bài tập coding thực hành.
- ✓ Tìm hiểu cách Kafka streams có thể được sử dụng để thực hiện transformation và aggregation với các bài tập coding thực hành.
- ✓ Ingest data vào Apache Pinot, một công nghệ OLAP.
- ✓ Ingest data vào Apache Druid, đây cũng là công nghệ OLAP.
- ✓ Sử dụng Apache Superset để tạo một số dashboard chi tiết.
- ✓ Nếu bạn muốn tìm hiểu cách kết nối tất cả các công nghệ này với nhau để xây dựng một hệ thống real-time streaming toàn diện thì khóa học này là dành cho bạn.
Mục lục:
- ✓ 01. Giới thiệu.
- ✓ 02. Ingesting data vào Kafka.
- ✓ 03. Real Time Data Processing.
- ✓ 04. Processing events sử dụng Flink.
- ✓ 05. Processing events sử dụng Spark Streaming.
- ✓ 06. Processing events sử dụng Kafka Streams.
- ✓ 07. Putting data vào Apache Pinot.
- ✓ 08. Putting data vào Apache Druid.
- ✓ 09. Dashboarding.
Khóa học này dành cho ai:
- ✓ Sinh viên muốn tìm hiểu cách xây dựng các real-time streaming pipeline từ đầu cho đến Triển khai Live Project.
- ✓ Sinh viên muốn tìm hiểu những công nghệ mới nhất được sử dụng trong Big Data Engineering.
- ✓ Các nhà phát triển muốn tìm hiểu các công cụ nổi tiếng khác nhau để xây dựng các streaming pipeline.
- ✓ Sinh viên muốn theo đuổi và phát triển sự nghiệp trong lĩnh vực Data Engineering.