Tin mới nhất

Menu

Chia Sẻ Khóa Học Làm Chủ Big Data - Apache Spark - Hadoop - Sqoop - Hive - Flume - Mongo [Khóa 7206 A]

Khóa học chuyên sâu về Big Data - Apache Spark, Hadoop, Sqoop, Flume & Apache Hive, MongoDB & Big Data Cluster setup.

Bạn sẽ học được gì:

  • ✓ Hadoop distributed File system and command. Lifecycle of sqoop command. Lệnh import Sqoop để di chuyển dữ liệu từ MySQL sang HDFS. Lệnh Sqoop import để di chuyển dữ liệu từ MySQL sang Hive. Làm việc với nhiều định dạng file, nén, phân tách file, mệnh đề where và truy vấn trong khi nhập dữ liệu. Hiểu các truy vấn split-by và boundary. Sử dụng incremental mode để di chuyển dữ liệu từ MySQL sang HDFS. Sử dụng sqoop export, di chuyển dữ liệu từ HDFS sang MySQL. Sử dụng sqoop export, di chuyển dữ liệu từ Hive sang MySQL. Hiểu kiến ​​trúc Flume. Sử dụng flume, Nhập dữ liệu từ Twitter và lưu vào HDFS. Sử dụng flume, Nhập dữ liệu từ netcat và lưu vào HDFS. Sử dụng flume, Nhập dữ liệu từ exec và hiển thị trên console. Flume Interceptor.

Trong khóa học này, bạn sẽ bắt đầu bằng cách tìm hiểu hadoop distributed file system là gì và các lệnh hadoop phổ biến nhất cần có để hoạt động với Hadoop File system.

Sau đó, bạn sẽ được giới thiệu về Sqoop Import:

  • ✓ Hiểu vòng đời của sqoop command.
  • ✓ Sử dụng lệnh sqoop import để di chuyển dữ liệu từ Mysql sang HDFS.
  • ✓ Sử dụng lệnh sqoop import để di chuyển dữ liệu từ Mysql sang Hive.
  • ✓ Sử dụng các định dạng tệp khác nhau, nén, phân tách tệp, mệnh đề where và truy vấn trong khi import dữ liệu.
  • ✓ Hiểu các truy vấn split-by và boundary.
  • ✓ Sử dụng incremental mode để di chuyển dữ liệu từ Mysql sang HDFS.

Hơn nữa, bạn sẽ học Sqoop Export để di chuyển dữ liệu:

  • ✓ Sqoop export là gì.
  • ✓ Sử dụng sqoop export, di chuyển dữ liệu từ HDFS sang Mysql.
  • ✓ Sử dụng sqoop export sqoop, di chuyển dữ liệu từ Hive sang Mysql.

Hơn nữa, bạn sẽ tìm hiểu về Apache Flume:

  • ✓ Tìm hiểu Flume Architecture.
  • ✓ Sử dụng flume, Nhập dữ liệu từ Twitter và lưu vào HDFS.
  • ✓ Sử dụng flume, Nhập dữ liệu từ netcat và lưu vào HDFS.
  • ✓ Sử dụng flume, Nhập dữ liệu từ exec và hiển thị trên console.
  • ✓ Mô tả flume interceptors và xem các ví dụ về cách sử dụng interceptor.
  • ✓ Flume multiple agents.
  • ✓ Flume Consolidation.

Trong phần tiếp theo, chúng ta sẽ tìm hiểu về Apache Hive:

  • ✓ Giới thiệu Hive.
  • ✓ External & Managed Tables.
  • ✓ Làm việc với các File khác nhau - Parquet, Avro.
  • ✓ Compressions.
  • ✓ Hive Analysis.
  • ✓ Hive String Functions.
  • ✓ Hive Date Functions.
  • ✓ Partitioning.
  • ✓ Bucketing.

Bạn sẽ tìm hiểu về Apache Spark:

  • ✓ Giới thiệu Spark.
  • ✓ Tổng quan về Cluster.
  • ✓ RDD.
  • ✓ DAG/Stages/Tasks.
  • ✓ Actions & Transformations.
  • ✓ Ví dụ về Transformation & Action.
  • ✓ Spark Data frames.
  • ✓ Spark Data frames - làm việc với File Formats & Compression khác.
  • ✓ Dataframes API.
  • ✓ Spark SQL.
  • ✓ Ví dụ về Dataframe.
  • ✓ Spark với Cassandra Integration.
  • ✓ Chạy Spark trên Intellij IDE.
  • ✓ Chạy Spark trên EMR.

Mục lục:

  • ✓ 01 - Giới thiệu Big Data.
  • ✓ 02 - Environment Setup.
  • ✓ 03 - Hadoop & Yarn.
  • ✓ 04 - Sqoop Import.
  • ✓ 05 - Sqoop Export.
  • ✓ 06 - Apache Flume.
  • ✓ 07 - Apache Hive.
  • ✓ 08 - Spark với Yarn & HDFS.
  • ✓ 09 - GCS Cluster.
  • ✓ 10 - Spark Internals.
  • ✓ 11 - Spark RDD : Transformation & Actions.
  • ✓ 12 - Spark RDD Practice.
  • ✓ 13 - Spark Dataframes & Spark SQL.
  • ✓ 14 - Sử dụng Intellij IDE.
  • ✓ 15 - Chạy Spark trên EMR (AWS Cloud).
  • ✓ 16 - Spark với Cassandra.
  • ✓ 17 - Bắt đầu với MongoDB.
  • ✓ 18 - CRUD Operations.
  • ✓ 19 - Làm việc với Operators.
  • ✓ 20 - MongoDB Compass.
  • ✓ 21 - Mongo nâng cao.
  • ✓ 22 - Spark với Mongo.


Khóa học này dành cho ai:

  • Ai muốn tìm hiểu big data một cách chi tiết.


NHẬN GET EBOOK TRÊN AMAZON THEO YÊU CẦU 



Copyright Disclaimer:
This site does not store any files on its server. We only index and link to content provided by other sites. Please contact the content providers to delete copyright contents if any and email us, we'll remove relevant links or contents immediately.
Tuyên bố miễn trừ bản quyền:
Trang web này không lưu trữ bất kỳ tệp nào trên máy chủ của nó. Chúng tôi chỉ lập chỉ mục và liên kết đến nội dung được cung cấp bởi các trang web khác. Vui lòng liên hệ với các nhà cung cấp nội dung để xóa nội dung bản quyền nếu có và gửi email cho chúng tôi, chúng tôi sẽ xóa các liên kết hoặc nội dung có liên quan ngay lập tức.

Chia sẽ bài viết lên:

Nhà Sách Tin Học

Chào mừng các bạn đến với Blog Nhà Sách Tin Học. Thông qua Blog này mình muốn chia sẻ đến các bạn những kiến thức về tin học, các tài liệu hay giáo trình mà mình có hoặc siêu tầm được... Mình rất mong được sự ủng hộ nhiệt tình của các bạn bằng cách comment bài viết, chia sẻ bài viết hoặc liên hệ với mình qua blog này! Mình xin cảm ơn!

No Comment to " Chia Sẻ Khóa Học Làm Chủ Big Data - Apache Spark - Hadoop - Sqoop - Hive - Flume - Mongo [Khóa 7206 A] "

  • To add an Emoticons Show Icons
  • To add code Use [pre]code here[/pre]
  • To add an Image Use [img]IMAGE-URL-HERE[/img]
  • To add Youtube video just paste a video link like http://www.youtube.com/watch?v=0x_gnfpL3RM