Tin mới nhất

Menu

Browsing "Older Posts"

Chia Sẻ Khóa Học Data Mining - Unsupervised Learning [Khóa 7168 A]

05 tháng 8 2023 / No Comments

Data Mining - Unsupervised Learning.

Bạn sẽ học được gì:

  • ✓ Trong Clustering hoặc Segmentation, chúng tôi giảm số lượng rows. Chúng tôi có Hierarchical Clustering, Non-Hierarchical, Density-Based Clustering, Grid-based Clustering.
  • ✓ Trong Dimension Reduction, chúng tôi giảm số lượng columns. Các Linear Pattern được xử lý bằng Linear Discriminant Analysis, Non-negative Matrix Factorization.
  • ✓ Có Collaborative Filtering trong Recommendation System. Traditional Collaborative Filtering, Search-based Method, và Item-Item Collaborative Filtering.
  • ✓ Trong Unsupervised Learning có 6 bộ phận bao gồm Clustering, Dimension Reduction, Association Rules, Recommendation Syst.

Khóa học Data Mining - Unsupervised Learning được thiết kế để cung cấp cho sinh viên sự hiểu biết toàn diện về các kỹ thuật unsupervised learning trong lĩnh vực data mining. Unsupervised learning là một loại machine learning trong đó các thuật toán được áp dụng cho dữ liệu chưa được gắn nhãn để khám phá các pattern, structure, và relationship mà không cần kiến ​​thức hoặc hướng dẫn trước.

Trong suốt khóa học, sinh viên sẽ khám phá nhiều thuật toán unsupervised learning khác nhau và các ứng dụng của chúng trong việc khám phá những hiểu biết ẩn giấu từ các tập dữ liệu lớn. Trọng tâm sẽ là hiểu các nguyên tắc, phương pháp và triển khai thực tế của các thuật toán này hơn là tập trung vào các dẫn xuất toán học.

Khóa học sẽ bắt đầu với phần giới thiệu về unsupervised learning, bao gồm các khái niệm và mục tiêu cơ bản. Học viên sẽ học cách unsupervised learning khác với supervised learning và semi-supervised learning, cũng như những ưu điểm và hạn chế của các kỹ thuật không giám sát. Tầm quan trọng của pre-processing và data preparation cũng sẽ được thảo luận để đảm bảo chất lượng kết quả.

Chủ đề chính đầu tiên của khóa học sẽ là các kỹ thuật clustering. Bạn sẽ đi sâu vào các thuật toán clustering khác nhau như hierarchical clustering, k-means clustering, density-based clustering (ví dụ: DBSCAN) và expectation-maximization (EM) clustering. Họ sẽ học cách áp dụng các thuật toán này để nhóm các điểm dữ liệu tương tự lại với nhau và xác định các pattern và cấu trúc cơ bản. Những thách thức và cân nhắc trong việc lựa chọn các phương pháp clustering thích hợp cho các kịch bản khác nhau sẽ được khám phá.

Sau đó, khóa học sẽ chuyển sang dimensionality reduction, nhằm mục đích giảm số lượng tính năng hoặc biến trong tập dữ liệu trong khi vẫn giữ lại thông tin liên quan. Bạn sẽ khám phá các kỹ thuật như principal component analysis (PCA), singular value decomposition (SVD) và t-distributed stochastic neighbour embedding (t-SNE). Họ sẽ hiểu cách sử dụng các phương pháp này để trực quan hóa dữ liệu nhiều chiều và trích xuất các diển tả có ý nghĩa để tạo điều kiện thuận lợi cho việc phân tích và diễn giải.

Association rule mining sẽ là một chủ đề quan trọng khác được đề cập trong khóa học. Bạn sẽ tìm hiểu về thuật toán Apriori phổ biến và thuật toán FP-growth, được sử dụng để khám phá các mối quan hệ và liên kết thú vị giữa các item trong transactional datasets. Họ sẽ hiểu rõ hơn về việc đánh giá và giải thích các association rule, bao gồm support, confidence, và lift measures cũng như các ứng dụng thực tế của chúng trong các recommendation system và market basket analysis.

Khóa học cũng sẽ đề cập đến outlier detection, một nhiệm vụ quan trọng trong unsupervised learning. Bạn sẽ khám phá các phương pháp thống kê như z-score và modified z-score, cũng như các phương pháp tiếp cận distance-based như Local Outlier Factor và Isolation Forest. Họ sẽ hiểu cách xác định điểm bất thường trong dữ liệu, điều này có thể cung cấp insight có giá trị về khả năng phát hiện gian lận tiềm ẩn, phát hiện xâm nhập mạng hoặc dự đoán lỗi hệ thống.

Evaluation và validation các mô hình unsupervised learning sẽ là một khía cạnh thiết yếu của khóa học. Bạn sẽ tìm hiểu về các biện pháp đánh giá bên trong và bên ngoài, bao gồm silhouette coefficient, purity, và Rand index. Họ sẽ đạt được các kỹ năng trong việc đánh giá chất lượng của kết quả clustering và đo lường hiệu suất của các kỹ thuật dimensionality reduction.

Trong suốt khóa học, sinh viên sẽ được tiếp xúc với nhiều ứng dụng thực tế khác nhau của unsupervised learning. Họ sẽ khám phá cách có thể đạt được phân khúc thị trường thông qua clustering, cho phép các doanh nghiệp nhắm mục tiêu các phân khúc khách hàng cụ thể một cách hiệu quả. Họ cũng sẽ khám phá image và text clustering, có ứng dụng trong nhận dạng hình ảnh, tổ chức tài liệu và hệ thống gợi ý. Khóa học sẽ nêu bật khả năng phát hiện bất thường, đóng vai trò quan trọng trong việc xác định các giao dịch gian lận, xâm nhập mạng hoặc lỗi sản xuất. Cuối cùng, sinh viên sẽ tìm hiểu cách unsupervised learning hỗ trợ các hệ thống gợi ý, cung cấp các gợi ý được cá nhân hóa dựa trên hành vi và sở thích của người dùng.

Kinh nghiệm thực hành sẽ là một phần quan trọng của khóa học. Bạn sẽ làm các bài tập và dự án thực tế, áp dụng các thuật toán unsupervised learning cho các bộ dữ liệu trong thế giới thực bằng cách sử dụng các công cụ data mining và thư viện lập trình phổ biến như scikit-learning của Python hoặc caret package của R. Họ sẽ thành thạo trong pre-processing data, lựa chọn các thuật toán thích hợp, tinh chỉnh các tham số, diễn giải và trực quan hóa các kết quả.

Khi kết thúc khóa học, sinh viên sẽ có hiểu biết vững chắc về các kỹ thuật unsupervised learning, các ứng dụng thực tế của chúng và khả năng tận dụng các phương pháp này để khám phá những insight và pattern có giá trị từ unlabelled data.

Mục lục:

  • ✓ 01 - Giới thiệu.
  • ✓ 02 - Giới thiệu về Analytics.
  • ✓ 03 - Business Understanding Phase.
  • ✓ 04 - Data Understanding Phase - Data Types.
  • ✓ 05 - Data Understanding Phase - Data Collection.
  • ✓ 06 - Understanding Basic Statistics
  • ✓ 07 - Data Preparation Phase - Exploratory Data Analysis (EDA).
  • ✓ 08 - Cài đặt và Thiết lập Python.
  • ✓ 09 - Data Preparation Phase | Data Cleansing - Type Casting.
  • ✓ 10 - Data Preparation Phase | Data Cleansing - Handling Duplicates.
  • ✓ 11 - Data Preparation Phase | Data Cleansing-Outlier Analysis Treatment.
  • ✓ 12 - Data Mining - Clustering / Segmentation sử dụng Python.
  • ✓ 13 - Các Kỹ thuật Dimension Reduction.
  • ✓ 14 - Network Analytics.

Khóa học này dành cho ai:

  • ✓ Các chuyên gia CNTT, bao gồm các software developer và database administrator, có thể đạt được các kỹ năng có giá trị bằng cách tham gia khóa học Data Mining.
  • ✓ Các Researcher muốn khám phá và phân tích các tập dữ liệu lớn, khám phá các pattern và generate insights có thể hưởng lợi từ khóa học Data Mining để tìm hiểu các phương pháp và kỹ thuật phù hợp.
  • ✓ Các chuyên gia muốn nâng cao kỹ năng ata analysis, pattern recognition và lập mô hình dự đoán có thể đăng ký khóa học Data Mining để tìm hiểu các kỹ thuật mới và luôn cập nhật các xu hướng của ngành.
  • ✓ Sinh viên theo đuổi bằng cấp trong các lĩnh vực này có thể hưởng lợi từ khóa học Data Mining để phát triển các kỹ năng và kiến ​​thức liên quan đến phân tích và trích xuất insights từ các bộ dữ liệu lớn.


NHẬN GET EBOOK TRÊN AMAZON THEO YÊU CẦU




Copyright Disclaimer:
This site does not store any files on its server. We only index and link to content provided by other sites. Please contact the content providers to delete copyright contents if any and email us, we'll remove relevant links or contents immediately.
Tuyên bố miễn trừ bản quyền:
Trang web này không lưu trữ bất kỳ tệp nào trên máy chủ của nó. Chúng tôi chỉ lập chỉ mục và liên kết đến nội dung được cung cấp bởi các trang web khác. Vui lòng liên hệ với các nhà cung cấp nội dung để xóa nội dung bản quyền nếu có và gửi email cho chúng tôi, chúng tôi sẽ xóa các liên kết hoặc nội dung có liên quan ngay lập tức.