Chia Sẻ Khóa Học Data Science Trong Python - Classification Modeling [Khóa 6883 A]
Tìm hiểu Python for Data Science & Supervised Machine Learning và xây dựng các classification model với các dự án thực hành thú vị.
Bạn sẽ học được gì:
- ✓ Nắm vững nền tảng của supervised Machine Learning & classification modeling trong Python.
- ✓ Thực hiện exploratory data analysis về các tính năng và mục tiêu của model.
- ✓ Áp dụng các kỹ thuật feature engineering và chia dữ liệu thành các training, test và validation set.
- ✓ Build và interpret k-nearest neighbors và logistic regression models sử dụng scikit-learn.
- ✓ Đánh giá hiệu suất của mô hình bằng cách sử dụng các công cụ như confusion matrices và các metric như accuracy, precision, recall và F1.
- ✓ Tìm hiểu các kỹ thuật modeling imbalanced data, bao gồm threshold tuning, sampling methods, và adjusting class weights.
- ✓ Build, tune, và evaluate các decision tree model cho classification, bao gồm các ensemble model nâng cao như random forests và gradient boosted machines.
Đây là khóa học thực hành, dựa trên dự án được thiết kế để giúp bạn nắm vững nền tảng về classification modeling trong Python.
Chúng ta sẽ bắt đầu bằng cách review về data science workflow, thảo luận về các mục tiêu chính và loại thuật toán phân loại, đồng thời tìm hiểu sâu về các bước lập mô hình phân loại mà chúng ta sẽ sử dụng trong suốt khóa học.
Bạn sẽ học cách thực hiện exploratory data analysis, tận dụng các kỹ thuật feature engineering như scaling, dummy variables, và binning, đồng thời chuẩn bị dữ liệu cho modeling bằng cách chia dữ liệu thành các train, test, và validation dataset.
Từ đó, chúng ta sẽ điều chỉnh các mô hình K-Nearest Neighbors & Logistic Regression, đồng thời xây dựng một intuition để diễn giải các hệ số và đánh giá hiệu suất của chúng bằng cách sử dụng các công cụ như confusion matrices và các số liệu như accuracy, precision, và recall. Chúng tôi cũng sẽ đề cập đến các kỹ thuật modeling imbalanced data, bao gồm threshold tuning, các phương pháp sampling như oversampling & SMOTE cũng như adjusting class weights trong model cost function.
Trong suốt khóa học, bạn sẽ đóng vai trò Data Scientist cho bộ phận risk management tại Maven National Bank. Sử dụng các kỹ năng bạn học được trong suốt khóa học, bạn sẽ sử dụng Python để khám phá dữ liệu của họ và xây dựng các classification model để xác định chính xác khách hàng nào có rủi ro tín dụng cao, trung bình và thấp dựa trên hồ sơ của họ.
Cuối cùng nhưng không kém phần quan trọng, bạn sẽ học cách xây dựng và đánh giá các decision tree model để phân loại. Bạn sẽ điều chỉnh, trực quan hóa và tinh chỉnh các mô hình này bằng Python, sau đó áp dụng kiến thức của mình vào các ensemble model nâng cao hơn như random forests và gradient boosted machines..
NỘI DUNG KHÓA HỌC:
1. Giới thiệu về Data Science:
- ✓ Giới thiệu các lĩnh vực khoa học dữ liệu và học máy, xem xét các kỹ năng thiết yếu và giới thiệu từng giai đoạn của quy trình làm việc về khoa học dữ liệu.
2. Classification 101:
- ✓ Review các kiến thức cơ bản về classification, bao gồm các thuật ngữ chính, các loại và mục tiêu của classification modeling cũng như modeling workflow.
3. Pre-Modeling Data Prep & EDA:
- ✓ Tóm tắt các bước chuẩn bị dữ liệu & EDA cần thiết để thực hiện modeling, bao gồm các kỹ thuật chính để khám phá mục tiêu, tính năng và mối quan hệ của chúng.
4. K-Nearest Neighbors:
- ✓ Tìm hiểu cách thuật toán k-nearest Neighbors (KNN) phân loại data points và thực hành xây dựng mô hình KNN trong Python.
5. Logistic Regression:
- ✓ Giới thiệu logistic regression, tìm hiểu math đằng sau model và thực hành fitting chúng và uning regularization strength.
6. Classification Metrics:
- ✓ Tìm hiểu cách thức và thời điểm sử dụng một số metric quan trọng cho evaluating classification models, chẳng hạn như precision, recall, F1 score, và ROC-AUC.
7. Imbalanced Data:
- ✓ Hiểu những thách thức của modeling imbalanced data và tìm hiểu các chiến lược để cải thiện hiệu suất mô hình trong các tình huống này.
8. Decision Trees:
- ✓ Xây dựng và đánh giá các mô hình cây quyết định, các thuật toán tìm kiếm sự phân chia trong dữ liệu để phân tách các lớp của bạn một cách tốt nhất.
9. Ensemble Models:
- ✓ Làm quen với những kiến thức cơ bản về ensemble models, sau đó đi sâu vào các mô hình cụ thể như random forests và gradient boosted machines.
Sẵn sàng để đi sâu vào? Hãy tham gia ngay hôm nay và nhận ngay quyền truy cập TRỌN ĐỜI vào những nội dung sau:
- ✓ 9,5 giờ video chất lượng cao.
- ✓ 18 bài tập về nhà.
- ✓ 9 quiz.
- ✓ 2 project.
- ✓ Ebook Data Science trong Python: Classification (hơn 250 trang).
- ✓ Các tệp và giải pháp dự án có thể tải xuống.
- ✓ Diễn đàn hỗ trợ chuyên môn và hỏi đáp.
Nếu bạn là một nhà khoa học dữ liệu đầy tham vọng đang tìm kiếm phần giới thiệu về thế giới classification modeling với Python thì đây là khóa học dành cho bạn.
Chúc bạn học tập vui vẻ!
Khóa học này dành cho ai:
- ✓ Các nhà khoa học dữ liệu muốn tìm hiểu cách xây dựng và áp dụng các supervised learning model trong Python.
- ✓ Các nhà phân tích hoặc chuyên gia BI muốn tìm hiểu về classification modeling hoặc chuyển đổi sang vai trò data science.
- ✓ Bất kỳ ai quan tâm đến việc học một trong những ngôn ngữ lập trình nguồn mở phổ biến nhất trên thế giới.
NHẬN GET EBOOK TRÊN AMAZON THEO YÊU CẦU