Tin mới nhất

Menu

Browsing "Older Posts"

Chia Sẻ Khóa Học Feature Engineering Cho Machine Learning [Khóa 8016 A]

22 tháng 6 2022 / No Comments

Tìm hiểu về imputation, variable encoding, discretization, feature extraction, cách làm việc với datetime, outliers và hơn thế nữa.

Bạn sẽ học được gì:

  • ✓ Tìm hiểu nhiều kỹ thuật về missing data imputation..
  • ✓ Transform categorical variables thành numbers trong khi thu thập thông tin có ý nghĩa.
  • ✓ Tìm hiểu cách đối phó với infrequent, rare, và unseen categories..
  • ✓ Tìm hiểu cách làm việc với skewed variables.
  • ✓ Convert numerical variables thành discrete ones.
  • ✓ Remove outliers khỏi các biến của bạn.
  • ✓ Extract useful features từ các biến dates and time.
  • ✓ Tìm hiểu các kỹ thuật được sử dụng trong các tổ chức trên toàn thế giới và trong các cuộc thi dữ liệu.
  • ✓ Tăng số lượng kỹ thuật của bạn để xử lý trước dữ liệu và xây dựng các mô hình học máy mạnh mẽ hơn.

Chào mừng bạn đến với Feature Engineering cho Machine Learning, khóa học toàn diện nhất về feature engineering có sẵn trực tuyến . Trong khóa học này, bạn sẽ tìm hiểu về variable imputation, variable encoding, feature transformation, discretization và cách tạo các new feature từ dữ liệu của bạn.

Master Feature Engineering và Feature Extraction.

Trong khóa học này, bạn sẽ học nhiều phương pháp feature engineering cho phép bạn biến đổi dữ liệu của mình và sẵn sàng đào tạo các mô hình học máy. Cụ thể, bạn sẽ học:

  • ✓ Cách xác định dữ liệu bị thiếu (missing data).
  • ✓ Cách encode categorical variables.
  • ✓ Cách biến đổi các biến số và thay đổi distribution của chúng.
  • ✓ Cách thực hiện discretization.
  • ✓ Cách remove outliers.
  • ✓ Cách extract features từ date and time.
  • ✓ Cách create new features từ features hiện có.

Tạo Features hữu ích với Math, Statistics and Domain Knowledge:

Feature engineering là quá trình chuyển đổi các tính năng hiện có hoặc tạo các biến mới để sử dụng trong học máy. Dữ liệu thô không phù hợp để đào tạo các thuật toán học máy. Thay vào đó, các nhà khoa học dữ liệu dành nhiều thời gian để xử lý trước dữ liệu. Khóa học này dạy bạn mọi thứ bạn cần biết để sẵn sàng cung cấp dữ liệu để đào tạo mô hình của bạn.

Mặc dù hầu hết các khóa học trực tuyến sẽ dạy bạn những điều rất cơ bản về feature engineering, như imputing variables với mean hoặc transforming categorical variables bằng cách sử dụng one hot encoding, khóa học này sẽ dạy bạn điều đó và nhiều hơn thế nữa.

Trong khóa học này, trước tiên bạn sẽ tìm hiểu các kỹ thuật phổ biến và được sử dụng rộng rãi nhất cho variable engineering, như mean và median imputation, one-hot encoding, transformation với logarithm, và discretization. Sau đó, bạn sẽ khám phá các phương pháp nâng cao hơn giúp thu thập thông tin trong khi mã hóa hoặc chuyển đổi các biến của bạn để cải thiện hiệu suất của các mô hình học máy.

Bạn sẽ học các phương pháp như weight of evidence, được sử dụng trong tài chính và cách tạo mối quan hệ đơn điệu giữa variables và targets để tăng hiệu suất của mô hình linear. Bạn cũng sẽ học cách tạo features từ các biến date and time và cách xử lý categorical variables với rất nhiều categories.

Các phương pháp bạn sẽ học được mô tả trong các bài báo khoa học, được sử dụng trong các cuộc thi khoa học dữ liệu và thường được sử dụng trong các tổ chức. Và hơn thế nữa, chúng có thể được triển khai dễ dàng bằng cách sử dụng các thư viện mã nguồn mở của Python!

Trong suốt các bài giảng, bạn sẽ tìm thấy các giải thích chi tiết về từng kỹ thuật và thảo luận về lợi thế, hạn chế và các giả định cơ bản của chúng, tiếp theo là các phương pháp lập trình tốt nhất để triển khai chúng bằng Python.

Vào cuối khóa học, bạn sẽ có thể quyết định kỹ thuật feature engineering nào bạn cần dựa trên các đặc tính biến đổi và mô hình bạn muốn đào tạo. Và bạn cũng sẽ được sắp xếp tốt để thử nghiệm các phương pháp chuyển đổi khác nhau và để các mô hình của bạn quyết định phương pháp nào hoạt động tốt nhất.

Nâng cao sự nghiệp của bạn trong Data Science:

Bạn đã thực hiện những bước đầu tiên của mình vào khoa học dữ liệu. Bạn biết về các mô hình dự đoán được sử dụng phổ biến nhất. Bạn thậm chí đã đào tạo một vài mô hình phân loại hoặc hồi quy tuyến tính. Ở giai đoạn này, bạn có thể bắt đầu nhận thấy một số thách thức: dữ liệu của bạn bị bẩn, thiếu rất nhiều giá trị, một số biến không phải là số và những biến khác thì cực kỳ sai lệch. Bạn cũng có thể tự hỏi liệu code của bạn có hiệu quả và hoạt động hay không hoặc có cách nào tốt hơn để lập trình không. Bạn tìm kiếm trực tuyến, nhưng bạn không thể tìm thấy các tài nguyên tổng hợp về feature engineering. Vì vậy, bạn có thể bắt đầu tự hỏi: mọi thứ thực sự được thực hiện như thế nào trong các công ty công nghệ?

Trong khóa học này, bạn sẽ tìm thấy câu trả lời cho những câu hỏi đó. Trong suốt khóa học, bạn sẽ học nhiều kỹ thuật cho các khía cạnh khác nhau của phép biến đổi và cách triển khai chúng một cách hiệu quả và chuyên nghiệp bằng Python. Bạn sẽ tận dụng sức mạnh của hệ sinh thái nguồn mở của Python, bao gồm các thư viện NumPy, Pandas, Scikit-learning và các package đặc biệt dành cho feature engineering: Feature-engine và Category encoders.

Vào cuối khóa học, bạn sẽ có thể triển khai tất cả các bước feature engineering của mình vào một đường ống thanh lịch duy nhất, cho phép bạn đưa các mô hình dự đoán của mình vào sản xuất với hiệu quả tối đa.

Tận dụng sức mạnh của nguồn mở:

Chúng tôi sẽ thực hiện tất cả các phương pháp feature engineering sử dụng Pandas và Numpy, đồng thời chúng tôi sẽ so sánh việc triển khai với Scikit-learn, Feature-engine, và Category encoders, nêu bật những ưu điểm và hạn chế của từng thư viện. Khi bạn tiến bộ trong khóa học, bạn sẽ có thể chọn thư viện mà bạn thích nhất để thực hiện các dự án của mình.

Có một Python notebook chuyên dụng với code để triển khai từng phương pháp feature engineering, mà bạn có thể sử dụng lại trong các dự án của mình để tăng tốc độ phát triển các mô hình học máy của bạn.

Khóa học trực tuyến toàn diện nhất về Feature Engineering:

Không có một nơi nào duy nhất để tìm hiểu về feature engineering. Nó bao gồm hàng giờ tìm kiếm trên web để tìm hiểu xem mọi người đang làm gì để tận dụng tối đa dữ liệu của họ.

Đó là lý do tại sao, khóa học này tập hợp nhiều kỹ thuật được sử dụng trên toàn thế giới cho feature transformation, học được từ các cuộc thi dữ liệu ở Kaggle và KDD, các bài báo khoa học và từ kinh nghiệm của người hướng dẫn với tư cách là một nhà khoa học dữ liệu. Do đó, khóa học này cung cấp một nguồn tham khảo nơi bạn có thể học các phương pháp mới và cũng có thể xem lại các kỹ thuật và code cần thiết để sửa đổi các biến bất cứ khi nào bạn cần .

Khóa học này được giảng dạy bởi một nhà khoa học dữ liệu hàng đầu có kinh nghiệm trong việc sử dụng máy học trong tài chính và bảo hiểm, người cũng là tác giả sách và nhà phát triển chính của thư viện mã nguồn mở Python cho feature engineering. Và còn nhiều hơn thế nữa:

  • ✓ Khóa học được cập nhật liên tục để bao gồm các phương pháp feature engineering mới.
  • ✓ Notebooks thường xuyên được làm mới để đảm bảo tất cả các phương pháp được thực hiện với các bản phát hành mới nhất của thư viện Python, vì vậy mã của bạn sẽ không bao giờ bị hỏng.
  • ✓ Khóa học kết hợp video, bản trình bày và Jupyter notebooks để giải thích các phương pháp và hiển thị cách triển khai của chúng bằng Python.
  • ✓ Chương trình giảng dạy được phát triển trong khoảng thời gian bốn năm với sự nghiên cứu liên tục trong lĩnh vực feature engineering để mang đến cho bạn những công nghệ, công cụ và xu hướng mới nhất.

Khóa học feature engineering toàn diện này chứa hơn 100 bài giảng trải dài trong khoảng 10 giờ video và TẤT CẢ các chủ đề đều bao gồm các ví dụ về code Python thực hành mà bạn có thể sử dụng để tham khảo, thực hành và sử dụng lại trong các dự án của riêng mình.

Bạn đang chờ đợi điều gì? Đăng ký ngay hôm nay và tham gia khóa học toàn diện nhất thế giới về feature engineering cho machine learning.

Khóa học này dành cho ai:

  • ✓ Các nhà khoa học dữ liệu muốn tìm hiểu cách xử lý trước bộ dữ liệu để xây dựng mô hình học máy.
  • ✓ Các nhà khoa học dữ liệu muốn tìm hiểu thêm các kỹ thuật về feature engineering cho machine learning.
  • ✓ Các nhà khoa học dữ liệu muốn cải thiện kỹ năng coding và thực hành lập trình cho feature engineering.
  • ✓ Các kỹ sư phần mềm, nhà toán học và học giả chuyển đổi nghề nghiệp sang khoa học dữ liệu.
  • ✓ Các nhà khoa học dữ liệu quan tâm đến việc thử nghiệm các kỹ thuật feature engineering khác nhau trong các cuộc thi dữ liệu.
  • ✓ Các kỹ sư phần mềm muốn học cách sử dụng Scikit-learning và các package mã nguồn mở khác cho feature engineering.


NHẬN GET EBOOK TRÊN AMAZON THEO YÊU CẦU

CUNG CẤP TÀI KHOẢN ONEDRIVE 5TB VÀ OFFICE 365 GIÁ RẺXEM CHI TIẾT TẠI ĐÂY 




Copyright Disclaimer:
This site does not store any files on its server. We only index and link to content provided by other sites. Please contact the content providers to delete copyright contents if any and email us, we'll remove relevant links or contents immediately.
Tuyên bố miễn trừ bản quyền:
Trang web này không lưu trữ bất kỳ tệp nào trên máy chủ của nó. Chúng tôi chỉ lập chỉ mục và liên kết đến nội dung được cung cấp bởi các trang web khác. Vui lòng liên hệ với các nhà cung cấp nội dung để xóa nội dung bản quyền nếu có và gửi email cho chúng tôi, chúng tôi sẽ xóa các liên kết hoặc nội dung có liên quan ngay lập tức.