Ebook Outlier Detection Trong Python [Ấn Bản Lần 1, Tháng 11/2024] [PDF] [9522E]
Tìm hiểu cách xác định các phần bất thường, thú vị, cực đoan hoặc không chính xác trong dữ liệu của bạn.
Các Data scientist có hai nhiệm vụ chính: tìm các pattern trong dữ liệu và tìm các ngoại lệ. Các giá trị ngoại lệ này thường là các phần dữ liệu cung cấp nhiều thông tin nhất, tiết lộ những insight ẩn, các pattern mới và các vấn đề tiềm ẩn. Outlier Detection trong Python là hướng dẫn thực tế để phát hiện các phần của một tập dữ liệu lệch khỏi chuẩn mực, ngay cả khi chúng bị ẩn hoặc đan xen giữa các điểm dữ liệu dự kiến.
Trong Outlier Detection trong Python, bạn sẽ học cách:
- ✓ Sử dụng các thư viện Python chuẩn để xác định các giá trị ngoại lệ.
- ✓ Chọn các phương pháp phát hiện phù hợp nhất.
- ✓ Kết hợp nhiều phương pháp outlier detection để cải thiện kết quả.
- ✓ Diễn giải kết quả của bạn một cách hiệu quả.
- ✓ Làm việc với numeric, categorical, time series, và text data.
Outlier detection là một công cụ quan trọng cho doanh nghiệp hiện đại, cho dù đó là khám phá các sản phẩm mới, mở rộng thị trường hay đánh dấu gian lận và các hoạt động đáng ngờ khác. Hướng dẫn này trình bày các công cụ cốt lõi cho outlier detection, cũng như các kỹ thuật sử dụng Python data stack quen thuộc với các nhà khoa học dữ liệu. Để bắt đầu, bạn chỉ cần hiểu biết cơ bản về thống kê và hệ sinh thái dữ liệu Python.
Về công nghệ:
Outliers-values có vẻ không nhất quán với phần còn lại của dữ liệu, có thể là chìa khóa để xác định gian lận, thực hiện một security audit, phát hiện hoạt động của bot hoặc chỉ đánh giá chất lượng của một tập dữ liệu. Hướng dẫn độc đáo này giới thiệu các công cụ, kỹ thuật và thuật toán outlier detection mà bạn sẽ cần để tìm, hiểu và phản hồi các bất thường trong dữ liệu của mình.
Về cuốn sách:
Outlier Detection trong Python minh họa các nguyên tắc và thực hành về outlier detection với nhiều ví dụ thực tế đa dạng bao gồm social media, finance, network logs và các lĩnh vực quan trọng khác. Bạn sẽ khám phá một bộ phương pháp thống kê và phương pháp tiếp cận machine learning toàn diện để xác định và diễn giải các giá trị không mong muốn trong dữ liệu dạng bảng, text, time series và hình ảnh. Trong quá trình này, bạn sẽ khám phá scikit-learn và PyOD, áp dụng các thuật toán OD chính và thêm một số kỹ thuật có giá trị cao cho các tình huống OD thực tế vào bộ công cụ của mình.
Bên trong cuốn sách này có gì:
- ✓ Các thư viện Python để xác định các outlier.
- ✓ Kết hợp các phương pháp outlier detection.
- ✓ Diễn giải results của bạn.
Về người đọc:
Dành cho các lập trình viên Python quen thuộc với các công cụ như pandas và NumPy, cùng kiến thức cơ bản về thống kê.
Mục lục:
- ✓ Chương 01. Giới thiệu về outlier detection.
- ✓ Chương 02. Simple outlier detection.
- ✓ Chương 03. Machine learning-based outlier detection.
- ✓ Chương 04. Outlier detection process.
- ✓ Chương 05. Outlier detection sử dụng scikit-learn.
- ✓ Chương 06. PyOD library.
- ✓ Chương 07. Các thư viện và thuật toán bổ sung cho outlier detection.
- ✓ Chương 08. Evaluating detectors & parameters.
- ✓ Chương 09. Làm việc với các kiểu dữ liệu cụ thể.
- ✓ Chương 10. Xử lý các tập dữ liệu rất lớn và rất nhỏ.
- ✓ Chương 11. Synthetic data cho outlier detection.
- ✓ Chương 12. Collective outliers.
- ✓ Chương 13. Explainable outlier detection.
- ✓ Chương 14. Ensembles of outlier detectors.
- ✓ Chương 15. Làm việc với các outlier detection prediction.
- ✓ Chương 16. Deep learning-based outlier detection.
- ✓ Chương 17. Time-series data.
LƯU Ý: Pass mở file pdf là mật khẩu giải nén chung của tài liệu !