Làm việc với Pandas, Cơ sở dữ liệu SQL, JSON, Web API, v.v. để nắm vững các dự án về Machine Learning và Finance trong thế giới thực của bạn.
Những gì bạn sẽ học:
- + Quy trình làm việc với dữ liệu nâng cao trong thế giới thực với Pandas mà bạn sẽ không tìm thấy trong bất kỳ Khóa học nào khác.
- + Làm việc song song với Pandas và SQL-Databases (tận dụng tối đa hai thế giới).
- + Làm việc với API, JSON và Pandas để import các Bộ dữ liệu lớn từ Web.
- + Đưa Pandas đạt đến giới hạn của nó (và hơn thế nữa ...)
- + Ứng dụng Machine Learning: Dự đoán giá bất động sản.
- + Ứng dụng tài chính: Backtesting & Forward Testing Investment Strategies + Index Tracking.
- + Feature Engineering, Standardization, Dummy Variables và Sampling với Pandas.
- + Làm việc với các Tập dữ liệu lớn (hàng triệu hàng/cột).
- + Làm việc với các Tập dữ liệu hoàn toàn lộn xộn / không sạch sẽ (trường hợp tiêu chuẩn trong thế giới thực).
- + Xử lý dữ liệu JSON được xâu chuỗi và lồng vào nhau với Pandas.
- + Tải dữ liệu từ Cơ sở dữ liệu (SQL) vào Pandas và ngược lại.
- + Tải dữ liệu JSON vào Pandas và ngược lại.
- + Web-Scraping với Pandas.
- + Làm sạch các Tập dữ liệu lớn và lộn xộn (hàng triệu hàng/cột).
- + Làm việc với các API và Python Wrapper Package để import các Tập dữ liệu lớn từ Web.
- + Phân tích dữ liệu với các tập dữ liệu lớn trong thế giới thực.
- + Visualizations nâng cao với Matplotlib và Seaborn.
Bạn có thể viết một số code Pandas nhưng bạn vẫn đang gặp khó khăn với các Dự án trong thế giới thực vì:
- + Dữ liệu trong thế giới thực thường không được cung cấp trong một hoặc một vài file text/excel -> cần phải có kỹ thuật import dữ liệu nâng cao hơn.
- + Dữ liệu trong thế giới thực lớn, không có cấu trúc, lồng vào nhau và không sạch -> kỹ thuật thao tác dữ liệu và phân tích/trực quan hóa dữ liệu nâng cao hơn là bắt buộc.
- + Nhiều phương thức Pandas dễ sử dụng hoạt động tốt nhất với các Tập dữ liệu tương đối nhỏ và sạch -> Tập dữ liệu trong thế giới thực yêu cầu nhiều General Code hơn (kết hợp các Thư viện/Mô-đun khác).
Bất kể bạn cần những kỹ năng tốt nhất của Pandas cho các mục đích Phân tích dữ liệu, Học máy hoặc Tài chính, đây là Khóa học phù hợp để bạn nâng các kỹ năng của mình lên Cấp độ Chuyên gia! Làm chủ các dự án trong thế giới thực của bạn!
Khóa học này bao gồm toàn bộ Quy trình làm việc với dữ liệu từ A đến Z:
- + Import dữ liệu (phức tạp và lồng nhau) từ các tệp JSON.
- + Import dữ liệu (phức tạp và lồng vào nhau) từ Web với Web API, JSON và Wrapper Packages.
- + Import dữ liệu (phức tạp và lồng nhau) từ Cơ sở dữ liệu SQL.
- + Lưu trữ dữ liệu (phức tạp và lồng nhau) trong các tệp JSON.
- + Lưu trữ dữ liệu (phức tạp và lồng nhau) trong Cơ sở dữ liệu SQL.
- + Làm việc song song với Pandas và Cơ sở dữ liệu SQL (tận dụng tối đa cả hai thế giới).
- + Import và hợp nhất Dữ liệu từ nhiều tệp Text/CSV một cách hiệu quả.
- + Làm sạch các Tập dữ liệu lớn và lộn xộn với nhiều General Code.
- + Làm sạch, xử lý và làm phẳng Dữ liệu lồng nhau và được xâu chuỗi trong DataFrames.
- + Biết cách xử lý và chuẩn hóa chuỗi Unicode.
- + Hợp nhất và kết hợp nhiều Tập dữ liệu một cách hiệu quả.
- + Cạo và Tự động hợp nhất dữ liệu.
- + Phân tích và Trình diễn Dữ liệu với các công cụ trực quan nâng cao (Matplotlib & Seaborn).
- + Test Giới hạn hiệu suất của Pandas với Tổng hợp và Nhóm dữ liệu nâng cao.
- + Data Preprocessing và Feature Engineering cho Máy học với code Pandas đơn giản.
- + Sử dụng Dữ liệu của bạn 1: Đào tạo và thử nghiệm Mô hình Học máy trên Dữ liệu được xử lý trước và phân tích kết quả.
- + Sử dụng dữ liệu của bạn 2: Backtesting và Forward Testing các chiến lược đầu tư (Finance & Investment Stack).
- + Sử dụng dữ liệu của bạn 3: Index Tracking (Finance & Investment Stack).
- + Sử dụng dữ liệu của bạn 4: Trình bày Dữ liệu của bạn bằng Python ở định dạng HTML đẹp mắt (Website chất lượng cao).
- + Và nhiều kiến thức bổ ích khác nữa...
Mục lục khóa học:
- 01 | Giới thiệu và chuẩn bị khóa học.
- 02 | Project 1: Explanatory Data Analysis & Data Presentation (Bộ dữ liệu Phim).
- 03 | Project 2: Import Dữ liệu - Làm việc với API và JSON (Bộ dữ liệu Phim).
- 04 | Project 3: Làm sạch dữ liệu - Thu dọn tập dữ liệu lộn xộn (Bộ dữ liệu Phim).
- 05 | Project 4: Hợp nhất, làm sạch và chuyển đổi dữ liệu (Bộ dữ liệu Phim).
- 06 | Project 5: Làm việc với Pandas và Cơ sở dữ liệu SQL (Bộ dữ liệu Phim).
- 07 | Project 6: Nhập và Ghép nhiều file (Bộ dữ liệu Baby Name).
- 08 | Project 7: Explanatory Data Analysis và trực quan hóa nâng cao (Bộ dữ liệu Baby Name).
- 09 | Project 8: Data Preprocessing và Feature Engineering cho Machine Learning.
- 10 | Project 9: Import dữ liệu - Web Scraping, API và Wrappers (US Stocks).
- 11 | Project 10 (Finance Stack): Backtesting Investment Strategies (US Stocks).
- 12 | Project 11 (Finance Stack): Index Tracking và Forward Testing (US Stocks).
- 13 | Project 12: Explanatory Data Analysis và Seaborn Visualization (Thế vận hội Olympic).
- 14 | Dự án bổ sung: Chuẩn bị cho tương lai - Pandas Version 1.0.
- 15 | Phần khóa học về Pandas.
- 16 | Kết thúc.
Copyright Disclaimer:
This site does not store any files on its server. We only index and link to content provided by other sites. Please contact the content providers to delete copyright contents if any and email us, we'll remove relevant links or contents immediately.
Tuyên bố miễn trừ bản quyền:
Trang web này không lưu trữ bất kỳ tệp nào trên máy chủ của nó. Chúng tôi chỉ lập chỉ mục và liên kết đến nội dung được cung cấp bởi các trang web khác. Vui lòng liên hệ với các nhà cung cấp nội dung để xóa nội dung bản quyền nếu có và gửi email cho chúng tôi, chúng tôi sẽ xóa các liên kết hoặc nội dung có liên quan ngay lập tức.