Chia Sẻ Khóa Học Sử Dụng Python Để Truy Cập Dữ Liệu Web [Khóa 6626 A]
Bạn sẽ học được gì
- ✓ Sử dụng regular expression để trích xuất dữ liệu từ chuỗi.
- ✓ Hiểu các giao thức mà trình duyệt web sử dụng để truy xuất document và ứng dụng web.
- ✓ Truy xuất dữ liệu từ các website và API bằng Python.
- ✓ Làm việc với dữ liệu XML (eXtensible Markup Language).
Những kỹ năng bạn sẽ đạt được:
- ✓ JSON
- ✓ XML.
- ✓ Lập trình Python.
- ✓ Web Scraping.
Có 6 module trong khóa học này:
Khóa học này sẽ chỉ ra cách người ta có thể coi Internet như một nguồn dữ liệu. Chúng ta sẽ quét, phân tích cú pháp và đọc dữ liệu web cũng như truy cập dữ liệu bằng các web API. Chúng ta sẽ làm việc với các định dạng dữ liệu HTML, XML và JSON trong Python. Khóa học này sẽ bao gồm các Chương 11 đến 13 của sách giáo khoa “Python for Everyone”. Để thành công trong khóa học này, bạn nên làm quen với tài liệu trong Chương 1 đến 10 của sách giáo khoa và hai khóa học đầu tiên trong chuyên ngành này. Các chủ đề này bao gồm biến và biểu thức, thực thi có điều kiện (vòng lặp, phân nhánh và try/except), hàm, cấu trúc dữ liệu Python (strings, lists, dictionaries, và tuples) và thao tác với file. Khóa học này bao gồm Python 3.
Module 1. Bắt đầu:
Trong phần này, bạn sẽ cài đặt Python và một text editor. Trong các lớp học trước đây trong chuyên ngành, đây là một bài tập tùy chọn, nhưng trong lớp này, đó là yêu cầu đầu tiên để bắt đầu. Từ thời điểm này trở đi, chúng ta sẽ ngừng sử dụng browser-based Python grading environment vì môi trường Python dựa trên trình duyệt (Skulpt) không có khả năng chạy các chương trình phức tạp hơn mà chúng ta sẽ phát triển trong lớp này.
Module 2. Regular Expressions (Chương 11):
Regular expression là một ngôn ngữ rất chuyên biệt cho phép chúng ta tìm kiếm chuỗi một cách ngắn gọn và trích xuất dữ liệu từ chuỗi. Regular expression là một ngôn ngữ cho chính nó. Không cần thiết phải biết cách sử dụng các regular expression, nhưng chúng có thể khá hữu ích và mạnh mẽ.
Module 3. Networks và Sockets (Chương 12):
Trong phần này, chúng ta tìm hiểu về các giao thức mà các trình duyệt web sử dụng để truy xuất document và các ứng dụng web sử dụng để tương tác với Application Program Interfaces (API).
Module 4. Programs that Surf the Web (Chương 12):
Trong phần này, chúng ta học cách sử dụng Python để truy xuất dữ liệu từ các web site và API qua Internet.
Module 5. Web Services và XML (Chương 13):
Trong phần này, chúng ta tìm hiểu cách truy xuất và phân tích dữ liệu XML (eXtensible Markup Language).
Module 6. JSON và REST Architecture (Chương 13):
Trong phần này, chúng ta làm việc với Application Program Interfaces / Web Services sử dụng định dạng dữ liệu JavaScript Object Notation (JSON).
NHẬN GET EBOOK TRÊN AMAZON THEO YÊU CẦU