Làm sạch văn bản, Spacy, NLTK, Scikit-Learn, Deep Learning, word2vec, GloVe, LSTM for Sentiment, Emotion, Spam & CV Parsing.
Bạn sẽ học được gì:
- ✓ Tìm hiểu cách xử lý văn bản hoàn chỉnh với Python.
- ✓ Tìm hiểu cách trích xuất văn bản từ tệp PDF.
- ✓ Sử dụng các Biểu thức chính quy (Regular Expression) để tìm kiếm trong văn bản.
- ✓ Sử dụng SpaCy và NLTK để trích xuất các văn bản đặc trưng hoàn chỉnh từ văn bản thô.
- ✓ Sử dụng Latent Dirichlet Allocation cho Topic Modelling.
- ✓ Sử dụng Scikit-Learn và Deep Learning để phân loại văn bản (Text Classification).
- ✓ Tìm hiểu về Multi-Class và Multi-Label Text Classification.
- ✓ Sử dụng Spacy và NLTK cho phân tích cảm xúc (Sentiment Analysis).
- ✓ Hiểu và xây dựng các mô hình ML dựa trên word2vec và GloVe.
- ✓ Sử dụng Gensim để lấy các vectơ từ được huấn luyện trước và tính toán các điểm tương đồng và loại suy.
- ✓ Tìm hiểu Text Summarization và Text Generation sử dụng LSTM và GRU.
Khóa học này được thiết kế để cung cấp cho bạn kiến thức toàn diện về Text Processing và Mining với việc sử dụng các thuật toán NLP hiện đại nhất trong Python.
Bạn sẽ tìm hiểu chi tiết về Spacy và khám phá các ứng dụng của NLP trong thực tế. Khóa học này bao gồm các kiến thức cơ bản về NLP để nâng cao các chủ đề như word2vec, GloVe, Deep Learning cho NLP như CNN, ANN và LSTM. Bạn sẽ học cách tối ưu code ML của mình bằng cách sử dụng các công cụ khác nhau của sklean trong python. Ở phần cuối của khóa học này, bạn sẽ học cách tạo thơ bằng cách sử dụng LSTM. Giải thích về phép phân loại Multi-Label và Multi-class. Ít nhất 12 Dự án NLP được đề cập trong khóa học này. Bạn sẽ học được nhiều cách khác nhau để giải quyết các vấn đề NLP tiên tiến.
Chúng ta sẽ bắt đầu với những điều cơ bản như họ máyc là gì và nó hoạt động như thế nào. Sau đó, bạn sẽ tìm hiểu đến Python, Numpy và Pandas. Nếu bạn có kinh nghiệm trước, bạn có thể bỏ qua các phần này. Trò chơi thực sự của NLP sẽ bắt đầu với phần Giới thiệu Spacy, nơi bạn sẽ được hướng dẫn qua các bước tiền xử lý NLP khác nhau. Bạn sẽ chủ yếu sử dụng Spacy và NLTK để tiền xử lý dữ liệu văn bản.
Trong phần tiếp theo, bạn sẽ tìm hiểu về cách làm việc với File để lưu trữ và tải dữ liệu văn bản. Phần này là nền tảng của phần khác về Tiền xử lý văn bản hoàn chỉnh. Bạn sẽ được hướng dẫn nhiều cách tiền xử lý văn bản bằng Spacy và Biểu thức chính quy. Cuối cùng, bạn sẽ học cách tạo python package của riêng mình khi thực hiện tiền xử lý. Nó sẽ giúp bạn cải thiện kỹ năng viết code của mình. Bạn có thể sử dụng lại code của mình trên toàn hệ thống mà không cần viết code cho tiền xử lý. Phần này là phần quan trọng nhất.
Sau đó,bạn sẽ bắt đầu phần lý thuyết Học máy và hướng dẫn về Scikit-Learn Python package, nơi bạn sẽ học cách viết code ML sạch. Sau đó, bạn sẽ phát triển trình phân loại văn bản đầu tiên của mình để phân loại thư SPAM và HAM. Bạn sẽ học các loại nhúng từ khác nhau được sử dụng trong NLP như Bag of Words, Term Frequency, IDF, và TF-IDF.
Sau đó, bạn sẽ tìm hiểu về việc triển khai mô hình học máy. Bạn cũng sẽ tìm hiểu nhiều công cụ quan trọng khác như word2vec, GloVe, Deep Learning, CNN, LSTM, RNN, v.v.
Vào cuối bài học này, bạn sẽ học được mọi thứ cần thiết để giải quyết vấn đề NLP của riêng bạn.
Copyright Disclaimer:
This site does not store any files on its server. We only index and link to content provided by other sites. Please contact the content providers to delete copyright contents if any and Email us, we'll remove relevant links or contents immediately.
Tuyên bố miễn trừ bản quyền:
Trang web này không lưu trữ bất kỳ tệp nào trên máy chủ của nó. Chúng tôi chỉ lập chỉ mục và liên kết đến nội dung được cung cấp bởi các trang web khác. Vui lòng liên hệ với các nhà cung cấp nội dung để xóa nội dung bản quyền nếu có và gửi email cho chúng tôi, chúng tôi sẽ xóa các liên kết hoặc nội dung có liên quan ngay lập tức.