Chia Sẻ Khóa Học Retrieval Augmented Generation (RAG) [DeepLearning.AI] [Khóa 5608 A]
Những gì bạn sẽ học được:
- ✓ Cách thiết kế và xây dựng các hệ thống RAG phù hợp với các nhu cầu thực tế.
- ✓ Cách cân nhắc sự đánh đổi giữa chi phí, tốc độ và chất lượng để lựa chọn các kỹ thuật phù hợp cho từng component của hệ thống RAG.
- ✓ Một foundational framework để điều chỉnh các hệ thống RAG khi các công cụ và phương pháp mới xuất hiện.
Các kỹ năng bạn sẽ đạt được:
- ✓ Prompt Engineering.
- ✓ Application Security.
- ✓ Large Language Modeling.
- ✓ Natural Language Processing.
- ✓ Artificial Intelligence.
- ✓ Semantic Web.
- ✓ LLM Application.
- ✓ Generative AI.
- ✓ System Monitoring.
- ✓ ChatGPT.
Có 5 module trong khóa học này:
Retrieval Augmented Generation (RAG) cải thiện các phản hồi của large language model (LLM) bằng cách thu thập dữ liệu có liên quan từ các knowledge base, thường là private, recent hoặc domain-specific, và sử dụng dữ liệu đó để tạo ra các câu trả lời chính xác và có căn cứ hơn.
Trong khóa học này, bạn sẽ học cách xây dựng các hệ thống RAG kết nối LLM với các data source bên ngoài. Bạn sẽ khám phá các core component như retriever, vector database và language model, đồng thời áp dụng các kỹ thuật chính ở cả component & system level. Thông qua việc thực hành với các công cụ production thực tế, bạn sẽ có được các kỹ năng để design, refine và evaluate các RAG pipeline đáng tin cậy, và thích ứng với các phương pháp mới khi lĩnh vực này phát triển.
Xuyên suốt năm module, bạn sẽ hoàn thành các bài tập lập trình thực hành hướng dẫn bạn xây dựng từng phần cốt lõi của một hệ thống RAG, từ các prototype đơn giản đến các production-ready component.
Thông qua các lab thực hành, bạn sẽ:
- ✓ Xây dựng hệ thống RAG đầu tiên của mình bằng cách viết các retrieval & prompt augmentation function, đồng thời truyền input có cấu trúc vào LLM.
- ✓ Triển khai và so sánh các retrieval method như semantic search, BM25 và Reciprocal Rank Fusion để xem mỗi method tác động như thế nào đến các phản hồi của LLM.
- - Scale hệ thống RAG của bạn bằng Weaviate và một ews dataset thực tế - chunking, indexing và retrieving document với vector database.
- ✓ Phát triển một chatbot chuyên biệt cho một cửa hàng quần áo hư cấu, có khả năng trả lời các câu hỏi thường gặp và đưa ra gợi ý sản phẩm dựa trên một bộ dữ liệu tùy chỉnh.
- ✓ Cải thiện độ tin cậy của chatbot bằng cách xử lý các thách thức thực tế như định giá động và ghi lại tương tác của người dùng để giám sát và gỡ lỗi.
- ✓ Phát triển một chatbot chuyên biệt cho một cửa hàng quần áo hư cấu sử dụng các open-source LLM do Together AI host, có khả năng trả lời các câu hỏi thường gặp và đưa ra gợi ý sản phẩm dựa trên một bộ dữ liệu tùy chỉnh.
Bạn sẽ áp dụng các kỹ năng của mình bằng cách sử dụng dữ liệu thực tế từ các lĩnh vực như truyền thông, chăm sóc sức khỏe và thương mại điện tử. Cuối khóa học, bạn sẽ kết hợp tất cả những gì đã học để triển khai một hệ thống RAG hoàn chỉnh, nâng cao hơn, phù hợp với nhu cầu của dự án của bạn.
01. Module 1: Tổng quan về RAG.
Tìm hiểu các khái niệm nền tảng về RAG, làm quen với các component chính của một hệ thống RAG, bao gồm LLM, knowledge base và retriever, và bắt đầu xây dựng hệ thống RAG chức năng đầu tiên của bạn.
02. Module 2: Information Retrieval & Search Foundation:
Tìm hiểu các kỹ thuật information retrieval nền tảng, bao gồm keyword search, semantic search và metadata filtering. Sau đó, xây dựng và đánh giá một hybrid search pipeline kết hợp cả ba kỹ thuật này.
03. Module 3: Information Retrieval với Vector Database:
Tìm hiểu cách các ector database mở rộng quy mô tìm kiếm và các kỹ thuật cải thiện retrieval, chẳng hạn như chunking, query parsing và reranking.
04. Module 4: LLM & Text Generation:
Tìm hiểu tất cả về các large language model, cách chúng hoạt động cũng như các kỹ thuật như prompt engineering, hallucination detection, agentic system design và fine-tuning để cải thiện hiệu suất của chúng trong một hệ thống RAG.
05. Module 5: Các RAG System trong Production:
Tìm hiểu cách giám sát và đánh giá hệ thống RAG ở cả component level và end-to-end, đồng thời xem xét sự đánh đổi về hiệu suất hệ thống, chi phí, khả năng và bảo mật mà các hệ thống RAG sản xuất phải đối mặt.
.png)