Chia Sẻ Khóa Học AI Engineering Bootcamp 2025 - Retrieval Augmented Generation (RAG) Cho LLM [Khóa 6156 A]
Phát triển mạnh mẽ trong kỷ nguyên AI với khóa học thực hành này, khóa học sẽ hướng dẫn bạn cách xây dựng các ứng dụng AI tốt hơn bằng một trong những kỹ thuật AI quan trọng nhất được sử dụng trong thế giới thực để bổ sung kiến thức cho các mô hình AI với thông tin độc quyền hoặc thông tin mới: Retrieval Augmented Generation (RAG).
Học cách tạo ra các hệ thống AI thông minh hơn bằng cách kết hợp LLM với Retrieval-Augmented Generation (RAG). Xây dựng các dự án thực tế bằng kiến trúc RAG bao gồm các chatbot, financial analysis tool và nhiều hơn nữa!
Những gì bạn sẽ học được:
- ✓ Kết hợp các mô hình generative AI với Retrieval Augmented Generation để xây dựng các hệ thống AI thông minh hơn.
- ✓ Sử dụng các OpenAI API cho text generation và processing unstructured data.
- ✓ Làm chủ FAISS để tìm kiếm sự tương đồng hiệu quả trong các tập dữ liệu lớn.
- ✓ Áp dụng các kỹ thuật prompt engineering để có các phản hồi AI tối ưu.
- ✓ Xây dựng các dự án AI thực tế như chatbot và công cụ phân tích tài chính.
- ✓ Khám phá các khái niệm RAG nâng cao như multimodal và agentic RAG.
AI Engineer là gì?
Phiên bản ngắn gọn là một AI Engineer làm việc trên toàn bộ vòng đời của một ứng dụng AI - tức là một ứng dụng sử dụng AI làm cốt lõi. Một AI Engineer lấy các mô hình AI, bao gồm Large Language Model và tùy chỉnh chúng theo nhu cầu của họ.
Điều đó đòi hỏi mọi thứ từ xây dựng các mô hình bằng cách sử dụng các bộ dữ liệu tùy chỉnh, đến training và tuning các mô hình, triển khai các mô hình và scaling chúng bằng các công nghệ đám mây.
Vai trò này đang phát triển nhanh chóng, nhưng vẫn đang tiến hóa và chắc chắn sẽ tiếp tục phát triển khi bối cảnh AI thay đổi.
Retrieval Augmented Generation (RAG) là gì?
Bạn đã bao giờ tự hỏi tại sao một số hệ thống AI có thể cảm thấy bị hạn chế, đưa ra những câu trả lời có vẻ hơi chung chung hoặc không đúng mục tiêu? Vâng, đó là vì chúng bị giới hạn bởi kiến thức trong dữ liệu đào tạo của chúng.
Và đó là rất nhiều dữ liệu. Nhưng không phải là tất cả. Nó không bao gồm dữ liệu riêng tư, cũng không bao gồm dữ liệu gần đây được tạo ra kể từ khi mô hình được đào tạo.
Retrieval-Augmented Generation, hay RAG, giải quyết vấn đề này bằng cách bổ sung thông tin riêng tư hoặc thông tin mới vào các mô hình AI.
Thay vì chỉ dựa vào những gì đã được đào tạo, RAG sẽ thu thập thông tin mới nhất, có liên quan từ database hoặc document.
Đây là cách thức hoạt động: hệ thống đầu tiên tìm những thông tin có liên quan nhất cho một câu hỏi nhất định (retrieval). Sau đó, nó sử dụng một mô hình ngôn ngữ để generate phản hồi dựa trên thông tin đó (generation). Đó là lý do tại sao nó được gọi là retrieval-augmented generation!
Kết quả là một AI kết hợp những điểm tốt nhất của cả hai thế giới: khả năng truy cập kiến thức bên ngoài theo thời gian thực và khả năng diễn đạt kiến thức đó một cách rõ ràng.
Chúng ta hãy làm một ví dụ.
Hãy tưởng tượng: Bạn đang duyệt trang web của một cửa hàng quần áo, tìm kiếm một chiếc áo khoác cụ thể có kích thước và màu sắc yêu thích của bạn, nhưng bạn không chắc liệu nó có còn hàng hay không. Thay vì nhấp qua vô số bộ lọc, một chatbot do RAG cung cấp có thể giúp bạn thực hiện việc này một cách dễ dàng.
Khi bạn hỏi, "Bạn có áo khoác xanh cỡ trung không?", hệ thống RAG sẽ lấy dữ liệu hàng tồn kho theo thời gian thực từ cơ sở dữ liệu của cửa hàng. Hệ thống sẽ tìm các chi tiết chính xác, như tình trạng còn hàng tại các cửa hàng gần đó hoặc ngày giao hàng dự kiến - thông tin không có trong dữ liệu đào tạo của các mô hình AI. Sau đó, hệ thống sẽ sử dụng thông tin đó để tạo ra phản hồi hữu ích: "Có, chúng tôi có hàng trong kho! Bạn có thể đến lấy tại địa điểm ở trung tâm thành phố hoặc yêu cầu giao hàng vào thứ Sáu".
Loại tương tác chính xác và năng động này giúp việc mua sắm trở nên dễ dàng và nhanh hơn, đảm bảo bạn nhận được câu trả lời cần thiết mà không gặp rắc rối.
RAG ngày càng được sử dụng nhiều trong các ứng dụng AI như các chatbot, công cụ nghiên cứu và hệ thống phân tích dữ liệu, nơi độ chính xác và ngữ cảnh là điều cần thiết. Đây là một cách thiết thực để làm cho AI đáng tin cậy và hữu ích hơn trong các tình huống phức tạp.
Tại sao lại là khóa học RAG này ?
Vâng, bởi vì đây là khóa học AI Engineering Bootcamp trực tuyến tốt nhất, mới nhất và thiết thực nhất, dạy cho bạn các kỹ năng RAG thực tế và cho phép bạn thực hành để có thể sử dụng các kỹ năng của mình trong thế giới thực.
Nhưng tất nhiên là chúng tôi thiên vị. Vì vậy, đây là bản phân tích những nội dung được đề cập trong khóa học RAG Bootcamp này để bạn có thể tự đưa ra quyết định:
1. Cơ bản về các Retrieval System: Phần này đặt nền tảng để hiểu cách tìm kiếm và truy xuất thông tin từ các tập dữ liệu lớn. Bạn sẽ học cách chuẩn bị dữ liệu văn bản để truy xuất, khám phá các mô hình truy xuất khác nhau (Boolean, vector space, probabilistic) và hiểu các khái niệm về indexing, querying và ranking. Mục tiêu là trang bị cho bạn các kỹ năng để tìm thông tin có liên quan một cách hiệu quả trong các tập dữ liệu lớn.
2. Cơ bản về các Generation Model: Dựa trên các khái niệm truy xuất (retrieval), phần này giới thiệu các nguyên tắc về text generation bằng AI. Bạn sẽ tìm hiểu về transformer architecture, đã cách mạng hóa quá trình xử lý ngôn ngữ tự nhiên và cách các cơ chế attention bên trong transformer cho phép các mô hình tập trung vào các phần có liên quan nhất của input. Bạn cũng sẽ hiểu được các kỹ thuật data preparation và training cho các mô hình này.
3. Giới thiệu về RAG: Phần này giới thiệu các khái niệm cốt lõi của Retrieval-Augmented Generation, giải thích cách kết hợp các điểm mạnh của mô hình retrieval và generation để tạo ra các phản hồi chính xác hơn, phù hợp với ngữ cảnh và toàn diện hơn. Bạn sẽ tìm hiểu về kiến trúc RAG cơ bản và hiểu lý do tại sao nó ngày càng trở nên quan trọng trong nhiều ứng dụng AI khác nhau.
4. Làm việc với OpenAI API: Phần này tập trung vào việc hướng dẫn bạn cách sử dụng API của OpenAI để truy cập và sử dụng các mô hình AI mạnh mẽ của họ, đặc biệt là cho text generation và image processing. Bạn sẽ tìm hiểu về cách lấy các API key, thiết lập môi trường của mình, tạo các prompt hiệu quả, tuning parameter và hiểu ảnh hưởng của lời system prompt đến hành vi của AI.
5. RAG với OpenAI Implementation: Phần này tập hợp mọi thứ bạn đã học cho đến nay để hướng dẫn bạn cách xây dựng các hệ thống RAG đầy đủ chức năng bằng cách sử dụng các mô hình OpenAI. Bạn sẽ tích hợp các retrieval và generation component, khám phá các khái niệm RAG nâng cao như multi-modal RAG và sử dụng OpenAI API để tạo ra các hệ thống thông minh có khả năng xử lý các tác vụ phức tạp.
6. Làm việc với dữ liệu phi cấu trúc: Phần này đi sâu vào những thách thức và kỹ thuật để làm việc với dữ liệu phi cấu trúc, chiếm phần lớn thông tin thực tế. Bạn sẽ học cách xử lý và trích xuất thông tin từ nhiều định dạng khác nhau như PDF, tài liệu Word, bản trình bày PowerPoint, EPUB, hình ảnh và dữ liệu Excel. Phần này trang bị cho bạn các công cụ để mở khóa giá trị ẩn trong dữ liệu phi cấu trúc.
7. Multimodal RAG: Dựa trên hiểu biết của bạn về RAG, phần này giới thiệu khái niệm về multi-modal RAG, mở rộng khả năng của RAG để xử lý dữ liệu từ nhiều phương thức, chẳng hạn như văn bản và hình ảnh. Bạn sẽ học cách xây dựng các hệ thống có thể tích hợp các loại dữ liệu khác nhau để tạo ra các phản hồi phong phú hơn và phù hợp hơn với ngữ cảnh.
8. Agentic RAG: Phần này giới thiệu khái niệm về agentic RAG, tập trung vào việc xây dựng các AI agent có thể tương tác với người dùng, xử lý các tác vụ và đưa ra các quyết định một cách tự động. Khóa học bao gồm agent state management, workflows và tích hợp retrieval và generation vào các agentic system. Phần này đại diện cho sự phát triển tiên tiến của RAG và khám phá cách các AI agent có thể phản hồi động với các yêu cầu của người dùng và hoàn thành các tác vụ phức tạp.
Quan trọng nhất là bạn sẽ được học từ một chuyên gia trong ngành có kinh nghiệm thực tế với AI và RAG. Anh ấy sẽ dạy bạn các chiến lược và kỹ thuật chính xác mà anh ấy sử dụng trong vai trò của mình.
Cuối cùng, khóa học này là một thứ sống động. Nó sẽ liên tục được cập nhật khi bối cảnh thay đổi để bạn có thể sử dụng nó như một hướng dẫn để xây dựng các ứng dụng AI thông minh hơn bằng RAG ngay bây giờ và trong suốt sự nghiệp của bạn.
Vậy thì không có lý do gì mà bạn lại không thể làm được điều đó.
Những gì bạn sẽ xây dựng:
Cách tốt nhất để tìm hiểu về AI là thực sự xây dựng với AI. Không chỉ xem hướng dẫn vô tận. Đó là lý do tại sao một phần quan trọng của khóa học này là triển khai RAG vào các dự án thực tế mà bạn sẽ xây dựng. Thêm vào đó, chúng sẽ trông tuyệt vời trên portfolio của bạn.
1. RAG System cho một Digital Cookbook:
Xây dựng một hệ thống AI xử lý một cookbook PDF, trích xuất công thức và tạo một retrieval model để trả lời các câu hỏi nấu ăn chi tiết với phản hồi tự nhiên.
2. RAG System cho Financial Analysis sử dụng các Earnings Report:
Phát triển một hệ thống phân tích báo cáo tài chính và báo cáo thu nhập bằng cách xử lý dữ liệu văn bản và âm thanh, cho phép người dùng retrieve và generate các insight từ các tập dữ liệu phức tạp.
3. RAG System cho PDF:
Học cách xử lý dữ liệu PDF và xây dựng một retrieval system có thể trả lời các truy vấn của người dùng dựa trên nội dung của tài liệu.
4. AI-Powered Digital Waiter sử dụng RAG:
Tạo một AI agent có thể tương tác với khách hàng nhà hàng như một người phục vụ. AI agent của bạn sẽ chào đón khách hàng, hiểu câu hỏi của họ, thu thập thông tin có liên quan và generate những phản hồi chu đáo.
5. RAG System cho Customer Feedback Analysis:
Xây dựng một hệ thống RAG có thể phân tích phản hồi của khách hàng từ nhiều nguồn khác nhau, như các đánh giá và khảo sát, để trích xuất những thông tin chi tiết có giá trị. Bạn sẽ học cách xử lý dữ liệu này, trích xuất thông tin chính và phân loại để cải thiện sản phẩm hoặc dịch vụ.
6. + 2 project thú vị hơn để thực hành các kỹ năng mới của bạn.
Mục lục:
- ✓ 01. Phần 1: Giới thiệu về các hệ thống Retrieval Augmented Generation (RAG).
- ✓ 02. Phần 2: Fundamentals of Retrieval Systems.
- ✓ 03. Phần 3: Science of Prompt Engineering.
- ✓ 04. Phần 4: Generative AI Fundamentals.
- ✓ 05. Phần 5: Science of LLM.
- ✓ 06. Phần 6: Retrieval-Augmented Generation (RAG) Fundamentals.
- ✓ 07. Phần 7: Science of RAG.
- ✓ 08. Phần 8: Làm việc với OpenAI API.
- ✓ 09. Phần 9: Project - Customer Acquisition.
- ✓ 10. Phần 10: RAG với OpenAI GPT Models.
- ✓ 11. Phần 11: Làm việc với Unstructured Data.
- ✓ 12. Phần 12: Multimodal RAG.
- ✓ 13. Phần 13: Project - Starbucks Financial Data.
- ✓ 14. Phần 14: Agentic RAG.
- ✓ 15. Đi đâu từ đây.