Tin mới nhất

Menu

Browsing "Older Posts"

Bài Viết Về Chủ Đề " Chroma "

Chia Sẻ Khóa Học RAG Dành Cho Các Chuyên Gia Với LangGraph, Python & OpenAI [Khóa 5623 A]

23 tháng 11 2025 / No Comments

Xây dựng các hệ thống AI sẵn sàng cho production cho các tài liệu kinh doanh nội bộ bằng LangChain, LangGraph, OpenAI, Chroma và Python.

Những gì bạn sẽ học được:

  • ✓ Giải thích RAG là gì, tại sao cần có nó và khi nào nó vượt trội hơn các LLM thông thường.
  • ✓ Thiết kế các giải pháp RAG Doanh nghiệp của riêng bạn cho Document & Knowledge base.
  • ✓ Sử dụng LangChain để xây dựng các Chatbot, Summarization Pipeline & RAG chain.
  • ✓ Sử dụng LangGraph để thiết kế các agentic AI Workflow dựa trên graph.
  • ✓ Load, split và chunk Document có nhiều loại và kích cỡ khác nhau một cách hiệu quả.
  • ✓ Áp dụng các chiến lược Summarization khác nhau (Stuff, Map-Reduce, Refine).
  • ✓ Tạo Embedding và sử dụng các Vector Store (FAISS, Chroma) cho Retrieval.
  • ✓ Evaluate & tune các chiến lược Retrieval (similarity, thresholds, MMR, multi-query).
  • ✓ Quản lý Vector Store với Metadata để lọc và tìm kiếm mạnh mẽ.
  • ✓ Xây dựng một Chroma vector DB động, persistent từ đầu.
  • ✓ Triển khai các Vector DB update tự động dựa trên File & Metadata Change.
  • ✓ Swap các LLM, Embedding và Vector DB để đáp ứng nhu cầu về Quyền riêng tư và Khả năng mở rộng.

Xây dựng các hệ thống RAG cấp doanh nghiệp thực tế, không chỉ là các demo đơn giản.

Các Large Language Model (LLM) như ChatGPT rất mạnh mẽ – nhưng bản thân chúng không thể hiểu rõ các tài liệu, chính sách hoặc báo cáo của công ty bạn. Đó là lúc Retrieval Augmented Generation (RAG) phát huy tác dụng.

Trong khóa học này, bạn sẽ học từng bước cách xây dựng các ứng dụng RAG chuyên nghiệp, có thể tùy chỉnh hoàn toàn bằng Python bằng LangChain, LangGraph, OpenAI và Chroma – được thiết kế riêng cho Dữ liệu kinh doanh nội bô, Knowledge và Document.

Bạn sẽ không chỉ sao chép một ví dụ đơn giản và nhận được "một số" kết quả - bạn sẽ hiểu mọi Building Block: Loading & Chunking Document, Embedding, Vector Database, các chiến lược Retrieval, các phương pháp Summarization, Conversational Memory và Update tự động cho Vector Store của bạn.

Cuối cùng, bạn sẽ có thể thiết kế, điều chỉnh và mở rộng các Enterprise RAG Pipeline của riêng mình một cách tự tin.

Điều gì làm cho khóa học này khác biệt?

Hầu hết các hướng dẫn RAG đều dừng lại sau phần demo đơn giản "đặt câu hỏi về PDF này". Khóa học này đi sâu hơn vào nhiều cấp độ:

1. RAG bên trong một agentic AI Framework lớn hơn:

Bạn sẽ tích hợp RAG vào LangChain và LangGraph, để nó có thể trở thành một công cụ trong một AI Agent lớn hơn, có thể quyết định khi nào nên sử dụng RAG – và khi nào thì áp dụng các tool hoặc workflow khác. Đây chính là cách các hệ thống Agentic AI hiện đại được xây dựng trong thực tế.

2. Giải thích đầy đủ, có thể tùy chỉnh hoàn toàn:

Mỗi bước đều được giải thích chi tiết:

  • ✓ Nhiều cách để load & split Document.
  • ✓ Các chiến lược Summarization khác nhau (Stuff, Map-Reduce, Refine).
  • ✓ Một số chiến lược Retrieval và trade-off của chúng.
  • ✓ Các lựa chọn thay thế và tùy chọn ở mỗi bước.

Bạn sẽ luôn thấy lý do tại sao phải làm điều gì đó, điều gì có thể xảy ra sai và cách điều chỉnh sao cho phù hợp với trường hợp sử dụng của riêng bạn.

3. Các update động, được tự động  – production, not prototype:

Các công ty thực sự không có tệp PDF tĩnh. Các tệp tin thay đổi liên tục.

Bạn sẽ xây dựng một hệ thống có thể:

  • ✓ Phát hiện những thay đổi về nội dung và Metadata trong Document và Folder.
  • ✓ Tự động Update Embedding và Vector trong ChromaDB.
  • ✓ Giữ cho RAG System của bạn đồng bộ với các document repository thực tế của bạn.

Đây là loại workflow bạn cần cho các kịch bản Doanh nghiệp.

4. Các Easily swappable Component (LLM, Embeddings, Vector DB, hosting):

  • ✓ Bởi vì mọi thứ đều được built trên LangChain và LangGraph, hệ thống của bạn được thiết kế theo dạng module:
  • ✓ Swap OpenAI for Azure OpenAI hoặc nhà cung cấp khác.
  • ✓ Change Embedding Model cho data privacy tốt hơn.
  • ✓ Replace Chroma với một Vector DB mạnh hơn nếu cơ sở người dùng của bạn phát triển.
  • ✓ Điều chỉnh prompt, retriever và memory mà không cần viết lại mọi thứ.

Bạn không bị giới hạn bởi một nhà cung cấp hoặc một toy stack duy nhất.

5. Kịch bản Enterprise document thực tế:

  • ✓ Bạn sẽ làm việc với một cấu trúc thư mục phức tạp và nhiều loại file: PDF, Word, PowerPoint, Text, CSV, Mixed directory.
  • ✓ Đây chính xác là loại dữ liệu hỗn tạp, không đồng nhất mà bạn sẽ thấy trong các tổ chức thực tế.

Những gì bạn sẽ xây dựng:

  • ✓ Trong suốt khóa học, bạn sẽ:
  • ✓ Tạo một Chatbot cơ bản với LangChain và OpenAI.
  • ✓ Triển khai các Document Summarization Pipeline cho các file nhỏ và rất lớn.
  • ✓ Xây dựng RAG Chain đầu tiên của bạn với FAISS và LangChain.
  • ✓ Thêm các chiến lược Retrieval như similarity search, threshold và MMR.
  • ✓ Sử dụng LangGraph để tạo một Chatbot dựa trên đồ thị với Memory.
  • ✓ Mở rộng nó thành một Agentic Workflow, trong đó RAG có thể là một tool trong số các tool khác.
  • ✓ Load và xử lý nhiều document và format từ các thư mục.
  • ✓ Tạo và vận hành một Chroma Vector Database động.
  • ✓ Triển khai Metadata-based search & filtering (theo document, page, date, v.v.).
  • ✓ Phát hiện các file change và tự động nhúng lại các Document đã cập nhật.
  • ✓ Kết hợp tất cả lại thành một hệ thống RAG có khả năng tùy chỉnh, mở rộng, tự cập nhật và sẵn sàng cho doanh nghiệp.

Mục lục:

  • ✓ 01. Bắt đầu.
  • ✓ 02. Cài đặt Python - Thiết lập môi trường Coding cho khóa học này.
  • ✓ 03. Truy cập vào OpenAI API.
  • ✓ 04. LangChain & OpenAI Basic: Tạo một ChatBot đơn giản bằng Python.
  • ✓ 05. Document Summarization với LangChain & OpenAI.
  • ✓ 06. Giới thiệu về Retrieval Augmented Generation (RAG) với LangChain & OpenAI.
  • ✓ 07. LangGraph Basic - Xây dựng một Graph ChatBot với Memory.
  • ✓ 08. Làm việc với nhiều Document & File Type.
  • ✓ 09. Tạo một Dynamic Vector Database với Chroma.
  • ✓ 10. Automated dynamic VectorDB Update với Chroma & Python.
  • ✓ 11. Kết hợp mọi thứ lại, nhiều tính năng & mẹo và thủ thuật hơn.

Khóa học này dành cho:

  • ✓ Các Data Scientist, ML Engineer và Developer muốn xây dựng các hệ thống RAG thực.
  • ✓ Chuyên gia AI/Analytics trong Doanh nghiệp làm việc với các internal knowledge base, report, manual hoặc document repository.
  • ✓ Các Technical Product Manager & Architect đang lập kế hoạch các công cụ hỗ trợ LLM cho Q&A & Summarization.
  • ✓ Người dùng Python nâng cao muốn hiểu LangChain, LangGraph và Vector Database theo cách có cấu trúc và thực hành.


NHẬN GET EBOOK TRÊN AMAZON THEO YÊU CẦU 



Copyright Disclaimer:
This site does not store any files on its server. We only index and link to content provided by other sites. Please contact the content providers to delete copyright contents if any and email us, we'll remove relevant links or contents immediately.
Tuyên bố miễn trừ bản quyền:
Trang web này không lưu trữ bất kỳ tệp nào trên máy chủ của nó. Chúng tôi chỉ lập chỉ mục và liên kết đến nội dung được cung cấp bởi các trang web khác. Vui lòng liên hệ với các nhà cung cấp nội dung để xóa nội dung bản quyền nếu có và gửi email cho chúng tôi, chúng tôi sẽ xóa các liên kết hoặc nội dung có liên quan ngay lập tức.