Chia Sẻ Khóa Học Xây Dựng Một Ứng Dụng RAG Trong Go (Golang) [Khóa 5342 A]
Tìm hiểu Retrieval-Augmented Generation bằng cách xây dựng nó bằng ngôn ngữ Go thuần túy, sử dụng bất kỳ mô hình nào tương thích với OpenAI - local hoặc hosted.
Những điều bạn sẽ học:
- ✓ Cách một RAG pipeline hoạt động từ đầu đến cuối: chunking, embedding, vector search, query rewriting, context injection & streaming generation.
- ✓ Cách thiết kế các Go interface sao cho LLM, embedder và vector store có thể hoán đổi cho nhau mà không cần thay đổi phần còn lại của codebase.
- ✓ Cách stream các LLM token đến một terminal và đến một browser với Server-Sent Events.
- ✓ Cách chạy mọi thứ với OpenAI, Ollama, LM Studio hoặc Groq - và cách kết hợp chúng (ví dụ: hosted chat với các local embedding).
- ✓ Cách sử dụng Postgres + pgvector cho production-grade vector search, bao gồm HNSW index và embedding-dimension migration.
- ✓ Cách nhập tài liệu một cách chủ động với fsnotify, debouncing half-written file và idempotent re-ingest.
- ✓ Cách handle multimodal content: image upload, vision-model captioning & image rendering trong chat.
Xây dựng một hệ thống RAG chuyên nghiệp bằng Go - Từ Zero đến Streaming Chat.
Tìm hiểu Retrieval-Augmented Generation bằng cách xây dựng nó bằng ngôn ngữ Go thuần túy, sử dụng bất kỳ mô hình nào tương thích với OpenAI - local hoặc hosted.
Đừng chỉ đọc về RAG nữa, hãy bắt tay vào xây dựng nó ngay. Trong khóa học thực hành này, bạn sẽ xây dựng một hệ thống Retrieval-Augmented Generation hoàn chỉnh, từ đầu đến cuối, sử dụng ngôn ngữ lập trình Go. Không Python. Không LangChain. Không có các lớp trừu tượng phức tạp. Chỉ có code Go rõ ràng, dễ hiểu, bạn có thể đọc, chỉnh sửa và làm chủ.
Khi hoàn thành khóa học, bạn sẽ có một ứng dụng hoạt động bao gồm một streaming terminal chat REPL, một chat UI dựa trên browser với token-by-token Server-Sent Events, file & image upload, một background filesystem watcher tự động thu thập tài liệu, công cụ đánh giá scores retrieval quality và một Postgres + pgvector backend chạy trong Docker.
Tại sao nên chọn khóa học này?
Hầu hết các hướng dẫn về RAG đều giấu những phần thú vị đằng sau một framework. Bạn chỉ cần nối ba dòng code từ thư viện của người khác lại với nhau, nó hoạt động, và bạn chẳng hiểu chuyện gì vừa xảy ra. Khi có lỗi xảy ra trong môi trường sản xuất, và chắc chắn sẽ có, bạn sẽ bị mắc kẹt.
Khóa học này áp dụng cách tiếp cận ngược lại. Mỗi component được xây dựng một cách rõ ràng, với sự kết nối rõ ràng giữa các khái niệm để bạn có thể thấy chính xác nơi mà LLM client kết thúc và vector store bắt đầu. package layout map trực tiếp với các chương bài giảng. Các interface giữa LLM, embedder, vector store, retriever, chat loop và web server được cố tình phơi bày, cho phép bạn thay thế các thành phần trong quá trình luyện tập.
Đây chính là khóa học mà tôi ước gì đã có khi tôi học RAG.
Những gì bạn sẽ xây dựng:
- ✓ Một ứng dụng RAG nhỏ nhưng thực tế với đầy đủ các phần của một hệ thống production:
- ✓ Một streaming chat REPL (Read-Eval-Print Loop) trong terminal với một "thinking" spinner & proper history management.
- ✓ Một web chat UI built với chi, Go template và Tailwind, streaming token đến browser qua SSE với in-browser markdown rendering.
- ✓ Một background filesystem watcher, phát hiện các tài liệu mới, chunk chúng, embed chúng và upsert chúng vào pgvector - sau đó di chuyển các bản gốc ra khỏi vị trí cần thiết.
- ✓ Một synchronous file upload path trên web UI để nhập dữ liệu bằng thao tác kéo và thả với chunk-count feedback.
- ✓ Một image upload pipeline với tùy chọn auto-captioning bởi một vision-capable model, được gửi trở lại trình duyệt và hiển thị trực tiếp trong khung chat.
- ✓ Một paragraph-aware chunker với configurable size & overlap.
- ✓ Một query rewriter giúp chuyển đổi multi-turn conversation thành một search query độc lập trước khi truy xuất.
- ✓ Một retriever với cosine-similarity filtering, top-K hit selection và các pluggable backend.
- ✓ Một pgvector + Postgres 18 vector store với idempotent migration, HNSW indexing và một delete-by-source path giúp giữ cho quá trình nhập lại dữ liệu luôn clean.
Những điều bạn sẽ học được:
- ✓ Cách một RAG pipeline hoạt động từ đầu đến cuối: chunking, embedding, vector search, query rewriting, context injection & streaming generation.
- ✓ Cách thiết kế các Go interface sao cho LLM, embedder và vector store có thể hoán đổi cho nhau mà không cần thay đổi phần còn lại của codebase.
- ✓ Cách stream các LLM token đến một terminal và đến một browser với Server-Sent Events.
- ✓ Cách chạy mọi thứ với OpenAI, Ollama, LM Studio hoặc Groq - và cách kết hợp chúng (ví dụ: hosted chat với các local embedding).
- ✓ Cách sử dụng Postgres + pgvector cho production-grade vector search, bao gồm HNSW index và embedding-dimension migration.
- ✓ Cách nhập tài liệu một cách chủ động với fsnotify, debouncing half-written file và idempotent re-ingest.
- ✓ Cách handle multimodal content: image upload, vision-model captioning & image rendering trong chat.
- ✓ Làm thế nào để debug câu hỏi "Tại sao mô hình không sử dụng tài liệu của tôi?"
Điều gì làm cho khóa học này khác biệt?
- ✓ Code thực, không phải code giả. Mọi ví dụ trong khóa học đều được lấy từ một project đang hoạt động và có thể chạy được.
- ✓ Local-first. Bạn có thể hoàn thành toàn bộ khóa học với Ollama trên laptop của mình. Không cần trả phí API.
- ✓ Khóa học đề cập đến những hạn chế đã biết (chunker không nhận diện token, thao tác xóa rồi cập nhật không mang tính giao dịch, việc truy xuất hình ảnh dựa trên mô tả) để bạn hiểu được không gian thiết kế, chứ không chỉ một câu trả lời cố định.
Bộ công nghệ bạn sẽ sử dụng:
Go, Postgres 18, pgvector, Docker Compose, chi router, Go templates, Tailwind, Server-Sent Events, fsnotify, các API tương thích với OpenAI (hoạt động với OpenAI, Ollama, LM Studio, Groq và các API khác).
Kết quả khóa học
Sau khi hoàn thành khóa học này, bạn sẽ có một ứng dụng RAG chất lượng portfolio chạy trên máy của mình, hiểu sâu sắc cách thức hoạt động của từng layer và tự tin áp dụng cùng kiến trúc đó vào một sản phẩm thực tế tại nơi làm việc. Bạn sẽ biết cần đo lường những gì, cần thay thế những gì và cần giữ nguyên những gì.
Đăng ký ngay và bắt đầu xây dựng hệ thống RAG của riêng bạn ngay hôm nay.
Mục lục:
- ✓ 1. Giới thiệu.
- ✓ 2. Bắt đầu.
- ✓ 3. Thiết lập Vector Store.
- ✓ 4. Add Document vào Vector Store.
- ✓ 5. Triển khai Retrieval Augmented Generation (RAG).
- ✓ 6. Thiết lập một Web App.
- ✓ 7. Những cân nhắc khi triển khai.
Khóa học này dành cho:
- ✓ Các Go developer muốn hiểu về các ứng dụng AI mà không cần thay đổi ngôn ngữ lập trình ưa thích của họ.
- ✓ Các Python AI engineer muốn xem RAG trông như thế nào mà không cần một frameworkche giấu cơ chế hoạt động.
- ✓ Các Backend Engineer đang cân nhắc sử dụng RAG cho một sản phẩm thực tế và muốn có một mô hình tư duy rõ ràng về các phần hoạt động.
- ✓ Sinh viên và người tự học muốn học hiệu quả nhất bằng cách xây dựng hơn là đọc sách.
NHẬN GET EBOOK TRÊN AMAZON THEO YÊU CẦU
.png)