Ebook Generative AI Với Kubernetes - Triển Khai AI infrastructure An Toàn Để Cung Cấp Các Ứng Dụng AI Đáng Tin Cậy [Ấn Bản Lần 1, Tháng 2/2025] [PDF, EPUB] [9397E]
Trong vài năm qua, chúng ta đã chứng kiến những bước tiến nhảy vọt trong ML và gần đây nhất là generative AI. Các công ty và team software đang nhanh chóng cải tiến, rebuild và tạo ra các dịch vụ phần mềm mới với trí thông minh mới này. Khi họ đổi mới và tạo ra những trải nghiệm mới thú vị cho khách hàng, những thách thức mới nảy sinh. Hiểu cách các ứng dụng này hoạt động và cách sử dụng các công cụ cơ sở hạ tầng tiên tiến như Kubernetes sẽ giúp các tổ chức và chuyên gia thành công với công nghệ mới này.
Cuốn sách bao gồm các triển khai kỹ thuật thiết yếu từ các nền tảng của ML thông qua các chiến lược triển khai nâng cao, tập trung vào các mô hình thực tế. Các chủ đề cốt lõi bao gồm Kubernetes-native GPU scheduling và resource management, MLOps pipeline architecture sử dụng Kubeflow/MLflow và các model serving pattern nâng cao. Cuốn sách trình bày chi tiết về các data management architecture, vector database và hệ thống RAG, cùng với các giải pháp monitoring bằng Prometheus/Grafana. Cuối cùng, chúng ta sẽ xem xét một số mối quan tâm nâng cao đối với sản xuất trong lĩnh vực bảo mật và độ tin cậy của dữ liệu.
Sau khi đọc cuốn sách này, bạn sẽ được trang bị kiến thức rộng về generative AI pipeline và cách tận dụng Kubernetes để chạy các generative AI workload của bạn ở quy mô lớn trong thế giới thực.
Các tính năng chính:
- ✓ Tìm hiểu cách Kubernetes có thể giúp bạn chạy các generative AI workload.
- ✓ Sử dụng các ví dụ thực hành, bạn sẽ làm việc với các foundational model thực tế và nhiều công cụ và khả năng khác nhau trong hệ sinh thái K8s.
- ✓ Tổng quan sâu rộng về generative AI và Kubernetes trong một cuốn sách.
Bạn sẽ học được gì:
- ✓ Cách đánh giá và so sánh các mô hình cho các ứng dụng và trường hợp sử dụng mới.
- ✓ Kubernetes có thể tăng thêm độ tin cậy và khả năng mở rộng cho các ứng dụng AI của bạn như thế nào.
- ✓ AI delivery pipeline bao gồm những gì và cách bắt đầu một quy trình.
- ✓ Cách các mô hình AI mã hóa từ ngữ và hoạt động với ngôn ngữ tự nhiên.
- ✓ Các kỹ thuật Prompting và refinement có thể cải thiện kết quả như thế nào.
- ✓ Cách sử dụng dữ liệu của riêng bạn để tăng cường phản hồi của AI.
Cuốn sách này dành cho ai:
Cuốn sách này dành cho các team xây dựng các ứng dụng mới hoặc chức năng mới với generative AI, nhưng muốn hiểu rõ hơn về cơ sở hạ tầng cần thiết để đưa ứng dụng AI của họ vào sản xuất. Cuốn sách này cũng dành cho các shared service, infrastructure hoặc cybersecurity team cung cấp các nền tảng và cơ sở hạ tầng cho ứng dụng hoặc phát triển sản phẩm.
Mục lục:
- ✓ Chương 01. Giới thiệu về Generative Artificial Intelligence.
- ✓ Chương 02. Kubernetes cho Generative AI.
- ✓ Chương 03. Giới thiệu về các Foundational Model trên Kubernetes.
- ✓ Chương 04. Làm việc với các Foundational Model.
- ✓ Chương 05. Process & Pipelines.
- ✓ Chương 06. Process & Pipelines trên Kubernetes.
- ✓ Chương 07. Quản lý dữ liệu cho Generative AI.
- ✓ Chương 08. Refining & Improving Results.
- ✓ Chương 09. Observability & Monitoring.
- ✓ Chương 10. Bảo mật ML/GenAI Pipelines trên K8s.
LƯU Ý: Pass mở file pdf là mật khẩu giải nén chung của tài liệu !