Tin mới nhất

Menu

Ebook AI System Performance Engineering - Tối Ưu Hóa Model Training & Inference Workload Với GPU, CUDA & PyTorch [Ấn Bản Lần 1, Tháng 12/2025] [PDF] [9123E]

Nâng cao các khả năng hiệu suất hệ thống AI của bạn với hướng dẫn toàn diện này để tối đa hóa hiệu quả trên mọi layer của cơ sở hạ tầng AI. Trong kỷ nguyên của các generative model ngày càng phát triển hiện nay, "AI System Performance Engineering" cung cấp cho các kỹ sư, nhà nghiên cứu và nhà phát triển một bộ chiến lược về tối ưu hóa thực tế. Học cách tối ưu hóa đồng thời phần cứng, phần mềm và thuật toán để xây dựng các hệ thống AI mạnh mẽ, có khả năng mở rộng và tiết kiệm chi phí, hoạt động xuất sắc cả trong training và inference. Được viết bởi một nhà lãnh đạo kỹ thuật và sản phẩm tập trung vào hiệu suất, tài liệu này biến các hệ thống AI phức tạp thành các giải pháp AI tinh gọn, có tác động cao.

Bên trong cuốn sách, bạn sẽ khám phá các phương pháp từng bước để tinh chỉnh GPU CUDA kernel, các thuật toán dựa trên PyTorch và các hệ thống multinode training & inference. Bạn cũng sẽ nắm vững nghệ thuật về scaling các GPU cluster cho các high performance, distributed model training job và inference server. Cuốn sách kết thúc với một danh sách checklist hơn 175 mục gồm các tối ưu hóa đã được chứng minh và sẵn sàng sử dụng.

  • ✓ Codesign và tối ưu hóa đồng thời phần cứng, phần mềm và thuật toán để đạt được hiệu suất tối đa và tiết kiệm chi phí.
  • ✓ Áp dụng các chiến lược inference tiên tiến giúp giảm độ trễ và tăng thông lượng trong môi trường thực tế.
  • ✓ Sử dụng các công cụ và framework hàng đầu trong ngành cho khả năng mở rộng.
  • ✓ Profile, diagnose và eliminate các performance bottleneck trong các AI pipeline phức tạp.
  • ✓ Tích hợp các kỹ thuật full stack optimization để đạt được hiệu suất hệ thống AI mạnh mẽ và đáng tin cậy.

Mục lục:

  • ✓ Chương 01. Giới thiệu và Tổng quan về AI System.
  • ✓ Chương 02. Tổng quan về AI System Hardware.
  • ✓ Chương 03. OS, Docker & Kubernetes Tuning cho các môi trường dựa trên GPU.
  • ✓ Chương 04. Tuning Distributed Networking Communication.
  • ✓ Chương 05. GPU-Based Storage I/O Optimization.
  • ✓ Chương 06. Kiến trúc GPU, Lập trình CUDA và Tối đa hóa Occupancy.
  • ✓ Chương 07. Profiling & Tuning GPU Memory Access Pattern.
  • ✓ Chương 08. Occupancy Tuning, Warp Efficiency & Instruction-Level Parallelism.
  • ✓ Chương 09. Tăng CUDA Kernel Efficiency & Arithmetic Intensity.
  • ✓ Chương 10. Intra-Kernel Pipelining, Warp Specialization & Cooperative Thread Block Cluster.
  • ✓ Chương 11. Inter-Kernel Pipelining, Synchronization & CUDA Stream-Ordered Memory Allocation.
  • ✓ Chương 12. Dynamic Scheduling, CUDA Graphs & Device-Initiated Kernel Orchestration.
  • ✓ Chương 13. Profiling, Tuning & Scaling PyTorch.
  • ✓ Chương 14. PyTorch Compiler, OpenAI Triton & XLA Backend.
  • ✓ Chương 15. Multinode Inference, Parallelism, Decoding & Routing Optimization.
  • ✓ Chương 16. Profiling, Debugging & Tuning Inference at Scale.
  • ✓ Chương 17. Scaling Disaggregated Prefill & Decode for Inference.
  • ✓ Chương 18. Prefill-Decode nâng cao & KV Cache Tuning.
  • ✓ Chương 19. Dynamic & Adaptive Inference Engine Optimization.
  • ✓ Chương 20. AI-Assisted Performance Optimization & Scaling Toward Multimillion GPU Cluster.
  • ✓ Phụ lục. AI Systems Performance Checklist (Hơn 175 Item).


LƯU Ý: Pass mở file pdf là mật khẩu giải nén chung của tài liệu !


NHẬN GET EBOOK TRÊN AMAZON THEO YÊU CẦU




Copyright Disclaimer:
This site does not store any files on its server. We only index and link to content provided by other sites. Please contact the content providers to delete copyright contents if any and email us, we'll remove relevant links or contents immediately.
Tuyên bố miễn trừ bản quyền:
Trang web này không lưu trữ bất kỳ tệp nào trên máy chủ của nó. Chúng tôi chỉ lập chỉ mục và liên kết đến nội dung được cung cấp bởi các trang web khác. Vui lòng liên hệ với các nhà cung cấp nội dung để xóa nội dung bản quyền nếu có và gửi email cho chúng tôi, chúng tôi sẽ xóa các liên kết hoặc nội dung có liên quan ngay lập tức.

Chia sẽ bài viết lên:

Thẻ bài viết:

Nhà Sách Tin Học

Chào mừng các bạn đến với Blog Nhà Sách Tin Học. Thông qua Blog này mình muốn chia sẻ đến các bạn những kiến thức về tin học, các tài liệu hay giáo trình mà mình có hoặc siêu tầm được... Mình rất mong được sự ủng hộ nhiệt tình của các bạn bằng cách comment bài viết, chia sẻ bài viết hoặc liên hệ với mình qua blog này! Mình xin cảm ơn!

No Comment to " Ebook AI System Performance Engineering - Tối Ưu Hóa Model Training & Inference Workload Với GPU, CUDA & PyTorch [Ấn Bản Lần 1, Tháng 12/2025] [PDF] [9123E] "

  • To add an Emoticons Show Icons
  • To add code Use [pre]code here[/pre]
  • To add an Image Use [img]IMAGE-URL-HERE[/img]
  • To add Youtube video just paste a video link like http://www.youtube.com/watch?v=0x_gnfpL3RM