Ebook How Large Language Models Work [Ấn Bản Lần 1, Tháng 6/2025] [PDF, EPUB] [9341E]
Tìm hiểu cách các large language model như GPT và Gemini hoạt động phía sau.
How Large Language Models Work biên soạn nhiều năm nghiên cứu chuyên sâu về Large Language Models thành một phần giới thiệu dễ đọc, tập trung vào cách làm việc với các hệ thống tuyệt vời này. Nó giải thích rõ ràng cách các LLM hoạt động, giới thiệu các kỹ thuật tối ưu hóa để fine-tune chúng và chỉ ra cách tạo các pipeline và quy trình để đảm bảo các ứng dụng AI của bạn hiệu quả và không có lỗi.
Trong How Large Language Models Work, bạn sẽ học cách:
- ✓ Test và evaluate các LLM.
- ✓ Sử dụng human feedback, supervised fine-tuning và Retrieval Augmented Generation (RAG).
- ✓ Giảm thiểu rủi ro về các bad output, high-stakes error và automation bias các Human-computer interaction system.
- ✓ Kết hợp các LLM với ML truyền thống.
How Large Language Models Work được biên soạn bởi các machine learning researcher hàng đầu, họ trình bày cách công nghệ LLM và GPT hoạt động bằng ngôn ngữ dễ hiểu và hấp dẫn với tất cả mọi người.
Về công nghệ:
Các mô hình ngôn ngữ lớn đặt chữ “I” vào “AI”. Bằng cách kết nối các từ, khái niệm và pattern từ hàng tỷ document, các LLM có thể tạo ra các phản hồi giống con người mà chúng ta mong đợi từ các công cụ như ChatGPT, Claude và Deep-Seek. Trong cuốn sách thông tin và giải trí này, các machine learning researcher giỏi nhất thế giới từ sẽ khám phá các khái niệm nền tảng của các LLM, các cơ hội và hạn chế của chúng, cũng như các best practice để kết hợp AI vào các tổ chức và ứng dụng của bạn.
Về cuốn sách:
How Large Language Models Work đưa bạn vào bên trong một LLM, hướng dẫn từng bước cách một natural language prompt trở thành một văn bản hoàn chỉnh rõ ràng, dễ đọc. Được viết bằng ngôn ngữ dễ hiểu, bạn sẽ tìm hiểu cách các LLM được tạo ra, lý do tại sao chúng mắc lỗi và cách bạn có thể thiết kế các giải pháp AI đáng tin cậy. Trên hành trình này, bạn sẽ tìm hiểu cách các LLM "suy nghĩ", cách thiết kế các LLM-powered application như agent và Q&A system, và cách điều hướng các vấn đề về đạo đức, pháp lý và bảo mật.
Bên trong có gì:
- ✓ Tùy chỉnh các LLM cho các ứng dụng cụ thể.
- ✓ Giảm thiểu nguy cơ bad output và bias.
- ✓ Xóa tan những lầm tưởng về LLM.
- ✓ Vượt xa hơn việc xử lý ngôn ngữ.
Về người đọc:
Không yêu cầu kiến thức về các hệ thống ML hoặc AI.
Mục lục:
- ✓ Chương 1. Big Picture: LLM là gì?
- ✓ Chương 2. Tokenizer: Các mô hình ngôn ngữ lớn nhìn thế giới như thế nào.
- ✓ Chương 3. Transformers: Các input trở thành output như thế nào.
- ✓ Chương 4. Cách các LLM learn.
- ✓ Chương 5. Làm thế nào để chúng ta hạn chế hành vi của các LLM?
- ✓ Chương 6. Vượt ra ngoài natural language processing.
- ✓ Chương 7. Những quan niệm sai lầm, giới hạn và khả năng nổi trội của LLM.
- ✓ Chương 8. Thiết kế các giải pháp với các mô hình ngôn ngữ lớn.
- ✓ Chương 9. Vấn đề về đạo đức khi xây dựng và sử dụng các LLM.
LƯU Ý: Pass