Ebook Data Engineering Cho Cybersecurity - Xây Dựng Các Data Pipeline An Toàn Với Các Công Cụ Miễn Phí Và Mã Nguồn Mở [Ấn Bản Lần 1, Tháng 8/2025] [PDF, EPUB] [9260E]
Biến nhật ký thô thành thông tin tình báo thực sự.
Các team Bảo mật dựa vào phép đo từ xa, một luồng liên tục các nhật ký, sự kiện, số liệu và tín hiệu cho thấy những gì đang diễn ra trên các hệ thống, endpoint và cloud service. Nhưng dữ liệu đó không tự tổ chức. Nó phải được thu thập, chuẩn hóa, làm giàu và bảo mật trước khi trở nên hữu ích. Đó là lúc data engineering phát huy tác dụng.
Trong hướng dẫn thực hành này, Tác giả là một kỹ sư an ninh mạng sẽ hướng dẫn bạn cách thiết kế và xây dựng các data pipeline an toàn, dễ mở rộng bằng các công cụ mã nguồn mở miễn phí như Filebeat, Logstash, Redis, Kafka, Elasticsearch và nhiều công cụ khác. Bạn sẽ học cách thu thập phép đo từ xa từ Windows, bao gồm các Sysmon & PowerShell event, các Linux file và syslog, cũng như streaming data từ các thiết bị mạng và bảo mật. Sau đó, bạn sẽ chuyển đổi dữ liệu sang các định dạng có cấu trúc, bảo mật dữ liệu khi truyền tải và tự động hóa việc triển khai bằng Ansible.
Bạn cũng sẽ học cách:
- ✓ Mã hóa và bảo mật dữ liệu khi truyền tải bằng TLS và SSH.
- ✓ Quản lý code và tệp cấu hình tập trung bằng Git.
- ✓ Chuyển đổi messy logs thành các event có cấu trúc.
- ✓ Enrich data với threat intelligence bằng Redis và Memcached.
- ✓ Stream và centralize data ở quy mô lớn với Kafka.
- ✓ Tự động hóa với Ansible cho các repeatable deployment.
Cho dù bạn đang xây dựng một pipeline với ngân sách eo hẹp hay triển khai một hệ thống quy mô doanh nghiệp, cuốn sách này sẽ chỉ cho bạn cách tập trung dữ liệu bảo mật, hỗ trợ phát hiện theo thời gian thực và đặt nền tảng cho ứng phó sự cố và giám định pháp y dài hạn.
Mục lục:
- ✓ Phần I: Nền tảng của Data Engineering An toàn:
- ✓ Chương 01. Data Engineering Basic.
- ✓ Chương 02. Network Encryption.
- ✓ Phần II: Log Extraction & Management:
- ✓ Chương 04. Endpoint & Network Data.
- ✓ Chương 05. Windows Logs.
- ✓ Chương 06. Tích hợp và Lưu trữ Dữ liệu.
- ✓ Chương 07. Làm việc với Syslog Data.
- ✓ Phần III: Data Transformation & Standardization:
- ✓ Chương 08. Data Manipulation Pipeline.
- ✓ Chương 09. Transformation Filter.
- ✓ Phần IV: Data Centralization, Automation & Enrichment:
- ✓ Chương 010. Centralizing Security Data.
- ✓ Chương 11. Tự động hóa Tool Configuration.
- ✓ Chương 12. Ansible Tasks & Playbooks.
- ✓ Chương 13. Caching Threat Intelligence Data.