Ebook Data Science at the Command Line [PDF]
Hướng dẫn thực hành này cho thấy mức độ linh hoạt của dòng lệnh có thể giúp bạn trở thành một nhà khoa học dữ liệu hiệu quả hơn. Bạn sẽ tìm hiểu cách kết hợp các công cụ dòng lệnh nhỏ nhưng mạnh mẽ để nhanh chóng lấy, xóa, khám phá và mô hình hóa dữ liệu của bạn.
Để giúp bạn bắt đầu, cho dù bạn đang sử dụng Windows, OS X hay Linux, tác giả Jeroen Janssens sẽ giới thiệu cho bạn về Data Science Toolbox, một môi trường ảo dễ cài đặt được đóng gói với hơn 80 công cụ dòng lệnh.
Khám phá lý do tại sao dòng lệnh là một công nghệ nhanh, có thể mở rộng. Ngay cả khi bạn đã thoải mái xử lý dữ liệu với Python, R, bạn sẽ cải thiện đáng kể quy trình làm việc khoa học dữ liệu của mình bằng cách tận dụng sức mạnh của dòng lệnh.
- + Lấy dữ liệu từ các trang web, API, cơ sở dữ liệu và bảng tính.
- + Thực hiện các thao tác trên văn bản thuần túy, CSV, HTML / XML và JSON.
- + Khám phá dữ liệu, tính toán thống kê mô tả và tạo trực quan hóa.
- + Quản lý quy trình làm việc khoa học dữ liệu của bạn bằng Drake.
- + Tạo các công cụ có thể tái sử dụng từ một lớp và mã Python hoặc R hiện có.
- + Parallelize and distribute data-intensive pipelines using GNU Parallel.
- + Mô hình dữ liệu với các thuật toán giảm kích thước, phân cụm, hồi quy và phân loại.
Copyright Disclaimer:
This site does not store any files on its server. We only index and link to content provided by other sites. Please contact the content providers to delete copyright contents if any and email us, we'll remove relevant links or contents immediately.
Tuyên bố miễn trừ bản quyền:
Trang web này không lưu trữ bất kỳ tệp nào trên máy chủ của nó. Chúng tôi chỉ lập chỉ mục và liên kết đến nội dung được cung cấp bởi các trang web khác. Vui lòng liên hệ với các nhà cung cấp nội dung để xóa nội dung bản quyền nếu có và gửi email cho chúng tôi, chúng tôi sẽ xóa các liên kết hoặc nội dung có liên quan ngay lập tức.
No Comment to " Ebook Data Science at the Command Line [PDF] "