Tin mới nhất

Menu

Chia Sẻ Khóa Học Data Analytics Toolkit Từ Excel Đến Python, R Và Tableau [Khóa 6215 A]

Tổng quan:

Có rất nhiều cách để học data analysis, nhưng một cách thực sự giúp bạn hiểu sâu hơn là xem các phân tích dữ liệu thực tế. Thêm vào đó là việc sử dụng bốn công cụ phân tích để phân tích từng bộ dữ liệu trong năm bộ dữ liệu, và bạn có một cách tuyệt vời để học data analysis. 

Trong Data Analytics Toolkit: Từ Excel đến Python, R và Tableau, đó chính xác là những gì được thực hiện. Dữ liệu từ năm case study đều được phân tích bằng Excel, Tableau, R và Python. Phương pháp này cung cấp một cách độc đáo, toàn diện và chuyên sâu để học data analytics.

Bạn sẽ học cách: Sử dụng Excel, Tableau, R và Python để phân tích dữ liệu từ năm case study.

Ai nên tham gia khóa học này: Bất cứ ai. Có hứng thú tìm hiểu về data analytics thông qua góc nhìn của bốn công cụ khác nhau được áp dụng cho năm case study.

Mô tả bài học:

Bài 1: Bank Data:

Trong bài học đầu tiên này, chúng ta sẽ xem xét một tập dữ liệu cơ bản liên quan đến thông tin ngân hàng, giới thiệu các khái niệm về cả quantitative và qualitative variable. Tập dữ liệu đủ nhỏ và gọn gàng để dễ dàng thao tác trong Excel và phù hợp với các khái niệm cơ bản về chuyển đổi và trực quan hóa dữ liệu của bạn. Việc tạo biểu đồ cột giống hệt nhau trong Excel bằng cách sử dụng pivot tables và trong Tableau minh họa các cấu trúc phân tích dữ liệu song song của hai gói phần mềm này. Tableau giới thiệu thêm ý tưởng "import" dữ liệu của bạn, một điều cơ bản khi sử dụng R và Python nhưng lại xa lạ với người dùng Excel, những người luôn "nhìn thấy" dữ liệu của họ trước mặt.

Bài 2: Quốc gia:

Case study đơn giản này trong Bài 2 nêu bật một số lợi ích chức năng chính của Tableau. Excel tương đối dễ sử dụng và nếu không có lý do rõ ràng để học một gói phần mềm mới, giảng viên (cũng như sinh viên) sẽ chống lại đường cong học tập cần thiết để định hướng cho một gói mới. Case study này sử dụng dữ liệu dễ dàng tải xuống từ internet bao gồm các số liệu thống kê cơ bản cho các quốc gia: GDP, tuổi thọ, tỷ lệ tử vong ở trẻ sơ sinh và dân số.

Ví dụ về dữ liệu ngân hàng bắt đầu với dữ liệu gọn gàng (do đó không cần phải dọn dẹp hay tranh cãi) và giới thiệu biểu đồ cột hoặc biểu đồ thanh cơ bản. Ví dụ về Quốc gia này làm nổi bật quy trình cleaning của data analysis. Đây thường là phần khó khăn nhất của data analysis và là điểm yếu lớn của Excel, thiếu một cách trực tiếp để hợp nhất các tập dữ liệu và remove các observation với các missing value. Thông thường, chúng ta chỉ cần sắp xếp dữ liệu và delete các row bằng tay trong Excel. Trong các package khác, có các hàm và thao tác data cleaning mạnh mẽ. Chúng ta bắt đầu với Tableau và tạo thêm bốn data visualization cơ bản nữa: scatterplot, histogram, boxplot và choropleth hoặc heat map.

Bài 3: Wisconsin Election:

Trong Bài 3, chúng ta sẽ khám phá cách các mô hình bỏ phiếu thay đổi ở Wisconsin giữa các cuộc bầu cử tổng thống năm 2012 và 2016. Năm 2012, đảng viên Dân chủ Barack Obama đã đánh bại đảng viên Cộng hòa Mitt Romney với tỷ lệ cách biệt đáng kể, cả trên toàn quốc và tại Wisconsin. Mặt khác, đảng viên Cộng hòa Donald Trump đã giành chiến thắng ở cả Wisconsin và số phiếu đại cử tri đoàn trước đảng viên Dân chủ Hillary Clinton (mặc dù không phải là tổng số phiếu phổ thông) vào năm 2016. Dựa trên số phiếu bầu cuối cùng, Wisconsin đã trở nên đỏ hơn (nhiều đảng Cộng hòa hơn) giữa năm 2012 và 2016. Chúng tôi tạo ra nhiều đồ họa khác nhau để khám phá cách điều này xảy ra.

Bài 4: COVID-19:

Bài 4 minh họa một hiện tượng gọi là Nghịch lý Simpson, có thể xảy ra khi áp dụng phép tính tổng hợp cho các tập hợp con của một tập dữ liệu. Ngược lại với trực giác (mặc dù không thực sự nghịch lý), phép tính tổng hợp - chẳng hạn như phép tính trung bình - có thể tạo ra một loại kết quả trên phần lớn hoặc thậm chí là tất cả các tập hợp con trong khi tạo ra một kết quả trái ngược trên toàn bộ tập dữ liệu. Trang Wikipedia về Nghịch lý Simpson mô tả một ví dụ đặc biệt hấp dẫn. Cầu thủ bóng chày David Justice có điểm trung bình đánh bóng tốt hơn Derek Jeter vào năm 1995 và 1996, nhưng khi kết hợp tất cả dữ liệu trong hai năm đó thành một tập dữ liệu duy nhất thì lại cho kết quả ngược lại: Điểm trung bình đánh bóng của Derek Jeter tốt hơn trong toàn bộ giai đoạn hai năm.

Trong ví dụ này, chúng ta có dữ liệu về một nhóm người đều mắc COVID-19. Nhìn chung, tỷ lệ tử vong của những người đã tiêm vắc-xin cao hơn so với những người chưa tiêm vắc-xin. Tuy nhiên, nếu chúng ta chia những người trong tập dữ liệu thành hai nhóm tuổi, chúng ta thấy rằng tỷ lệ tử vong của những người chưa tiêm vắc-xin cao hơn ở mỗi nhóm.

Bài 5: Nightingale’s Rose:

Trong Bài 5, chúng tôi tái hiện một visualization trực quan nổi tiếng do nữ điều dưỡng và nhà thống kê Florence Nightingale tạo ra. Đồ họa cho thấy số ca tử vong tại một bệnh viện quân y ở Crimea, được phân chia theo tháng và theo nguyên nhân tử vong. Visualization được chia thành hai khung thời gian: trước khi các biện pháp vệ sinh được cải thiện được thực hiện và sau đó. Mục đích của đồ họa là minh họa rằng các bệnh có thể phòng ngừa đã làm như sau:

  • ✓ Gây ra phần lớn các ca tử vong.
  • ✓ Có thể ngăn ngừa bằng các quy trình vệ sinh cơ bản.

Nightingale đã sử dụng một dạng đồ họa cực kỳ sáng tạo và hấp dẫn được gọi là polar bar chart để hiển thị thông tin này. Trong bài học, bạn sẽ thấy hình ảnh biểu đồ gốc của cô ấy và sau đó chúng ta sẽ tạo lại nó bằng các công cụ trực quan hóa của mình.


NHẬN GET EBOOK TRÊN AMAZON THEO YÊU CẦU 



Copyright Disclaimer:
This site does not store any files on its server. We only index and link to content provided by other sites. Please contact the content providers to delete copyright contents if any and email us, we'll remove relevant links or contents immediately.
Tuyên bố miễn trừ bản quyền:
Trang web này không lưu trữ bất kỳ tệp nào trên máy chủ của nó. Chúng tôi chỉ lập chỉ mục và liên kết đến nội dung được cung cấp bởi các trang web khác. Vui lòng liên hệ với các nhà cung cấp nội dung để xóa nội dung bản quyền nếu có và gửi email cho chúng tôi, chúng tôi sẽ xóa các liên kết hoặc nội dung có liên quan ngay lập tức.

Chia sẽ bài viết lên:

Nhà Sách Tin Học

Chào mừng các bạn đến với Blog Nhà Sách Tin Học. Thông qua Blog này mình muốn chia sẻ đến các bạn những kiến thức về tin học, các tài liệu hay giáo trình mà mình có hoặc siêu tầm được... Mình rất mong được sự ủng hộ nhiệt tình của các bạn bằng cách comment bài viết, chia sẻ bài viết hoặc liên hệ với mình qua blog này! Mình xin cảm ơn!

No Comment to " Chia Sẻ Khóa Học Data Analytics Toolkit Từ Excel Đến Python, R Và Tableau [Khóa 6215 A] "

  • To add an Emoticons Show Icons
  • To add code Use [pre]code here[/pre]
  • To add an Image Use [img]IMAGE-URL-HERE[/img]
  • To add Youtube video just paste a video link like http://www.youtube.com/watch?v=0x_gnfpL3RM