Tranh thủ đầu tuần mình chia sẻ một source về trực quan hóa dữ liệu ( Data visualization) trong bài post ngắn này. Và đặc biệt hơn source đó đến từ reddit. Một cái tên khá bất ngờ vì ấn tượng đầu tiên của người Việt chúng ta về reddit khá giống 9gag. Tuy nhiên, reddit lại là nơi tập trung rất nhiều chủ đề khác nhau và vui vẻ, giải trí chỉ là 1 phần trong đó.
Table of Contents
Reddit là gì
Để tiết kiệm thời gian mình xin trích dẫn đoạn giới thiệu của Wiki về reddit như sau
Reddit/ˈrɛdɪt/,[4] hay cách điệu là reddit,[5] là một trang web giải trí, dịch vụ giao tiếp xã hội, tin tức xã hội (social news) và tin tức trực tuyến (online newspaper), nơi mà cộng đồng các thành viên đã đăng ký có thể gửi lên nhiều loại nội dung, chẳng hạn như bài đăng chữ hay đường dẫn trực tiếp. Chỉ có các thành viên đăng ký sau đó mới có thể bầu chọn bằng mũi tên lên và mũi tên xuống (có thể coi như “thích” hoặc “không thích”) cho những nội dung được gửi lên để sắp xếp các bài đăng và quyết định vị trí của nó trên các trang của trang web. Các mục nội dung được tổ chức theo lĩnh vực quan tâm gọi là các “subreddit” (các reddit con – phiên bản dịch chính thức gọi là chuyên mục) mà người dùng đăng ký có thể tự do tạo ra cộng đồng thảo luận của riêng mình với bất kì ngôn ngữ nào.
Wiki – Reddit – Wikipedia tiếng Việt
Nói nôm na reddit là một forum platform, tức là cái diễn đàn nhỏ chứa các diễn đàn con, các diễn đàn con này được gọi là những subreddit. Với các sự kiện gần đây chắc các bạn cũng nghe cái tên subreddit Wallstreetbet trên các mặt báo. Ngoài WSB thì reddit còn có những diễn đàn liên quan đến công việc, thú vui cá nhân như, r/datascience, r/businessintelligence ,…
Hôm nay mình muốn giới thiệu đến các bạn một subreddit mới và cực kì thú vị, có thể mang đến ý tưởng cho việc trình bày dữ liệu của các bạn đến đồng nghiệp và sếp. Có bao giờ bạn cảm thấy chán nản với chính bài báo cáo của mình? Với những cái pie chart và table và số liệu khô cứng không có một chút thú vị nào.
Để tránh điều đó mình xin giới thiệu đến các bạn Subreddit r/dataisbeautiful
r/dataisbeautiful
Địa chỉ truy cập subreddit đó ngay tại đây (click vào link): r/dataisbeautiful
Đây là trang subreddit mình truy cập rất nhiều để lấy ý tưởng cho các bài báo cáo, cũng như ý tưởng để tạo ra dashboard. Ban đầu khi bạn lên sub này sẽ rất choáng ngợp. Lý do là vì, có rất nhiều các biểu diễn dữ liệu rất đẹp và kì công, và bạn nghĩ bạn không thể bắt chước hoặc làm lại tương tự được (Mình cũng từng nghĩ vậy).
Tuy nhiên khi bạn thực sự chú ý, bạn sẽ thấy thường những bản biểu diễn dữ liệu cực kì đẹp (với nhiều màu sắc và chi tiết), thì thường không thực dụng cho lắm (không đạt được mục đích công việc – nhưng rất nghệ thuật). Ngược lại những bản biểu diễn đơn giản (nhưng đẹp) thì thường rất hiệu quả.
Mình xin trích dẫn 2 bản biểu diễn dữ liệu trong sub reddit trên và so sánh chúng để bạn hiểu rõ vấn đề này
Tiếng ồn ở San Jose
Như bạn có thể thấy bản đồ san jose với đánh dấu nơi nào ồn hơn nơi nào . Khi nhìn vào, ấn tượng đầu tiên của chúng ta là … nó rất đẹp. Với nhiều các mảng sáng tối, và được bày trí rất cân đối. Tuy nhiên bạn sẽ dễ dàng nhận ra các vấn đề sau:
- Bạn khó so sánh được nơi nào ồn nhất, nơi nào ít ồn nhất (Vì không có xếp hạng từ trên xuống dưới)
- Có quá nhiều địa điểm, nhưng lại quá ít không gian màn hình (Nếu cần thì phải zoom càng bất tiện hơn)
- Để ý các điểm không ồn, nó gần như là các dấu chấm giống nhau… không tài nào phân biệt được và không có tên nữa.
Tất nhiên mình hiểu bản đồ này có thể sử dụng trong 1 số trường hợp, nhưng nếu sử dụng trong 1 buổi họp thì nó sẽ rất mất thời gian để tương tác và chỉ ra điểm cần chú ý -> Không tốt cho buổi họp.
Và sau đây chúng ta đến với một đồ thị đơn giản hơn nhưng rất hiệu quả
Tỉ lệ tăng trưởng lãnh đạo nữ ở các quốc gia
Không cần mô tả nhiều mình xin note ngay các điểm cộng của biểu đồ này. Nó giúp ta:
- Thấy ngay tỉ lệ lãnh đạo nữ ở nước nào cao nhất
- Note các châu lục (Dòng chữ)
- Note tỉ lệ thay đổi so với năm 1997 (Màu đỏ là 1997 xanh là 2020)
- Đồ thị lolipop (cây kẹo) rất phù hợp cho việc biểu diễn thay đổi trong 1 khoảng thời gian nhất định
Rõ ràng với các thông tin trên, cuộc họp sẽ trơn tru hơn vì người tham gia đã biết những điều mình cần biết và có thể nhanh chóng đạt được mục tiêu công việc.
Kết
Tất nhiên các loại biểu diễn khác nhau sẽ phục vụ các mục đích khác nhau. Bạn nên sử dụng sub reddit này để tìm kiếm ý tưởng, từ đó phát triển các trực quan dữ liệu riêng của bản thân. Các bạn cũng nên nhớ chỉ nên tham khảo kĩ thuật hoặc hình ảnh ở sub reddit này thôi, còn dữ liệu chỉ mang tính chất tham khảo.
Vậy là mình đã giới thiệu cho các bạn source để tìm kiếm ý tưởng data visualization rồi. Nếu các bạn thích có thể like và subscribe và follow mình để update các bài viết mới nhất của mình nhé :D/