[Data Engineer] ETL là gì, từ khái niệm đến thực tế
ETL là viết tắt của ba chữ Extract – Transform – Load . Trong các hệ thống dữ liệu, ETL là hoạt động để vận chuyển dữ liệu từ một điểm gốc (source) đến một điểm đến (destination). Thông thường, dữ liệu ở điểm gốc sẽ lớn hơn và lộn xộn hơn dữ liệu ở…
[Covid 19] – API Dữ liệu Covid19 theo tỉnh thành
Sau khi post bài viết race chart về số lượng ca covid19 ở tâm dịch, có nhiều bạn hỏi mình lấy nguồn dữ liệu từ đâu? Mình xin được chia sẻ dữ liệu mình có. Để xem race chart số ca ở tâm dịch hãy xem ở link này nhé:https://tuananalytic.com/race-chart-bieu-do-so-ca-covid19-o-tam-dich/ Có thể lấy dữ liệu…
[Race chart] – Biểu đồ số ca Covid19 ở tâm dịch
Biểu đồ số ca ở các tâm dịch, TP. Hồ Chí Minh (Sài Gòn), Bắc Giang, Hà Nội,… Tính đến ngày 11-07-2021. Dịch không có dấu hiệu dừng lại ở sài gòn Biểu đồ chạy trên Youtube https://www.youtube.com/embed/YWvtZTpkYdY Biểu đồ trên nền web Cases of covid in Vietnam big cities Run again
Tài liệu tự học Python – Data Science
Mình xin chia sẻ một tài liệu bao gồm hơn 800+ trang tên là Python notes for professional. Giúp các bạn đang tự học Python có thể tra cứu nhanh chóng. Các bạn chỉ cần tải tài liệu về, và chọn mục mà mình muốn tham khảo trong tài liệu. Tài liệu được phát hành…
Hàm LAG và LEAD trong SQL
Hôm nay mình sẽ hướng dẫn các bạn sử dụng Hàm LAG và Hàm LEAD với ví dụ cụ thể để truy vấn dữ liệu theo dạng time-series ( dòng thời gian ). Định nghĩa Hàm LAG và LEAD trong SQL server Hàm LAG là 1 window function cho phép bạn truy vấn một hoặc…
Python rất căn bản – Tài liệu tiếng việt
Download tài liệu tự học Python bằng tiếng việt, học Python để phục vụ data science. Bao gồm hướng dẫn chi tiết việc học và ứng dụng Python.