[Data Engineer] ETL là gì, từ khái niệm đến thực tế

[Data Engineer] ETL là gì, từ khái niệm đến thực tế

ETL là viết tắt của ba chữ Extract – Transform – Load . Trong các hệ thống dữ liệu, ETL là hoạt động để vận chuyển dữ liệu từ một điểm gốc (source) đến một điểm đến (destination). Thông thường, dữ liệu ở điểm gốc sẽ lớn hơn và lộn xộn hơn dữ liệu ở…

[Covid 19] – API Dữ liệu Covid19 theo tỉnh thành

[Covid 19] – API Dữ liệu Covid19 theo tỉnh thành

Sau khi post bài viết race chart về số lượng ca covid19 ở tâm dịch, có nhiều bạn hỏi mình lấy nguồn dữ liệu từ đâu? Mình xin được chia sẻ dữ liệu mình có. Để xem race chart số ca ở tâm dịch hãy xem ở link này nhé:https://tuananalytic.com/race-chart-bieu-do-so-ca-covid19-o-tam-dich/ Có thể lấy dữ liệu…

[Race chart] – Biểu đồ số ca Covid19 ở tâm dịch

[Race chart] – Biểu đồ số ca Covid19 ở tâm dịch

Biểu đồ số ca ở các tâm dịch, TP. Hồ Chí Minh (Sài Gòn), Bắc Giang, Hà Nội,… Tính đến ngày 11-07-2021. Dịch không có dấu hiệu dừng lại ở sài gòn Biểu đồ chạy trên Youtube https://www.youtube.com/embed/YWvtZTpkYdY Biểu đồ trên nền web Cases of covid in Vietnam big cities Run again

Tài liệu tự học Python – Data Science

Tài liệu tự học Python – Data Science

Mình xin chia sẻ một tài liệu bao gồm hơn 800+ trang tên là Python notes for professional. Giúp các bạn đang tự học Python có thể tra cứu nhanh chóng. Các bạn chỉ cần tải tài liệu về, và chọn mục mà mình muốn tham khảo trong tài liệu. Tài liệu được phát hành…

Hàm LAG và LEAD trong SQL

Hàm LAG và LEAD trong SQL

Hôm nay mình sẽ hướng dẫn các bạn sử dụng Hàm LAG và Hàm LEAD với ví dụ cụ thể để truy vấn dữ liệu theo dạng time-series ( dòng thời gian ). Định nghĩa Hàm LAG và LEAD trong SQL server Hàm LAG là 1 window function  cho phép bạn truy vấn một hoặc…

Scroll to Top