[Data Engineer] ETL là gì, từ khái niệm đến thực tế

ETL là viết tắt của ba chữ Extract – Transform – Load . Trong các hệ thống dữ liệu, ETL là hoạt động để vận chuyển dữ liệu từ một điểm gốc (source) đến một điểm đến (destination). Thông thường, dữ liệu ở điểm gốc sẽ lớn hơn và lộn xộn hơn dữ liệu ở điểm đến do quá trình “biến đổi” (Transform) ở giữa, tuy nhiên cũng có một số trường hợp ngược lại.