Dummy data là dữ liệu giả.
Vậy dữ liệu giả ở đây là gì? Thường thì trong một chương trình hoặc một đoạn code sql hoặc 1 đoạn script python,..v..v… Nếu đoạn code này có một dữ liệu đầu vào và trả về một dữ liệu đầu ra thì điều cốt lõi để đoạn code này chạy được là có dữ liệu đầu vào.
Tuy nhiên có một số trường hợp trong thực tế mà dữ liệu đầu vào chưa tồn tại. Ví dụ bạn đang phát triển một cái app để bán hàng đi chẳng hạn, tuy nhiên vì bạn chưa đưa cái app này lên mạng bao giờ cho nên chưa từng có một người nào đặt hàng cả. Điều này dẫn đến dữ liệu đơn hàng không tồn tại.
Dù vậy, bạn vẫn cần phải chạy thử chương trình này để biết code của bạn chạy được không có bị lỗi không đúng chứ? Ví dụ bạn có một hàm phát_khuyến_mãi(đơn_hàng) mà nó nhận đơn hàng là giá trị và trả về phiếu khuyến mãi, thì bạn phải có một đơn hàng để thử xem có phát được khuyến mãi không.
Như vậy để kiểu thử hàm phát_khuyến_mãi(đơn_hàng) bạn phải tạo một đơn hàng giả bằng tay ( có thể là file text, có thể là json, tuỳ vào input của nhận loại dữ liệu gì) sao đó sử dụng đơn hàng giả này để bỏ vào chạy thử.
Dummy data thường được sử dụng cho Unit testing trong kiểm thử phần mềm.