Penelitian ini membahas tentang rancang bangun sistem data cleaning untuk dapat mendeteksi duplikasi data yang ada pada master data konsumen Divisi Consumer Care PT XYZ. Metode yang digunakan dalam penelitian ini untuk mendeteksi duplikasi data adalah dengan menerapkan pendekatan metode Sorted Neighbourhood (SNM) dan N-Gram. Sistem data cleaning ini bertujuan membantu user untuk dapat mempermud…