Filter input (là file csv) theo quy tắc:
- nếu
OUTLET VISIT IDlà duy nhất, lấy - nếu
OUTLET VISIT IDlà trùng lặp (ví dụ:L080341096bên dưới), lấy dòng cóOUTLET VISIT DATElớn nhất - nếu
OUTLET VISIT IDchỉ trùng phần code, có thêm phần "đuôi" như cáiL080341126và cáiL080341126-2021-06-12-1vẫn tính là trùng lặp
chú ý
file csv có thể có 1,000,000 dòng trở lên
input
OUTLET VISIT ID,OUTLET VISIT DATE,TEAM ID,USER ID,OUTLET VISIT SOURCE TYPE
L080341013,2021-05-01,NORTH_Tuan Tuyet,21C00135,Đã lên lịch & Được phân công
L080341096,2021-05-01,NORTH_Tuan Tuyet,21C00135,Đã lên lịch & Được phân công
L080341096,2021-05-02,NORTH_Tuan Tuyet,21C00135,Đã lên lịch & Được phân công
L080341123,2021-05-01,NORTH_Tuan Tuyet,21C00135,Đã lên lịch & Được phân công
L080341126,2021-05-01,NORTH_Tuan Tuyet,21C00135,Đã lên lịch & Được phân công
L080341126-2021-06-12-1,2021-05-06,NORTH_Tuan Tuyet,21C00135,Đã lên lịch & Được phân công
L080341127,2021-05-01,NORTH_Tuan Tuyet,21C00135,Đã lên lịch & Được phân công
output
OUTLET VISIT ID,OUTLET VISIT DATE,TEAM ID,USER ID,OUTLET VISIT SOURCE TYPE
L080341013,2021-05-01,NORTH_Tuan Tuyet,21C00135,Đã lên lịch & Được phân công
L080341096,2021-05-02,NORTH_Tuan Tuyet,21C00135,Đã lên lịch & Được phân công
L080341123,2021-05-01,NORTH_Tuan Tuyet,21C00135,Đã lên lịch & Được phân công
L080341126-2021-06-12-1,2021-05-06,NORTH_Tuan Tuyet,21C00135,Đã lên lịch & Được phân công
L080341127,2021-05-01,NORTH_Tuan Tuyet,21C00135,Đã lên lịch & Được phân công
input sample : https://drive.google.com/file/d/1y9exPRUgnxxYo-vmo9j1xwf58qKHNYRU/view?usp=sharing