Skip to content

Instantly share code, notes, and snippets.

@longtth
Last active June 12, 2021 11:16
Show Gist options
  • Save longtth/6f2ec607c9ac21501bc7ee38c5344a18 to your computer and use it in GitHub Desktop.
Save longtth/6f2ec607c9ac21501bc7ee38c5344a18 to your computer and use it in GitHub Desktop.

Filter input (là file csv) theo quy tắc:

  • nếu OUTLET VISIT ID là duy nhất, lấy
  • nếu OUTLET VISIT ID là trùng lặp (ví dụ: L080341096 bên dưới), lấy dòng có OUTLET VISIT DATE lớn nhất
  • nếu OUTLET VISIT ID chỉ trùng phần code, có thêm phần "đuôi" như cái L080341126 và cái L080341126-2021-06-12-1 vẫn tính là trùng lặp

chú ý

file csv có thể có 1,000,000 dòng trở lên

input

OUTLET VISIT ID,OUTLET VISIT DATE,TEAM ID,USER ID,OUTLET VISIT SOURCE TYPE
L080341013,2021-05-01,NORTH_Tuan Tuyet,21C00135,Đã lên lịch & Được phân công
L080341096,2021-05-01,NORTH_Tuan Tuyet,21C00135,Đã lên lịch & Được phân công
L080341096,2021-05-02,NORTH_Tuan Tuyet,21C00135,Đã lên lịch & Được phân công
L080341123,2021-05-01,NORTH_Tuan Tuyet,21C00135,Đã lên lịch & Được phân công
L080341126,2021-05-01,NORTH_Tuan Tuyet,21C00135,Đã lên lịch & Được phân công
L080341126-2021-06-12-1,2021-05-06,NORTH_Tuan Tuyet,21C00135,Đã lên lịch & Được phân công
L080341127,2021-05-01,NORTH_Tuan Tuyet,21C00135,Đã lên lịch & Được phân công

output

OUTLET VISIT ID,OUTLET VISIT DATE,TEAM ID,USER ID,OUTLET VISIT SOURCE TYPE
L080341013,2021-05-01,NORTH_Tuan Tuyet,21C00135,Đã lên lịch & Được phân công
L080341096,2021-05-02,NORTH_Tuan Tuyet,21C00135,Đã lên lịch & Được phân công
L080341123,2021-05-01,NORTH_Tuan Tuyet,21C00135,Đã lên lịch & Được phân công
L080341126-2021-06-12-1,2021-05-06,NORTH_Tuan Tuyet,21C00135,Đã lên lịch & Được phân công
L080341127,2021-05-01,NORTH_Tuan Tuyet,21C00135,Đã lên lịch & Được phân công
@longtth
Copy link
Author

longtth commented Jun 12, 2021

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment