Created
November 21, 2019 07:46
-
-
Save behitek/f8c86770c744d77fb756c6b0f6e60933 to your computer and use it in GitHub Desktop.
Replace teencode in text
This file contains hidden or bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
public static String processLine(String line) { | |
double r = Math.random(); | |
line = line.replaceAll("\\binb\\b", "inbox") | |
.replaceAll("\\bkô\\b", "không") | |
.replaceAll("\\bđtqg\\b", "đội tuyển quốc gia") | |
.replaceAll("\\bđag\\b", "đang") | |
.replaceAll("\\bvoz\\b", "vê ô dét") | |
.replaceAll("\\bhqua\\b", "hôm qua") | |
.replaceAll("\\bmọe\\b", "mẹ") | |
.replaceAll("\\bxog\\b", "mẹ") | |
.replaceAll("\\bu[hk]\\b", "mẹ") | |
.replaceAll("\\bnhoé\\b", "nhé") | |
.replaceAll("\\bbiet\\b", "nhé") | |
.replaceAll("\\bthich\\b", "nhé") | |
.replaceAll("\\bquí\\b", "nhé") | |
.replaceAll("\\bstk\\b", "nhé") | |
.replaceAll("\\bwá\\b", "nhé") | |
.replaceAll("\\bquịt\\b", "nhé") | |
.replaceAll("\\bcùg\\b", "cùng") | |
.replaceAll("\\bhong kong\\b", "hồng_kông") | |
.replaceAll("ð", "đ") | |
// .replaceAll("\\bđươc\\b", "được") | |
// .replaceAll("\\bqá\\b", "quá") | |
// .replaceAll("\\bnghành\\b", "ngành") | |
// .replaceAll("\\bnvqs\\b", "nghĩa vụ quân sự") | |
// .replaceAll("\\bngừoi\\b", "người") | |
// .replaceAll("\\btrog\\b", "trong") | |
// .replaceAll("\\btgian\\b", "thời gian") | |
// .replaceAll("\\bbiêt\\b", "biết") | |
// .replaceAll("\\bcũg\\b", "cũng") | |
// .replaceAll("\\bfải\\b", "phải") | |
// .replaceAll("\\bmịe\\b", "mẹ") | |
// .replaceAll("\\bnguời\\b", "người") | |
// .replaceAll("\\btđn\\b", "thế đéo nào") | |
// .replaceAll("\\bbth\\b", "bình thường") | |
// .replaceAll("\\bvcđ\\b", "vãi cả đái") | |
// .replaceAll("\\btgdd\\b", "thế giới di động") | |
// .replaceAll("\\bkhg\\b", "không") | |
// .replaceAll("\\bnhưg\\b", "nhưng") | |
// .replaceAll("\\bthpt\\b", "trung học phổ thông") | |
// .replaceAll("\\bthằg\\b", "thằng") | |
// .replaceAll("\\bmoá\\b", "má") | |
// .replaceAll("\\bđuợc\\b", "được") | |
// .replaceAll("\\b[đd]c\\b", "được") | |
// .replaceAll("\\bae\\b", "anh em") | |
// .replaceAll("\\btrc\\b", "trước") | |
// .replaceAll("hlv", "huấn luyện viên") | |
// .replaceAll("\\b[aà]h\\b", "à") | |
// .replaceAll("\\bcmt\\b", "comment") | |
// .replaceAll("\\bngta\\b", "người ta") | |
// .replaceAll("\\bku\\b", "cu") | |
// .replaceAll("\\bthým\\b", "thím") | |
// .replaceAll("\\bonl\\b", "online") | |
// .replaceAll("\\bzô\\b", "dô") | |
// .replaceAll("\\bzậy\\b", "vậy") | |
// .replaceAll("\\bzú\\b", "vú") | |
// .replaceAll("\\bđhs\\b", "đéo hiểu sao") | |
// .replaceAll("\\bp{5,}\\b", "") | |
// .replaceAll("\\ba{5,}\\b", "") | |
// .replaceAll("\\bt{5,}\\b", "") | |
// .replaceAll("\\btks\\b", "thanks") | |
// .replaceAll("\\bvk\\b", "vợ") | |
// .replaceAll("\\bck\\b", "chồng") | |
// .replaceAll("\\bib\\b", "inbox") | |
// .replaceAll("\\b[dđ]km\\b", "đê ca mờ") | |
// .replaceAll("\\bcmnd\\b", "chứng minh nhân dân") | |
// .replaceAll("\\bhnay\\b", "hôm nay") | |
// .replaceAll("\\bvs\\b", "với") | |
// .replaceAll("\\bcmnr\\b", "con mẹ nó rồi") | |
// .replaceAll("\\bcmn\\b", "con mẹ nó") | |
// .replaceAll("\\bntn\\b", "như thế nào") | |
// .replaceAll("\\bsđt\\b", "số điện thoại") | |
// .replaceAll("\\bklq\\b", "không liên quan") | |
// .replaceAll("\\bvkl\\b", "vê ca lờ") | |
// .replaceAll("(\\d+) ?tr\\b", "$1 triệu"); | |
.replaceAll("(\\d+) ?tr\\b", "$1 triệu"); | |
if (r < 0.5) { | |
line = line.replaceAll("\\b[dđ]m\\b", "địt mẹ") | |
// .replaceAll("\\b[dđ]mm\\b", "địt mẹ mày") | |
.replaceAll("\\b[dđ]cm\\b", "địt con mẹ") | |
// .replaceAll("\\bvl\\b", "vãi lồn") | |
// .replaceAll("\\bsml\\b", "sờ mờ lờ") | |
// .replaceAll("\\bvcl\\b", "vãi cả lồn") | |
// .replaceAll("\\bvc\\b", "vãi chưởng") | |
.replaceAll("\\blol\\b", "lồn"); | |
} else { | |
line = line.replaceAll("\\b[dđ]m\\b", "đờ mờ") | |
.replaceAll("\\b[dđ]cm\\b", "đờ cờ mờ") | |
// .replaceAll("\\b[dđ]mm\\b", "đờ mờ mờ") | |
// .replaceAll("\\bvl\\b", "vê lờ") | |
// .replaceAll("\\bvcl\\b", "vê ca lờ") | |
// .replaceAll("\\bsml\\b", "ét mờ lờ") | |
// .replaceAll("\\bvc\\b", "vờ cờ") | |
.replaceAll("\\blol\\b", "lờ o lờ"); | |
} | |
return line; | |
} |
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment