Skip to content

Instantly share code, notes, and snippets.

@behitek
Created November 21, 2019 07:46
Show Gist options
  • Save behitek/f8c86770c744d77fb756c6b0f6e60933 to your computer and use it in GitHub Desktop.
Save behitek/f8c86770c744d77fb756c6b0f6e60933 to your computer and use it in GitHub Desktop.
Replace teencode in text
public static String processLine(String line) {
double r = Math.random();
line = line.replaceAll("\\binb\\b", "inbox")
.replaceAll("\\bkô\\b", "không")
.replaceAll("\\bđtqg\\b", "đội tuyển quốc gia")
.replaceAll("\\bđag\\b", "đang")
.replaceAll("\\bvoz\\b", "vê ô dét")
.replaceAll("\\bhqua\\b", "hôm qua")
.replaceAll("\\bmọe\\b", "mẹ")
.replaceAll("\\bxog\\b", "mẹ")
.replaceAll("\\bu[hk]\\b", "mẹ")
.replaceAll("\\bnhoé\\b", "nhé")
.replaceAll("\\bbiet\\b", "nhé")
.replaceAll("\\bthich\\b", "nhé")
.replaceAll("\\bquí\\b", "nhé")
.replaceAll("\\bstk\\b", "nhé")
.replaceAll("\\bwá\\b", "nhé")
.replaceAll("\\bquịt\\b", "nhé")
.replaceAll("\\bcùg\\b", "cùng")
.replaceAll("\\bhong kong\\b", "hồng_kông")
.replaceAll("ð", "đ")
// .replaceAll("\\bđươc\\b", "được")
// .replaceAll("\\bqá\\b", "quá")
// .replaceAll("\\bnghành\\b", "ngành")
// .replaceAll("\\bnvqs\\b", "nghĩa vụ quân sự")
// .replaceAll("\\bngừoi\\b", "người")
// .replaceAll("\\btrog\\b", "trong")
// .replaceAll("\\btgian\\b", "thời gian")
// .replaceAll("\\bbiêt\\b", "biết")
// .replaceAll("\\bcũg\\b", "cũng")
// .replaceAll("\\bfải\\b", "phải")
// .replaceAll("\\bmịe\\b", "mẹ")
// .replaceAll("\\bnguời\\b", "người")
// .replaceAll("\\btđn\\b", "thế đéo nào")
// .replaceAll("\\bbth\\b", "bình thường")
// .replaceAll("\\bvcđ\\b", "vãi cả đái")
// .replaceAll("\\btgdd\\b", "thế giới di động")
// .replaceAll("\\bkhg\\b", "không")
// .replaceAll("\\bnhưg\\b", "nhưng")
// .replaceAll("\\bthpt\\b", "trung học phổ thông")
// .replaceAll("\\bthằg\\b", "thằng")
// .replaceAll("\\bmoá\\b", "má")
// .replaceAll("\\bđuợc\\b", "được")
// .replaceAll("\\b[đd]c\\b", "được")
// .replaceAll("\\bae\\b", "anh em")
// .replaceAll("\\btrc\\b", "trước")
// .replaceAll("hlv", "huấn luyện viên")
// .replaceAll("\\b[aà]h\\b", "à")
// .replaceAll("\\bcmt\\b", "comment")
// .replaceAll("\\bngta\\b", "người ta")
// .replaceAll("\\bku\\b", "cu")
// .replaceAll("\\bthým\\b", "thím")
// .replaceAll("\\bonl\\b", "online")
// .replaceAll("\\bzô\\b", "dô")
// .replaceAll("\\bzậy\\b", "vậy")
// .replaceAll("\\bzú\\b", "vú")
// .replaceAll("\\bđhs\\b", "đéo hiểu sao")
// .replaceAll("\\bp{5,}\\b", "")
// .replaceAll("\\ba{5,}\\b", "")
// .replaceAll("\\bt{5,}\\b", "")
// .replaceAll("\\btks\\b", "thanks")
// .replaceAll("\\bvk\\b", "vợ")
// .replaceAll("\\bck\\b", "chồng")
// .replaceAll("\\bib\\b", "inbox")
// .replaceAll("\\b[dđ]km\\b", "đê ca mờ")
// .replaceAll("\\bcmnd\\b", "chứng minh nhân dân")
// .replaceAll("\\bhnay\\b", "hôm nay")
// .replaceAll("\\bvs\\b", "với")
// .replaceAll("\\bcmnr\\b", "con mẹ nó rồi")
// .replaceAll("\\bcmn\\b", "con mẹ nó")
// .replaceAll("\\bntn\\b", "như thế nào")
// .replaceAll("\\bsđt\\b", "số điện thoại")
// .replaceAll("\\bklq\\b", "không liên quan")
// .replaceAll("\\bvkl\\b", "vê ca lờ")
// .replaceAll("(\\d+) ?tr\\b", "$1 triệu");
.replaceAll("(\\d+) ?tr\\b", "$1 triệu");
if (r < 0.5) {
line = line.replaceAll("\\b[dđ]m\\b", "địt mẹ")
// .replaceAll("\\b[dđ]mm\\b", "địt mẹ mày")
.replaceAll("\\b[dđ]cm\\b", "địt con mẹ")
// .replaceAll("\\bvl\\b", "vãi lồn")
// .replaceAll("\\bsml\\b", "sờ mờ lờ")
// .replaceAll("\\bvcl\\b", "vãi cả lồn")
// .replaceAll("\\bvc\\b", "vãi chưởng")
.replaceAll("\\blol\\b", "lồn");
} else {
line = line.replaceAll("\\b[dđ]m\\b", "đờ mờ")
.replaceAll("\\b[dđ]cm\\b", "đờ cờ mờ")
// .replaceAll("\\b[dđ]mm\\b", "đờ mờ mờ")
// .replaceAll("\\bvl\\b", "vê lờ")
// .replaceAll("\\bvcl\\b", "vê ca lờ")
// .replaceAll("\\bsml\\b", "ét mờ lờ")
// .replaceAll("\\bvc\\b", "vờ cờ")
.replaceAll("\\blol\\b", "lờ o lờ");
}
return line;
}
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment