Skip to content

Instantly share code, notes, and snippets.

@behitek
Last active April 3, 2019 03:56
Show Gist options
  • Save behitek/ef625ddb7a290a90b5b1a1a82d19fc4b to your computer and use it in GitHub Desktop.
Save behitek/ef625ddb7a290a90b5b1a1a82d19fc4b to your computer and use it in GitHub Desktop.
Fix some vietnam error encoding
à,à
ằ,ằ
ầ,ầ
è,è
ề,ề
ì,ì
ò,ò
ồ,ồ
ờ,ờ
ù,ù
ừ,ừ
ỳ,ỳ
á,á
ắ,ắ
ấ,ấ
é,é
ế,ế
í,í
ó,ó
ố,ố
ớ,ớ
ú,ú
ứ,ứ
ý,ý
ả,ả
ẳ,ẳ
ẩ,ẩ
ẻ,ẻ
ể,ể
ỉ,ỉ
ỏ,ỏ
ổ,ổ
ở,ở
ủ,ủ
ử,ử
ỷ,ỷ
ã,ã
ẵ,ẵ
ẫ,ẫ
ẽ,ẽ
ễ,ễ
ĩ,ĩ
õ,õ
ỗ,ỗ
ỡ,ỡ
ũ,ũ
ữ,ữ
ỹ,ỹ
ạ,ạ
ặ,ặ
ậ,ậ
ẹ,ẹ
ệ,ệ
ị,ị
ọ,ọ
ộ,ộ
ợ,ợ
ụ,ụ
ự,ự
ỵ,ỵ
À,À
Ằ,Ằ
Ầ,Ầ
È,È
Ề,Ề
Ì,Ì
Ò,Ò
Ồ,Ồ
Ờ,Ờ
Ù,Ù
Ừ,Ừ
Ỳ,Ỳ
Á,Á
Ắ,Ắ
Ấ,Ấ
É,É
Ế,Ế
Í,Í
Ó,Ó
Ố,Ố
Ớ,Ớ
Ú,Ú
Ứ,Ứ
Ý,Ý
Ả,Ả
Ẳ,Ẳ
Ẩ,Ẩ
Ẻ,Ẻ
Ể,Ể
Ỉ,Ỉ
Ỏ,Ỏ
Ổ,Ổ
Ở,Ở
Ủ,Ủ
Ử,Ử
Ỷ,Ỷ
Ã,Ã
Ẵ,Ẵ
Ẫ,Ẫ
Ẽ,Ẽ
Ễ,Ễ
Ĩ,Ĩ
Õ,Õ
Ỗ,Ỗ
Ỡ,Ỡ
Ũ,Ũ
Ữ,Ữ
Ỹ,Ỹ
Ạ,Ạ
Ặ,Ặ
Ậ,Ậ
Ẹ,Ẹ
Ệ,Ệ
Ị,Ị
Ọ,Ọ
Ộ,Ộ
Ợ,Ợ
Ụ,Ụ
Ự,Ự
Ỵ,Ỵ
private static String[] findChars = new String[]{"à", "ằ", "ầ", "è", "ề", "ì", "ò", "ồ", "ờ", "ù", "ừ", "ỳ", "á", "ắ", "ấ", "é", "ế", "í", "ó", "ố", "ớ", "ú", "ứ", "ý", "ả", "ẳ", "ẩ", "ẻ", "ể", "ỉ", "ỏ", "ổ", "ở", "ủ", "ử", "ỷ", "ã", "ẵ", "ẫ", "ẽ", "ễ", "ĩ", "õ", "ỗ", "ỡ", "ũ", "ữ", "ỹ", "ạ", "ặ", "ậ", "ẹ", "ệ", "ị", "ọ", "ộ", "ợ", "ụ", "ự", "ỵ", "À", "Ằ", "Ầ", "È", "Ề", "Ì", "Ò", "Ồ", "Ờ", "Ù", "Ừ", "Ỳ", "Á", "Ắ", "Ấ", "É", "Ế", "Í", "Ó", "Ố", "Ớ", "Ú", "Ứ", "Ý", "Ả", "Ẳ", "Ẩ", "Ẻ", "Ể", "Ỉ", "Ỏ", "Ổ", "Ở", "Ủ", "Ử", "Ỷ", "Ã", "Ẵ", "Ẫ", "Ẽ", "Ễ", "Ĩ", "Õ", "Ỗ", "Ỡ", "Ũ", "Ữ", "Ỹ", "Ạ", "Ặ", "Ậ", "Ẹ", "Ệ", "Ị", "Ọ", "Ộ", "Ợ", "Ụ", "Ự", "Ỵ"};
private static String[] repChars = new String[]{"à", "ằ", "ầ", "è", "ề", "ì", "ò", "ồ", "ờ", "ù", "ừ", "ỳ", "á", "ắ", "ấ", "é", "ế", "í", "ó", "ố", "ớ", "ú", "ứ", "ý", "ả", "ẳ", "ẩ", "ẻ", "ể", "ỉ", "ỏ", "ổ", "ở", "ủ", "ử", "ỷ", "ã", "ẵ", "ẫ", "ẽ", "ễ", "ĩ", "õ", "ỗ", "ỡ", "ũ", "ữ", "ỹ", "ạ", "ặ", "ậ", "ẹ", "ệ", "ị", "ọ", "ộ", "ợ", "ụ", "ự", "ỵ", "À", "Ằ", "Ầ", "È", "Ề", "Ì", "Ò", "Ồ", "Ờ", "Ù", "Ừ", "Ỳ", "Á", "Ắ", "Ấ", "É", "Ế", "Í", "Ó", "Ố", "Ớ", "Ú", "Ứ", "Ý", "Ả", "Ẳ", "Ẩ", "Ẻ", "Ể", "Ỉ", "Ỏ", "Ổ", "Ở", "Ủ", "Ử", "Ỷ", "Ã", "Ẵ", "Ẫ", "Ẽ", "Ễ", "Ĩ", "Õ", "Ỗ", "Ỡ", "Ũ", "Ữ", "Ỹ", "Ạ", "Ặ", "Ậ", "Ẹ", "Ệ", "Ị", "Ọ", "Ộ", "Ợ", "Ụ", "Ự", "Ỵ"};
static int charLen = findChars.length;
public static String window1252ToUTF8(String text) {
for (int i = 0; i < charLen; i++) {
text = text.replaceAll(findChars[i], repChars[i]);
}
return text;
}
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment