Skip to content

Instantly share code, notes, and snippets.

@sertraline
Created November 7, 2020 03:51
Show Gist options
  • Save sertraline/6427b084d5e99e32ce5b0b4a116da30c to your computer and use it in GitHub Desktop.
Save sertraline/6427b084d5e99e32ce5b0b4a116da30c to your computer and use it in GitHub Desktop.
TCVN3 to UTF-8
# TCVN3 to UTF-8
UNICODETAB = [
"À", "Á", "Â", "Ã", "È", "É", "Ê", "Ì", "Í", "Ò",
"Ó", "Ô", "Õ", "Ù", "Ú", "Ý", "à", "á", "â", "ã",
"è", "é", "ê", "ì", "í", "ò", "ó", "ô", "õ", "ù",
"ú", "ý", "Ă", "ă", "Đ", "đ", "Ĩ", "ĩ", "Ũ", "ũ",
"Ơ", "ơ", "Ư", "ư", "Ạ", "ạ", "Ả", "ả", "Ấ", "ấ",
"Ầ", "ầ", "Ẩ", "ẩ", "Ẫ", "ẫ", "Ậ", "ậ", "Ắ", "ắ",
"Ằ", "ằ", "Ẳ", "ẳ", "Ẵ", "ẵ", "Ặ", "ặ", "Ẹ", "ẹ",
"Ẻ", "ẻ", "Ẽ", "ẽ", "Ế", "ế", "Ề", "ề", "Ể", "ể",
"Ễ", "ễ", "Ệ", "ệ", "Ỉ", "ỉ", "Ị", "ị", "Ọ", "ọ",
"Ỏ", "ỏ", "Ố", "ố", "Ồ", "ồ", "Ổ", "ổ", "Ỗ", "ỗ",
"Ộ", "ộ", "Ớ", "ớ", "Ờ", "ờ", "Ở", "ở", "Ỡ", "ỡ",
"Ợ", "ợ", "Ụ", "ụ", "Ủ", "ủ", "Ứ", "ứ", "Ừ", "ừ",
"Ử", "ử", "Ữ", "ữ", "Ự", "ự", "Ỳ", "ỳ", "Ỵ", "ỵ",
"Ỷ", "ỷ", "Ỹ", "ỹ"
]
TCVN3TAB = [
"Aµ", "A¸", "¢", "A·", "EÌ", "EÐ", "£", "I×", "IÝ", "Oß",
"Oã", "¤", "Oâ", "Uï", "Uó", "Yý", "µ", "¸", "©", "·",
"Ì", "Ð", "ª", "×", "Ý", "ß", "ã", "«", "â", "ï",
"ó", "ý", "¡", "¨", "§", "®", "IÜ", "Ü", "Uò", "ò",
"¥", "¬", "¦", "­", "A¹", "¹", "A¶", "¶", "¢Ê", "Ê",
"¢Ç", "Ç", "¢È", "È", "¢É", "É", "¢Ë", "Ë", "¡¾", "¾",
"¡»", "»", "¡¼", "¼", "¡½", "½", "¡Æ", "Æ", "EÑ", "Ñ",
"EÎ", "Î", "EÏ", "Ï", "£Õ", "Õ", "£Ò", "Ò", "£Ó", "Ó",
"£Ô", "Ô", "£Ö", "Ö", "IØ", "Ø", "IÞ", "Þ", "Oä", "ä",
"Oá", "á", "¤è", "è", "¤å", "å", "¤æ", "æ", "¤ç", "ç",
"¤é", "é", "¥í", "í", "¥ê", "ê", "¥ë", "ë", "¥ì", "ì",
"¥î", "î", "Uô", "ô", "Uñ", "ñ", "¦ø", "ø", "¦õ", "õ",
"¦ö", "ö", "¦÷", "÷", "¦ù", "ù", "Yú", "ú", "Yþ", "þ",
"Yû", "û", "Yü", "ü"
]
dct = '§¬n yªu cÇu cÊp giÊy chøng nhËn ®¨ng ký nh∙n hiÖu '
dct = [char for char in dct]
for dct_count, dct_char in enumerate(dct):
for unicode_count, tcvn_char in enumerate(TCVN3TAB):
if dct_char in tcvn_char:
dct[dct_count] = UNICODETAB[unicode_count]
if '−' in dct_char:
dct[dct_count] = 'ư'
if 'μ' in dct_char:
dct[dct_count] = 'à'
dct = ''.join(dct)
print(dct)
# Đơn yêu cầu cấp giấy chứng nhận đăng ký nh∙n hiệu
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment