HirbodBehnam · January 10, 2022 15:48
diff --git a/unicode-decompose.py b/unicode-decompose.py
 import re
 import json
 fixset = {}
 # Get this file from http://ftp.unicode.org/Public/UNIDATA/UnicodeData.txt
 with open('UnicodeData.txt', 'r') as data:
 	for line in data:
 		lineData = line.split(';')
 		if lineData[5] != '':
 			g = re.search(r'^<.+> (.+)$', lineData[5])
 			if g is not None and g.group(1) is not None:
 				fixed = ""
 				for unicode in g.group(1).split():
 					fixed += chr(int(unicode, 16))
 				fixset[chr(int(lineData[0], 16))] = fixed
 # Pirnt to json for other apps
 with open('decomposition.json', 'w') as decomposition:
 	json.dump(fixset, decomposition, separators=(',', ":"))
 # Fix file
 with open('in.txt', 'r', encoding='utf-8') as input:
 	with open('out.txt', 'w', encoding='utf-8') as output:
 		while True:
 			char = input.read(1)         
 			if not char:
 				break
 			output.write(fixset.get(char, char))
	import re
	import json
	fixset = {}
	# Get this file from http://ftp.unicode.org/Public/UNIDATA/UnicodeData.txt
	with open('UnicodeData.txt', 'r') as data:
	for line in data:
	lineData = line.split(';')
	if lineData[5] != '':
	g = re.search(r'^<.+> (.+)$', lineData[5])
	if g is not None and g.group(1) is not None:
	fixed = ""
	for unicode in g.group(1).split():
	fixed += chr(int(unicode, 16))
	fixset[chr(int(lineData[0], 16))] = fixed
	# Pirnt to json for other apps
	with open('decomposition.json', 'w') as decomposition:
	json.dump(fixset, decomposition, separators=(',', ":"))
	# Fix file
	with open('in.txt', 'r', encoding='utf-8') as input:
	with open('out.txt', 'w', encoding='utf-8') as output:
	while True:
	char = input.read(1)
	if not char:
	break
	output.write(fixset.get(char, char))