黑墨水鱼 heimoshuiyu

初音未来的狗

adejones / python-docx-replace-text-and-retain-style.py

Created April 17, 2019 17:27

 def docx_replace(doc, data):
 	paragraphs = list(doc.paragraphs)
 	for t in doc.tables:
 		for row in t.rows:
 			for cell in row.cells:
 				for paragraph in cell.paragraphs:
 					paragraphs.append(paragraph)
 	for p in paragraphs:
 		for key, val in data.items():
 			key_name = '${{{}}}'.format(key) # use placeholders in the form ${PlaceholderName}

ctlllll / longest_chinese_tokens_gpt4o.py

Created May 13, 2024 19:53

Longest Chinese tokens in gpt4o

	import tiktoken
	import langdetect
	T = tiktoken.get_encoding("o200k_base")

	length_dict = {}

	for i in range(T.n_vocab):
	try:
	length_dict[i] = len(T.decode([i]))
	except: