ParadoxV5 · October 20, 2025 06:58 · ParadoxV5 · Nov 12, 2024
diff --git a/魔塔语.rb b/魔塔语.rb
 # ### 问：大五码系列和ＧＢ系列的字节长度“兼容”吗？
 # 大五码系列用一或两个字节编码一个字符，而最新的 GB 18030 用一、二或四个。
 # * 大五和ＧＢ的单字节范围都是 `00`–`7F`；大于这个范围的字节才表示多节的编码。
 # * GB 18030 特有的驷节编码通过 `30`–`39` 范围的第二节辨识；这个范围小于大五*和ＧＢ*的双节编码的第二节范围。
 # 排除上面后，大五码系列除了错误之外的双字节均对应ＧＢ系列的双字节————虽然有些大五范围超出了ＧＢ范围。

 puts ARGV.map { it
  .encode(Encoding::Big5_HKSCS) # 大五码・香港增补字符集
  .force_encoding(Encoding::GB18030) # 信息技术　中文编码字符集（码位最新最全）
  .encode(Encoding.default_external)
 }
	# ### 问：大五码系列和ＧＢ系列的字节长度“兼容”吗？
	# 大五码系列用一或两个字节编码一个字符，而最新的 GB 18030 用一、二或四个。
	# * 大五和ＧＢ的单字节范围都是 `00`–`7F`；大于这个范围的字节才表示多节的编码。
	# * GB 18030 特有的驷节编码通过 `30`–`39` 范围的第二节辨识；这个范围小于大五和ＧＢ的双节编码的第二节范围。
	# 排除上面后，大五码系列除了错误之外的双字节均对应ＧＢ系列的双字节————虽然有些大五范围超出了ＧＢ范围。

	puts ARGV.map { it
	.encode(Encoding::Big5_HKSCS) # 大五码・香港增补字符集
	.force_encoding(Encoding::GB18030) # 信息技术　中文编码字符集（码位最新最全）
	.encode(Encoding.default_external)
	}
字节一	字节二	码位数	对应的 UCS 码位
A1–A7	40–7E	7×63 = 441	E4C6–E744（断续）
AA–AF	A1–FE	6×94 = 564	E000–E233
F8	A1–FE	1×94 = 94	E234–E291
F9	A1–D5	1×53 = 53	E292–E2C6