従来の (u)pTeX と「付かず離れず」のクリーンな設計を考える。
- 可能な文字コードは全 Unicode 範囲とする。
- 欧文・和文とは関係なく常に「1文字1トークン」とする。(変更)
- これで「1文字1トークンの和文文字の UTF-8 → Unicode 変換結果」と「1バイト1トークンの欧文文字」が 0x80--0xFF で衝突することがなくなる。★
- 文字トークンの区切りが変化することもなくなる=「バッククオートで Unicode 文字直書きからコード取得」は常に安全。
- [TODO] TeX82 の「1文字コントロールシーケンスの特別扱い」(つまり
\a
とa
はバッククオートでのコード取得が同値)は 0--255 のままにできるか?
- 内部バッファの文字コードは固定する。(pTeX の EUC/SJIS は廃止)