Created
March 24, 2023 18:59
-
-
Save BillKek/d39c4ed93088a87b15cd76346aae58f4 to your computer and use it in GitHub Desktop.
условие рускости байтов в байтовой строке utf8
This file contains hidden or bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
utf8 -- проамериканский стандарт кодировки букв, где их буквы имеют размер 1 байт, а всё выше 0x80 - чужие буквы и спецсимволы, их размер от 2 до 4 байтов, плюс всякие рушечки для букв. | |
русские буквы имеют первый байт равный 0xD0 или 0xD1, и второй байт тоже чему-то равен. | |
простое не 100% условие для русских букв в байтовом потоке: | |
((ch>=0x80)&&(ch<=0xBF))||(ch==0xD0)||(ch==0xD1) |
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment