>>703
UTF-8 は以下のように、先頭ニブル・4ビットで、1〜4バイト文字を判別している

1バイト文字: 0000〜0111: 0〜7

多バイト文字の2バイト目以降
1000〜1011: 8〜11(8〜B)

2バイト文字: 1100〜1101: 12〜13(C〜D)
3バイト文字: 1110: 14(E)
4バイト文字: 1111: 15(F)

Unicode → UTF-8

1バイト文字(数字・アルファベット)
U+0000 〜 U+007F 0xxx xxxx

2バイト文字(アラビア文字)
U+0080 〜 U+07FF 110x xxxx 10xx xxxx

3バイト文字(ひらがな・漢字)
U+0800 〜 U+FFFF 1110 xxxx 10xx xxxx 10xx xxxx

4バイト文字(難漢字)
U+10000 〜 U+10FFFF 1111 0xxx 10xx xxxx 10xx xxxx 10xx xxxx

BOM = "\uFEFF"
→ EF BB BF