>>858
みたいな事が成立するのは、ひょっとしたら、
UTF-32 で、すべての文字が4バイトで統一されているのかも

Ubuntu は、そうかも知れない

Windows, Java などはUTF-16 で、
2バイトの範囲外ではサロゲートペアで、4バイト文字を使う