C#のコードも改善の余地があるかな。
配列+インデックスでやってるところをCと同じにポインタにすればもう少し(数%くらい?)速くできる気がする。
「godbolt で生成されたマシンコードを見ると、こんな感じです。」と言ってるところのアセンブリリスト43命令だけど試しにポインタにしてみたら https://godbolt.org/z/sKj9vdGT5 33命令になった。