x86 の SIMD 最適化はアセンブラでもそう難しくなかったから、
調子に乗って arm でも SIMD のコード書こうとしたらなんか難しくてやめたの思い出した
アセンブラは一発完動しないととてもめんどくさい