CopyMemory が原因みたいだな
*des++=*src++
で単純にコピーすると64bitの方が速いな