>>100
演算量に対しメモリアクセスの少ないループなら有効ですかね?
↓みたいな。

for(i=0;i<100000000;i++)
 a[i] = sin(b[i]) + cos(b[i]);