インライン展開するかどうか含めて
最適化はコンパイラ依存

パフォーマンス測定やチューニングは
実際の環境でやらないと

可能性で言えばマクロが一番インライン展開の可能性が高い
(コンパイラが賢すぎて同一コードを共有するとかない限り)