SYSTEM AND METHOD FOR SCHEDULING INSTRUCTIONS IN A MULTITHREAD SIMD ARCHITECTURE WITH A FIXED NUMBER OF REGISTERS
http://www.freepatentsonline.com/y2019/0179798.html

AMDのGPU向けの新しいパテント。
要点はWaveというAMD GPUのスレッド単位をそれぞれスコアリングしてシェーダー振り分けの最適化を行う。
もう一歩踏み込むと各Waveが必要な量のGPUレジスタを前もって把握し、同時に走るWave数と優先度をスコアリングに応じてインテリジェントなスケジューリングを行う。

これどこで行うかが難しくて、デバイスドライバ(CPU)でやればハードウェアは簡易さを維持できる。
かわりにハードウェアの利用状況を見ながらの動的なスケジュール最適化は制限される。
逆にハードウェア(GPU)側で行わせると複雑になってしまうが最適化幅は大きい。
パテント見るとCPU+GPUのようなので中間か。

RDNAのRX 5000シリーズ登場直前に出てきたのでまあそういう事なのだろう。
Waveの単位はGCNで64要素・RDNAで32要素、ハードウェアのSIMD要素は現在16となっている。
そのためRDNAの方が細かくて最適化要素は大きいと思われる。
なかなか難しいアプローチではあるがかなりの高速化が望める。
スコアリングが洗練されるようになってからが本領発揮となるのかもしれない。