いや、やねうら王の方法は重要な特徴量である駒割りをスタート時点から使っていて
その駒割りは人間の棋譜を元に得られたものだから
残念ながら「人間の棋譜を用いずに評価関数の学習に成功」とは厳密には言えない
AlphaGo Zeroとは別物
駒割り0の状態から学習スタートしてAlphaGO Zeroより早く公開していたなら
文句無しで凄い成果だった