んーデータベースや蓄積フロー自体があるんなら
とりあえずコピーしてpythonでpandasをnumpyするあたりからはじめてみて
イケそうなら独自の情報基盤構築検討の方向性じゃないか
異常値検出本は難しいのが多いから、前処理大全とかかね。あれpython/r/sql併記だし