複数の音が混ざってるmp3ファイルがあって、時間指定をしてその間にだけ含まれる成分を抽出するAIを作りたいです
時間指定は手動でできるとして、どんなネットワークみたいなものを使えばいいでしょうか?
ざっくりとした手順でいいのでやり方の方針を教えてください