473さん、ご回答ありがとうございます。
説明不足でも申し訳ありません。実は「ゼロから作るDeep Learning」は既に購入しております。
学習過程で使用した書籍を記載させていただきます。正直これらもなんとか読んだ状態です。

Python言語によるプログラミングイントロダクション
入門 Python 3
ゼロから作るDeep Learning
MLP深層学習
MLP画像認識

ゼロから作るDeep Learningは一月ほどかけてすべてのプログラムを走らせなんとか概要が分かるようになりました。
RasPiいじりから入りAnacondaに移行してpytorchの導入して取り組んでおります。
FastAIやQiitaを参考にしながらMNIST, cifar-10, catsdogsをチュートリアルのサンプルコードと自前コードでそれぞれ作成しました。

webカメラから画像を収集するためにopencvの障りを調べて撮影→キャプチャ
事前学習させた重みをdictから読ませて分類するところまではこぎつけました。

撮影画像から特定の物体だけを抽出するために検出に取り掛かったのですが
R-CNNやらFaster-R-CNN,yolo,SSDと盛りだくさんでハードルが高かったので基礎から読み返してます。
MLPの画像認識でバウンディングボックスの仕組みを分かった気でいたものの実装となるとさっぱりでした。
素人なもので、OPENCVや画像処理関係を適当に手を出してる状態です。