深層学習使い画像から物体検出をする時の1例
とりあえず画像からの物体検出なら
1. 何万枚あるいはそれ以上の画像を用意して
その中に目的となる物体があったら、それを大まかに四角く括るか
またはある程度の精度で輪郭をなぞる
そして、それぞれの四角に「これは何という物体である」という札をつける
(アノテーション)
2. 四角く囲んだら画像内での左上座標と四角形の幅と長さと物体の種類を
XMLファイルに記述する(JSONファイルなどでも良い)
また輪郭をなぞった時はなぞるというか使った多角形座標の数だけ
XMLファイルに記録される
3. 画像と、その上の物体座標を対応させたXMLをまとめて読み込んで
このような画像なら、例えば1000×1000のピクセル数の画像を
数十回の「畳み込み演算」(1000×1000を300×200、220×130、と徐々に減らして行く)を行い
最後は物体の種類数(太陽、雲、J-20、J-31、J-11、J-10、F-3、F-15J、F-2などなどなどこの場合9種)
まで、つまり9×1まで絞り込む
ピクセル上のどの座標とどの座標がどこに組み合わされて次の配列に変換されるかを
数万回の演算で調べ、最も確からしく(最尤法という奴)出力される
最初の画像ピクセル配列からの畳み込みの組み合わせの数値及び途中の配列を、学習器として出力する
ここまでが学習過程である
4. 得られた学習器を使って、インスタントに任意の画像を使って物体を検出できる。
この場合、一度学習器が作られているので一々学習せずに使えるので
コンピュータの性能次第ではあるが、瞬時に物体を検出できる(それでも性能次第では20秒以上掛かったりする)
とは言っても、この畳み込みを使ったCNNだの改良したRNNだのももう幾分古いね
今はトランスフォーマーという手法があって素晴らしい性能を示している
探検
【XF9-1】F-3を語るスレ199【推力15トン以上】
■ このスレッドは過去ログ倉庫に格納されています
468名無し三等兵 (ワッチョイ bb02-5zR4 [106.166.50.77])
2021/05/25(火) 20:57:45.53ID:Xm+P0KCs0■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 高市内閣の若い世代の支持率は92.4% FNN世論調査★3 [♪♪♪★]
- 【サッカー】日本代表の南野拓実は左膝前十字靱帯断裂の重傷 全治は明らかにされず フランス杯で負傷 所属先のモナコが発表 [久太郎★]
- H3ロケット8号機打ち上げ失敗、衛星軌道投入できず ★7 [少考さん★]
- 【兵庫】「女性を妊娠させる権利と30万ドル渡す」にだまされ暗号資産50万円相当詐欺被害 西宮市の男性会社員(50) [ぐれ★]
- 日本の労働生産性28位に後退、先進7か国で最下位…デフレやコロナ禍で経済の低成長続く [ぐれ★]
- 【MLB】村上宗隆の『小型契約』は吉田正尚の影響か 市場が思いのほか停滞 「NPB打者に懐疑的。吉田が高すぎた」 [冬月記者★]
- 【高市画像】松屋の完全新作メニュー‼wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww [986198215]
- お前らオススメの不良漫画教えろ
- 駅弁業界ヤバイ「な・ん・で・買ってくれないのぉおおおおおお!」 [592058334]
- 【高市悲報】超有名YouTuber、「米山隆一が逮捕される」というデマ動画が20万回再生、無事訴えられる🥹 [931948549]
- 無職専用のお🏡😪
- アマゾンのアダルト下着のコーナー
