深層学習使い画像から物体検出をする時の1例
とりあえず画像からの物体検出なら
1. 何万枚あるいはそれ以上の画像を用意して
その中に目的となる物体があったら、それを大まかに四角く括るか
またはある程度の精度で輪郭をなぞる
そして、それぞれの四角に「これは何という物体である」という札をつける
(アノテーション)
2. 四角く囲んだら画像内での左上座標と四角形の幅と長さと物体の種類を
XMLファイルに記述する(JSONファイルなどでも良い)
また輪郭をなぞった時はなぞるというか使った多角形座標の数だけ
XMLファイルに記録される
3. 画像と、その上の物体座標を対応させたXMLをまとめて読み込んで
このような画像なら、例えば1000×1000のピクセル数の画像を
数十回の「畳み込み演算」(1000×1000を300×200、220×130、と徐々に減らして行く)を行い
最後は物体の種類数(太陽、雲、J-20、J-31、J-11、J-10、F-3、F-15J、F-2などなどなどこの場合9種)
まで、つまり9×1まで絞り込む
ピクセル上のどの座標とどの座標がどこに組み合わされて次の配列に変換されるかを
数万回の演算で調べ、最も確からしく(最尤法という奴)出力される
最初の画像ピクセル配列からの畳み込みの組み合わせの数値及び途中の配列を、学習器として出力する
ここまでが学習過程である
4. 得られた学習器を使って、インスタントに任意の画像を使って物体を検出できる。
この場合、一度学習器が作られているので一々学習せずに使えるので
コンピュータの性能次第ではあるが、瞬時に物体を検出できる(それでも性能次第では20秒以上掛かったりする)
とは言っても、この畳み込みを使ったCNNだの改良したRNNだのももう幾分古いね
今はトランスフォーマーという手法があって素晴らしい性能を示している
探検
【XF9-1】F-3を語るスレ199【推力15トン以上】
■ このスレッドは過去ログ倉庫に格納されています
468名無し三等兵 (ワッチョイ bb02-5zR4 [106.166.50.77])
2021/05/25(火) 20:57:45.53ID:Xm+P0KCs0■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 高市氏に好感「自民に投票」大幅増 参政などから流入、朝日阪大調査 [蚤の市★]
- イオンがカリフォルニア産米🍚を販売、これが日本の食料安全保障にとって取り返しのつかない一歩になりかねない理由 [パンナ・コッタ★]
- 日テレの男性記者と女性記者が二次会のカラオケBOXでわいせつ行為 NHK記者が撮影、動画が拡散 女性記者「泥酔していて記憶がない」 [Hitzeschleier★]
- 日テレの男性記者と女性記者がカラオケBOXで行為に及び、NHK記者が動画撮影 動画が拡散するも女性記者は「泥酔していて記憶がない」★2 [Ailuropoda melanoleuca★]
- 高市内閣の若い世代の支持率は92.4% FNN世論調査★6 [♪♪♪★]
- 【読売世論調査】野党支持率で国民民主が再び首位、立憲民主・参政は低迷続く… [ぐれ★]
- シンガポールの元外務大臣「台湾よ、アメリカはどうせお前を捨てるだろう。早く再統一したほうが自由の残滓を長く楽しめるぞ」 [838847604]
- 日清食品「かつてないほどの危機感。アメリカでうちのカップラーメン売れないの・・・営業利益-51%、辛ラーメンにも負けてる」 [256556981]
- 10Gbpsを超えて25Gbpsに!新サービス「フレッツ光25G」、来年3月から提供開始 [663766621]
- ㊗🏡今年のとうすこ流行語大賞を決定するスレ🏡㊗
- るるさんとラーメン豚山食べてきた
- 【悲報】ワイ、上司から「お前言葉遣いがムカつく😡」言われた
