画像処理 15枚目 [転載禁止]©2ch.net
画像処理プログラミングについて質問、議論を行うスレッドです
・画像処理について素人同士で大激論
・初学者の質問に対してやさしく(的を外れた)解答を与える
・その道の玄人も大歓迎 Windows の GDIplus で PNG 画像を読むと
pixel のデータがオリジナルの PNG 画像と若干値が違うんだけど
こんなバグある? どちらかがカラープロファイルやガンマ値のチャンクを処理してるんだろ チャンクは IHDR と IDAT と IEND しか含まれていない PNG なんです
いま IDAT のダンプして uncompress と filter 通してみて
元データと比較してみたんですが
やっぱり GDIplus が何か変なことしてくれてるみたいです GIMPで作ったXBM画像が白黒反転してねーか? どうもおかしい。 メディアンフィルタを作ってるんだけど?(´・ω・`)
よくあるRGBを別々にソートしてそれぞれの中央値を組み合わせる方法だと参照した
(3x3とかの)ピクセルの中には存在しなかったピクセル値を格納する事になるよね?(´・ω・`)
参照したピクセルの中のRGBの組み合わせをそのまま使わなくてもできあがる画像に
問題はないのかな?(´・ω・`) 気になるというか、オリジナルのデータがインデックスドカラーだと元のパレットに
存在しないピクセル値を使う事になるんで、なんだかなあと思っただけなんだけど?(´・ω・`) 別にクリティカルな条件じゃないよ?(´・ω・`)
元々の画像には使われていなかったピクセル値が使われるというのは
インデックスドカラーでなくても同じだからね?(´・ω・`)
ただ、メディアンには元々の画像環境を壊さずにスムージングできる可能性が
あるのになんでRGBを別々にソートする手法がメジャーなのかな?(´・ω・`)
と思って、まあ、そういう事を聞くのにここ辺りが一番手軽だっただけだよ?(´・ω・`)
>>89
NTSC加重平均でグレスケ化してソートした後、オリジナルのピクセル値を
参照すれば、かなりいい感じになりそうでわあるよね?(´・ω・`)
これでいこうかな?(´・ω・`) もう知ってるだろうけど、
https://www.google.co.jp/search?q=deep+dream&biw=1691&bih=1450&source=lnms&tbm=isch&sa=X&ved=0CAYQ_AUoAWoVChMIgP7mxdLLxwIV0QSOCh2HeAuR
これってどうやってるの?
これと同じことを音声で行うと、面白そうじゃね?
例えばチャー研の音声素材をDBに突っ込んでおいて、
音声や音楽ファイルを読み込んで適用すれば、
自動的に音声MADを生成できるんじゃね? AA自動生成をDCNNでやったら楽しそうじゃない? >>87
昔作ったけど元の色のみを輝度ソートすると色情報が失われるので色の分布によってノイズ状に変なエイリアスが出る
例えば殆どの個所で赤系の色が輝度の中間だけど、微妙に色の揺らぎで青系が中間になるピクセルがあったりすると
そのピクセルだけ違う色で斑状になったりする、特にjpeg画像でテストすると顕著
RGB個別は確かに元の色は失われるけど、結果は安定してて妙なエイリアスも出ないので長年こっちを使っているけど
特に問題は出てないかな 個人的見解だけど、元の中央値フィルタの考え方自体が分布から大きく外れた値の影響を除外した領域の特徴量の抽出にあるから、
意図する処理での特殊な事情がなければ元のピクセルの値が残る事に拘る必要は無い気もします
それでも拘るのであれば、RGBでのメディアン結果を元にカーネル内で最も近い色で置換する方が輝度よりも安定しているかもしれません(未検証)
また前述のノイズ以外では輝度でのソートもRGB個別のソート結果もそれ程見た目は変わりません
また当時自分が調査した限り、写真等の画像処理ソフト分野に限定ですがRGB個別の処理を実装している方が多い多い気がしました フィルタって時点でもとの画素値にないものが出力されるのは当たり前やろアホか フィルタって時点で云々っていう主張はおかしいよな、ものによるとしか言いようが無い 素人考えなんだけど、一色に近い特定のエリア内のノイズを取りたいとき、
予め指定されたエリア内の平均色(?)を計算してから、それから大きく外れる色=ノイズを
計算した平均色に置きかえてやれば、そこそこ自然にノイズが取れるのじゃないかと
思ったのだけど、こんなことをしてくれるプログラムってありませんか?
それとも素人考えで落とし穴がありまくりかなww 素人考えだけど
そういうのはとっくに実現されているでしょうね 素人だけど
それをノイズ除去といって画像処理の一分野だよ 素人だけど
ノイズにはたくさんの種類があるし、よくわかんないのもノイズ 平均値の算出領域を自分で指定してどれだけのメリットがあるかだね。
そのままのことがやりたれば、Photoshopでノイズと見做すピクセルを選択して平均値で塗れば。
Photoshopには色というか領域を選択するための機能も色々あるんだからそんなに大した手間じゃない。 素人だけど、GIMPっていうのがあるよ。
いろいろ試して調べてみないとわからないと思うよ。 101の素人ですが、教えてくださりありがとうございます!
やっぱり当然のようにあるものなのですね スキャン画像で裏写りが出てしまった場合、裏写りが出ているページと、
裏写りとして出ているページの画像を左右反転して、何か演算処理をすることで
裏写りをうまく軽減できないだろうか?
画像が傾いたりして、二枚をぴったりと合わせるのは難しいからアイデア倒れ? ドキュメントスキャナでやってるものがある。
裏表同時にスキャンするからペア判るからね。
傾きだけの問題でもないけど、位置合わせはパターン認識等で良いように頑張るしかないわな。 位置合わせよりも、裏写りのレベル設定が難しそう
特にカラーだとわけわからんw 内積最大値でいいんじゃない?
サブピクセルまで精度求めると大変そう 暇人におすすめのゲーム
http://goo.gl/dlkwgT
20000円貰えるよ >>108
被写体がrigidなので既存手法を使えば高精度で位置合わせ可能。あと取り除きたいもの(裏面)が完全にわかっている状態なのでそれなりに定式化できると思われ とりあえず一番簡単そうな裏写りしたモノクロ画像に特化してgimpで実験
A:裏写りが出た画像、これを綺麗にしたい
B:裏写りの原因となった裏の画像
・Bを左右反転、白黒反転
・AのレイヤーとしてBを上に重ねる
・Bのレイヤーモードを「加算」、不透明度を適切に設定
で、裏写りがそれなりに綺麗に消えました。
問題になりそうなのは
・不透明度を適切に設定、この度合いをどうすれば自動化できるのかわからない
・Aの黒い部分にBの黒い部分が重なる場合、裏写りが出ているとされ、新たな白い裏写りができてしまう >・不透明度を適切に設定、この度合いをどうすれば自動化できるのかわからない
Aが白に近い色で、Bが黒だと裏写りが出ていると判断できるでしょう。
そういうポイントを何箇所か見つけて、他の白レベルぐらいになる数値を求めればどうだろう。
>・Aの黒い部分にBの黒い部分が重なる場合、裏写りが出ているとされ、新たな白い裏写りができてしまう
Aにある限りなく黒に近い部分に一致する所を、予めBから消しておくと問題は出ない。 >>116
ありがとうございます
>>117
でも助かりましたw すべての処理を自動化するのが理想だが、大雑把な所までを人間に指定させて
最後の微調整を自動でするというような画像処理をしているものは多いのだろうか? >>119
ユーザアシスタントは2000年代でオワコンじゃない? これはいい
いいものだw
ttp://blog.onk.ninja/2015/12/24/auto_circle_collage ニュー速で使ってた人がいたけど、不評だったよ
やっぱり単純にOpenCV使うんじゃ手抜きすぎてダメだね
エロに対する執着が足りない ImageJ を使って画像解析をしようとしていますが、
机に置いた紙を斜めから撮った写真の場合、奥にいくほど
画像上での横方向のみかけの長さが短くなりますが、
これを真上から見た座標に直す方法はどうなりますか(あるいはツールはありますか)?
GIMPのパースペクティブを使うことも考えましたが、
大量のファイルがある&画質の問題上、座標を取ってから変換したいです。 マークシートの認識出来るぞコードどこかにないでしょうか bool Mark;
if(GetPixel(X_pos,Y_pos) < 128)
Mark = false;
else
Mark = true;
で、いいんじゃね? プログラムでの結果の座標を修正したいのですが以下の場合はどうすれば良いでしょうか?
ある関数angle()に角度を入力すると画像の中心を基準として画像が回転します。
その回転の基準を好きな位置に変更できるようにしたいです。例えば画像のx,yを基準に等。
こちらで弄れるデータは画像の座標x,yのみ(左上を示す)です。
これで例えば回転基準を0,0や500,500にした場合に画像のx,yをどのように弄れば良いでしょうか?
説明がヘタですみません。 Vexclでcudaのコードを書き直したほうが良いのでは? 正規化相互相関ZNCCはなぜ、画像の平均値を引いているんでしょうか? >>137
こういうこと?
http://navi.cs.kumamoto-u.ac.jp/~koutaki/pukiwiki/index.php?%A5%BC%A5%ED%CA%BF%B6%D1%C0%B5%B5%AC%B2%BD%C1%EA%B8%DF%C1%EA%B4%D8 写真を明るくしようと思ってRGB各8ビットの写真に
論理和で0x444444突っ込んだら
黒っぽいところは白っぽくなったが
グレー系のところがオレンジや青になったぞ
意味わかんねーよ そりゃ0x444444との理論和取ったら意味不明なことになるわ
0x444444って二進数で01000100 01000100 01000100だけど
こんな値と論理和取って何の意味が有るんだか
元の画像のピクセルが0x7F以下であることが確定していて
それで、0x808080と論理和取るってんなら
各ピクセルに0x80足したのと同じことだから意味あるの分かるんだが
でも普通は明るくするのに論理和を使わないよ 色々調べてたらガンマ補正ってのが出てきたんだけど、これって一般的なペイントソフトの明るさ調整のこと? むしろ最初にガンマ補正が出て来ると思うんだが・・・
なぜ謎の論理和をやったのかが理解に苦しむw 書こうと思ったら気がついたか。GIMPにはガンマ補正機能がある。 匿名通信(Tor、i2p等)ができるファイル共有ソフトBitComet(ビットコメット)みたいな、
BitTorrentがオープンソースで開発されています
言語は何でも大丈夫だそうなので、P2P書きたい!って人居ませんか?
Covenantの作者(Lyrise)がそういう人と話したいそうなので、よろしければツイートお願いします
https://twitter.com/Lyrise_al
ちなみにオイラはCovenantの完成が待ち遠しいプログラミングできないアスペルガーw
The Covenant Project
概要
Covenantは、純粋P2Pのファイル共有ソフトです
目的
インターネットにおける権力による抑圧を排除することが最終的な目標です。 そのためにCovenantでは、中央に依存しない、高効率で検索能力の高いファイル共有の機能をユーザーに提供します
特徴
Covenant = Bittorrent + Abstract Network + DHT + (Search = WoT + PoW)
接続は抽象化されているので、I2P, Tor, TCP, Proxy, その他を利用可能です
DHTにはKademlia + コネクションプールを使用します
UPnPによってポートを解放することができますが、Port0でも利用可能です(接続数は少なくなります)
検索リクエスト、アップロード、ダウンロードなどのすべての通信はDHT的に分散され、特定のサーバーに依存しません
1q 突然ですが
画像処理の雑音の例でよく、インパルス雑音が挙げられていますが、現在で実際にインパルス雑音の除去が必要な場面はどういう画像でしょうか?
特に高発生確率のインパルス雑音がのる場合はどんなときでしょうか? 画像加工について質問なんですが、小顔にしたり目を大きくしたりするアプリでそういった加工をしたら、画像処理の技術で加工されたものかどうかわかるものなんですか? 判るんじゃね
見た目そのものでも人間に判るように
データ上にも不自然さが残る 深層学習でドット絵のような荒い写真を高画質化できるプログラムがGitHubに公開
http://pc.watch.impress.co.jp/docs/news/1017571.html
時々復元に失敗しているけども、すげぇな どっかのスレでアワビを学習させて・・・って話を思い出した
どこだっけ すっかり過疎になったな
機械学習に完全にもってかれた 囲碁…はともかく
認識・拡大・ノイズ除去・グレースケールへの着色etc
だいたいディープラーニングでどうこうって話になってるからね
色々読んでも未だに「教師無し」学習が理解できない…orz 教師なしも教師ありも本質的に同じだぞ
深層学習 Deep Learning (監修:人工知能学会)
これにちょっと書いてあるが、ボルツマンマシンには次元の入出力の区別がない。 今ディープラーニング以外で画像処理で熱心に研究されてるものってなに? 二次元画像処理はもうやれること無くなった感じもするしね
実用的なのは本当にディープラーニングでパターン抽出くらい 二値化画像のラベリングを行っているのですが、
重心は解っており、その重心から、
長手方向の角度と、短手方向の角度を算出したいのですが、
どの様なアルゴリズムが必要でしょうか。
ご教示お願いします。 >>171
ありがとうございます。
ググってみます。 170です
できました。
動画を処理すると。おもしろいです。 >>174
おめでとう!ちなみにどんな用途?差し支えなければ。 ゆくゆくはディープラーニングをやるつもりなんですが、
まずは画像処理の勉強中です
アルゴリズムは全て自作します すっげー基本的な質問で申し訳無いけども、
カメラやモニタの1画素辺りのタテとヨコの比率って、基本的に1:1と考えていいのかな? スケールを書いた水平面を垂直に見下ろして確認してみ カメラで撮った画像ってレンズで歪むよね
スキャナの代わりにと思って紙に書いた絵を撮ってみたが
軽く魚眼してて使い物にならなかった どのレベルを要求するかだが簡易ならともかくちゃんとしたスキャナー代わりにはならんよね
つーかその「軽く魚眼してた」絵すら、もっと歪んだ生データを加工して出力してるかもしれないし