圧縮・復元 相談室

レス数が900を超えています。1000を超えると表示できなくなるよ。
1デフォルトの名無しさん
垢版 |
NGNG
アルゴリズムは別スレで
2011/12/03(土) 23:20:20.81
話にならんな
2011/12/03(土) 23:24:13.18
>>805
bzip2を知らんのか。
2011/12/03(土) 23:58:56.90
話にならんって言ってんだ
流れを読めよ
2011/12/04(日) 00:04:18.76
>>807
お前Linuxのインストールで躓いたくちだろ。
2011/12/04(日) 00:07:16.85
流れが読めない…
2011/12/04(日) 00:17:57.42
今のLinuxのインストールにどうやって躓く要素があるんだ?
2011/12/04(日) 00:19:41.82
Linuxができないのに圧縮を語るとは世も末。
2011/12/04(日) 00:24:16.25
LHA、ZIP、GZIPをはじめとする圧縮ユーティリティーの大部分はLinuxで開発された。
まずLinuxの勉強からやり直せ。
2011/12/04(日) 00:25:10.02
Linuxは俺が教えた
814デフォルトの名無しさん
垢版 |
2011/12/04(日) 00:28:07.22
これからはLinuxの時代
2011/12/04(日) 00:56:55.25
>>812
えっ
2011/12/04(日) 00:58:14.31
>>786の要望に応えられる圧縮をLinuxで作ってくれよ。
2011/12/04(日) 00:59:28.04
>>815
お前は圧縮ユーティリティーがCUIとして作られたことも知らないのか。
2011/12/04(日) 00:59:33.37
bzip2を知らんのか。
2011/12/04(日) 01:00:20.11
馬鹿には無理
2011/12/04(日) 01:00:53.14
CUI=Linuxだ(キリッ)
2011/12/04(日) 01:03:49.60
>>816
それは車輪の再発明と言って優秀なリソースを分散させる結果となる。
2011/12/04(日) 01:07:07.61
できないんならひっこんでろ。
2011/12/04(日) 01:09:20.06
>>822
bzip2を知らんのか。
2011/12/04(日) 01:11:00.95
できてないじゃん。
2011/12/04(日) 01:13:36.24
最近ム板に変なのが住み着いて、ほとんどのスレが機能しなくなってるのは
なにか対策を考えて欲しい。
もう2chでは無理かね。
2011/12/04(日) 01:13:58.37
>>817
>LHAは、奥村晴彦が開発したアルゴリズムをもとに、吉崎栄泰がMS-DOS向けに開発したもので、1988年にパソコン通信で初公開された。
ttp://ja.wikipedia.org/wiki/LHA
2011/12/04(日) 01:16:49.73
フォントですか?
2011/12/04(日) 03:17:42.97
>>800
だから、やってみろよ。自分が馬鹿だったってわかるから。
2011/12/04(日) 03:29:31.18
>>802
全然違うよ。
JPEGのエンコーダを書いたこともなく、ろくに理解もしないで何言っているの?
統計的性質なんて関係ないから。

>ちゃんと辞書のサイズZって書いてあるだろ。

共有しているなら、辞書がネットワーク上にあったっていいだろ。
ローカルストレージに限定する理由はない。

>ハッシュの先に格納されてるデータがあって、そこのサイズも考慮すれば、それって圧縮できてないよね。

本当に馬鹿だな。
ネットワーク全体で冗長度が下がっていれば、それは圧縮と同じなんだよ。
ハッシュは、辞書の符号化に相当する。
830デフォルトの名無しさん
垢版 |
2011/12/04(日) 06:10:22.03
>>829

>統計的性質なんて関係ないから。
JPEGエンコーダってDCTしてハフマン符号化じゃねーのかよ。
統計的性質使って圧縮してんだろ、馬鹿か?
全然違うって、何が違うか指摘しろよ。議論の基本を知らないのか?

>共有しているなら、辞書がネットワーク上にあったっていいだろ。
>ネットワーク全体で冗長度が下がっていれば、それは圧縮と同じなんだよ。
ならハッシュ値計算してデータをひっぱってくるシステムも、圧縮できているわけだな。
今現在ある全ての画像を一箇所に溜めて、未来に撮影される画像もそこに含まれていれば、圧縮できていると言えるだろうな。
とりあえず、学習データで圧縮アルゴリズム作って、検証用のデータで精度を測るって、基本は理解してるか?
2011/12/04(日) 08:54:51.86

こいつ最高にアホ(AAry
832デフォルトの名無しさん
垢版 |
2011/12/04(日) 09:36:28.61
とりあえず、ハッシュマップの話は飽きたよ。
100枚画像があって、20枚重複してて、実質80枚分のデータだったら、サイズ0.8倍になるのね。

DCTとハッシュマップの間を責めれば圧縮率あがるだろってことでしょ?
2011/12/04(日) 12:21:13.24
>>830
初心者はWindowsでも使ってろ。
2011/12/04(日) 17:45:11.22
>>830
>JPEGエンコーダってDCTしてハフマン符号化じゃねーのかよ。

そうだよ。で、君はJPEGエンコーダぐらい書いたことあるんだよね?
俺はちゃんと0から自作したことあるよ。

>統計的性質使って圧縮してんだろ、馬鹿か?

どこが?
DCTは統計とは関係がないし、ハフマン符号は対象データの中での出現頻度であって、
先の様々な画像の統計的性質とは無関係だよ。
量子化テーブルをどういうものにするかは、ある統計的な性質と関係あるが、
それは画像の統計的性質じゃなくて、人間が見たときに許容できる誤差としての統計的性質。

>全然違うって、何が違うか指摘しろよ。議論の基本を知らないのか?

こんな枯れた技術は議論する価値もないだろ。
調べればわかるし、わからないような馬鹿や、調べることもできないような馬鹿はここに来るな。

最低限、自分のアイデアを自作してみてからここに来い。
その上で、わからないことがあれば、俺様が教えてやる。
2011/12/04(日) 17:46:44.08
webp っていいの?
持ってる jpeg ファイル全部 webp 化して
元の画像捨てても平気?
2011/12/04(日) 18:12:14.39
>>835
お前が今後使うブラウザやビュアが対応しているならいいんじゃね
可逆モードもあるしな。
2011/12/04(日) 18:16:28.65
>>834
>DCTは統計とは関係がないし、ハフマン符号は対象データの中での出現頻度であって、
>先の様々な画像の統計的性質とは無関係だよ。
ん?関係あるよね?
なんでDCTで直行変換かますと、多くの軸の係数が0になるの?
近くのピクセルの色が似てるからだよね。
こーいうのを、人は統計的性質と呼ぶのでは?

>それは画像の統計的性質じゃなくて、人間が見たときに許容できる誤差としての統計的性質。
人の見が感じる違いと2乗誤差は違うから、そこを責めてる話もあるけど。
そこに拘らなければ、まぁ2乗誤差だろうな。
DCT後の軸の係数が小さいところを0に打ち切るだけ。

上の議論は、COS以外の基底を使って、より少ない非ゼロの軸で、2乗誤差を小さくすることが出来ないかって話じゃね?
後ろのハフマン符号化には触れてない。
2011/12/04(日) 18:20:06.53
>>837
まず、答えろよ。
君はJPEGエンコーダぐらい書いたことあるの?ないの?どっち?
お前のレベルに合わせて教えてあげるから。
2011/12/04(日) 18:24:29.29
>>837
>なんでDCTで直行変換かますと、多くの軸の係数が0になるの?

ならないよ。

>DCT後の軸の係数が小さいところを0に打ち切るだけ。

違うよ。

量子化テーブルをなんで使うのかわかってる?
2011/12/04(日) 18:29:21.23
>>839

0になるというか、係数が小さくなるってことな。
それで量子化テーブルの数値がきまってんだろ。馬鹿か?
2011/12/04(日) 18:34:19.38
>>840
小さくならないよ。小さくするために量子化テーブルを使うの。
馬鹿なことを書いて恥をかく前に、JPEGエンコーダぐらい自作しろよ。
基本部分は一日あればできるし、理解も深まるから、こんなスレに書き込んでいるよりずっといいぞ。

それができないような馬鹿なら、この世界に首を突っ込まない方がいい。
2011/12/04(日) 18:37:49.68
>>841
http://ja.wikipedia.org/wiki/%E9%9B%A2%E6%95%A3%E3%82%B3%E3%82%B5%E3%82%A4%E3%83%B3%E5%A4%89%E6%8F%9B
ほら、Wikipediaにのってるよ。
右の画像のDCTみてね!
2011/12/04(日) 18:44:10.50
さらにいうと、どんな画像食わせても、高周波数成分は小さくなる。
この大きさに合わせて量子化テーブルの値が決まってるわけだな。

おまえ、作ったことあんじゃねーの?理解せずにコード書き写しただけ?
2011/12/04(日) 18:51:27.51
>>842
だから何?実際の数値見たことないの?
量子化テーブルが周波数によって数値が違う意味わかってる?
2011/12/04(日) 18:55:04.30
>>843
>この大きさに合わせて量子化テーブルの値が決まってるわけだな。

違うよ。
実際には、高周波成分に大きな値が来ることが多々ある。
低周波の値より、高周波の値の方が無視できるから、量子化テーブルの係数が大きくなるの。
低周波は数値が小さくても無視しない方がいいから、テーブルの係数が小さい。
2011/12/04(日) 18:55:58.56
>>844
大体、低周波数が大きくならないなら、DCTする意味ねーだろ。
ひとつおりこうさんになったな。
2011/12/04(日) 18:57:19.48
>>845
そう。
多々ある。その頻度と、各基底が人の目に影響を与える比率で、係数が決まっている。
2011/12/04(日) 18:57:47.70
>>843
作ったことあるも何も、仕事でやってて、それで飯食っている。
2011/12/04(日) 19:03:34.67
>>846
>大体、低周波数が大きくならないなら、DCTする意味ねーだろ。

JPEGにおいてDCTは高周波成分と低周波成分を分ける意味しかない。
つまり、どの情報を捨てるかというフィルタ(後段の量子化テーブル)を使って、圧縮率を上げている。
(他にも色情報を落とすとかもあるが)
変換誤差があるものの、DCT自体はnear可逆変換なので、それだけでは圧縮にならない。
2011/12/04(日) 19:17:15.10
>>849
そんなはずはない。
色んなソフトで使われてる係数は、「頻度の逆数x視覚への影響」で決まってるはずだぞ。
つまり、基底組み替えた結果、スペクトルに偏りがあるってのは重要なんだよ。

どっかに、量子化係数の決め方の解説があったが、見つからんな。
2011/12/04(日) 19:21:25.29
この話って、そもそも基本なはずだが。

つーか仕事でやってんのに、こーいうの理解してないの?
流石に周波数分離するだけってのはないだろ。
音の圧縮だって同じじゃん。
2011/12/04(日) 19:27:28.31
>>850
>色んなソフトで使われてる係数は、「頻度の逆数x視覚への影響」で決まってるはずだぞ。

頻度じゃなくて、重要度で決まっている。
高周波成分は頻度があっても、基本的には重要ではない。

それこそ量子化テーブルは、画像単位で変えれるが、
ある画像ので低周波成分の頻度やDCT後の数値が低いからと言って、
量子化テーブルの値を大きくできるわけじゃないぞ。
そんなことをしたら悲惨な画像になる。

>つまり、基底組み替えた結果、スペクトルに偏りがあるってのは重要なんだよ。

高周波成分を捨てるために、分けることが重要なだけ。
2011/12/04(日) 19:28:35.66
>>851
JPEGは周波数分離のためにDCTを使っているの。
2011/12/04(日) 19:45:01.33
で、元の問題である、
>>795
>コサイン基底なんか使わずに、10GByte分くらいの過剰な基底を用意しとけば、画像なんか超小さくなるべ!

だが、なんでそうなるんだ?

数値として存在しうる全パターンの基底を用意しても圧縮なんてできんぞ。
どうやるの?

DCTも変換しただけでは圧縮なんてできないのに。
2011/12/04(日) 19:45:03.58
>>852
重要度ってどうやって決めてんの?
2011/12/04(日) 19:52:30.24
>>854
存在しうる全パターンの基底を用意する意味がよく分からんが。

8x8の各ブロックを、常に3個の基底のみの線形和で十分表現できれば、それだけで3/64になる。
2011/12/04(日) 19:53:20.99
>>855
だから、頻度でその重要度が決まってんだろ。
人間の目は、たまにしか出現しないものには鈍感になってんだよ。
2011/12/04(日) 19:54:49.69
>>855
ぶっちゃけ好みの問題。
文字、アニメ絵、写真、CGで、それぞれ変えた方が良い感じになるが、
ほとんどの実装系があんまり気にしないで一般的数値を利用している。
真剣に設定しているのはフォトショップぐらい。

そもそも今時JPEGなんて糞フォーマット、議論する価値もないぞ。
2011/12/04(日) 20:01:18.37
>>856
>8x8の各ブロックを、常に3個の基底のみの線形和で十分表現できれば、それだけで3/64になる。

馬鹿か。できるわけないだろ。
2011/12/04(日) 20:09:43.25
>>859
だから、何故できるわけないのか、理由を答えろよ。
2011/12/04(日) 20:15:58.64
>>860
何故できないのか、わからないから教えて欲しいのか?
それなら口のきき方を改めろよ。
2011/12/04(日) 20:17:16.20
>>861
いいから説明してみ?

>>858
あと、これも回答になってない。
量子化係数の逆数と、スペクトル比較してみろよ。
2011/12/04(日) 20:32:51.64
>>862
>いいから説明してみ?

尊大な馬鹿に説明してやる義理はないな。

>量子化係数の逆数と、スペクトル比較してみろよ。

そんなものは画像による。
「DCT後の数値が高い=重要」ではないの。
平坦な画像では、低周波成分に集中するのと、低周波成分が重要だから
DCT後の数値が高いところと、量子化係数が低いところが、たまたま一致する傾向があるだけ。

DCT後の数値は、大きくても、小さくても、低周波なら重要なんだよ。
数値の大きさで、重要度(量子化テーブルの値)が決まるわけじゃない。
大きいなら大きいなり、小さいなら小さいなりに、「解像度」が必要。
2011/12/04(日) 21:02:04.86
ここまでおれのじえん
2011/12/04(日) 21:33:40.43
なんかスレのびてんな。

両者同じこと言ってねーか?
2011/12/04(日) 23:47:38.83
ま、頭でっかちな子は一度手を動かしてみるといいよ。
そしたら、案外、この2人も仲良くなったりしてな。
2011/12/05(月) 03:04:34.19
基底を3つ用意して線形和とか言ってるのを除けば、
既存の概念以上の何かを語っているに過ぎないような。

基底の話は、なんだかなぁ
DCTでやるかwaveletでやるかの違いよりもどうでもいい。
2011/12/05(月) 08:04:31.27
ドザはDCTすら理解できていないことが分かった。
やっぱりLinuxerの方が優秀。
2011/12/05(月) 14:41:58.73
            /  \____
             ⌒゙i\ \    \
              . ゙i \ ゙i(゚)   ゙i     ____\   ー‐┐  一十一
             。., ' ⌒。゙i )   ゙i      \      ノ´   ノ |
            o。∴。゚//  ┬-、_      \    ー‐┐
           (∴U//  }ノ ノ   \      ,>   ノ´   ─┬─
            |U゙/     / i |     l、     く.   ー‐┐    |
ー‐┐ 一十一 /  u' \ヽ‐'´  !|     ト、     \   ,ノ´    ─┴─
 ノ´   ノ |  /_____,  }j  ハ、  ヽ ヽ,___/    /  ー‐┐  ─┬─
ー‐┐    .     / ___ノ /\_,≧/ u 人.   /     ,ノ´   ─┴─
 ノ´  ─┬─  く  {上rン´  ,厶../ / ヽヽ   \    ||
ー‐┐   |    /    ̄   ノ{こ, /,〃   !|    \   ・・   ─┬─
 ノ´  ─┴─  \     ,.イ !l`T´ | /     |:|     /     ..─┴─
ー‐┐ ─┬─   \   //    l  |     |_|   ∠.、
 ノ´  ─┴─     /   ヒ_ー--、_|ー、____,ノj┘    /        ─┬─
ー‐┐         /     \ ̄\ー`トー-<    /          .─┴─
 ノ´  ─┬─  \      \  ヽ  \  ヽ    ̄ ̄|
 | |  .─┴─   >       \. ヽ.  ヽ   l      |/l   /|  ∧  /\
 ・・         /           ) lヽ   ',  l、      |/   | /   V
     ─┬─  \       , イ、_,上ハ   }  小          |/
    ─┴─    \     (乙≧='''"´ ,∠,__ノ/
             /           厶乙iフ/
      ─┬─  く               `¨¨¨´
      ─┴─    \
2011/12/05(月) 15:23:01.99
プログラム板だろ
コード書けよ
2011/12/05(月) 17:59:33.84
〜〜〜〜
 ↑
コード
872デフォルトの名無しさん
垢版 |
2012/01/08(日) 08:51:31.36
DLLを使ってZIP圧縮をするとき
-t mmddyyyy形式で指定日付以降のファイルの圧縮を指定できますが
時間の指定はできないのでしょうか?
-t mmddyyhhmmss とか
-t yyyy-mm-dd-hh-mm-ss とか
やってみましたが、ダメでした。
2012/01/08(日) 11:00:01.66
DLLに聞けよ
874デフォルトの名無しさん
垢版 |
2012/08/02(木) 16:10:36.61
7zip64.dllって32ビット版と何がちがうん?
2012/08/02(木) 17:07:01.40
>>874
64bit板として作られている。
2012/08/03(金) 16:45:31.23
こうなったら体に聞くしかないな
877デフォルトの名無しさん
垢版 |
2012/09/25(火) 23:36:05.02
ハフマンに興味を持って、セジウィック先生の1-3巻購入したんだけど
いまひとつ分らんのです。
奥村先生の本はどんなかんじでしょうか?
まあ、購入するつもりになってるのですが、
圧縮とかハフマンとかの開設は詳しいのでしょうか?
2012/09/26(水) 06:46:34.26
セジウィック本も、奥村本も、原理は簡単にしか書いてない
同じ実装向けでも、「データ圧縮ハンドブック」あたりだと詳しく載っていたはず。

完全に理論からだと、情報理論の参考書がよい。
「情報源符号化」とか。
2012/09/28(金) 20:06:55.81
rarを作れるプログラムわどこにあるの?
880デフォルトの名無しさん
垢版 |
2012/09/28(金) 20:33:12.71
>>878
ありがとー
アマで中古が10,000か・・・
NGNG?PLT(12080)
  ∧_∧
  ( ・∀・)            人 ガッ
  (    つ―-‐-‐-‐-‐-‐○ <  >__Λ∩
  人 Y ノ.             V`Д´)/
  し(_)                  /  ←>>127
882デフォルトの名無しさん
垢版 |
2013/04/17(水) 15:30:00.55
ファイルのタイムスタンプをUTCで保存している圧縮フォーマットってないの?
883デフォルトの名無しさん
垢版 |
2013/11/18(月) 17:46:07.95
Z01とかって拡張子のファイルを結合、解凍できるソフトってどんなのがありますか?
2013/11/18(月) 20:36:22.54
>>883
ソフトウェア板行け
885デフォルトの名無しさん
垢版 |
2014/01/02(木) 03:04:42.98
>>812>>817が恥ずかしすぎるな
886デフォルトの名無しさん
垢版 |
2014/01/03(金) 00:42:03.07
昨今音声認識や画像認識でニューラルネットがもてはやされてるけれど
オートエンコーダーの技術でできた優秀なコーディックってないの?
2014/04/15(火) 18:30:19.05ID:OGcfFU1C
>>883
とりあえず、青木ヶ原かどこかへ行った方が良い
ここでは君のような池沼は扱っていない
2014/04/17(木) 20:40:26.29ID:WnuPjrTt
おまえも東尋坊にでも行けば?
889デフォルトの名無しさん
垢版 |
2014/05/20(火) 11:56:27.03ID:Y+03zp8V
deflateの終端ってどうやって判断するの?
2014/05/20(火) 13:55:09.80ID:dsJU0YCN
ブロックの先頭1ビットが、最終ブロックかどうかを指してる
2014/05/20(火) 20:33:29.63ID:Y+03zp8V
そのブロックのヘッダはどう見分ければいいの?
RFC1951見てみたけど全くわからん
2014/05/21(水) 00:13:57.01ID:TqDi4OMb
最初のブロックは最初の1ビット目
残りのブロックは順次復号していくしかない。
2014/05/21(水) 00:33:52.29ID:u1VeI0rj
>>892
なるほど ありがとう
コード書かなきゃだめか
894デフォルトの名無しさん
垢版 |
2014/06/17(火) 10:35:41.26ID:RbI2cI1i
1000分の1くらいにまで圧縮できるソフトがあれば便利なのにな。
無謀な意見そのものなのだが。
2014/06/17(火) 12:17:18.05ID:Zuw0gcgB
情報量について勉強してこい、というのがマジレスかな。
THcompでググれ、というのがお約束。
2014/06/17(火) 12:56:51.62ID:Ws1v548F
出来たら出来たで、それを前提にしたクソシステムがどっと出てくるから無意味
CPU速度や記憶媒体で何度も通った道
2014/06/18(水) 08:44:02.18ID:SROYhCqR
ディレクトリ名やファイル名にデータ埋め込んでみましたとかな
2014/06/18(水) 12:18:57.23ID:csAcA5GD
理論的に不可能なことを「出来たら出来たで」とか言うほうが無限倍無意味w
2014/06/18(水) 12:35:03.67ID:G43Rg57i
>>897
里芋とかそんな名前のソフト無かったっけ
2014/06/19(木) 15:32:35.10ID:gduOxxnf
質問です

何年か前に話題になったと思うのですが
「圧縮したらサイズが0になった」
みたいな題名で(タイトルはうろ覚え)
NTFSなどのファイルシステムで
ディレクトリ名やファイル名にデータを格納し
ファイルサイズは0にしておくと
ディスク使用容量は0のまま
とかなんとかいうアルゴリズムを
OneDriveやGoogleDriveに適用すると
やはり7GBとか15GBとかの無料枠を
超えずに使い続けることが可能でしょうか?

だれか実験したひととかサイトとかご存知ですか?
2014/06/19(木) 15:42:50.59ID:dWoxSXDO
実験したこともないしサイトも知らんけど
ランダムな名前でサイズ0の大量のファイルの転送とかは
新手のサイバーテロと捉えられる可能性が高いので自分でやるのは止めとけよ
2014/06/19(木) 16:19:44.82ID:wfyUZ16B
わざとやってるだろw 「里芋」と、他に適当なフレーズを加えて検索したら
当該ソフトが見つかったけど、実用的な意味は全く無い。

Unixとかでは、ディレクトリのサイズとしてファイル名とかの情報が入ったブロックが
カウントされるけど、Windowsでは0と表示されるから、というだけのお遊び。
ディスクの空き容量は同じように減っていく。

MS-DOS時代に、ディスクの空き容量が倍に見える(だけど、ファイルを作ると、
本来必要な量の倍の量が減っていく)というジョークソフトがあったけど、
そういうのの同類で、実験ないしジョーク以上の意味は無い。
2014/06/19(木) 18:55:48.69ID:BRW9+QBS
>>902
>MS-DOS時代に、ディスクの空き容量が倍に見える(だけど、ファイルを作ると、本来必要な量の倍の量が減っていく)というジョークソフト
ほしい!原理は?
2014/06/19(木) 21:37:22.91ID:wfyUZ16B
原理は、セクタサイズとクラスタサイズを不整合にする....んだと思う。多分。
『近代プログラマの夕』 (単行本)p.99〜100に書いてある。ネット検索では見つからない。
一応THcompのジョークの話の次に書いてあるけど、ジョークではないはず。
レス数が900を超えています。1000を超えると表示できなくなるよ。
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも