探検
圧縮・復元 相談室
■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん
NGNG アルゴリズムは別スレで
705デフォルトの名無しさん
2009/12/12(土) 21:52:21 圧縮解凍プログラム作った時の疑問点なんですが、最初unzip32.dllを使用していて解凍したのですが、
必ず解凍確認ダイアログが表示されてしまうので、7zip.dllに乗り換えました。
解凍確認ダイアログ消す方法ってあるんですかね?
必ず解凍確認ダイアログが表示されてしまうので、7zip.dllに乗り換えました。
解凍確認ダイアログ消す方法ってあるんですかね?
706デフォルトの名無しさん
2009/12/12(土) 22:26:14 >>704
や、単なるモノクロ絵を配布はあまりしないだろうという話
や、単なるモノクロ絵を配布はあまりしないだろうという話
>>705
「解凍確認ダイアログ」というのがよく分からないので、間違っていたらすみません。
展開時の上書き確認ダイアログのことであれば、(統合アーカイバの)unzip32.dllでは-oスイッチで自動上書きにできるかと思います。
展開時の進捗状況を表示するダイアログのことであれば、(統合アーカイバの)unzip32.dllでは--iスイッチで消せるかと思います。
7zip.dllが7-zip32.dllなのか7z.dllなのか、あるいは他のdllなのかも分かりませんが、
7-zip32.dllであれば、それぞれ-aoスイッチと-hideスイッチが該当するかと思います。
info-zipのunzip32.dllや7z.dllについてもおそらくその類のダイアログを表示しない方法はあると思います。
的外れな回答をしていたらすみません。
「解凍確認ダイアログ」というのがよく分からないので、間違っていたらすみません。
展開時の上書き確認ダイアログのことであれば、(統合アーカイバの)unzip32.dllでは-oスイッチで自動上書きにできるかと思います。
展開時の進捗状況を表示するダイアログのことであれば、(統合アーカイバの)unzip32.dllでは--iスイッチで消せるかと思います。
7zip.dllが7-zip32.dllなのか7z.dllなのか、あるいは他のdllなのかも分かりませんが、
7-zip32.dllであれば、それぞれ-aoスイッチと-hideスイッチが該当するかと思います。
info-zipのunzip32.dllや7z.dllについてもおそらくその類のダイアログを表示しない方法はあると思います。
的外れな回答をしていたらすみません。
708デフォルトの名無しさん
2009/12/15(火) 23:33:39 >>707
的外れではなく、合っていますw
「解凍確認ダイアログ」というのは、解凍終了しました等、解凍した(何か動作した)と分かるようなPOPUP画面の事です。
自動上書き、進行状況非表示を引数で指定したのですが、進行状況を表示するための空のPOPUP画面がどうしても消えませんでした。(進行状況自体は消えましたが)
readmeを見たのですが、
それらしきオプションもなく断念しました。
的外れではなく、合っていますw
「解凍確認ダイアログ」というのは、解凍終了しました等、解凍した(何か動作した)と分かるようなPOPUP画面の事です。
自動上書き、進行状況非表示を引数で指定したのですが、進行状況を表示するための空のPOPUP画面がどうしても消えませんでした。(進行状況自体は消えましたが)
readmeを見たのですが、
それらしきオプションもなく断念しました。
>>708
すみません。開発者用sdkのUNZIP32S.txtに次のように書かれていました。
> また、標準で結果窓が表示されるようになってます。これを禁止するには以下のレジストリに ShowResult と言う DWORD 値を作成し、0に設定してください。0 のかわりに 0xFFFFFFFF とすると、エラーがあったときだけ結果窓が表示されます。
> HKEY_CURRENT_USER\Software\ArchiverDll\UNZIP32\Settings\
UNZIP32.APIに記されている内容によれば、この設定は初期値でoffになっているようですが、何かの拍子に設定が変えられてしまっていませんでしょうか。
すみません。開発者用sdkのUNZIP32S.txtに次のように書かれていました。
> また、標準で結果窓が表示されるようになってます。これを禁止するには以下のレジストリに ShowResult と言う DWORD 値を作成し、0に設定してください。0 のかわりに 0xFFFFFFFF とすると、エラーがあったときだけ結果窓が表示されます。
> HKEY_CURRENT_USER\Software\ArchiverDll\UNZIP32\Settings\
UNZIP32.APIに記されている内容によれば、この設定は初期値でoffになっているようですが、何かの拍子に設定が変えられてしまっていませんでしょうか。
710デフォルトの名無しさん
2010/01/09(土) 05:12:02 データ復活/完全削除 【無料版】
これもうダウンロードできないけど
持っている人いないかな?
これもうダウンロードできないけど
持っている人いないかな?
711デフォルトの名無しさん
2010/01/09(土) 17:32:12 ソフトウェア板で聞けよ
ここは作る方の板だ
ここは作る方の板だ
712デフォルトの名無しさん
2010/01/09(土) 19:02:46 資料にするんだろ
713デフォルトの名無しさん
2010/01/09(土) 21:17:11 それならそれでスレ違いだな
714デフォルトの名無しさん
2010/01/09(土) 21:32:01 わざわざスレチ教えるなんてやさしい奴ら
でも「データ復活/完全削除」超えるフリー無いな
でも「データ復活/完全削除」超えるフリー無いな
715デフォルトの名無しさん
2010/03/08(月) 15:02:33 新しい圧縮方法考えてみた。0と1が何個続くかをデータにする。
1bit目は開始するbit
1000→113
0110→0121 となる
7以上は0をはさむ(7かどうかは未定)
0101 1000 0000 0010
なら
0111270211
3桁ずつに分け、3の倍数にならなければ0を付与する
011 127 021 100
3桁(999)は10bit(1023)あれば足りるから
0101 1000 0000 0010
は
0000001011 0001111111 0000010101 0001100100
となる
あ…ありのまま 今 起こった事を話すぜ!
『自作の新圧縮方式を試していたら
いつのまにか容量が増えていた』
な… 何を言ってるのか わからねーと思うが
俺にもわからねえ
1bit目は開始するbit
1000→113
0110→0121 となる
7以上は0をはさむ(7かどうかは未定)
0101 1000 0000 0010
なら
0111270211
3桁ずつに分け、3の倍数にならなければ0を付与する
011 127 021 100
3桁(999)は10bit(1023)あれば足りるから
0101 1000 0000 0010
は
0000001011 0001111111 0000010101 0001100100
となる
あ…ありのまま 今 起こった事を話すぜ!
『自作の新圧縮方式を試していたら
いつのまにか容量が増えていた』
な… 何を言ってるのか わからねーと思うが
俺にもわからねえ
716デフォルトの名無しさん
2010/03/08(月) 15:29:45717デフォルトの名無しさん
2010/03/08(月) 16:25:31 1000→113
この時点でおかしいw
この時点でおかしいw
718デフォルトの名無しさん
2010/03/08(月) 16:27:38 自然対数の底とかなんとか
719デフォルトの名無しさん
2010/03/09(火) 13:06:30720デフォルトの名無しさん
2010/03/09(火) 20:44:27 0 と 1 なら、数え上げ符号にしておけとあれほど・・・
721デフォルトの名無しさん
2010/03/10(水) 14:11:25 >自然対数の底とかなんとか
これって良く見るけど
そこ?
てい?
どっちですか
これって良く見るけど
そこ?
てい?
どっちですか
722デフォルトの名無しさん
2010/03/10(水) 15:05:29 高校で習うよ
723デフォルトの名無しさん
2010/03/10(水) 16:52:42 てい
724デフォルトの名無しさん
2010/03/10(水) 17:39:36 ありがとうございました
でもなんで 2.71828182845904523536028・・・ みたいな変な数字なんだろ
でもなんで 2.71828182845904523536028・・・ みたいな変な数字なんだろ
725デフォルトの名無しさん
2010/03/10(水) 17:43:26 e = 1/0! + 1/1! + 1/2! + 1/3! + 1/4! + ・・・・
だからさ
だからさ
726デフォルトの名無しさん
2010/03/10(水) 18:03:19 それは自然対数の底だな。
分野によって10(工学関係とか)2(情報関係とか)が底のこともある。
2とかそれ以外が底だったら普通は明示される。
たいてい10かeが底で、底がeの対数は特にlogではなくlnと書かれたりする
(その場合logで示されるのは底が10)。
ネイピア数(ないしオイラー数)eは (1 + (1 / n)) ** n ( ** は冪乗)の n を∞にした
時の極限(ほかにもいろいろな定義はあるが)。いろいろな性質がある。
たとえば、y = e ** x というグラフの傾きは e ** x であるとか。
分野によって10(工学関係とか)2(情報関係とか)が底のこともある。
2とかそれ以外が底だったら普通は明示される。
たいてい10かeが底で、底がeの対数は特にlogではなくlnと書かれたりする
(その場合logで示されるのは底が10)。
ネイピア数(ないしオイラー数)eは (1 + (1 / n)) ** n ( ** は冪乗)の n を∞にした
時の極限(ほかにもいろいろな定義はあるが)。いろいろな性質がある。
たとえば、y = e ** x というグラフの傾きは e ** x であるとか。
727デフォルトの名無しさん
2010/03/10(水) 18:47:51 logって何が便利なの?
728デフォルトの名無しさん
2010/03/10(水) 18:53:07 高校で習うよ
729デフォルトの名無しさん
2010/03/10(水) 18:54:06 eとかlogとかって圧縮復元に役に立つの?
730デフォルトの名無しさん
2010/03/10(水) 18:57:36 729の役には立たないよ
731デフォルトの名無しさん
2010/03/10(水) 21:02:01 >>727
例えば10進数で81桁の数値は64進数だと何桁必要か計算するときにlogを使う。
例えば10進数で81桁の数値は64進数だと何桁必要か計算するときにlogを使う。
732デフォルトの名無しさん
2010/03/11(木) 13:26:56 64進数とか要らないなw
733デフォルトの名無しさん
2010/03/11(木) 20:41:09 Base64なんかはある意味64進数といえなくもない
734デフォルトの名無しさん
2010/03/20(土) 17:05:41 位取りの概念がないじゃない
735デフォルトの名無しさん
2010/03/21(日) 11:57:06 は?馬鹿ですか?
736デフォルトの名無しさん
2010/09/17(金) 23:12:57 ぼくではない
737デフォルトの名無しさん
2010/11/10(水) 20:50:47 "Move To Front" の改良 良になっていると思います
過去2Byte値から今の1Byte値を"Move To Front"するテーブルを選ぶ
詳しい処理はソースを見てください
http://gmdev.xrea.jp/
[標準10MB] [148.zip] 実験用実行アプリ Delphi4 ソース付き
注意
実行アプリのウイルスチェックはしてません
感染は無いと思いますが自己責任ということで
過去2Byte値から今の1Byte値を"Move To Front"するテーブルを選ぶ
詳しい処理はソースを見てください
http://gmdev.xrea.jp/
[標準10MB] [148.zip] 実験用実行アプリ Delphi4 ソース付き
注意
実行アプリのウイルスチェックはしてません
感染は無いと思いますが自己責任ということで
738デフォルトの名無しさん
2010/11/10(水) 23:18:20 学生さんかな?
ここで晒してもしょうがないと思うのだけど…
MTFの改良とか一度は考えるよね
実際にやってみると大したこと無くてがっかりっていう
この手のやつをRecency Rankingというのだけど
頻度が考慮されないから算術符号やハフマン符号と比べるとだめなんだな
もっともっと勉強してちょうだい
ここで晒してもしょうがないと思うのだけど…
MTFの改良とか一度は考えるよね
実際にやってみると大したこと無くてがっかりっていう
この手のやつをRecency Rankingというのだけど
頻度が考慮されないから算術符号やハフマン符号と比べるとだめなんだな
もっともっと勉強してちょうだい
739デフォルトの名無しさん
2010/11/11(木) 00:25:01 再帰順位符号化法は、理論的にはエントロピーを達成できるよ!できるよ!
740天使 ◆uL5esZLBSE
2011/07/03(日) 13:21:22.14 なんだ、ただのゴミか
741デフォルトの名無しさん
2011/07/07(木) 21:50:49.65742デフォルトの名無しさん
2011/07/07(木) 22:30:26.96 LHCでブラックホール圧縮したほうが簡単。
743デフォルトの名無しさん
2011/07/07(木) 23:25:05.99 >>741
昔に流行ったπ(円周率)圧縮と原理は同じ
昔に流行ったπ(円周率)圧縮と原理は同じ
744デフォルトの名無しさん
2011/07/08(金) 00:41:50.33 それとは違うだろ
745デフォルトの名無しさん
2011/07/08(金) 01:54:35.69 >>741
圧縮と関係ないから。
圧縮と関係ないから。
746デフォルトの名無しさん
2011/07/18(月) 16:25:30.65 アキレスと亀みたいな無限圧縮理論があったろ。
あれと似てるねって話だろう。
あれと似てるねって話だろう。
747デフォルトの名無しさん
2011/08/20(土) 12:26:41.97 基本的なことを教えてください。
@1Mバイトのランダムなデータ列と2Mバイトのランダムなデータ列をファイルにしてzipにしました。
圧縮率はどっちが高いですか?
A1Mバイトのランダムなデータ列と1Mバイトの数列(0,1,2・・・ffH・・・)をファイルにしてzipにしました。
圧縮率はどっちが高いですか?
B1Mバイトの数列(0,1,2・・・ffH・・・)と2Mバイトの同じ数列(0,1,2・・・ffH・・・)をファイルにしてzipにしました。
圧縮率はどっちが高いですか?
できれば、経験的な結果ではなくて、数学的?技術的結果を知りたいです。(経験的結果ももしあれば知りたいです)
よろしくお願いします。
当方ハード屋です。簡単なプログラミングはできるぐらいのキャリアです。
@1Mバイトのランダムなデータ列と2Mバイトのランダムなデータ列をファイルにしてzipにしました。
圧縮率はどっちが高いですか?
A1Mバイトのランダムなデータ列と1Mバイトの数列(0,1,2・・・ffH・・・)をファイルにしてzipにしました。
圧縮率はどっちが高いですか?
B1Mバイトの数列(0,1,2・・・ffH・・・)と2Mバイトの同じ数列(0,1,2・・・ffH・・・)をファイルにしてzipにしました。
圧縮率はどっちが高いですか?
できれば、経験的な結果ではなくて、数学的?技術的結果を知りたいです。(経験的結果ももしあれば知りたいです)
よろしくお願いします。
当方ハード屋です。簡単なプログラミングはできるぐらいのキャリアです。
748デフォルトの名無しさん
2011/08/20(土) 12:41:46.03749デフォルトの名無しさん
2011/08/20(土) 12:45:01.97750デフォルトの名無しさん
2011/08/20(土) 12:51:08.48751デフォルトの名無しさん
2011/08/20(土) 13:03:32.15752デフォルトの名無しさん
2011/08/20(土) 13:11:59.31 >>751
いや、zipはLZ法といって
同じパターンを検出して別の符号で置き換えるという仕組みになってる
ランダムデータは繰り返しがないから圧縮出来ないし
数列の方は00h-ffhが繰り返されるからそこで縮むのよ
いや、zipはLZ法といって
同じパターンを検出して別の符号で置き換えるという仕組みになってる
ランダムデータは繰り返しがないから圧縮出来ないし
数列の方は00h-ffhが繰り返されるからそこで縮むのよ
753デフォルトの名無しさん
2011/08/20(土) 13:27:20.28 >>752
レス、どうも。
よくわかりました。
この場合ランダムデータと言えるか疑問ですが、
もし、ランダムデータでもちょっとでも繰り返しパターンが現れたとして、その大きさも出現率もランダムだとして、この場合少しは圧縮できると思います。
その場合は、
『データ量が多いほうが圧縮率が高くなる傾向がある』
とは理論的に言えないのでしょうか?
実験をして臨床的に?測定はできるでしょうが、まずは頭の中で整理したいので、よろしくお願いします。
レス、どうも。
よくわかりました。
この場合ランダムデータと言えるか疑問ですが、
もし、ランダムデータでもちょっとでも繰り返しパターンが現れたとして、その大きさも出現率もランダムだとして、この場合少しは圧縮できると思います。
その場合は、
『データ量が多いほうが圧縮率が高くなる傾向がある』
とは理論的に言えないのでしょうか?
実験をして臨床的に?測定はできるでしょうが、まずは頭の中で整理したいので、よろしくお願いします。
754デフォルトの名無しさん
2011/08/20(土) 13:36:12.73 >>753
データ(情報源)次第としか言いようがないんだけど
データ量が増えるほど参照可能なデータが増えるので圧縮率は上がる
と言える
ので理屈としてはそれであってる
言うまでもなく計算量は増えるけども
データ(情報源)次第としか言いようがないんだけど
データ量が増えるほど参照可能なデータが増えるので圧縮率は上がる
と言える
ので理屈としてはそれであってる
言うまでもなく計算量は増えるけども
755デフォルトの名無しさん
2011/08/20(土) 14:12:35.01756デフォルトの名無しさん
2011/08/20(土) 16:35:41.98 圧縮について理論的な裏付けを探しているなら、
次のキーワードについて調べてみるとよいでしょう。
初等的な情報理論の参考書に出ているものです。
情報源(符号化)
エントロピー
ユニバーサル
エルゴード性
エントロピーレート
次のキーワードについて調べてみるとよいでしょう。
初等的な情報理論の参考書に出ているものです。
情報源(符号化)
エントロピー
ユニバーサル
エルゴード性
エントロピーレート
757デフォルトの名無しさん
2011/08/20(土) 17:20:35.51758デフォルトの名無しさん
2011/08/21(日) 00:44:08.36 >>749
やってみないとわからないというより、何を目的に聞いているのかわからないから、答えにくい。
圧縮もzip(LZ法+ハフマン)に限る話なのか、あらゆるアルゴリズムを検討するかによっていろいろ変わってくる。
情報理論的にランダムデータは統計的には圧縮できない。
(圧縮できるケースも0ではないが、できないケースがそれをはるかに上回る)
やってみないとわからないというより、何を目的に聞いているのかわからないから、答えにくい。
圧縮もzip(LZ法+ハフマン)に限る話なのか、あらゆるアルゴリズムを検討するかによっていろいろ変わってくる。
情報理論的にランダムデータは統計的には圧縮できない。
(圧縮できるケースも0ではないが、できないケースがそれをはるかに上回る)
759デフォルトの名無しさん
2011/09/08(木) 00:22:45.54 解凍速度重視でデコーダー書いてアセンブリ出力見て無駄が減り
実測でも速くなってるとお茶が美味い、でへへ
実測でも速くなってるとお茶が美味い、でへへ
760デフォルトの名無しさん
2011/09/22(木) 01:47:33.31761デフォルトの名無しさん
2011/10/04(火) 04:33:33.93 7zなら、パスを列挙したリストファイルを渡して圧縮させるコマンドが無かったか?
762デフォルトの名無しさん
2011/10/19(水) 17:21:06.75 zip32j.dllで同じファイルを圧縮しても、
出来るzipのCRCが毎回違うってのは正常?
WinRAR使うと毎回CRCは同じなんだが
出来るzipのCRCが毎回違うってのは正常?
WinRAR使うと毎回CRCは同じなんだが
763デフォルトの名無しさん
2011/10/19(水) 17:53:00.10 圧縮ルーチンの中で乱数使ってるんじゃないかな
解凍後のCRCが一致してれば問題なし
解凍後のCRCが一致してれば問題なし
764デフォルトの名無しさん
2011/10/19(水) 18:29:03.25765デフォルトの名無しさん
2011/10/19(水) 19:09:18.86766デフォルトの名無しさん
2011/10/20(木) 22:51:54.07 スレ違い
767デフォルトの名無しさん
2011/11/29(火) 22:44:34.18 ふと気になってzipの仕様を見ていて疑問に思ったのだけれど、
「中央ディレクトリ」の存在意義ってなんですか?
わざわざローカルファイルヘッダと分離して、しかも書庫末端に配置
させている意味がわからないです。
書庫冒頭ならここを基点にランダムアクセスがしやすい、というのは
想像できるんですが、可変長コメントを終端に許容している時点で
後ろから計算するのも非常にめんどくさいことになってますし。
どうせだし作者にメールでも投げるか、と思ったら作者亡くなってるし。
「中央ディレクトリ」の存在意義ってなんですか?
わざわざローカルファイルヘッダと分離して、しかも書庫末端に配置
させている意味がわからないです。
書庫冒頭ならここを基点にランダムアクセスがしやすい、というのは
想像できるんですが、可変長コメントを終端に許容している時点で
後ろから計算するのも非常にめんどくさいことになってますし。
どうせだし作者にメールでも投げるか、と思ったら作者亡くなってるし。
768デフォルトの名無しさん
2011/11/29(火) 23:04:07.92 LZH書庫のゼロ終端と同レベルには必要。
769デフォルトの名無しさん
2011/11/29(火) 23:11:50.61 1passで書庫作る場合、中央ディレクトリみたいのをつけようとすると
どうしてもケツにしかつけられないってだけでしょ。
1passで書庫作れるようになってるのはzipの強みの一つだと思うんだが。
例えばlhaはチェックサム書き出すために一旦ヘッダまで戻らなきゃいかんから2passになる。
圧縮データをどっかに保存しておければ1passっぽくできるけど。そのために記憶領域が必要になる。
どうしてもケツにしかつけられないってだけでしょ。
1passで書庫作れるようになってるのはzipの強みの一つだと思うんだが。
例えばlhaはチェックサム書き出すために一旦ヘッダまで戻らなきゃいかんから2passになる。
圧縮データをどっかに保存しておければ1passっぽくできるけど。そのために記憶領域が必要になる。
770767
2011/11/29(火) 23:20:10.21 解凍することだけ考えてて圧縮のこと何も考えてなかった。
なるほど。確かに1passで作れるっていうその点は強みですね。
すごいスッキリしました。ありがとう。
なるほど。確かに1passで作れるっていうその点は強みですね。
すごいスッキリしました。ありがとう。
771デフォルトの名無しさん
2011/11/29(火) 23:44:11.23 ケツにもコメントの長さつけてくれれば
後ろから読むのが楽だったと思わずにはいられない
後ろから読むのが楽だったと思わずにはいられない
772デフォルトの名無しさん
2011/11/30(水) 02:12:31.07 ファイル先頭に置くと、ファイルを追加するたびに書庫ファイル全体を
書き直さないといけなくなるよ。
末尾にあれば追加された分と中央ディレクトリ分だけで済む。
書き直さないといけなくなるよ。
末尾にあれば追加された分と中央ディレクトリ分だけで済む。
773デフォルトの名無しさん
2011/11/30(水) 03:49:27.68 インデックスは末尾が当然だな。もしくはシーケンシャルアクセスで良いならTARのようにする。
774デフォルトの名無しさん
2011/11/30(水) 13:05:45.71 圧縮と暗号化を両方行いたい場合
先に暗号化してから圧縮すると
圧縮してから暗号化したときに比べて
サイズがかなり大きくなってしまいます
圧縮と暗号化を同時に行うアルゴリズムだと
効率は良くなるのでしょうか?
先に暗号化してから圧縮すると
圧縮してから暗号化したときに比べて
サイズがかなり大きくなってしまいます
圧縮と暗号化を同時に行うアルゴリズムだと
効率は良くなるのでしょうか?
775デフォルトの名無しさん
2011/11/30(水) 13:11:04.03 符号化と暗号化を勉強しろw
776デフォルトの名無しさん
2011/11/30(水) 13:22:50.71777デフォルトの名無しさん
2011/11/30(水) 13:25:01.15 まあアルゴリズムの話はともかく
どうして暗号化ツールには圧縮機能がなくて
圧縮ツールには暗号化機能がないのはなぜ?
どうして暗号化ツールには圧縮機能がなくて
圧縮ツールには暗号化機能がないのはなぜ?
778デフォルトの名無しさん
2011/11/30(水) 14:22:37.76 君が馬鹿だからそういう疑問が出る。
>>775
>>775
779デフォルトの名無しさん
2011/11/30(水) 14:57:55.25 一番の問題点は仕様がアホみたいに巨大かつ肥大化を続けてることだろう
780デフォルトの名無しさん
2011/11/30(水) 15:28:11.94 モチはモチ屋的な思考する人が多いからじゃねーかと思ったが、
圧縮ソフトは暗号化機能つけてるのも結構あるよね。
圧縮ソフトは暗号化機能つけてるのも結構あるよね。
781デフォルトの名無しさん
2011/11/30(水) 15:44:18.70 圧縮するときの符号化した辞書を暗号化すれば医院で内科医
782デフォルトの名無しさん
2011/11/30(水) 15:53:09.43 馬鹿には無理
783デフォルトの名無しさん
2011/12/02(金) 05:52:08.41 ちょっとした思いつき
ABCCABBCA
というような並びのデータがあるとして、このままではあまり圧縮に適してないが
これを
ABC
CAB
BCA
と並べて右上から右下斜めに読むと
CBBAAACCB
となって圧縮しやすくなる
これを斜め読みアルゴリズムと名付けた
データを二次元に展開すると読み方は横読み、右下斜め読み、縦読み、左下斜め読みの4種類定義できるが
この4種類を順番に適用して圧縮を繰り返すと、可逆を維持したままファイルサイズをものすごく小さくできるかもしれない
これを回転圧縮法と名付けた
暇な人は論文でも書いてみたらお金になるかも
ABCCABBCA
というような並びのデータがあるとして、このままではあまり圧縮に適してないが
これを
ABC
CAB
BCA
と並べて右上から右下斜めに読むと
CBBAAACCB
となって圧縮しやすくなる
これを斜め読みアルゴリズムと名付けた
データを二次元に展開すると読み方は横読み、右下斜め読み、縦読み、左下斜め読みの4種類定義できるが
この4種類を順番に適用して圧縮を繰り返すと、可逆を維持したままファイルサイズをものすごく小さくできるかもしれない
これを回転圧縮法と名付けた
暇な人は論文でも書いてみたらお金になるかも
784デフォルトの名無しさん
2011/12/02(金) 06:02:58.46785デフォルトの名無しさん
2011/12/02(金) 11:35:07.19 馬鹿には無理
786デフォルトの名無しさん
2011/12/02(金) 12:16:26.63 俺も考えたぜ!
1 はなっから元のデータを線形合同法で作る
2 シード値のみ保存
やばい 1/10000000000ぐらいいく
誰か論文作れ
1 はなっから元のデータを線形合同法で作る
2 シード値のみ保存
やばい 1/10000000000ぐらいいく
誰か論文作れ
787デフォルトの名無しさん
2011/12/02(金) 12:40:08.63 それは似たようなことをIBMが専用チップを作ってやろうとしてたね
788デフォルトの名無しさん
2011/12/02(金) 12:44:45.72 馬鹿には無理
789デフォルトの名無しさん
2011/12/02(金) 14:28:29.13 データを最適化する手法は昔からあるわけで、恥ずかしいから馬鹿は黙っておけw
790デフォルトの名無しさん
2011/12/03(土) 11:06:16.82 静止画・動画とかアプリケーションが既知の場合なら、データの統計的性質分かってるわけだから、予め超巨大な辞書を作ってみんなで共有しておけば、めっちゃ圧縮できそうな気がするんだけど。
なんで未だに離散コサイン変換+ベクトル量子化で頑張ってるの?
詳しい人おしえて!
なんで未だに離散コサイン変換+ベクトル量子化で頑張ってるの?
詳しい人おしえて!
791デフォルトの名無しさん
2011/12/03(土) 11:19:41.21 それってさ、「ここのURLにデータがあるよ」ってアドレス渡す事と同義なんだよ
データ自体が小さくなるわけじゃないんだ
データ自体が小さくなるわけじゃないんだ
792デフォルトの名無しさん
2011/12/03(土) 11:26:41.08 量子テレポーテーションをうまく応用すれば圧縮に使えるのではないか。
793デフォルトの名無しさん
2011/12/03(土) 12:05:45.58 >>791
データ自体が小さくなるってことじゃね?
画像の元サイズX、圧縮後のサイズY、枚数N、辞書のサイズZとすると
N*X > N*Y + Z
になってれば圧縮できてるよね。
Nがでかけりゃでかいほど、辞書でかくしてもいいじゃん。
1G
データ自体が小さくなるってことじゃね?
画像の元サイズX、圧縮後のサイズY、枚数N、辞書のサイズZとすると
N*X > N*Y + Z
になってれば圧縮できてるよね。
Nがでかけりゃでかいほど、辞書でかくしてもいいじゃん。
1G
794デフォルトの名無しさん
2011/12/03(土) 12:22:40.45 研究発明にはこういう馬鹿も必要だ
795デフォルトの名無しさん
2011/12/03(土) 12:49:44.40 しかも、辞書分のZを全員が共有できてるという前提であれば、
N*X > N*Y
って、すごい圧縮できそうやん!
コサイン基底なんか使わずに、10GByte分くらいの過剰な基底を用意しとけば、画像なんか超小さくなるべ!
N*X > N*Y
って、すごい圧縮できそうやん!
コサイン基底なんか使わずに、10GByte分くらいの過剰な基底を用意しとけば、画像なんか超小さくなるべ!
796デフォルトの名無しさん
2011/12/03(土) 18:32:29.10 >>790
別に頑張ってないよ。
もっと先の技術はちゃんとあるが、馬鹿は知らなくていいよ。
ハッシュ値(またはそれに類するもの)で元のデータを引っ張って来れる仕組みを圧縮と見なすなら、
ファイル共有ソフトは一種の圧縮であり、winnyなりshareなり、既にある。
別に頑張ってないよ。
もっと先の技術はちゃんとあるが、馬鹿は知らなくていいよ。
ハッシュ値(またはそれに類するもの)で元のデータを引っ張って来れる仕組みを圧縮と見なすなら、
ファイル共有ソフトは一種の圧縮であり、winnyなりshareなり、既にある。
797デフォルトの名無しさん
2011/12/03(土) 18:34:54.58798デフォルトの名無しさん
2011/12/03(土) 19:04:11.19 昔、「ハノイ圧縮」ってネタがあったけど、これって辞典型の究極と言える。
ところが、このハノイ圧縮で、世界中のデータを圧縮していくと、
たちまち圧縮できなくなっていき、かえってサイズが増えることになる。
ちょっと試算してみるとわかるけど、
データ圧縮が圧縮となる世界って、非常に狭いんだよね。
ハノイ圧縮で圧縮できている範囲だけ利用するとしても、
結局それは、現在の他のデータ圧縮法よりは多少マシかなぁ程度。
ハノイ圧縮とLZ78を比べると面白いかもしれない、程度。
ところが、このハノイ圧縮で、世界中のデータを圧縮していくと、
たちまち圧縮できなくなっていき、かえってサイズが増えることになる。
ちょっと試算してみるとわかるけど、
データ圧縮が圧縮となる世界って、非常に狭いんだよね。
ハノイ圧縮で圧縮できている範囲だけ利用するとしても、
結局それは、現在の他のデータ圧縮法よりは多少マシかなぁ程度。
ハノイ圧縮とLZ78を比べると面白いかもしれない、程度。
799デフォルトの名無しさん
2011/12/03(土) 20:28:46.35 >>796
圧縮アルゴリズム構築時に既知のデータと、圧縮時に未知のデータと分けて考える必要があるね。
ちなみに非可逆ね。
アルゴリズム構築時にハッシュテーブル作っておいて、様々な未知データに対してハッシュ値計算してハッシュテーブルを引く。
ハッシュテーブルにハッシュ値がなかったら、圧縮画像=真っ黒画⇒像残差デカイってこと。
残差小さくしつつ圧縮率上げるんだから、非可逆の圧縮アルゴリズム考えてる人たちは、この間を責めてるわけだよな。
COS関数という既知の基底以外でも、ウェーブレットみたいに基底も学習しておけば、圧縮率上がるケースも当然あるだろうね。
圧縮アルゴリズム構築時に既知のデータと、圧縮時に未知のデータと分けて考える必要があるね。
ちなみに非可逆ね。
アルゴリズム構築時にハッシュテーブル作っておいて、様々な未知データに対してハッシュ値計算してハッシュテーブルを引く。
ハッシュテーブルにハッシュ値がなかったら、圧縮画像=真っ黒画⇒像残差デカイってこと。
残差小さくしつつ圧縮率上げるんだから、非可逆の圧縮アルゴリズム考えてる人たちは、この間を責めてるわけだよな。
COS関数という既知の基底以外でも、ウェーブレットみたいに基底も学習しておけば、圧縮率上がるケースも当然あるだろうね。
800デフォルトの名無しさん
2011/12/03(土) 20:31:16.19 ちなみに、8x8の画像だったら64次元の基底があれば、任意の画像を線形和で表せるけど、
基底を10000万個用意しておいても良いわけだ。
圧縮したい画像の枚数が多ければ、10000万個基底用意しておいたとしても、勝てる場合がありそう。
基底を10000万個用意しておいても良いわけだ。
圧縮したい画像の枚数が多ければ、10000万個基底用意しておいたとしても、勝てる場合がありそう。
801デフォルトの名無しさん
2011/12/03(土) 20:49:07.46 >>800
ちなみに、10000次元の係数の大半がゼロになるように、L1正則化でもかけて、基底学習できればよさげだな。馬鹿馬鹿いってるやついるけど、血の巡り悪そうだな。
ちなみに、10000次元の係数の大半がゼロになるように、L1正則化でもかけて、基底学習できればよさげだな。馬鹿馬鹿いってるやついるけど、血の巡り悪そうだな。
802デフォルトの名無しさん
2011/12/03(土) 21:55:07.14803デフォルトの名無しさん
2011/12/03(土) 22:49:37.03 このデータがこのシステムでこれだけのサイズになりましたっていう実測値だしてくれよ
804デフォルトの名無しさん
2011/12/03(土) 23:10:54.75 WikipediaデータすべてがLinuxで1MBになった。
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 高市首相の答弁書に「台湾有事答えない」と明記 存立危機発言当時 ★3 [蚤の市★]
- ミス・ユニバース フィンランド代表の「つり目」写真が波紋… 本人釈明も批判やまず 協会謝罪「徹底的に検証」へ★2 [冬月記者★]
- 「偽サッチャー」「自滅的」「時代遅れ」 高市首相の経済政策を海外メディアが酷評 ★2 [蚤の市★]
- 東京都「都民の税金1.5兆円が国に奪われている」「全国に分配されている」に地方民ブチギレ ★2 [Hitzeschleier★]
- 「もうキモくてキモくて…」29歳女性が語る“おぢアタック”の実態。「俺ならイケるかも」年下女性を狙う勘違い中年男性に共通点が★5 [Hitzeschleier★]
- 【ド軍】山本由伸、WBC出場を決断!ドジャースが本人の意向を尊重、佐々木朗希はチームが故障歴を懸念で不参加 [鉄チーズ烏★]
- 「ハイブリッド教科書」でこの国の子どもたちの視力悪化へ… アクセスしてみると映るコンピュータースクリーンの中、チカチカしてる文字 [452836546]
- 竹中平蔵「日米が長年守り続けてき台湾有事に関する曖昧戦略の知恵を一瞬にして無にさせた岡田の責任は非常に重い」 [271912485]
- 肌黒グロマグロ
- お前ら無職にはわからんだろうけど国保高すぎだろ
- 嘘喰い作者「高市総理の自分の命自分で守れ発言を叩いてる左翼、しょーもな!!!」 [935793931]
- 中国人、超ド正論。「チベットやウイグルに住んでるのはチベット族やウイグル族だが、アイヌから奪った土地に住んでる日本人こそ侵略者」 [314039747]
