w3m その8
TIPS 串設定 → オプション設定パネルで 日本語表示 → 環境変数と端末ソフトを日本語化 migemo検索 → --with-migemo (j)vim の空行付加 → jvim は :set noeol、vim は :set bin noeol ps, pdf を見る → application/postscript; ps2ascii %s ; copiousoutput Word の文章を読む → application/msword; wvWare %s /dev/stdout; x-htmloutput 動画 → video/*; mplayer -vo aa -aadriver curses -ao oss -playlist %s; needsterminal 動画(Linux FB) → video/*; mplayer -vo fbdev2 -fs %s; needsterminal [Q]w3mメモリ食いすぎ。BoehmGCが悪いのでは? [A]ページバッファの開きすぎのせいなのでGCを変えても解決できません。 CLOSE_TABとBACKとDELETE_PREVBUFを使ってこまめにバッファを消しましょう。 ただし多くの環境ではバッファを消した瞬間に目に見えて使用メモリが 減るわけではありません。C-FAQ 7.24参照。 http://www.kouno.jp/home/c_faq/c7.html http://www.aoky.net/articles/why_poignant_guide_to_ruby/index.html ここで画像表示をオンにしたらw3mimgdisplayがCPU喰いまくって w3mの操作できんくなった。いったんw3mimgdisplayを殺しても、 画像のところにカーソルがいったらまたw3mimgdisplayが生成されて 同じ事になった。 まえにも他所でこんなことあったな。 質問します。 「あ い う え お」 ---> 「あいうえお」 のように文字の間のスペースが消えるんですが、スペースをそのまま 表示するようにできますか? >>11 htmlの仕様に忠実なら半角スペースは表示されないのが正しい。 逆にスペースが入って表示される方が本来はおかしい。 >>5 > C-FAQ 7.24参照。 そこで C-FAQ 7.24 は参照先として適切とは思えないんだけど。 そのページの中だと、 7.25 の方が良いんじゃないかな。 http://www.kouno.jp/home/c_faq/c7.html#25 >>12 そうなんですか? htmlの仕様はよく知らないんですが困ってる点だけ書くと、日本語とロシア語が 混在したページなどで日本語の場合はスペースが消えても構わないんですが、 ロシア語の単語の間のスペースが消えると読みにくいんです。 だからスペースを表示する設定があったら便利だと思ったんです。 別に日本語と混在してなくても ロシア語のページは全部スペース喰われるよね ttp://www.ifun.ru/comments/joke12533.html > For all HTML elements except PRE, sequences of white space separate > "words" (we use the term "word" here to mean "sequences of non-white space > characters"). When formatting text, user agents should identify these > words and lay them out according to the conventions of the particular > written language (script) and target medium. htmlの仕様だとスペースは単語の区切りと定義されているから w3mがロシア語でこれを適切に処理できてないということになるんかな? 日本語 では 単語 の 間 には 空白 は 置か ない から これ で いい ん だ けど だよもん >>16 表示が UTF-8 なら空白は保存されるんだけど、EUC-JP などの日本語用文字コードで表示すると空白は消される。 >>15 日本語とロシア語が混在したページ これは大変難しい。 つまり This is a pen. も半角空白を詰めないでほしい、ってことか。 単語の区切りと言えば、NEXT_WORD(w)とPREV_WORD(W)が 日本語では全く役に立たないのもこの件と少し関連するのかな utf-8 環境の方は migemo をどのように設定していますか? 特に設定しないと euc-jp 出力されて正常動作しないですよね。 そういえば、w3mbookmark でも UTF8環境下だとバケバケだよ ブックマークの登録と読込なら化けてないけど。 関係ないけど DICT_WORD_AT って数字も単語区切になるんだね。 system_charset EUC-JP と migemo_command migemo -t egrep /usr/share/migemo/migemo-dict |nkf -Ewu の 2通りの方法があったけど、前者はオプションパネルが化けるんで後者にした。 前スレは天寿を全うされましたか?それとも死神に連れていかれましたか? >>29 From: [985] 名無しさん@お腹いっぱい。 <sage> Date: 2007/07/25(水) 15:55:06 で死神に連れていかれました。 FreeBSD の ports に security/ca_root_nss ってのができてるみたいなんだけど、 コレ使うようにできないかな? # w3m は野良ビルドで使用してます https://helixcommunity.org/projects/player/files/download/2479 から RealPlayer-10.0.9.809-20070726.i586.rpm おとすと gzipped なんだけど。 こればぐかな。いってみただけ。 emacs-w3mが新版リリースとか言ってますが、 こっちもそういう話なかったっけ? w3m 0.5.1 で xtermのタイトルバーの日本語タイトルが文字化けします。 コマンドは↓です。 env LANG='ja_JP.eucjp' xterm -lc -e /usr/bin/w3m -title -B 日本語のどの文字コードでも文字化けします。 ktermでは文字化けしないのですが。 こういう症状がでた方、いますか? うちは日本語タイトルは Unnamed Window って出るなあ。 wm は openbox だけど、だからかな。 gc-7.0を$HOME/localにインストールし、 w3mのconfigure時にLDFLAGSとCPPFLAGSを設定しても、 libgcを見つけてくれない。。。 >>34 レス、ありがとうございます。 タイトルバーの日本語表示にはウィンドウマネージャーにも関係するのですね。 いくつかウィンドウマネージャーで試してみたところ、日本語表示の可否はこんな感じでした。 IceWM, fluxbox : kterm ○ xterm × window maker : kterm × xterm × w3mの内部コードはEUCなのでしょうか。 そのために utf-8 な xtermでは日本語表示に支障があるのでしょうか。 wm は LANG の encoding を期待してて、 xterm は utf-8 でタイトルを送ってるとか? その場合、xterm の luit がタイトルハックコマンド(?)のタイトル文字列を utf-8 に変換していることになるか。それはないかな。 まあ、わからんけど。 >>37 w3m の内部コードは特殊だけど端末(xtermなど)には Locale に従ったコードで送っている。 国際化されたウィンドウマネージャーで動作しないなら、xterm のバグでしょう。 luit は xterm のタイトル表示機能には絡まないと思うので、xterm は内部コードの UTF-8 でタイトルを表示しようとしているのかも。 xterm (に与えられた) Locale を、 xterm 内のシェルから起動された w3m が正しく知り得るのか疑問な気がするので、 一概に「xterm のバグ」とは言い切れないような気も。 >>40 Locale は環境変数なので継承されるはず。 % env LANG='ja_JP.eucJP' xterm +lc -e w3m -title -B でタイトルバーに日本語表示でるよ。 % env LANG='ja_JP.eucJP' xterm +u8 -e w3m -title -B % env LANG='ja_JP.eucJP' xterm +u8 +lc -e w3m -title -B でも出る。ただし端末表示の方はそれなりの encoding で表示されるが。 >>38-42 たいへん勉強になりました。 w3mの内部コードではなく、xtermの方を調べています。 とくにluitについて。 >>42 ありがとうございます。 3つともタイトルバーに日本語がでました。 ページは文字化けしてしまいましたが。 w3m0.5.1ユーザーです。 一般のウェブブラウザにある「戻る←」「進む→」に当たるコマンドというかキーが ヘルプを読んでも見当たりません。 Ctrl-vだとPageDown Esc-vだとHTMLのソースが表示されます。 どれがそれに当たるキーなのでしょうか? H でヘルプがでるからそれをみればいい(PREV と NEXT) もし割り当てられれてないようなら ~/.w3m/keymap で割り当てればいい form に入力後 NEW_TAB して一方のタブで form の入力内容を変更すると 他方にも反映されるのはどうにかならんかな。 なかなか不便だ。 >>47 ホントだ。バグだなぁ。reload するといい。 NEW_TAB のたびに Opening socket... とかは勘弁。 kterm -e w3m のようにして起動した時の C-zを無視してほしいです。 時々うっかり固まらせてしまい大ショックです。 あるいは何かいいworkaroundを御存知ないでしょうか。 質問です. $ w3mman ls とすると,エスケープシーケンスがうまく解釈されず下記のようになってしまいます, 何がまずいのでしょうか? [1m名前 [0m ls, dir, vdir - ディレクトリの中身をリスト表示する [1m書式 [0m [1mls [ [4m [22moptions [24m [1m] [ [4m [22mfile... [24m [1m] [0m なぜか w3mman w3mman だけは正しく期待したとおりに表示されます. >>54 普通、man はバックスペース(\010,^H)で太字やアンダーラインを表示するので、 w3mman はそれだけ解釈して、エスケープシーケンス(\033[1m 等)は解釈できない。 w3mman w3mman が OK ということなら、妙な環境で catman によるフォーマット済み man ファイル(/usr/share/man/cat1/ls.1 あたりか)が出来ているのかな。 Cygwinでw3m使うには、どうしたらいいのでしょうか。 はい。今夜やってみます。ホルダーはlocal/binでいいですか? 7MB以上の大きいhtmlを読み込むと segmentation fault で落ちるのですが こういうもんでしょうか? >>56 コマンドプロンプトだとまともに動きそうにないので、 Astec-Xとuxtermの組み合わせで動かしてます。 X Serverは別にAstec-Xじゃなくても似たようなもんだと思います。 LANGja_JP.UTF-8にしているとオプション設定画面で文字化けするので、 en_US.UTF-8にしています。 バッファ選択メニューにてmigemoが使えるようになるのは 何世紀後の事でしょうか ttp://megaui.net/oss4art/wiki/AAlib >AAlib は任意の画像をアスキーアート (Ascii Art) に変換・表示するためのライブラリである。 なるほど。 いや、けっこうマジで。 ダウンロードしmplayerで視る手順が、w3m上で出来んすかね。 現行のyoutubeダウンローダを見ると、flashは要件じゃないと思うんですよ。 youtube-dl とか? そこまで分かってるならなんとかなるんじゃない? いや、そこからが分からんくて、あれこれ調べてるんですよ。 拡張子の無いurlをアプリケーションに渡すことが出来ないと分かれば、emacs-w3mやfirefox等他のブラウザを使うと思います。 w3mの他ブラウザ起動機能で視てるのですが、確かにこれが一番現実的なのかもしれない。 ん、いやなんつうか emacs-w3m はキー配置は若干違うけど、レンダリングは w3m と一緒でしょ? で、 w3m-filter.el を使えば、 youtube のページ開いたら 動画へのリンクを表示するようなこともできる。 だから、うまく書いてやれば、 youtube の URL 開いたら 自動ダウンロードして mplayer で開くは自動化できると思う。 mplayerに渡すようなlocal-cgiを書くのが手っ取り早いんじゃないの 俺は以前はそうしてた え"。 今いちlocal-cgiと結びつかないんですが、 http://jp.youtube.com でload mycgi.cgiなどとやるということ? local-cgiってそんな使い方ができるのか。 ありがとう。 >>74 URLの頭にy:とか付けてurimethodmapでシェルスクリプトに渡してた。 スクリプトの内容は、一旦wgetしてパラメータのある行を抜き出し、 それを元にmplayerに渡すURLを生成するっていう作業。sedとかawkで事足りた。 自動読み込みじゃなく、U押してC-aしてy:っていう手間は要るけどね。 youtubeのファイルダウンロード&再生を >>75 を参考に local.cgi でつくってみました。 もうひとつ、こんなふうに ↓menu からシェルスクリプトに渡す方法も。 EXTERN_LINK "y" "uxterm -e w3m-youtube '%s'" local.cgi の方は、xine の再生がおわる前に、 echo "w3m-control: BACK" が処理されて?、前のページにもどってくれないのを直せませんが、 すごく便利になりました。 方向性を示してもらって感謝。 誤解があるとナンなので言っておくが、77 != 74 77 != 74です。 >>74 のレスを読んで触発された別人です。 >>74 =78の方は具体的にどんなシェルスクリプトにされましたか? こういうちょっとした、w3mから使えるシェルスクリプトは、 検索しても意外とないものですね。 いろいろ作っていても一々公開しないものね。 最近の YouTube に関していえば、 privoxy 等でフィルタをかまさないと まともに見られる表示じゃなくなってる。 ああ、>>75 に礼も言ってなかった。その節は有難うございます。 >>79 youtube-dlでファイルに落として、それをmplayerで表示させてるだけです。 なのでwgetはしてないですが、75のスキームそのまま。 >>81 youtube-dl のこと、ありがとうございます。 最初、ダウンロードに失敗するので試行錯誤したら、 youtube の仕様が変わっていたようで、 自分が使っていた youtube-dl は古いバージョンでした。 対応したアップデート版でうまくいきました。 こういう野良シェルスクリプトも、 examples としてw3mと一緒に配布されたら嬉しいと思うのですが、 外部プログラムに依存していると難しいのかな。 w3mman.cgi で、 "::" を含む名前のPerl のモジュールのマニュアル、 たとえば AptPkg::Cache を見ることが出来ないのですが、 これは仕様でしょうか? $man =~ s:([^-\w\200-\377.,])::g; の行で :: が削られている。 >>85 >>84 です。 どうもありがとうございます。 その正規表現の部分で、 "\072" で表示される ":"はじかないように変更すれば、 名前に "::" を含む マニュアルも検索できるようになるのですね。 まあ、場当たり的に $man =~ s!([^-\w\200-\377.,:])!!g; とでもしとけばいいんじゃないの >>87 そのように変更した w3mman2html.cgi をローカルの /cgi-bin に置きました。 ありがとうございました。 amazonがずいぶん前から見辛いっちゅーか、 w3mだと7スクロールぐらいしないと本題部分に辿り着かないけど、 いいフィルタ自作されてる方、公開してくれないですかね。 64ビット版のfedora8で自前でmakeしたw3mを使っていたら頻繁に落ちました. CFLAGS="-m32 -O2" ./configure でmakeしてやると安定しているので どこかでポインタのサイズを32ビットと仮定してるのかなぁ, などと思いつつ 現在安定しているので放っています. 誰かデバッグしてくれるとうれしいな (完全に他人まかせです) youtube で英語で見られる方法を教えてほしい。 強制的に日本語になりやがる。 Locale(LC_CTYPE) に従ってシステムの文字コードを設定をNO でhttp://uk.youtube.com/ にアクセス Accept-Languageじゃねえかい? patch送ったら取り込んでもらえるんですかねえ?@ML クライアントのIPアドレスで国を判断してるんじゃないかなあ。 YouTubeだけじゃなく例えばwww.google.comでも、 telnetでHTTPを直接しゃべってみると、 リクエストヘッダーをHost:しかつけなくても www.google.co.jpにリダイレクトされるんだよね。 >>96 全然駄目じゃないか。 Accept-Language も関係みたいだな。98 の言う通りか。 read.cgi ver 07.5.1 2024/04/28 Walang Kapalit ★ | Donguri System Team 5ちゃんねる