X

w3m その8

1名無しさん@お腹いっぱい。
垢版 |
2007/07/30(月) 17:43:18
みんな大好き w3m
http://sourceforge.net/projects/w3m/

07 http://pc11.2ch.net/test/read.cgi/unix/1132042800/
06 http://pc8.2ch.net/test/read.cgi/unix/1106393065/
05 http://pc5.2ch.net/test/read.cgi/unix/1087225153/
04 http://pc5.2ch.net/test/read.cgi/unix/1065600900/
03 http://pc.2ch.net/test/read.cgi/unix/1047038317/
02 http://pc.2ch.net/test/read.cgi/unix/1035755937/
01 http://pc.2ch.net/unix/kako/1012/10124/1012484783.html
688名無しさん@お腹いっぱい。
垢版 |
2019/09/09(月) 18:59:11.46
すまん。xselなくてもいけるなPIPE_BUFでも普通に%s使えるっぽいな。
直すか。
689名無しさん@お腹いっぱい。
垢版 |
2019/09/09(月) 19:18:13.15
いや、どうやら無理だな。後sedで変更する値が見えてるままの値じゃなくて
検索に入ってる文字列を変更するようになってるけと、これは直さないほうが使いやすいな。
後ほんとsedに流し込んでるだけなので、危険な事すれば危険なのでね。
690名無しさん@お腹いっぱい。
垢版 |
2019/09/09(月) 19:36:12.85
# 下部分だけちょっと改良。
# でも前のほうがxsel -sにurlがそのまま入ってる形だけど。
# xselを一時fileにしたほうが素直だと思うけどrm使うのは頭働かせないと怖いからやらない。
<<EOF
Content-Type: text/plain
w3m-control: GOTO $URL
w3m-control: EXTERN echo %s |sed 's/&/\\\&amp;/g' |xsel -s
w3m-control: VIEW
w3m-control: PIPE_BUF sed "s,<body [^>]*>,&\$(xsel -s)<br />,;"\
's%\(<input[^>]*\)Shift_JIS%\1UTF-8%; s%\(<form \)\([^>]*>\)'\
'%\1action="file:///cgi-bin/google.zsh" \2<input name=$UNIQ type=hidden value="form">%;'\
's,</form>,&<form action="file:///cgi-bin/google.zsh">'\
'<input name=$UNIQ value="option" type=hidden>'\
'<input name=field value='"\$(xsel -s)"' type=hidden>'\
'<input type=text></form>,;'\
's%\(<span[^>]*>\|</span>\)%%g; s%<div[^>]*>%%g; s%</div>%<div>&%g;'\
's,\(<a [^>]*href="\)/\(search?\|url?q=/search%3F\)\([^"]*"\)'\
',\1file:///cgi-bin/google.zsh?${UNIQ}=rotate\&\2\3,g;'\
's%\(<a [^>]*href="\)/url?%\1https://www.google.co.jp/url?%g'
w3m-control: VIEW
$( printf '%s\n' 'w3m-control: DELETE_PREVBUF'{,,,} )

EOF
691名無しさん@お腹いっぱい。
垢版 |
2019/09/09(月) 19:58:46.24
どうでもいいだろうけど以下の部分は、""いらないな。
'<input name=field value='"\$(xsel -s)"' type=hidden>'\
こう見たほうが素直に何してるか分かるかも。\\\&が非常に自分でも分かり辛い。
'<input name=field value='\$(xsel -s)' type=hidden>'\
692名無しさん@お腹いっぱい。
垢版 |
2019/09/11(水) 02:42:21.38
w3mは適当にformだけを切り出してもちゃんと描画してくれるから、
適当に抜き出してw3m-control: SUBMITを使えば、
10行20行に満たないコードでいろいろ書けちゃうね。shで書くよりも短く書ける。
やっぱw3m作った人はセンスの塊だと思うわ。いつか俺はテコ入れしてバージョン上げたいね。
色々書いたから載せたい所だか、まあ間違い直しでスレッドが埋まっちゃうから無理だな。
5chはmoreなんだな。lessじゃない。
2019/09/11(水) 17:50:18.92
自己顕示欲の塊みたいなやつだな
694名無しさん@お腹いっぱい。
垢版 |
2019/09/19(木) 19:41:51.98
5chでよく聞く気持ち悪い台詞だな。
2019/09/20(金) 08:49:56.46
そんなにたくさん5chを見てるのか
2019/12/07(土) 20:24:38.61
「誰に向けて書いてんだよ?」とは思うけど、どうせ過疎スレだし…
そんなことより Google の仕様がまた変わったな。
テキストがリンクになってる。a 要素の中に div 要素が無い。
まあ、この変更に気付いたのは lynx で見てる時なんだが。
2019/12/08(日) 08:31:19.86
俺の環境だとgoogle検索結果の <a> 要素中に <div> が入ってる。
User-Agent を見て出力形式を振り分けてるのかも知れん。
lynx は対応してるけど w3m は放置されてる感じで。
2019/12/16(月) 05:18:09.36
Lynx で google が使えなくなった視覚障害者の話がちょっと前にバズってたけど
ちょっとは影響があったのかな? でも、リンクが辿れるだけマシになったとは言え、
圧倒的に情報量が少ない。

User-Agent が Mozilla 系でも使えた頃が一番見やすかった。まだ今年の話だと思うが、
まともに見られなくなり User-Agent を Lynx 系にして凌いでいた。しかし、1 ヶ月
ちょっと前に完全にダメになってしまった。それまでにもちょいちょい表示が崩れることが
あったが大抵リロードで解決できていたのに。JavaScript 必須、GET より POST の時代ですな。

StartPage もいつからか次ページに移動できなくなったし、DuckDuckGO も何だか
見辛かったのだが、今回の騒動で Lite 版があるのを知って使い勝手がマシになった。
とは言え、タイトルはぶったぎりだし、検索の質はやはり劣るか。

本家の CVS から落とせなくなってからは、Debian 管理化の Git リポジトリを利用してるけど
User-Agent を Lynx 系にしようとしたとき siteconf に対応していることに気付いた。
それ以来便利に使っている。
2019/12/19(木) 22:17:05.18
>>698
w3mは高機能でテーブルのレイアウトができて視覚障害者は利用しないので、Lynx対応の方が社会的な要求が強いのでしょうね。
いきなりLynx-devのメール流量が増えた時は、私も驚きました。
2020/06/30(火) 16:54:57.14
googleさんの検索結果ページだけど、またw3mで使い物になるように改善されたかな。
皆さんどうですか?

自分とこ、色々手を入れちゃったせいで一般的な環境じゃないんだわ。
2020/07/11(土) 18:42:08.43
書き込みがあったとは、気付かなかった。ほら、過疎スレだからさ…

w3m も lynx も、a 要素の中に div 要素があると hidden link になるけど
特に困ることじゃない。
w3m の場合はリンク番号を表示させれば済む。
Google で hidden link になってた時期は >>616 から >>696 まで。
2020/10/13(火) 23:15:09.45
ぬるぽ
2020/10/15(木) 17:32:38.52
ぬるぬるぽ
2020/12/09(水) 09:26:06.05
https://i.imgur.com/YQnnV5M.jpg
2020/12/17(木) 07:19:07.67
Twitter 逝ったぁ!
2020/12/17(木) 20:49:45.01
Twitter 閲覧する local CGI とか作ってる方っていらっしゃらないですかね……?
2020/12/19(土) 05:44:43.76
>>706
スクレイピングする方法はググれば沢山見つかるから簡単に自作できるんじゃない?
っていうか自分もこれから作ろうと思ってる

あんま関係ないけど、とあるサイトで w3m で画像が表示されなくなったことがあって
なんか lazy load とかいうやつらしくて
そのときは串自作して対応したよ
2020/12/19(土) 09:31:37.92
>>706
Twitterは、user-agentをBot等に変えれば行けませんか?
2020/12/21(月) 23:40:46.24
>>708
いままで mobile.twitter.com でモバイル版が提供されてて
w3m などのテキストブラウザでも HTML で直接閲覧できていたんですが、
2020-12-16 で mobile.twitter.com 自体が廃止になったので、
今後は API 叩いたり JSON いじったりしないとダメじゃないかと思います。
710名無しさん@お腹いっぱい。
垢版 |
2020/12/22(火) 07:39:15.54
試してみれば見れるのは分かるだろうに
なんで適当な事書くのかね
2020/12/22(火) 07:57:03.19
そっか、検索でツイート引っかかるよう抜け道残してあるんだな
712709
垢版 |
2020/12/22(火) 09:45:21.44
>>710
失礼しました。「user_agent」を「Bot」にしたら確かに見れますね。
だいぶ読みづらくはなりますが……。
2020/12/23(水) 20:46:52.98
え、User-Agentを「Bot」にしても、ログインすると
「このブラウザは現在サポートされていません。」
と出るんだけど、何か足りない設定があるのかな
2020/12/24(木) 07:16:18.68
>>713
ログインしない状態での閲覧はできましたが、ログインしてからの操作は、こちらもできませんでした。
user-agent以外の手段が必要そうです。
なお、閲覧するだけなら、nitterを使うとすっきりした表示になるようです。
2020/12/25(金) 00:27:22.83
ありがとう、やっぱり見れないのね
JavaScriptの勉強してlocal CGIを書くかなあ
716709
垢版 |
2020/12/25(金) 09:34:43.94
すみません、私は普段ログインせずに閲覧するだけなのでなんとか見れるようになりましたが、
確かにログインするとダメですね……。

ちなみに、 UA をボットにするのは、 README.siteconf にそのものズバリな例が載っていました。
717709
垢版 |
2020/12/25(金) 09:37:27.24
あ、あと、ボットにして見れるのも最新 20 件くらいだけで、ページ送りはできないみたいですね。
718709
垢版 |
2020/12/25(金) 20:30:40.04
>>714
nitter 良いですね。 siteconf に設定しました。

url "https://twitter.com/";
substitute_url "https://nitter.net/";
719名無しさん@お腹いっぱい。
垢版 |
2021/04/25(日) 22:21:20.66
Opening socket... と表示されてる時に接続が切れると
うんともすんともと言わなくなるんだな
どれだけタブを開いていても固まってしまうから kill して全て破棄するしかなくなる
2021/04/29(木) 05:14:50.57
それはまだ接続してないんじゃないか。
「接続が切れる」とは何を指してる?
2021/04/29(木) 06:09:49.92
文字通りだろ
光だと経験ないかもしれないが
ボロいADSLなんかで使えば分かる
最初からオフラインだと固まらない
2021/04/29(木) 06:22:36.78
Opening socket... の少し後で切れた場合は操作はできても
子プロセスがずっと残ったりする
2021/08/12(木) 15:41:18.59
        |ヽ|l:.:.:.:/|:l:.:.:.:.:.:..|:.,rー'''゙¨ヽ、:.:.:.:.|:.:.:.:|:.:.:.|:.:|
        |/ l\/ l/|:.:.:.:l:.|!´       l:.:.:.:.:|:.:.:.:l!:.:.:|:.:|
        |_/|/ ヽ、|:.:.:.!/      /:.:.:.:.:.|:.:.:.:.l:.:.:.|:.:|
        |`ヽミ   l:.:.:./  _,,,.. -ー/li.:.:.:.:.:l:.:.:.:.:|:.:.:.|:.:|
        |ィト,/`  l,/´     l:/|`:.:.:./:.:.:.:.:|:.:.:.|:.:|
        |ソ,/         ___  ' i:.:.:.:/:.:.:.:.:.:|:.:.:.|:.:|
        |`         ./,、 ̄`_ヽ|:./l:.:.:.:.:./:.:.:.:|:.:|
        |         ,ト!(:.:rテ'/ ´ /:.:.:.:./:.:.:.:.:.:l:.:|
        |    '    ヾニ_ /  /'ノl:.:.:/:l:.:.:.:.:.:.|:.:|
      /iヽ ヽ 、_         ,/_' -‐':.:.:|:.:.:.:.:.:|:.:l
        ヽ` \  ̄        ィ‐':.:.|:.:.:.:.:.:.l:.:.:.:.:.:.|:/ >>1乙だよ
     l`ヾ、  l--──‐─‐.' ´:.:.:.:.:.:|:.:.:.:.:.:i:.:.:.:.:.:.l/
     _'、  \. |イ:./l/:.:.:.:.:.:.:.:.:.:.,:.:.:.:.ノ:.:.:/l/:.:.:.:.:./'
     l l \  `'i Y  |:.:/ノ_ -‐!/l:./l:.:.:/ /:.:.:.:./l
      〉、  ヽ  | \ ` ´    レ i/ il_/
2021/08/12(木) 16:41:27.11
>>723
13年も経って礼か。時効だろう。
2021/11/21(日) 23:17:59.97
光回線だがOpening socket...で固まると何も操作できなくなるな
killするしかない
2022/05/28(土) 22:25:49.63
w3mで2chはかけない? エラーになるけど。
727名無しさん@お腹いっぱい。
垢版 |
2022/05/29(日) 04:46:10.90
>>725
-4オプションをつけてみて
2022/05/29(日) 13:14:51.00
そんな事はとっくに試してる
729名無しさん@お腹いっぱい。
垢版 |
2022/05/29(日) 19:01:03.82
うそつけ、例をいえよ、ゴミ
730名無しさん@お腹いっぱい。
垢版 |
2022/05/29(日) 19:01:37.71
2022/05/29(日) 20:46:32.67
ipv6なんて無い昔からの挙動だからな>>719-
732名無しさん@お腹いっぱい。
垢版 |
2022/10/26(水) 20:06:28.47
redhatでmake出来るソースどこかにありますか?
dnf searchではヒットするけど
installしようとするとエラーで終わってしまいます
733名無しさん@お腹いっぱい。
垢版 |
2023/12/31(日) 13:37:00.69
no_proxy 環境変数を理解できない、或いはクセがあるのだっけ?
curl、wget では $no_proxy に従い直接接続できるが、w3m はプロキシに行ってしまうのだが。

$ w3m --version
w3m version w3m/0.5.3, options lang=en,m17n,image,color,ansi-color,mouse,gpm,menu,cookie,ssl,ssl-verify,external-uri-loader,w3mmailer,nntp,gopher,ipv6,alarm,mark
734名無しさん@お腹いっぱい。
垢版 |
2023/12/31(日) 15:01:55.58
>>733 自己レス。
そもそも proxy 環境変数を見ないのだな。.w3m/config に書くのであって。
2024/03/27(水) 19:45:23.12
あぼーん
汚い汚物顔の強さと濃さかな
2024/03/27(水) 20:47:38.10
ガーシーが依頼したのか?
2024/03/27(水) 20:55:54.03
人生には謝罪しろ言うくせにな
738名無しさん@お腹いっぱい。
垢版 |
2025/03/24(月) 08:33:26.83
メモ。w3m ソースは github.com/tats/w3m/ の最新版を取得すると良いのかもしれない。sourceforge.net/projects/w3m/files/w3m/ や deb.debian.org/debian/pool/main/w/w3m/ でなく。

例えば CVE-2023-4255 (Published Date: 12/21/2023 Last Modified: 11/21/2024)
https://nvd.nist.gov/vuln/detail/CVE-2023-4255
は、
Commits on Jul 13, 2023
https://github.com/tats/w3m/commit/edc602651c506aeeb60544b55534dd1722a340d3
で解決されたように見える。が、sourceforge.net(最新2011-01-15) や deb.debian.org(最新2023-01-21) には梱包されてなさそう。
レスを投稿する

5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況