探検
Pythonのお勉強 Part76
127デフォルトの名無しさん (アウアウウー Sae3-7str)
2025/11/15(土) 16:50:32.72ID:sfMVLVN/a スクレイピングでrequests.getした際にテーブル内の負の値だけが取れないってことありますか?ホームページ上では-156と表示されているのにres.textで確認すると<td>-</td>になってしまうのです。
128デフォルトの名無しさん (ワッチョイ 1f77-KAfG)
2025/11/15(土) 17:43:18.31ID:Yrz/bNnl0 >>127
いいことを教えてやろう。
うまくいかないときは、それを手掛けた奴が頭悪そうな順に疑え。
この場合、最も頭悪そうなのは自分自身であり、次に頭悪そうなのはWebサイトを作った奴、
そしてrequestsの開発者については、お前やWebサイト制作者に比べて遥かに頭悪くないと考えられる。
つまりまずは自分の目とWebサイトを疑え。即ち、Webブラウザの開発者ツールを使用して当該箇所のHTMLソースを確認するとよい。
いいことを教えてやろう。
うまくいかないときは、それを手掛けた奴が頭悪そうな順に疑え。
この場合、最も頭悪そうなのは自分自身であり、次に頭悪そうなのはWebサイトを作った奴、
そしてrequestsの開発者については、お前やWebサイト制作者に比べて遥かに頭悪くないと考えられる。
つまりまずは自分の目とWebサイトを疑え。即ち、Webブラウザの開発者ツールを使用して当該箇所のHTMLソースを確認するとよい。
129デフォルトの名無しさん (ワッチョイ 7fcf-1rUY)
2025/11/15(土) 18:03:53.17ID:Sy/WrQOu0 ソースでは <td>-156</td> になってますね。
requests.getしてprintすると<td>-</td> になってしまいます。なんでだろー
requests.getしてprintすると<td>-</td> になってしまいます。なんでだろー
130デフォルトの名無しさん (アウアウウー Sa85-H7iN)
2025/11/16(日) 13:21:38.88ID:0LN83zrSa131デフォルトの名無しさん (ワッチョイ a107-Bsbk)
2025/11/16(日) 13:32:37.53ID:ypmWL8150132デフォルトの名無しさん (ワッチョイ 5d54-3Fnc)
2025/11/16(日) 13:49:21.05ID:YRIk+m9R0 試行錯誤して意見を取り入れながら改良していくべきものなのに、
追加発注は金がかかるからバージョン1のままずっと使う
内作しろ
追加発注は金がかかるからバージョン1のままずっと使う
内作しろ
133デフォルトの名無しさん (ワッチョイ 91df-iLwu)
2025/11/16(日) 18:27:30.83ID:fnmgx6dT0 Pytnonのraw文字列リテラルって、raw文字列リテラル界の中ではかなり見劣りする仕様だけど、導入時期が他の言語より早かったんだっけ?
個人的にはわりとPython好きな方だと思うけど、これとstr.joinだけはちょっと擁護する気になれないわ。
個人的にはわりとPython好きな方だと思うけど、これとstr.joinだけはちょっと擁護する気になれないわ。
134デフォルトの名無しさん (ワッチョイ 5d54-3Fnc)
2025/11/16(日) 18:41:41.10ID:YRIk+m9R0 strをイテレータとして1文字取り出してもまだstrでイテレータっていう
135デフォルトの名無しさん (ワッチョイ a9ad-amEk)
2025/11/17(月) 01:57:45.84ID:yN+O6HpM0 >129
requests は「JS 実行前の生HTML」しか取れないから、
ブラウザで見えてる DOM(JS で書き換わった後)は取れない。
その1
-Selenium / Playwright で DOM を展開(下までスクロールやクリック含む)して、
-その後の該当する要素を拾う。
その2
-API(fetch/XHR)を探して、そこで返ってくる JSON を直接リクエストする方法。
-大抵は画面の数字やテーブルの元データがそのまま手に入る。
まずは デベロッパーツールで Networkを見る。
requests は「JS 実行前の生HTML」しか取れないから、
ブラウザで見えてる DOM(JS で書き換わった後)は取れない。
その1
-Selenium / Playwright で DOM を展開(下までスクロールやクリック含む)して、
-その後の該当する要素を拾う。
その2
-API(fetch/XHR)を探して、そこで返ってくる JSON を直接リクエストする方法。
-大抵は画面の数字やテーブルの元データがそのまま手に入る。
まずは デベロッパーツールで Networkを見る。
136デフォルトの名無しさん (ワッチョイ 9117-juqw)
2025/11/17(月) 02:32:20.55ID:opYjrUAf0 自分でサイトつくるのって思っているより大変なことなんですね
137デフォルトの名無しさん (ワッチョイ 22bc-RaAf)
2025/11/17(月) 20:32:37.49ID:2/K3mAIm0 型ヒントって意味ないやん
strで宣言しても、intの数値を代入できるしw
strで宣言しても、intの数値を代入できるしw
138デフォルトの名無しさん (ワッチョイ a15b-Bsbk)
2025/11/17(月) 20:48:36.71ID:kK8nO+oA0 標準では何もせんからね
自前でtypingのコード書くか外部ツールいれないと
主要なIDEなら対応してるし実行時ならPydanticとか
自前でtypingのコード書くか外部ツールいれないと
主要なIDEなら対応してるし実行時ならPydanticとか
139デフォルトの名無しさん (ワッチョイ 5d54-3Fnc)
2025/11/17(月) 21:04:29.35ID:1fkr/nM60 型ヒントのある関数の中では教えてくれても、
呼び出し時に型間違っても何も言わない
呼び出し時に型間違っても何も言わない
140デフォルトの名無しさん (ワッチョイ 6e10-iLwu)
2025/11/17(月) 22:46:24.13ID:fGU+8gYk0 Pylanceとか、呼び出し時に型が違っていたら警告出してなかったっけ?
141デフォルトの名無しさん (ワッチョイ 5d54-3Fnc)
2025/11/17(月) 23:04:59.21ID:1fkr/nM60 やろうと思えばやれるから、やってるのもあるだろうけど、
vscodeはやってない
vscodeはやってない
レスを投稿する
ニュース
- 【速報】トランプ大統領、中国の習近平国家主席を「国賓」として招待することに ★2 [ニョキニョキ★]
- 日本と中国を結ぶ12航空路線で全便欠航 中国人に最も人気の海外旅行先は日本から韓国に [ぐれ★]
- 米中電話会談、トランプ氏は「米国側は中国にとっての台湾問題の重要性を理解する」 [1ゲットロボ★]
- 【東京・足立の車暴走】赤信号無視か 危険運転致死傷疑いも視野に捜査 逮捕された職業不詳の男性(37)は精神疾患で通院歴も ★3 [ぐれ★]
- 【音楽】「なんでこんなバカが国のトップなの?」 若者に人気のバンド「GEZAN」のマヒトゥ・ザ・ピーポーが高市総理に苦言 [シャチ★]
- 中国人「『日本は危ないから行かないように』と言われたが、日本に来たらとても安全だった」 [お断り★]
- 【岸田朗報】鰻(ウナギ)、ガチで3年以内に1匹1000円以下へ!!!! [782460143]
- 【実況】博衣こよりのえちえち朝こよ🧪
- 習「中国とアメリカは軍国主義(日本)を倒した仲間。勝利の成果を守るために協力すべきだ」とトランプに呼び掛け。高市早苗、終了。 [153490809]
- スキルス胃がんってあるじゃん?
- 【急募】巨人の人的補償プロテクトリストWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWW
- 【高市悲報】来年、習近平主席がアメリカに「国賓」として訪米。どうするんだよ高市・・・アメリカも敵に回すのか? [483862913]
