!extend:default:vvvvv:1000:1024
↑スレ立てる毎に減るので、減ってたら3つに補充すること。
・当スレにRubyのソースコード類を書くことを禁ず
・Ruby等、Pythonではないプログラミング言語での回答類・質問を書くのも禁止
・「Ruby では」「Rubyでは」「Rails」正規表現→「^クソチョンw$」をNGワード登録推奨
・エラーを解決したいときは、かならず
エラー文(勝手に省略orスクショうp等の横着禁止)と
おま環(Pythonのバージョン番号+OS名とバージョン+IDE名)を書け。
★Pythonのソースコードを5ちゃんに直貼はインデントが崩壊するので、
↓等のコードうp用サイトに貼ってきてくだしあ。(スクリーンショットをうpる「横着」禁止)
ttps://techiedelight.com/compiler/ Run Code機能あり。
ttp://ideone.com/ デフォ設定がCなので、Pythonするには言語種選択ボタン押下がピコ手間かも。
ttp://pastebin.com/ まずまずシンプル。
ttp://dpaste.com/ とてもシンプル。消えるまでの日数は十分長ーく指定のこと。
◇Pythonオフィシャルサイト http://www.python.org/
◇Pythonドキュメント https://docs.python.org/ja/3/
◇まとめwiki ttp://python.rdy.jp/
●関連スレ● 自称初心者は↓へ
【まず1嫁】くだすれPython(超初心者用) その58
https://mevius.5ch.net/test/read.cgi/tech/1662514433/
〇前スレ〇
Pythonのお勉強 Part68
https://mevius.5ch.net/test/read.cgi/tech/1663235546/
次スレの建立は>>985が挑戦する。(980通過して24h後も落ちなくなった)
### END of TEMPLATE ### ?
VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured
探検
Pythonのお勉強 Part69
■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん (ワッチョイ c733-stRS)
2022/11/24(木) 21:39:44.67ID:A6xfpKBe02デフォルトの名無しさん (ワッチョイ ef33-stRS)
2022/11/24(木) 22:06:48.23ID:A6xfpKBe0 何か最後に?ついてるんやけど
3デフォルトの名無しさん (アウアウウー Sa3b-t8YJ)
2022/11/25(金) 00:11:23.76ID:2/ccX3XOa >>1
O₂🍛
O₂🍛
4デフォルトの名無しさん (アウアウウー Sa3b-kfYZ)
2022/11/25(金) 12:28:38.81ID:PV2ZG9bua スレ埋めるだけの簡単なお仕事です
5デフォルトの名無しさん (ワンミングク MM92-IwB9)
2022/11/25(金) 13:32:24.92ID:KAp4t6I3M スコップ一本さらしにまいて♪
6デフォルトの名無しさん (ブーイモ MM3e-7Dqo)
2022/11/25(金) 20:28:02.56ID:Ex0f5l5+M 今日もNullpoを葬る~♪
7デフォルトの名無しさん (ワッチョイ b7da-Qvc3)
2022/11/27(日) 22:00:34.60ID:6go5tzEb0 LSTMで全部で1000あるデータの、1001期目の予測値を得るにはどうすれば良いですか
どのサイトを見ても検証期間中の予測値は得られても、それより先の予測を得る手段がいまいち分かりません
どのサイトを見ても検証期間中の予測値は得られても、それより先の予測を得る手段がいまいち分かりません
8デフォルトの名無しさん (ワッチョイ ff63-RPwI)
2022/11/27(日) 22:12:17.80ID:7lw/d0vw0 「そんな先のことは分からない」
9デフォルトの名無しさん (ワッチョイ b7da-Qvc3)
2022/11/27(日) 22:35:08.90ID:6go5tzEb0 無事解決しました
10デフォルトの名無しさん (アウアウウー Sa5b-j/58)
2022/11/28(月) 10:29:47.82ID:kuSQgmzBa テンプレのrubyでは~に時代を感じるな
11デフォルトの名無しさん (ワッチョイ bf89-t+XA)
2022/11/28(月) 12:15:33.61ID:2MZJX1kl0 Twitterのエゴサをpythonでできないかなと思って
seleniumでやってみたけど画面上は表示されてるのに
ソースには「JavaScriptを使用できません。」と出る
どうすりゃいいんや…
seleniumでやってみたけど画面上は表示されてるのに
ソースには「JavaScriptを使用できません。」と出る
どうすりゃいいんや…
12デフォルトの名無しさん (ワッチョイ ffbb-rfgC)
2022/11/28(月) 13:04:31.73ID:QxjFh41D0 >>11
せめて日本語が読めるようになってから手を出せ。あほ
せめて日本語が読めるようになってから手を出せ。あほ
13デフォルトの名無しさん (ワッチョイ bf89-t+XA)
2022/11/28(月) 15:59:10.98ID:2MZJX1kl0 実行して立ち上がったブラウザではTwitterが表示されている
つまりJavaScriptは実行されている
にもかかわらずpython内では実行されていないソースコードが表示される
JavaScriptが実行された後のソースコードを取得するにはどうするといいでしょうか?
つまりJavaScriptは実行されている
にもかかわらずpython内では実行されていないソースコードが表示される
JavaScriptが実行された後のソースコードを取得するにはどうするといいでしょうか?
14デフォルトの名無しさん (ワッチョイ 9f2a-+r4L)
2022/11/28(月) 19:04:45.26ID:v7hHcTqw0 webdriverのインスタンスを作るときにjavascriptをenableにしてないとか
ページの生成が終わるのを待たずにhtml読んでしまっているとか
ページの生成が終わるのを待たずにhtml読んでしまっているとか
15デフォルトの名無しさん (ワッチョイ bf89-t+XA)
2022/11/28(月) 20:47:02.50ID:2MZJX1kl0 >>14
ありがとうございます。
オプションに「options.add_argument('--enable-javascript')」を追加したり
time.sleep(15)も追加しましたが駄目でした。
ありがとうございます。
オプションに「options.add_argument('--enable-javascript')」を追加したり
time.sleep(15)も追加しましたが駄目でした。
16デフォルトの名無しさん (ワッチョイ bf89-t+XA)
2022/11/28(月) 21:06:19.85ID:2MZJX1kl0 JavaScriptが反映されていないのが原因だと思うので
そのあたりをもう少し調べてみます。
そのあたりをもう少し調べてみます。
17デフォルトの名無しさん (ワントンキン MM7f-Znd8)
2022/11/28(月) 21:07:26.37ID:cGJ8oXTgM18デフォルトの名無しさん (アウアウウー Sa5b-tkFl)
2022/11/28(月) 21:26:56.65ID:6X8/W5dUa ソース出さないで言ってもわからんぞ
19デフォルトの名無しさん (ワッチョイ d733-Z2Iz)
2022/11/28(月) 22:48:45.25ID:g0wreZ1J0 こういうの見て思うんだけど、スクレイピングの参考書ってAPIへの誘導ってないの?
プログラミングもWebの知識もない人間にスクレイピングだけでやらせようとするのってだいぶ罪深いと思う
それに、Webの勉強するのにスクレイピングやブラウザでアクセスしながらって相当な悪手だろ
普通簡単なWebサイト作りながらとか構築する側の立場で進めた方が効率いいし、それでもボリューム的に片手間で済むようなもんでもないでしょ
プログラミングもWebの知識もない人間にスクレイピングだけでやらせようとするのってだいぶ罪深いと思う
それに、Webの勉強するのにスクレイピングやブラウザでアクセスしながらって相当な悪手だろ
普通簡単なWebサイト作りながらとか構築する側の立場で進めた方が効率いいし、それでもボリューム的に片手間で済むようなもんでもないでしょ
20デフォルトの名無しさん (ワッチョイ ff63-RPwI)
2022/11/28(月) 22:54:19.81ID:TOwN4nTg0 そういう参考書を作ってあげて
21デフォルトの名無しさん (ワッチョイ ffcf-ykd8)
2022/11/28(月) 22:59:12.17ID:LDNjf6uN0 Webプログラミングと言えば
情報を発信するか集めるか、まあどっちかだしな
情報を発信するか集めるか、まあどっちかだしな
22デフォルトの名無しさん (ワッチョイ 9f2a-+r4L)
2022/11/28(月) 23:02:43.25ID:v7hHcTqw0 >>19
全くもっておっしゃるとおりだと思うけど、静的なサイトだとBeautifulsoupとかで見よう見まねでできちゃったりするから素人さんにもキャッチーなのよね
http通信とは?とかWebサーバーの仕組みとは?から入ると素人は力尽きちゃう
全くもっておっしゃるとおりだと思うけど、静的なサイトだとBeautifulsoupとかで見よう見まねでできちゃったりするから素人さんにもキャッチーなのよね
http通信とは?とかWebサーバーの仕組みとは?から入ると素人は力尽きちゃう
23デフォルトの名無しさん (ワッチョイ 1797-QUc+)
2022/11/29(火) 01:26:48.72ID:wVUySIDy0 >>19
APIはAPIで辛くない?認証不要APIとかだったらいいけど、大体お作法を調べるのに時間かかる。
スクレイピングは、HTML/CSSやったことあるならわかる感じがする。RPAみたいなものかなと。
いや逆にRPAこそGUIの知識いるしAPI整備してもらってやったらいいじゃんと思うんだけど、API整備の予算が付かないんだろうね…
APIはAPIで辛くない?認証不要APIとかだったらいいけど、大体お作法を調べるのに時間かかる。
スクレイピングは、HTML/CSSやったことあるならわかる感じがする。RPAみたいなものかなと。
いや逆にRPAこそGUIの知識いるしAPI整備してもらってやったらいいじゃんと思うんだけど、API整備の予算が付かないんだろうね…
24デフォルトの名無しさん (ワッチョイ ff63-odCL)
2022/11/29(火) 01:43:32.73ID:fkaofXgI0 スクレイピングって、ウェブブラウザの振る舞いを模倣すればいいのと違うん?
25デフォルトの名無しさん (ワッチョイ 9f2a-+r4L)
2022/11/29(火) 07:37:52.82ID:NO7HG1hV0 >>24
今どきのブラウザは巨大アプリの筆頭みたいなもんなので簡単にエミュレートできないのさ
なのでjavascriptで自分を書き換えたりするサイトをスクレイピングするにはブラウザそのものを立ち上げて外部からブラウザに今どう表示してんのと聞くほうがいいわけ、それがSeleniumという仕組み
今どきのブラウザは巨大アプリの筆頭みたいなもんなので簡単にエミュレートできないのさ
なのでjavascriptで自分を書き換えたりするサイトをスクレイピングするにはブラウザそのものを立ち上げて外部からブラウザに今どう表示してんのと聞くほうがいいわけ、それがSeleniumという仕組み
26デフォルトの名無しさん (テテンテンテン MM8f-Ww1B)
2022/11/29(火) 08:28:45.05ID:rvct1gbBM カールで取るかAPIでとった方が早いだろ
27デフォルトの名無しさん (ワッチョイ d72c-/LaG)
2022/11/29(火) 10:28:54.87ID:Zdiz5UrS0 アホがいきなり動的生成サイトにwhile無限アタックをしかけるまである
悪いのは無責任な企業系入門サイトと、ライブラリ豊富なpython
悪いのは無責任な企業系入門サイトと、ライブラリ豊富なpython
28デフォルトの名無しさん (ワッチョイ 775f-4gln)
2022/11/29(火) 10:35:59.05ID:oFH75lpf0 >>25
おまけにブラウザごとに挙動が大きく変わるから、ややこしい!
おまけにブラウザごとに挙動が大きく変わるから、ややこしい!
29デフォルトの名無しさん (ワッチョイ ffbb-NZIw)
2022/11/29(火) 11:42:39.57ID:JTTSm0Nf0 初級者がスクレイピングやるなら、先にネット倫理から勉強してほしいところ
30デフォルトの名無しさん (テテンテンテン MM8f-Ww1B)
2022/11/29(火) 12:06:36.59ID:oHPPEt2oM 初級者が考えるような事は調べりゃ出てくる
初級者は検索して自己解決に導けないならあきらめた方が良い
初級者は検索して自己解決に導けないならあきらめた方が良い
31デフォルトの名無しさん (ワッチョイ ff63-RPwI)
2022/11/29(火) 12:12:16.73ID:OkL5Yz/20 Twitterなら、API利用から始めると楽だと思う
32デフォルトの名無しさん (ワッチョイ ff63-odCL)
2022/11/29(火) 12:12:24.76ID:fkaofXgI0 >>25
単純化すると
ウェブブラウザみたいに、サイト開いてAPI叩いてデータ(JSONが主流になったね)拾って、
これをパースして個別データとして取り込んで、ってことだよね
これってウェブブラウザの振る舞いを模倣していることにならないのかな?
単純化すると
ウェブブラウザみたいに、サイト開いてAPI叩いてデータ(JSONが主流になったね)拾って、
これをパースして個別データとして取り込んで、ってことだよね
これってウェブブラウザの振る舞いを模倣していることにならないのかな?
33デフォルトの名無しさん (ワッチョイ d74f-emCW)
2022/11/29(火) 12:12:37.05ID:Rlb9t/Eq0 たいてい、スクレイピングの本には、図書館へスクレイピングして、
サーバーを落とした香具師が、業務妨害で逮捕された事件も書いてある。
だから必ず、契約してAPI を使うように書いてある
あくまで練習用に、自分のPC 内のウェブサーバーへアクセスして試すべき。
VSCode の拡張機能・Live Server で、簡単にサーバーを起動できる
そこに対して、curl, wget, Selenium Webdriver などで試す
基本的に、ほとんどのサイトは、5ch みたいに先にHTML を送っておいて、
その中で、Ajax(JavaScript)によって内容をサーバーへ取りに行くので、
Selenium で実際のブラウザを使って、wait しないと内容を取れないはず
サーバーを落とした香具師が、業務妨害で逮捕された事件も書いてある。
だから必ず、契約してAPI を使うように書いてある
あくまで練習用に、自分のPC 内のウェブサーバーへアクセスして試すべき。
VSCode の拡張機能・Live Server で、簡単にサーバーを起動できる
そこに対して、curl, wget, Selenium Webdriver などで試す
基本的に、ほとんどのサイトは、5ch みたいに先にHTML を送っておいて、
その中で、Ajax(JavaScript)によって内容をサーバーへ取りに行くので、
Selenium で実際のブラウザを使って、wait しないと内容を取れないはず
34デフォルトの名無しさん (ワッチョイ ff63-RPwI)
2022/11/29(火) 12:24:13.36ID:OkL5Yz/20 >>33
落としたことにされた人には、図書館も開発元の三菱情報システムも、謝罪しているけどね
落としたことにされた人には、図書館も開発元の三菱情報システムも、謝罪しているけどね
3533 (ワッチョイ d74f-emCW)
2022/11/29(火) 12:26:22.23ID:Rlb9t/Eq0 山浦 清透
【作業工程フル公開】エンジニアが30万円案件の制作過程を公開
www.youtube.com/watch?v=tYbVl6N8oxI
これは、PHP だけど、
Udemy の山浦ぐらいの相当プロでも、1:5:42 の所で、
マイナビ求人をスクレイピング攻撃しているだろw
プロでも間違うから、なおさら素人なら、無限ループで攻撃し放題。
業務妨害で逮捕されるだけ
データベースに保存するなら、普通はPHPじゃなくて、Ruby on Rails を使う
【作業工程フル公開】エンジニアが30万円案件の制作過程を公開
www.youtube.com/watch?v=tYbVl6N8oxI
これは、PHP だけど、
Udemy の山浦ぐらいの相当プロでも、1:5:42 の所で、
マイナビ求人をスクレイピング攻撃しているだろw
プロでも間違うから、なおさら素人なら、無限ループで攻撃し放題。
業務妨害で逮捕されるだけ
データベースに保存するなら、普通はPHPじゃなくて、Ruby on Rails を使う
36デフォルトの名無しさん (ワッチョイ ff63-RPwI)
2022/11/29(火) 12:29:52.96ID:OkL5Yz/2037デフォルトの名無しさん (オッペケ Srcb-c1Xh)
2022/11/29(火) 12:31:54.18ID:HCCm6VNmr サーバーを落とした香具師!
38デフォルトの名無しさん (ワッチョイ ffcf-ykd8)
2022/11/29(火) 12:35:46.90ID:5xrJvc530 このような場合はJPCERT/CCに相談して欲しかった
39デフォルトの名無しさん (ワッチョイ ff63-RPwI)
2022/11/29(火) 12:58:16.32ID:OkL5Yz/20 この障害は岡崎だけでなく、全国の図書館でも発生していたそうだ
朝一でサーバー再起動が業務となっていたところもあるそうだ
悪質なのは、この障害、原因を開発元が承知していたことと、
システム更新(もちろん有料)の口実にされていたこと
ハードの買換をさせられた図書館もある
詐欺事件とされてもおかしくはない
朝一でサーバー再起動が業務となっていたところもあるそうだ
悪質なのは、この障害、原因を開発元が承知していたことと、
システム更新(もちろん有料)の口実にされていたこと
ハードの買換をさせられた図書館もある
詐欺事件とされてもおかしくはない
40デフォルトの名無しさん (テテンテンテン MM8f-Ww1B)
2022/11/29(火) 13:04:50.65ID:azSIQh15M まぁ我々は困らないし
当事者が気を付ければ済む話
過去の事件ループはもう良いから
それで終わりにしろ
当事者が気を付ければ済む話
過去の事件ループはもう良いから
それで終わりにしろ
41デフォルトの名無しさん (ワッチョイ ffbb-rfgC)
2022/11/29(火) 13:14:40.68ID:eTNa7b4f0 twitterなんて「規約読め」「API利用しろ」で終了だろ
図書館事件は特殊条件踏みすぎててミスリードすぎる
図書館事件は特殊条件踏みすぎててミスリードすぎる
42デフォルトの名無しさん (ワッチョイ d733-Z2Iz)
2022/11/29(火) 13:16:57.04ID:fQLmT73p0 >>32
逆に、人がAPIで提供されるjsonのデータ読めって言われてもきついでしょ
それと同じで人が読みやすいように作られてるWebのUIをソフトウェアにやらせるのは筋違いなんだよ
seleniumにしたって元々はJavaScriptのテストを走らせるために作られていて、誰かが作った仕様のはっきりしないWebサービスのUIを解析するためには作られてないと思うよ
今もそうだかは使ったことないからはっきりとはいえないけど
逆に、人がAPIで提供されるjsonのデータ読めって言われてもきついでしょ
それと同じで人が読みやすいように作られてるWebのUIをソフトウェアにやらせるのは筋違いなんだよ
seleniumにしたって元々はJavaScriptのテストを走らせるために作られていて、誰かが作った仕様のはっきりしないWebサービスのUIを解析するためには作られてないと思うよ
今もそうだかは使ったことないからはっきりとはいえないけど
4333 (ワッチョイ d74f-emCW)
2022/11/29(火) 13:34:20.35ID:Rlb9t/Eq0 元々、Selenium Webdriver, Capybara などは、
Ruby on Rails の開発で、システムテストで実際のブラウザを自動操作して、
画面の動作を確認するためのツール
Ruby on Rails の開発で、システムテストで実際のブラウザを自動操作して、
画面の動作を確認するためのツール
44デフォルトの名無しさん (スップ Sd3f-8UFK)
2022/11/29(火) 14:04:13.09ID:AC1KYodjd Ruby馬鹿がいつもの噓
45デフォルトの名無しさん (ブーイモ MM8f-oElN)
2022/11/29(火) 14:04:43.85ID:sKS8alA2M API使いたくないからスクレイピングするんだろ
何言ってんだか
何言ってんだか
46デフォルトの名無しさん (ワッチョイ 5701-ZS+X)
2022/11/29(火) 14:28:15.03ID:6F6KBCUn0 >>44
今回はちょっと違う
今回はちょっと違う
47デフォルトの名無しさん (ワッチョイ 9f2a-+r4L)
2022/11/29(火) 15:17:30.94ID:NO7HG1hV0 >>32
おっしゃる範囲では模倣してることになるよ
しかしPythonのライブラリでブラウザの全部の機能を模倣するのは難しいので、Javascriptをゴリゴリ使うようなサイトではブラウザを模倣するんじゃなくてブラウザにレンダリングを外注するのよ
おっしゃる範囲では模倣してることになるよ
しかしPythonのライブラリでブラウザの全部の機能を模倣するのは難しいので、Javascriptをゴリゴリ使うようなサイトではブラウザを模倣するんじゃなくてブラウザにレンダリングを外注するのよ
48デフォルトの名無しさん (ワッチョイ 9f47-NCR5)
2022/11/29(火) 18:02:03.33ID:lUjN289S0 集合って使う?
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 高市首相答弁を“引き出した”立民・岡田克也氏が改めて説明「なぜ慎重な答弁をされなかったのか。非常に残念に思っている」 ★9 [ぐれ★]
- 【news23】小川彩佳アナ「ここまでの広がりになるということを、高市総理はどれだけ想像できていたんでしょうね」 日中問題特集で [冬月記者★]
- 【野球】大谷翔平、佐々木朗希、山本由伸らがWBC辞退なら広がる不協和音… 『過去イチ盛り上がらない大会』になる可能性も★2 [冬月記者★]
- 【国際】ロシアはすでに戦争準備段階――ポーランド軍トップが警告 ★2 [ぐれ★]
- 「町中華」の“息切れ倒産”が増加 ブームにも支えられ職人技で踏ん張ってきたが… 大手チェーンは値上げでも絶好調 [ぐれ★]
- 毛寧(もう・ねい)報道官「中国に日本の水産品の市場は無い」 高市首相の国会答弁に「中国民衆の強い怒り」 ★2 [ぐれ★]
- 優しいジャイアン「お前の物はお前の物だろ」
- 【高市核兵器】 小泉コメ防衛大臣「民主党政権 岡田外務大臣の “非核三原則” に関する国会答弁を引き継いでいる」 政策堅持を明言 [485983549]
- 【悲報】巨人山瀬、他球団への移籍も要望WWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWW
- 【高市賃上げ】 自民党&維新の会「国会議員の給与を 月5万円アップさせる!」 今国会で歳費法改正。 月129万円→月134万円に [485983549]
- ㊗157円 [194819832]
- 犯罪者たち「刑事罰受けて罪は償った!被害者への賠償金?もう反省済みだから一円も払わねーよばーかwww」 [177178129]
