X



Pythonのお勉強 Part72
0001デフォルトの名無しさん (ワッチョイ 03c5-hEBs)
垢版 |
2023/12/27(水) 15:42:25.63ID:sVIMH2iW0
!extend:default:vvvvv:1000:1024
!extend:default:vvvvv:1000:1024
↑スレ立てる毎に減るので、減ってたら3つに補充すること。

・当スレにRubyのソースコード類を書くことを禁ず
・Ruby等、Pythonではないプログラミング言語での回答類・質問を書くのも禁止
・「Ruby では」「Rubyでは」「Rails」正規表現→「^クソチョンw$」をNGワード登録推奨
・エラーを解決したいときは、かならず
エラー文(勝手に省略orスクショうp等の横着禁止)と
おま環(Pythonのバージョン番号+OS名とバージョン+IDE名)を書け。

★Pythonのソースコードを5ちゃんに直貼はインデントが崩壊するので、
 ↓等のコードうp用サイトに貼ってきてくだしあ。(スクリーンショットをうpる「横着」禁止)
ttps://techiedelight.com/compiler/  Run Code機能あり。
ttp://ideone.com/      デフォ設定がCなので、Pythonするには言語種選択ボタン押下がピコ手間かも。
ttp://pastebin.com/     まずまずシンプル。
ttp://dpaste.com/      とてもシンプル。消えるまでの日数は十分長ーく指定のこと。

◇Pythonオフィシャルサイト http://www.python.org/
◇Pythonドキュメント https://docs.python.org/ja/3/
◇まとめwiki ttp://python.rdy.jp/
※前スレ
Pythonのお勉強 Part71
https://mevius.5ch.net/test/read.cgi/tech/1695168821/
VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured
0748デフォルトの名無しさん (ワッチョイ 7f54-wePh)
垢版 |
2024/05/06(月) 11:03:33.16ID:poYagYhe0
たくさんのファイルを3ステップで加工したい
一つずつやると時間かかるので、並列処理させる
全ファイルをステップ1処理 -> 全ファイルをステップ2処理、という感じ

それでかなりスピードアップはするけど、
ステップの継ぎ目部分で全体の完了を待つのが無駄
全体は待たずにファイル毎にどんどん先に進む並列処理を
簡単に書くモジュールある?
0751デフォルトの名無しさん (ワッチョイ 7f54-wePh)
垢版 |
2024/05/06(月) 12:28:01.25ID:poYagYhe0
あんまりいいサンプルが見つからない

キモは、プロセスの実行に条件があるという点
file1-step1が完了してないとfile1-step2は実行できない
必要なプロセスを全部登録して実行させるとそんなことは考慮されないので、
どのプロセスが実行可能か依存関係を教えてやらないといけない
0752デフォルトの名無しさん (ワッチョイ 7b3f-U069)
垢版 |
2024/05/06(月) 13:02:05.97ID:6LmmIky40
モジュール使う分には単純だから公式ドキュメント読んで
https://docs.python.org/ja/3/library/multiprocessing.html
https://docs.python.org/ja/3/library/concurrent.futures.html
それでファイル単位に並列にして
ファイルを引数にstep1/step2を関数化したら後は呼ぶだけよ

あるいは外部コマンド化して
cat paths | xargs -IZ -P $(nproc) sh -c 'step1.py Z; step2.py Z'
0754デフォルトの名無しさん (ワッチョイ 6301-levy)
垢版 |
2024/05/06(月) 17:25:03.16ID:JLRUeB280
for file in files:
 step1.exe file
for file in files:
 step2.exe file
という形じゃなく
step1.exe files
step2.exe files
という形で実行してるなら各exeがファイル毎に進捗報告やコールバックしてくれないと
ファイル単位で処理を先に進めるのは無理

前者でやってるならやりようがあるけど
ファイル単位じゃなくステップ単位にまとめるとスピードアップしたということなので
その原因を先に確認した上でやり方考えたほうがいい

性能向上のための並行/並列化は
具体的な処理内容やワークロードの特性によってアプローチが変わる
one size fits allなやり方は存在しない
0757デフォルトの名無しさん (ワッチョイ 6301-levy)
垢版 |
2024/05/06(月) 17:41:01.35ID:JLRUeB280
>>755
なるほど
実際にはまだ何も並行化/並列化できてないという話なのか

>実際にはそれぞれで別のexeファイルを実行するのでなかなか難しい
だったら↑この思い込みを捨てることから始めたほうがいいよ

結局のところPythonで並行/並列化するなら以下の4択なので
具体的な処理内容とワークロードの特性を加味して適切なものを選んでね
1.非同期
2.マルチスレッド
3.マルチプロセス
4.非同期+マルチプロセス
0758デフォルトの名無しさん (ワッチョイ 7f54-wePh)
垢版 |
2024/05/06(月) 19:12:43.39ID:poYagYhe0
結局、
proc1.exeをsubprocess.Popen()で並列処理
proc2.exeをsubprocess.Popen()で並列処理
proc3.exeをsubprocess.Popen()で並列処理
となっていたものを、
proc1.exe
proc2.exe
proc3.exe
を実行するbatファイルに移動させて、
batファイルをsubprocess.Popen()で並列処理で目的は達成できた

batファイルかー、という気もするけど、並列処理で依存関係を気にした例は見つからなかった
(並行処理なら普通)
0759デフォルトの名無しさん (ワッチョイ 9f5f-ggbZ)
垢版 |
2024/05/06(月) 19:51:46.91ID:mwAWJr9U0
バッチファイルのことをbatファイルと書いているのは初めて見た
0760デフォルトの名無しさん (ワッチョイ 7f54-wePh)
垢版 |
2024/05/06(月) 19:58:25.18ID:poYagYhe0
マジか
"バッチファイル" 473,000
"batファイル" 134,000
だから少数派ではあるけど、22%くらいの勢力はあるのに

そもそも、batファイルを使った経験自体が少ないのでは
0761デフォルトの名無しさん (ワッチョイ 9f5f-ggbZ)
垢版 |
2024/05/06(月) 19:58:39.61ID:mwAWJr9U0
>>758
テキストファイルの操作みたいだけど、そういうのは処理範囲を指定して同時に動かすんだよ。
0763デフォルトの名無しさん (ワッチョイ 9f5f-ggbZ)
垢版 |
2024/05/06(月) 20:04:20.54ID:mwAWJr9U0
>>760
batファイルという書き言葉は最近、発生しているようだけど、一般書籍でもマイクロソフトでもbatファイルとは呼んでいない。

日本語ではバッチファイル、英語ではbatch file。

バッチファイルを使ったことがないというのは、シェルスクリプトを使ったことがないというのと同じで、Pythonコードも動かいたことがないと思われてしまうレベル。
0764デフォルトの名無しさん (ワッチョイ 9f5f-ggbZ)
垢版 |
2024/05/06(月) 20:06:52.12ID:mwAWJr9U0
>>762
ステップは行という意味に思われるからやめた方がいい
0765デフォルトの名無しさん (ワッチョイ 9f5f-ggbZ)
垢版 |
2024/05/06(月) 20:13:01.17ID:mwAWJr9U0
>>762
複数のファイルと書いてあったな。

並列化には担当するファイルを分けるなどいくらでも方法はある。

マルチプロセスの日本語訳が並列処理、マルチスレッドの日本語訳が並行処理だが、英語ではマルチという言葉で同時実行という言葉ではない。

同時実行という意味を付加しているのは日本語。
0767デフォルトの名無しさん (ワッチョイ 9f5f-ggbZ)
垢版 |
2024/05/06(月) 20:21:34.96ID:mwAWJr9U0
EXEファイルを二重起動とかPythonもバッチファイルも関係ねえな

実行ファイルを引数なしで実行するとか、シリアル前提処理を多重起動して、想定どおりにならないとか狂っんなw
0768デフォルトの名無しさん (ワッチョイ 9f5f-ggbZ)
垢版 |
2024/05/06(月) 20:23:17.58ID:mwAWJr9U0
>>766
本人不在だったのか
0769デフォルトの名無しさん (ワッチョイ 9f5f-ggbZ)
垢版 |
2024/05/06(月) 20:24:57.69ID:mwAWJr9U0
ID:poYagYhe0 は自作自演のネタ野郎だった
0771デフォルトの名無しさん (ワッチョイ 9f5f-ggbZ)
垢版 |
2024/05/06(月) 21:40:01.57ID:mwAWJr9U0
テキストファイルの拡張子をtxtとしているのはWindowsの世界だけ

Windowsを使っていてバッチファイルを知らないなんて素人だろ
0772デフォルトの名無しさん (ワッチョイ 9f5f-ggbZ)
垢版 |
2024/05/06(月) 21:47:03.75ID:mwAWJr9U0
>>770
拡張子は拡張子でしかない

JPEGのファイルの拡張子はjpegが本来の拡張子で、jpgはWindows、MS-DOSの拡張子は3文字までという仕様で発生したもの。

さらにWindowsのデフォルト設定だと拡張子を表示しないんだぜ?

何をどう勘違いしているのかな。
0774デフォルトの名無しさん (ワッチョイ be2a-R/2N)
垢版 |
2024/05/06(月) 22:24:52.88ID:BKncXC1b0
>>772 の中では噛み合った会話なのかな。
0776デフォルトの名無しさん (ワッチョイ 9f5f-ggbZ)
垢版 |
2024/05/06(月) 23:45:29.15ID:mwAWJr9U0
txtファイルなんて書くやついるのか?
0777デフォルトの名無しさん (ワッチョイ 9f5f-ggbZ)
垢版 |
2024/05/06(月) 23:50:45.62ID:mwAWJr9U0
拡張子がhtmlだとhtmlファイル、拡張子がhtmだとhtmファイルだと呼ぶなら、単に無知をごまかしているだけ
0778デフォルトの名無しさん (ワッチョイ 9f5f-ggbZ)
垢版 |
2024/05/07(火) 00:02:15.12ID:pgxJqkT00
バッチファイルはマイクロソフトの命名のセンスが悪かっただけだが、バッチファイルと作っている会社が言っている名称を使うのが素直

拡張子が3文字だと思っている疑惑があるのと、UNIX、Linuxの世界では拡張子はあくまで目印にすぎない

ファイルが何のファイルかは少し読み込んで判断する
WindowsでUTF-8のテキストファイルを扱う場合は、テキストファイルにBOMという情報を先頭に書く

シェルスクリプトも1行目に自分自身の種類と何で実行するのかを書く
0780デフォルトの名無しさん (ワッチョイ 1701-Jq+s)
垢版 |
2024/05/07(火) 01:25:06.73ID:H+bNZbY80
どうでもいいことで盛り上がってんなww
batファイルってのは同じバッチファイルでも.cmdじゃなく.batだぞってこと
htmファイルも同じ
まあ個人的には.batファイルのようにドット付きでなら書くけどドット無しでは書かないな
0781デフォルトの名無しさん (ワッチョイ 1701-Jq+s)
垢版 |
2024/05/07(火) 01:49:44.68ID:H+bNZbY80
>>758
proc1.exeをsubprocess.run()
proc2.exeをsubprocess.run()
proc3.exeをsubprocess.run()
↑この一連を関数にまとめればbatファイルはいらない
それとまとめた関数は直接Popenじゃなくmultiprocessing経由で処理すれば
Poolを使う分だけオーバーヘッドが減る

あと処理内容次第だけどasyncio使って全部非同期ににしたほうが
コードは多少面倒でもリソースが減って速度も出る可能性もある
0783デフォルトの名無しさん (ワッチョイ 7f54-wePh)
垢版 |
2024/05/07(火) 14:13:11.88ID:Ik+FWYJJ0
子供がエラー出てもなんも判らんのな
get() すると判るけど、マルチプロセスにならないので、デバッグ終わったら外す
グローバル変数経由で参照させようとしても見えないとか罠がいろいろ
0787デフォルトの名無しさん (ワッチョイ 7f54-wePh)
垢版 |
2024/05/07(火) 15:55:19.18ID:Ik+FWYJJ0
グローバル変数が参照できるかどうかは処理系依存な気がするんだよな
Copy-On-Writeでプロセス増やしてたら普通に参照できる筈
そんな互換性の無いコードが書けていいのかとは思うけど
0790デフォルトの名無しさん (ワッチョイ 7f54-wePh)
垢版 |
2024/05/07(火) 16:11:14.75ID:Ik+FWYJJ0
要素1個のタプル 1,
要素0個のタプル ()

なんでやねん
コンマこそがタプルを表しているなら、コンマだけが空タプルの本質だろうに
冗長に書いて(,) でもエラーになる
コンマがタプルで括弧はおまけだけど空の時だけ例外ルール
0791デフォルトの名無しさん (ワッチョイ 177c-0EWD)
垢版 |
2024/05/07(火) 19:25:27.35ID:pe1yL5GL0
>>790
あのさ(1)だとタプルじゃなくてただ数値がカッコで括られてるだけと判別出来ないだろ
0793デフォルトの名無しさん (ワッチョイ 6301-c3oD)
垢版 |
2024/05/08(水) 00:49:45.86ID:Y9XLt/8j0
>>792
要素数が変化しない空のシーケンスを表現するためにある
fが引数1個を取る関数、gが引数を取らない関数だとしたら
apply(f, (1,))とapply(g, ())
のようにempty tupleを使うのが理にかなってる
0795デフォルトの名無しさん (ワッチョイ 7e44-c5DX)
垢版 |
2024/05/09(木) 23:41:44.90ID:P9FAaCLY0
SQLで書いてるクエリをSQLAlchemyでORMにしたいのに
全然出来んわ、半分諦めかけてる
なんかコツとかないんか?
0796デフォルトの名無しさん (ワッチョイ 7f54-wePh)
垢版 |
2024/05/09(木) 23:48:54.52ID:QJAKpfod0
word1かword2かword3のいずれかがstrに含まれているかどうか
はどうやったらすっきり書けるだろう

内包表記なら書けるけど、
if (word1, word2, word3) in str
くらいの判りやすさが欲しい
0799デフォルトの名無しさん (ワッチョイ be2a-gL2P)
垢版 |
2024/05/10(金) 10:30:11.03ID:kWReMx2d0
>>798
>>796 さんは「すっきり」と仰っていますが。

# 敢えて反語法で表現しました。
0800デフォルトの名無しさん (JP 0H33-ePh+)
垢版 |
2024/05/10(金) 15:27:10.41ID:r+qjDbjAH
どういうこと?strかどうか調べたいていうこと?
0801デフォルトの名無しさん (ワッチョイ be2a-gL2P)
垢版 |
2024/05/10(金) 17:50:44.59ID:D/Pzsr590
>>800
(word1 in str) or (word2 in str) or (word3 in str)
を、すっきり書きたいのですと。
0804デフォルトの名無しさん (ワッチョイ 8b2c-ePh+)
垢版 |
2024/05/10(金) 18:40:17.35ID:AxWmaiK30
isinstance(word1, str)
0805デフォルトの名無しさん (ワッチョイ 8b2c-ePh+)
垢版 |
2024/05/10(金) 18:47:36.75ID:AxWmaiK30
anyかallで>>804わたすのじゃだめなの?
0806デフォルトの名無しさん (ブーイモ MM8a-c5DX)
垢版 |
2024/05/10(金) 18:50:16.41ID:doYTKqcMM
>>796
ここで言うstrって変数じゃなくて型か?
0808デフォルトの名無しさん (ワッチョイ 8b71-0+0w)
垢版 |
2024/05/10(金) 21:21:08.00ID:AxWmaiK30
any([isinstance(x, str) for x in (word1, word2, word3)])
any(map(isinstance, (word1, word2, word3), [str]*3))
0810デフォルトの名無しさん (ワッチョイ be10-1Vpt)
垢版 |
2024/05/10(金) 21:41:47.92ID:I57YSXlo0
、pythonでWEBスクレイピングをしてるのですが、タスクスケジューラで動かすと画面が欠けます。
ログイン中だと問題なくでます。
なぜかサイズ指定しても効かないのですが、タスクスケジューラで登録して自動実行させてる方いませんでしょか?
0811デフォルトの名無しさん (ワッチョイ 6a79-1zLe)
垢版 |
2024/05/11(土) 00:19:43.68ID:Lq3Rg3RR0
>>810
「ユーザーがログオンしているかどうかに関わらず実行する」が選択された場合、
タスクはセッション0のデスクトップが無い環境で実行される(Vista以降)
通常のブラウザでイスクレイピングをしたければ適当なアカウントにログインしていなければならない
またはヘッドレスモードのあるブラウザなら動きそうではあるがどうだったかな
0816デフォルトの名無しさん (ワッチョイ 7f54-wePh)
垢版 |
2024/05/11(土) 07:40:03.89ID:6kJwwEnQ0
0の方がいろいろ合理的だけど、
printf(f'{count+1}')
とかやるよな

範囲を示す時に始点と終点よりも、始点と終点+1(次の要素の始点)の方が
便利なケースが圧倒的に多いけど、なんか怖いので愚直にやる
0817デフォルトの名無しさん (ワッチョイ be2a-gL2P)
垢版 |
2024/05/11(土) 08:22:43.45ID:N2421kI80
>>813-814
スマソ、なんか Trueにならなくね?

>>> word1 = 'abc'
>>> word2 = 'def'
>>> word3 = 'ghi'
>>> sstr = 'aaabcddd'
>>> s = set(sstr.split())
>>> {word1, word2, word3} & s != set()
False
>>> s = set('zzzzzzz'.split())
>>> {word1, word2, word3} & s != set()
False
>>>
0818デフォルトの名無しさん (ワッチョイ 177c-0EWD)
垢版 |
2024/05/11(土) 08:24:59.32ID:KSi13UAi0
>>815
Pythonって配列無いんじゃ?リストやろ

C言語系とかの配列的に添字が0から始まるのはメモリアドレスを計算する時に高速な為
0819デフォルトの名無しさん (ワッチョイ 7310-lc7q)
垢版 |
2024/05/11(土) 09:00:38.69ID:yJym4BaO0
1. {'sss'}.issubset({'s', 'ss', 'sst'})

2.
strings = ('miss')
ret = any([s for s in ('s', 'ss', 'ss') if s in strings])

3. filter(lambda s=s: s in strings, strings)

4.
strings = ('ss', )
is_in = strings in ('s', 'ss', 'sss')
0820デフォルトの名無しさん (ワッチョイ 37ca-ePh+)
垢版 |
2024/05/11(土) 11:03:50.73ID:6E9A5zBq0
strって関数オブジェクトじゃないの?
0821デフォルトの名無しさん (ワッチョイ ea83-Np3+)
垢版 |
2024/05/11(土) 11:33:01.51ID:gV6TyhSc0
ヒント
画像情報 テレポート
エネルギー 瞬間にどう
観測結果論部あり
※情報とエネルギーを送れるのなら任意の波と線とHzを任意の場所で発生可能

上記の技術に脳内インプラントデータを対象者全身に送信で操り人形
地球外宇宙人もサイコパスが使用中

高度な科学を使用できていても自然環境も人間社会いも狡猾な者【人間を物として見る者】が圧勝
ガスライティング.ギャングストーカー.電磁波攻撃 等
現在の若者サイコパスで無い者は何%いるのかな?

地球派【マイクロ波聴覚効果】は違法でないので宇宙人が行っていても合法
別の惑星はテロに該当なので問答無用で戦争

マイクロ波は波の種類なので
X線でマイクロ波を起こしているので
お前に200回のx線を打ち込んだも理解できるでしょう
※5Gはミリ波で動的動作も追跡可能になるのでマイクロ波より便利
テラヘルツ波はミリ波と比べて現在不明なので研究中

何Hzの帯域は対象者周囲の状況に応じて変化していると思われるので
線種類 + 波種類 + 何hz + 使用w数 = 音波【音の高さ】?
0823デフォルトの名無しさん (ワッチョイ 8b05-HBr6)
垢版 |
2024/05/11(土) 12:21:55.32ID:XZyyqECr0
>>817
その条件では使えない
英文みたいに空白で単語が区切られている時に使える
部分一致はsuffix arrayみたいな重く複雑なsetが必要
ひょっとしたら何かエレガントな書き方があるのかもしれないが
0824デフォルトの名無しさん (ワッチョイ 7e44-c5DX)
垢版 |
2024/05/11(土) 13:44:37.23ID:dlaw+38P0
>>822
まずdecodeしないでmeta見れるの?
0826デフォルトの名無しさん (ワッチョイ 7f54-wePh)
垢版 |
2024/05/11(土) 16:57:44.24ID:6kJwwEnQ0
apparent_encoding にするといいよという記事をよく見るけど、
encodingに困ってる時にapparent_encoding使うと悪化する
困ってない時は何もしなくていい
結局使い所が無い
0828デフォルトの名無しさん (ワッチョイ 7e44-c5DX)
垢版 |
2024/05/11(土) 17:32:49.96ID:dlaw+38P0
>>826
エンコーディングの推論って日本語だとうまく機能しないよな
結局決め打ちして試すしかない
0830デフォルトの名無しさん (ワッチョイ 2bd0-2p88)
垢版 |
2024/05/12(日) 01:03:35.51ID:sYFXlqml0
charsetに嘘書いてある事もあるから
metaは参考程度
0836デフォルトの名無しさん (ワッチョイ 557c-06YP)
垢版 |
2024/05/12(日) 15:49:04.86ID:jPmIOKVf0
基本情報も持ってないような奴はその辺のデータ構造としての配列とかリスト分かってないんだろ
0837デフォルトの名無しさん (ワッチョイ a1f0-NuW3)
垢版 |
2024/05/12(日) 15:51:41.09ID:H0ypy+dK0
大抵はリンクリストを指すのだろうけど動的言語あたりが好き勝手用語を解釈し始めて
動的配列を指すこともあるし一般的にモノが並んでいることをリストと言ったりもする
ややこしい時代になったもんだ
0838デフォルトの名無しさん (ワッチョイ 5f79-nHLb)
垢版 |
2024/05/12(日) 18:01:26.30ID:XuEaHJPQ0
データ構造に言及しない文脈なら一般的に一覧とかリストで済ますでしょ
PythonスレはVBAスレに並ぶ初心者が集うスレだからこんな議論が度々起きても仕方ない
0839デフォルトの名無しさん (ワッチョイ 7568-sqPz)
垢版 |
2024/05/12(日) 19:15:29.77ID:TeUsEGsc0
ごくごく一般的な言葉を環境特有の用語として使う馬鹿が悪い
0842デフォルトの名無しさん (ワッチョイ 7568-sqPz)
垢版 |
2024/05/13(月) 02:42:21.97ID:4H4E5Igk0
俺の投稿GW以降初なんだが馬鹿の自演言い訳扱いにされてんの?
0843 警備員[Lv.1][新初] (ブーイモ MMb3-7UPu)
垢版 |
2024/05/13(月) 19:42:10.18ID:FIEerBn6M
>>833
配列そのものが連続したアドレスのメモリ領域のことだからな

動的にメモリを確保する場合は、型が後づけになるから配列と呼ぶの違和感があるのは仕方ない
レスを投稿する


ニューススポーツなんでも実況