【まず1嫁】くだすれPython(超初心者用) その55

**デフォルトの名無しさん** · 2021/10/01(金) 15:46:47.17

当スレに★Python以外のプログラミング言語での回答類を書くべからず★
派生言語はそれぞれ専スレがある（この板にあるとは限らない）ので、そっち池。
「Ruby」「Rails」「某言語では」「クソチョンw」をNGワード登録推奨。荒らしは、完全スルー放置が一番きらいです。

このスレッドは「お勉強」スレのほうには書き込めない超低レベル、
もしくは質問者自身何が何だか分からない質問を、勇気を持って書き込むスレッドです。
へび使いが優しくコメントを返しますので、お礼は Python の布教と初心者の救済をお願いします。

★エラーを解決したい場合★は、
　　表示されたエラーの全文（勝手に省略やスクショうｐ等の横着クソ行為禁止）と、
　　実行環境（Pythonのバージョン・OSとIDEの種類およびバージョン）をシッカリ書くこと。

Pythonの★ソースコードをそのまま５ちゃんに貼るとインデントが崩れてチヌ★
【【【複数の連続半角スペースはなにもなかったことにされる＆タブは普通には入れられない】】】掲示板の仕様なので、
プログラム文は↓等の、いわゆるコードうｐ用サイトに貼ってこいください。
ttps://techiedelight.com/compiler/　　Run Code機能あり。
ttp://ideone.com/　　　　　　デフォ設定はC用のため、言語選択ボタン押下がﾋﾟｺ手間かも。
ttp://codepad.org/　　　　　ほぼ直感的に使える。Run codeボタンあり。
ttp://pastebin.com/　　　　　まずまずシンプル。
ttp://dpaste.com/　　　　　　とてもシンプル。消えるまでの日数は十分長ーく指定のこと。

◇Python公式◇ http://www.python.org/
◇まとめwiki◇ ttp://python.rdy.jp/wiki.cgi

〇前スレ〇　【まず1嫁】くだすれPython(超初心者用) その54
https://mevius.5ch.net/test/read.cgi/tech/1623240344/

次スレたては >>985 あたりが挑戦する。
### END OF TEMPLATE ###

**デフォルトの名無しさん** · 2021/10/01(金) 15:51:56.85

pythonの本この前かったわ
エロ画像収集するんだ

**デフォルトの名無しさん** · 2021/10/01(金) 16:14:27.26

最近 youtube 側のクローラー対策アルゴリズムが変わったらしく
前に描いてた python スクリプトがエラー吐くようになった
適当に wait 入れてアクセス頻度落とすとエラー出ない訳だが
遅くなるのでぎりぎり最適の wait にしたいんだが肝心な google 側のアルゴリズムが不明
納得行く速度が出るまでごちゃごちゃ試すと BAN されちゃうかな？

**デフォルトの名無しさん** · 2021/10/01(金) 16:20:44.94

契約して、YouTube API を使えば？

**デフォルトの名無しさん** · 2021/10/01(金) 16:57:41.48

おにただ正論

**デフォルトの名無しさん** · 2021/10/01(金) 18:22:34.09

python関係無いしｗ

**デフォルトの名無しさん** · 2021/10/01(金) 19:40:08.43

うちもとあるサイト毎週引っこ抜いてたらいつもはない臨時メンテがあってその直後非同期だと接続エラーはくようになったな
非同期なくしたら大丈夫だったので今はおとなしく1倍速で落としてるけど。IPBANされなかっただけマシか

**デフォルトの名無しさん** · 2021/10/01(金) 19:59:28.33

pypy（パイパイ）って発音しにくいよね、特に社内だと（　＾ω＾）・・・

**デフォルトの名無しさん** · 2021/10/02(土) 11:36:25.91

魑魑こそ正義

**デフォルトの名無しさん** · 2021/10/02(土) 15:09:37.96

pypiのクローラーねぇ

**デフォルトの名無しさん** · 2021/10/02(土) 23:18:51.11

クソチョンw

**デフォルトの名無しさん** · 2021/10/05(火) 14:54:46.13

プライベートクラス変数にするメリットってどのようなときがあるのでしょうか・・
https://docs.python.org/ja/3/tutorial/classes.html#private-variables

＞もし仮に MappingSubclass に __update 識別子を実装したとしても
これなら普通、Mappingクラスに実装しませんか？

それとは別にメリットとして、オブジェクトの中からしかアクセスしない変数
として使うなら、class外に書いた方がいいような？

**デフォルトの名無しさん** · 2021/10/05(火) 15:14:02.22

>>12
神がコーディングするならどうでもいいけど
クラス外に置くとドキュメンテーションの点で劣る
識別子の置き換えが発生しないと意図しない副作用の可能性を残してしまう
ひとつでもそういう箇所があると疑心暗鬼になり生産性も落ちる

**デフォルトの名無しさん** · 2021/10/05(火) 15:48:22.95

windows、python3.9.7で
fileにパス付きファイル名が与えられた時に、パス無しファイル名（拡張子無し）と拡張子を取得する場合
if "." in os.path.basename(file):
____ext_without_dot = os.path.basename(file).split(".")[-1]
____basenaname_without_ext = os.path.basename(file).removesuffix("." + ext_without_dot)
else:
____ext_without_dot = ""
____basenaname_without_ext = os.path.basename(file)
で問題ないでしょうか？
もっと綺麗な書き方あったら教えてください。

**デフォルトの名無しさん** · 2021/10/05(火) 15:58:59.57

>>12
その例は、Mappingクラスが、MappingSubclassのupdateメソッドではなくMappingクラスのupdateメソッドを呼び出したい場合の実装例。

Mappingの__update変数の中にMappingのupdateメソッドを格納しておけば、updateメソッドをオーバーライドされてしまってたとしても常に元のupdateメソッドを参照することができる。

サブクラスが__update変数自体をオーバーライドしようとしても、内部的に識別子を変えてるから大丈夫ですよ、そんなことできませんよ、と言っている

**デフォルトの名無しさん** · 2021/10/05(火) 16:07:03.30

>>14
https://docs.python.org/3/library/os.path.html#os.path.splitext

**デフォルトの名無しさん** · 2021/10/05(火) 16:13:46.71

>>14
PurePath使え

**デフォルトの名無しさん** · 2021/10/05(火) 16:16:39.53

>>16
>>16
splitextを使うと、basenaname_without_extが""の場合うまくいかないんです

**デフォルトの名無しさん** · 2021/10/05(火) 16:32:23.12

>>18
splitextの戻り値の第2要素が空文字列だったら第1要素と第2要素をひっくり返せばよいのでは？

**デフォルトの名無しさん** · 2021/10/05(火) 16:35:35.19

>>18
PurePath試してみました。
これもbasenaname_without_extが""の場合うまくいきません

**デフォルトの名無しさん** · 2021/10/05(火) 16:38:24.45

>>19
"..jpg"のようなファイル名の場合ひっくり返してもうまくいきません

**デフォルトの名無しさん** · 2021/10/05(火) 16:58:23.72

>>14
from pathlib import Path

p = Path('.')

for file in p.iterdir():
ext = ''.join(file.suffixes)
without_ext = file.name.rstrip(ext)

**デフォルトの名無しさん** · 2021/10/05(火) 16:59:34.11

import re
basename = ...
if m := re.match(r'(.*)\.([^.]+)$', basename):
. basename_without_ext = m.group(1)
. ext_without_dot = m.group(2)
めんどいからもう㍉

**デフォルトの名無しさん** · 2021/10/05(火) 17:31:21.64

>>22
これもbasenaname_without_extが""の場合うまくいきません

**デフォルトの名無しさん** · 2021/10/05(火) 17:36:31.51

>>23
理解できない…ムズイ
検証もやりかた分からないです
何をやってるか理解出来たら後でコメントします

**デフォルトの名無しさん** · 2021/10/05(火) 17:40:40.24

...のところにファイル名を入れて実行してください
basename = 'hoge.jpg'

**デフォルトの名無しさん** · 2021/10/05(火) 18:00:15.70

二重拡張子の場合はどうするの？
*.tar.zxとか

**デフォルトの名無しさん** · 2021/10/05(火) 18:10:11.85

>>26
拡張子がある場合正常に動きました
拡張子がない場合はうまくいきませんでした
拡張子がない場合を別処理すると14で書いた処理より長くなる・・・
正規表現勉強してみます

**デフォルトの名無しさん** · 2021/10/05(火) 18:29:46.70

>>27
二重拡張子は各アプリ毎に取り決めが違うので個別に考えるしかないかと
"abc.net.txt" とかを二重拡張子扱いしたらまずいですし

**デフォルトの名無しさん** · 2021/10/05(火) 19:15:38.22

Python 3.10入れてみたけどIDLEのプロンプト表示が良くなってるね
最初違和感があったけど、これは見やすくて良いわ＾＾

新機能の構造的パターンマッチに注目ですな、これは使っていきたい

**デフォルトの名無しさん** · 2021/10/05(火) 19:55:29.85

当方でも、パッケージ管理ソフトChocolateyにPython 3.10が来たようでPython 3.9から自動更新された
困ったことに、pywin32がまだPython 3.10に対応してない

**デフォルトの名無しさん** · 2021/10/05(火) 19:59:53.84

vscodeでこのウィンドウどうやって出すの？

https://i.imgur.com/PK7erF2.jpg

**デフォルトの名無しさん** · 2021/10/05(火) 20:47:41.95

>>28
import re
basename = ...
if m:=re.match(r'(.*)(\.([^.]+))|(.*)',basename):
. basename_without_ext = m.group(1) or m.group(4)
. ext_without_dot = m.group(3)

**デフォルトの名無しさん** · 2021/10/05(火) 21:03:44.19

>>14
from pathlib import Path

p = Path('hoge.jpg').resolve().absolute()
ext_without_dot = p.suffix[1:]
basename_without_ext = p.stem

**デフォルトの名無しさん** · 2021/10/05(火) 21:38:18.61

>>33
少し書き換えましたが希望した動作をしています
勉強になりますた、感謝

import os, re
file = "C:\\test\\a"
#file = "C:\\test\\a.b"
#file = "C:\\test\\.b"
#file = "C:\\test\\..b"
basename = os.path.basename(file)
if m := re.match(r'(.*)(\.([^.]+))|(.*)', basename):
____basename_without_ext = m.group(1) or ""
____ext_without_dot = (m.group(2) or m.group(4)).removeprefix(".")
print("\""+basename_without_ext+"\"")
print("\""+ext_without_dot+"\"")

**デフォルトの名無しさん** · 2021/10/05(火) 21:49:55.73

>>34
"C:\\test\\.b"
の場合、うまくいきません
resolve()　absolute() 等初めて見るものが多いので調べてみます

**デフォルトの名無しさん** · 2021/10/05(火) 22:19:04.45

3.8からのセイウチ構文は便利だと思うけど、見通し悪くなるしどうも好きになれない
先に変数にしたほうがわかりやすくないか？
if m := re.match(r'(.*)(\.([^.]+))|(.*)', basename):
↓
m = re.match(r'(.*)(\.([^.]+))|(.*)', basename)
if m:

**デフォルトの名無しさん** · 2021/10/05(火) 22:29:08.23

>>36
はい私の優勝ｗ
p = Path(f).resolve().absolute()
stem = p.stem
ext = p.suffix[1:]
if stem.startswith('.') and not ext: #ファイル名が空の場合
stem, ext = ext, stem

basename_without_ext = stem
ext_without_dot = ext

**デフォルトの名無しさん** · 2021/10/05(火) 22:36:52.31

おまいらマジでポンコツだなω

**デフォルトの名無しさん** · 2021/10/05(火) 22:46:47.72

>>38
stem, ext = ext, stem[1:] ですね。
最初に覚えた書き方から少しずつpathlibに書き換えてるけどまだ慣れない
os.pathが頭にこびりついてる

**デフォルトの名無しさん** · 2021/10/05(火) 23:11:06.33

>>36
basenameって書いてるのだからbasenameを渡して

**デフォルトの名無しさん** · 2021/10/05(火) 23:34:48.42

>>41
??
>>35 で
basename = os.path.basename(file)
でbasename渡してますが、？？
>>36は>>34へのレスですが

**デフォルトの名無しさん** · 2021/10/06(水) 00:13:14.92

こうやってみたら動いてる
単純になった

import os
file = "C:\\test\\.b"
basename = os.path.basename(file)
basename_without_ext = os.path.splitext("!" + basename)[0][1:]
ext_without_dot = os.path.splitext("!" + basename)[1][1:]

**デフォルトの名無しさん** · 2021/10/06(水) 00:26:22.25

ドットファイル名だから
".b"が返らないとダメなのでは？

**デフォルトの名無しさん** · 2021/10/06(水) 00:28:36.53

Ruby ではパス区切りに、/ も使える

require 'fileutils'

Dir.glob( 'c:/users/owner/documents/あ/*' )
.select { |full_path| File.file?( full_path ) } # ファイルのみ
.each do |full_path|
file_name = File.basename( full_path ) # ファイル名
file_extname = File.extname( file_name ) # 拡張子

puts "#{ file_name } : #{ file_extname }"
end

出力
あ.txt : .txt
い.csv : .csv

**デフォルトの名無しさん** · 2021/10/06(水) 00:38:36.79

>>44
LinuxではそうでもWindowsは違うと思うんですが・・・

**デフォルトの名無しさん** · 2021/10/06(水) 00:53:55.80

>>46
今のWindowsはエクスプローラー上でドットファイルの作成が出来るようになってるし
WSLなんかでも困ることになるので、ちゃんとドットファイルとして扱ったほうがいいと思うよ

**デフォルトの名無しさん** · 2021/10/06(水) 01:06:01.53

>>47
不特定多数からファイル受け取るんです
エクスプローラー上でドットファイルの作成が出来るからなおさらドットファイルとしては扱えないんです

**デフォルトの名無しさん** · 2021/10/06(水) 01:14:22.59

じゃあ、例えば以下のファイル名（パス）の場合、
どんな結果を期待しているの？

file = r'..txt'
file = r'test.txt'
file = r'test.tar.xz'
file = r'test'
file = r'.\test.txt'
file = r'c:\test.txt'
file = r'c:/test.txt'
file = r'C:\dir\.test'
file = r'C:\dir\.test.txt'
file = r'C:\dir\test'

45 · 2021/10/06(水) 01:18:15.89

隠しファイルか？

Ruby のglob でも、. で始まる、directory, file を除くから、
こういうのを許すと、バグのもと

特殊ファイルを作らせたら、ダメ

**デフォルトの名無しさん** · 2021/10/06(水) 01:22:00.09

>>49
'.' txt'
'test' 'txt'
'test.tar' 'xz'
'test' ''
相対パスは扱わない、というか、basenameを処理
'test' 'txt'
basenameを処理
'' 'test'
'.test' 'txt'
'test' ''

**デフォルトの名無しさん** · 2021/10/06(水) 01:27:53.38

>>50
不特定多数にだめといってもしょうがないでしょう
受け取った後、問題ないファイル名にして、後続処理しますが
最初からドットファイル扱いすると処理抜けする

**デフォルトの名無しさん** · 2021/10/06(水) 01:49:05.27

>>51
.test はファイル名じゃなくて拡張子として扱うのかぁ

**デフォルトの名無しさん** · 2021/10/06(水) 01:53:11.34

>>53
そうです
windowsでは例えば、".jpg"は普通にjpegファイルとしてあつかわれるので

**デフォルトの名無しさん** · 2021/10/06(水) 08:16:30.25

確かにWindowsだと.testはファイル名じゃなく拡張子として扱うね、だからWindowsの場合だけそうすればいい

import os
from pathlib import Path
def hoge(f):
____p = Path(f).resolve().absolute()
____stem = p.stem
____ext = p.suffix[1:]
____if os.name=='nt' and stem.startswith('.') and not ext: # Windowsの場合
________stem, ext = ext, stem[1:]

____print(f'{p.name=}\n{stem=}\n{ext=}\n')

31 · 2021/10/06(水) 09:26:58.81

pywin32がPython3.10向けpipにない問題を自己解決したので一応報告

以下githubのpywin32レポジトリをクローンしてソースからビルドしてインストール
https://github.com/mhammond/pywin32

以下ビルドコマンドを実行
> python setup.py install --skip-verstamp
Visual Studio 2015 のビルドツールが必要なので、適宜Visual Studio Installer から「MSVC v140 …」を追加インストール
レジストリ登録するらしく管理者権限も必要

**デフォルトの名無しさん** · 2021/10/06(水) 10:49:29.50

[{'data': 'data123’, 'test': [{'testname': 'test123', 'testvalue': 'value123'}], 'date': '20211006}, {'data': 'data789’, 'test': [{'testname': 'test789', 'testvalue': 'value789'}], 'date': '20211007}]

上のようなかんじのデータ構造のデータがありまして、
forか何かでループして切り出して下のような感じに分割してデータを扱いたいんですがどうやればできますか？

[{'data': 'data123’, 'test': [{'testname': 'test123', 'testvalue': 'value123'}], 'date': '20211006}]

[{'data': 'data789’, 'test': [{'testname': 'test789', 'testvalue': 'value789'}], 'date': '20211007}]

**デフォルトの名無しさん** · 2021/10/06(水) 11:06:28.93

アップする前にちゃんとデータ検証しとけよ。
ary=[{'dict':'test'},{'dict':'test2'}]
for itm in ary:
__print(itm)

**デフォルトの名無しさん** · 2021/10/06(水) 11:17:52.70

>>58
ありがとうございます
早速試したみましたがそれっぽいことができました
printした結果、前後の[ ]がなくなっていてリストではなくなっているようにみえるんですがこいつをリストにはできないですか？

**デフォルトの名無しさん** · 2021/10/06(水) 11:23:52.33

各要素には[ ]はもともと付いてないからな。
その程度がわからんようなら基本的な知識が不足しすぎ。

初めから各要素をリストにしとくか、[itm]にする。
つーか、なんで抽出してまた各々をリストにする必要があるんだよ。

**デフォルトの名無しさん** · 2021/10/06(水) 11:35:16.77

任意のjson文字列を読み込む必要があるとかかね？

**デフォルトの名無しさん** · 2021/10/06(水) 11:47:56.89

うーん、よくわからんっす
知識不足ってのはそうですね、まだpythonさわって3日目ですw
web apiに引数としてデータ渡す際にリストで渡さないといけないのです

最初の分解する前の状態でも渡せないことはないんですが全部一度に渡すと具合悪いので分割して一つずつ渡したい感じです

**デフォルトの名無しさん** · 2021/10/06(水) 11:48:29.59

あれipが変わってしまいました

**デフォルトの名無しさん** · 2021/10/06(水) 12:10:25.68

リストで渡す＝json文字列で渡す
って意味なのかな？
そうならjson文字列で渡したいのです

**デフォルトの名無しさん** · 2021/10/06(水) 12:23:59.95

>>62
>うーん、よくわからんっす
[itm]がわからんてこと？　書いてあるママだが。
リストで渡せるならわざわざjsonにする必要はない。
その理解度でweb apiを触ろうとするのが逆にすごいな。

**デフォルトの名無しさん** · 2021/10/06(水) 12:28:38.78

for [itm] ってことですか？
エラーで返ってきますけど

**デフォルトの名無しさん** · 2021/10/06(水) 12:31:24.23

>>58
print([itm])だよ
もうちょい基本的なところから勉強したほうがいいよ

**デフォルトの名無しさん** · 2021/10/06(水) 12:40:42.74

なるほど！試してみますw

**デフォルトの名無しさん** · 2021/10/06(水) 12:49:00.18

できました！
すげえっす
めっちゃサンキューな

**デフォルトの名無しさん** · 2021/10/06(水) 15:56:51.31

StreamlitからLiberoffice Base操作するってどうしたら良いですか?

**デフォルトの名無しさん** · 2021/10/06(水) 21:08:11.15

sqlalchemyでデータベースの検索やInsert処理をします。
挿入処理A、検索処理B、検索処理Cをそれぞれ並列処理したとき
session.close()するタイミングはどうやればいいのでしょうか
例えば
addしたいレコードが複数あるとき
#挿入処理A
for item in items:
＿db.session.add(item)
＿time.sleep(3)#あえてsleep
db.session.commit()
db.session.close()
↑
この処理中に並列処理中の検索B、Cでの
（.commit()然り）db.session.close()がかぶる気がするのですが

**デフォルトの名無しさん** · 2021/10/06(水) 21:26:27.63

3.10来てるじゃねえか教えろよ
…
…
パターンマッチくらいか
あれば便利だけど取り立てて欲しい！って機能ではないなあ

**デフォルトの名無しさん** · 2021/10/06(水) 21:31:05.16

型の方はますますTypeScriptじみて来たな
もうTythonですよ
10年くらい前にTythonあったよね

71 · 2021/10/07(木) 10:04:08.76

自己解決？しました
まだ確信は持てませんが結局commitとcloseの総数が適切なら
挿入処理Aのループ処理の途中で（他の並列処理B,Cが）commit、closeしようが
DB更新瞬間さえセキュアであれば関係ないっぽいですね

**デフォルトの名無しさん** · 2021/10/07(木) 11:50:22.62

elifだと構文上subjectを固定できずコードが曖昧になってたからmatchたすかる
パターンマッチできるところが増えてくといいなあ

**デフォルトの名無しさん** · 2021/10/07(木) 13:09:40.31

Windowsの拡張子の取得をテストして気づいたこと
現代では拡張子は"."を含めるらしい
DOSの時代は含めなかったのに・・・
作成済みのプログラムの修正するか悩む

**デフォルトの名無しさん** · 2021/10/07(木) 15:39:01.76

ドットディレクトリとかの影響かな？

**デフォルトの名無しさん** · 2021/10/07(木) 16:16:39.36

理由はよくわからないけど、LinuxやUNIX側の影響でしょうね
ドットディレクトリの、".abc"みたいなのは対応は簡単？なんですが
"abc."みたいなドットで終わるタイプのファイル名想定してませんでした
DOSではこんなファイル名付けられなかったもんで

**デフォルトの名無しさん** · 2021/10/07(木) 19:30:33.12

ドットで終わるファイル名
os.path.isfile(file) -> False
ドットで終わるディレクトリ名
os.path.isdir(file) -> False

ドットで終わるファイル名・ディレクトリ名
attribute = win32api.GetFileAttributes(file) -> 例外

**デフォルトの名無しさん** · 2021/10/07(木) 19:43:13.97

p_dir = pathlib.Path(dir)
p_files = list(p_dir.glob("**/*"))
1stのディレクトリを再帰読込しようとすると、下の階層のドットで終わるファイル名・ディレクトリ名で例外

1st --- 2nd1 -
_____|- 2nd2. -
_____|- 2nd.3

例外を発生させずドットで終わるファイル名・ディレクトリ名を読み飛ばすには、
自力で再帰読込するしかないのでしょうか？

**デフォルトの名無しさん** · 2021/10/07(木) 20:07:13.59

>>80
80 のコメント取り消します
さらに分析必要みたい
どうなっているのかまだ詳細不明
正常に動かないのは確か

**デフォルトの名無しさん** · 2021/10/07(木) 20:30:18.08

改めて質問します

p_dir = pathlib.Path(dir)
p_files = list(p_dir.glob("**/*"))
1stのディレクトリを再帰読込しようとすると、下の階層のドットで終わるディレクトリ名で例外

1st --- 2nd1
_____|- 2nd2. (ドットで終わるファイル)
_____|- 2nd3. (ドットで終わるディレクトリ) -> 例外 FileNotFoundError

例外を発生させずドットで終わるディレクトリ名を読み飛ばすには、
自力で再帰読込するしかないのでしょうか？

未検証のアイデアでも頂けたらうれしいです

**デフォルトの名無しさん** · 2021/10/07(木) 21:02:20.97

やってみたらドットで終わるディレクトリ作れまへんがな
最後のドット消えてまうんやけど？

**デフォルトの名無しさん** · 2021/10/07(木) 21:20:59.25

>>83
エクスプローラーから作る方法は私も知りません
コマンドプロンプトで
copy "C:\test\a.txt" "\\?\C:\test\a."
md "\\?\C:\test\b."
みたいなかんじです
コマンドラインの知識が全くないかたは実験しないでください。

**デフォルトの名無しさん** · 2021/10/07(木) 21:28:40.10

>>84
コマンドプロンプトでやってみたけど最後のドットが無いファイル／ディレクトリが作られるよ
OSはWindows10

**デフォルトの名無しさん** · 2021/10/07(木) 21:40:15.30

> ID:vIJYcTdp
システム依存な話なのでよそでどうぞ

**デフォルトの名無しさん** · 2021/10/07(木) 21:44:37.02

>>85
こちらもWindows10です
ずっとコマンドプロンプトでやっていてできてます
今PowerShellでやってみましたが、PowerShellでもできました
\\?\C　つけ忘れていませんか？
フルパスで　""　もつけてください
ほかに条件あるのだろうか

**デフォルトの名無しさん** · 2021/10/07(木) 21:56:31.61

>>87
\\?\Cは付けてませんでした。
調べたら最後にドットがあるファイルは削除できないとかアクセスできないらしい
やだー　こわいからやらなーいｗ

**デフォルトの名無しさん** · 2021/10/07(木) 22:01:48.59

>>88
同様の方法で
del や rd で削除できます

**デフォルトの名無しさん** · 2021/10/07(木) 22:02:37.28

>>86
これでいいですか？

p_dir = pathlib.Path(dir)
p_files = list(p_dir.glob("**/*"))

で例外が発生する場合、該当ファイルを読み飛ばして処理を行う方法はありますか？
自力で再帰読込はできればやりたくありません

**デフォルトの名無しさん** · 2021/10/07(木) 22:28:17.75

最後がドッドのアクセスできないディレクトリに入ろうとして例外が出るのかな？
これは自力で再帰読込するしかないよ、再帰はそんな難しくないと思うよ！　がんばって＾＾

**デフォルトの名無しさん** · 2021/10/07(木) 23:35:06.59

超レアケースなのでルートのディレクトリ毎エラー処理することにします
できればファイル単位でエラー処理したかったのですが

**デフォルトの名無しさん** · 2021/10/07(木) 23:50:14.03

>>82
どうかな

import pathlib
p_dir = pathlib.Path(".")
p_glob = p_dir.glob("**/*")
p_files = []
while True:
try:
p = next(p_glob)
p_files.append(p)
except FileNotFoundError as e:
import sys
print(e, file=sys.stderr)
except StopIteration:
break
print(*p_files, sep="\n")

**デフォルトの名無しさん** · 2021/10/07(木) 23:53:44.05

>>93
ありがとうございます。
早速検証してみます

**デフォルトの名無しさん** · 2021/10/08(金) 00:17:02.73

>>93
すごいです
完璧に動いてます
早くこのレベルのプログラムがしたい
本当にありがとうございました

**デフォルトの名無しさん** · 2021/10/08(金) 00:41:36.79

Path.glob()いいね
いままでos.walk()で自前でフィルタしてたけど今度つかってみる

**デフォルトの名無しさん** · 2021/10/08(金) 08:04:57.04

ジェネレーターのスゴさを認識できた

**デフォルトの名無しさん** · 2021/10/08(金) 09:08:14.69

globって見に行かない名前のファイルかディレクトリなかったっけ？

**デフォルトの名無しさん** · 2021/10/08(金) 09:45:15.17

for i in range(100):
＿if条件:
＿＿time.sleep(3)など
＿＿continue
＿if条件:
＿＿time.sleep(3)など
＿＿continue

こういうとき、time.sleep(3)などが重複するのでまとめたいと思い
for i in range(100):
＿if i!=0:
＿＿time.sleep(3)など
としましたが
要は、continueするときには必ず実行する文がある
ということなので
continue後毎に処理するような節とかテクニックや慣習はあるのでしょうか

**デフォルトの名無しさん** · 2021/10/08(金) 09:56:28.31

イマイチ何言ってるかわからんけど、関数でいいんじゃないの？

**デフォルトの名無しさん** · 2021/10/08(金) 10:14:00.03

if条件の中にはif条件１とif条件２で違う処理も入っているので
continueするときに必ず行う処理はべつのとこに書いた方が見やすいかな
と思ったのです
つまり、continue文の宣言自体がそれ（continueするときに必ず行う処理）を示すような書き方があれば
と思ったのですがなさそうですね
ありがとうございました

**デフォルトの名無しさん** · 2021/10/08(金) 10:20:00.72

書いてる例だけ見るとcontinueを使うべきケースではなさそう

**デフォルトの名無しさん** · 2021/10/08(金) 10:44:16.94

for i in range(100):
＿if i!=0:
＿＿i=0以外で実行する関数１()

↑こういうのってあんまり使わないものなのでしょうか？
continue後時に必ず実行する関数、と違う点は
if i!=0:だと最期のcontinue後は実行されない、ので混乱するかなと。
（else節併用だと野暮になるし）

やはり重複しようが
if 条件1:
＿関数A()
＿関数１("")
＿continue
if 条件2:
＿関数B()
＿関数１("")
＿continue
みたいにした方がいいのかもしれませんね

**デフォルトの名無しさん** · 2021/10/08(金) 10:54:49.70

for i in range(100):
____if i != 0:
________if 条件1:
____________関数A()
________if 条件2:
____________関数B()
________関数1("")
________continue

**デフォルトの名無しさん** · 2021/10/08(金) 11:39:53.95

>>103
関数１でi==0で実行しない設定にしとけばいいだけだろ。

45 · 2021/10/08(金) 12:38:00.40

>>50
に書いたけど、

Ruby のglob では、. で始まる、隠し directory/file を除く

**デフォルトの名無しさん** · 2021/10/08(金) 14:27:43.17

tkinterでrowconfigure([1, 2, 3], weight=1)とかすると
_GridIndexにlist[int]できねーよって怒られるんだけど実際はできる
どういう型指定したらいいんでしょうか

**デフォルトの名無しさん** · 2021/10/08(金) 22:41:24.42

>>93
今日詳細にテストしました。今使っているコードです
p_dir = pathlib.Path(dir)
p_files = []
p_err_files = []
p_glob = p_dir.glob("**/*")
while True:
____try:
________p = next(p_glob)
________dot_chk = False
________for divided_path in str(p).replace("/", "\\").split("\\"):
____________if divided_path[-1] == ".":
________________dot_chk = True
________________break
________if not dot_chk:
____________p_files.append(p)
________else:
____________p_err_files.append(p)
____except FileNotFoundError as e:
________print(e, file=sys.stderr)
____except StopIteration:
________break
____for i in p_err_files:
________for j in p_err_files:
____________if str(i).startswith(str(j)):
________________if len(str(i)) > len(str(j)):
____________________p_err_files.remove(i)
print(*p_files, sep="\n")
print(*p_err_files, sep="\n")

**デフォルトの名無しさん** · 2021/10/08(金) 22:49:21.67

ドットで終わるディレクトリがあっても例外が発生しない場合があるようです。
例外が発生しない場合、このコードで正常・異常分類できてます
例外が発生した場合、探索が打ち切られているような感じです。
解釈間違ってるかも
例外が発生した場合、全件エラーにした方がよさそうです。

**デフォルトの名無しさん** · 2021/10/08(金) 23:04:50.88

例外が発生しない場合でも
ドットで終わるファイル・ディレクトリを検出したら全件エラーのほうが安全かな

**デフォルトの名無しさん** · 2021/10/09(土) 08:06:03.22

class Person():
＿def __init__(self, name, age):
＿＿self.name = name
＿＿self.age = age
＿def sample1(self):
＿＿print(self.name,self.age,self.f)

class JapanesePerson(Person):
＿def __init__(self,name,age,f=False):
＿＿self.name = name
＿＿self.age = age
＿＿self.f=f

class JapanesePerson2(Person):
＿def __init__(self,name,age,f=False):
＿＿super().__init__(name,age)
＿＿self.f=f

yamada = JapanesePerson("山田", 30)
yamada.sample1()
yamada2 = JapanesePerson2("山田2", 20,True)
yamada2.sample1()

JapanesePersonとsuper()つかったJapanesePerson2って同じ意味っすよね？
super()使って書くのって継承したPersonにname,ageがあるぞっていう意味合いのためなんでしょうか？

**デフォルトの名無しさん** · 2021/10/09(土) 08:45:15.87

>>111
>JapanesePersonとsuper()つかったJapanesePerson2って同じ意味っすよね？
違うよ、super()を使った方は基底クラスPersonの属性name,ageに値をセットするが
JapanesePersonの方は基底クラスの方にセットせずに重複したJapanesePersonの属性name,ageにセットしている
Personを継承している意味がナッシング

**デフォルトの名無しさん** · 2021/10/09(土) 09:52:36.10

>>112
そうなんですね
yamada.sample1() でself.name,self.ageが参照できてるので
なんのためにsuper().__init__でわざわざ値セットする必要があるんだろう？？と気になったので。
def sample1(self):のselfってなんなんだ？？みたいな
ありやした

**デフォルトの名無しさん** · 2021/10/09(土) 11:41:14.80

>>108
>________for divided_path in str(p).replace("/", "\\").split("\\"):
>____________if divided_path[-1] == ".":
これはfor divided_path in p.parts: # で分割できる、pathlibの機能を使おう
更にここは内包表記で一気に書けて
_________if any(part.endswith('.') for part in p.parts):
よってdot_chk変数が不要になる

>____except FileNotFoundError as e:
>________print(e, file=sys.stderr)
これエラー表示してるだけだから、p_err_files.append(p) しといた方が良くない？

>____for i in p_err_files:
>________for j in p_err_files:
>____________if str(i).startswith(str(j)):
>________________if len(str(i)) > len(str(j)):
>____________________p_err_files.remove(i)

こっちの方が早いかも、短いし
____for i in p_err_files:
________p_err_files = [j for j in p_err_files if not j.match(i.name+'/*')]

**デフォルトの名無しさん** · 2021/10/09(土) 12:37:39.05

>>114
アドバイスありがとうございます。
内包表記覚えたいと思ってるんですがなかなか身につかないです
glob.glob使っていてpathlib.globに書き直したのでpathlibの他の機能何も知らない状態です
勉強しなきゃいけないこと多いな

>>____except FileNotFoundError as e:
>>________print(e, file=sys.stderr)
>これエラー表示してるだけだから、p_err_files.append(p) しといた方が良くない？
動作確認に使ってるだけなんで、printじゃなくpassでいいかと思ってます。
この例外のメッセージから有用な情報は得られませんでした
例外が発生する以前に、pathlib.globに限らずファイル関連の関数・クラスの挙動があやしいです
pathlib.globは試した範囲では１番挙動がまともでした

**デフォルトの名無しさん** · 2021/10/09(土) 13:10:11.80

>>114
>________p_err_files = [j for j in p_err_files if not j.match(i.name+'/*')]
j.match(i.name+'/*')]　の部分なんですが、pathlibは'/'で決め打ちして大丈夫なんですか？
pythonが'/'と'\\'をどう使い分けてるかよくわからないです。
取得したパスが'/'と'\\'混在してたりするし・・・

**デフォルトの名無しさん** · 2021/10/09(土) 13:20:34.47

>>116
決め打ちじゃなく正規表現の書き方なのか？
急いで調べます

**デフォルトの名無しさん** · 2021/10/09(土) 13:22:15.13

>>116
どっち使ってもいいし混在してもいいみたいですよ

>>____except FileNotFoundError as e:
>>________print(e, file=sys.stderr)
これ有益な情報が得られないとあるけど、どのディレクトリかファイルで例外発生したかは分かったの？
分からなかったらpも表示させた方がいいんでない？

**デフォルトの名無しさん** · 2021/10/09(土) 13:49:18.15

>>118
例外発生したディレクトリの名前が信用できないんです
except FileNotFoundError as e: のところで分かるのは、発生したということだけです
恐らく発生したと思われるディレクトリ名は既にp_err_filesに入ってます
例外が発生したときのみ全件エラーにするなら何かフラグを立てたほうがいいと思います
今回はドットで終わるものを見つけたら、エラーログにp_err_filesを書き出して
全件処理しないのでこれで十分かと
その後、手作業でエラーログのすべてに対応すると思うので、例外発生個所の情報は使いません

**デフォルトの名無しさん** · 2021/10/09(土) 14:29:12.42

>>119
いやいや、例外が発生する箇所はp = next(p_glob)のところで
そこからexcept FileNotFoundError as e: にジャンプしてくるわけですから
p_err_filesには入りません（p_err_filesに入るのは例外が発生しない場合です）

で、おそらくpの変数に代入する前のnext(p_glob)で例外が発生するから
その場合except FileNotFoundError as e:でpを表示させた場合は例外が発生する前のpなわけで
そのpの次にアクセスするディレクトリかファイルで例外が発生するということですよ、きっと

あと/と\\なんですけど、これはファイルパスの区切り文字でLinuxとかが/でWindowsは\\です
Pythonではどっち指定してもいいんですが、これをstr()で文字列にすると文字が違うわけですから
同じパスでも違うパスと判定してしまうので注意です
if str(i).startswith(str(j)):は危険です

**デフォルトの名無しさん** · 2021/10/09(土) 14:45:18.21

>>120
詳しく書きますね
最初ドットで終わるディレクトリに入れなくて例外すると考えていました。
テストしているとそうではないと思うようになってきました。
例外が発生原因はドットで終わるディレクトリです
でも必ず例外が発生するわけではありません
pathlib.globが最後に探索する箇所がドットで終わるディレクトリの場合、例外は発生しません
この状態でドットで終わるディレクトリのうしろに問題のないディレクトリを追加します
そうすると、ドットで終わるディレクトリではやはり例外は発生しません
例外が発生するのは次の問題のないディレクトリです
このとき、間違ったファイル名で処理をしようとしてFileNotFoundErrorが発生していると思われます
例外で取得できるのは問題のないディレクトリにアクセスするときの間違ったファイル名です

**デフォルトの名無しさん** · 2021/10/09(土) 15:09:43.07

>>121
よく分かりました。それなら言われたとおり例外はpassするだけでいいですね

ところで
____for i in p_err_files:
________p_err_files = [j for j in p_err_files if not j.match(i.name+'/*')]
ですが、、
____for i in p_err_files:
________p_err_files = [j for j in p_err_files if not j.match(str(i/'*'))]
に訂正します

matchの中のstr(i/'*') は文字列にした場合区切り文字が\\になります
これをstr(i) + '/*'として/と\\を混在させてもmatchでは正常に動くようです

**デフォルトの名無しさん** · 2021/10/09(土) 15:30:28.23

printと書かない以外でなんか出力するのある？

**デフォルトの名無しさん** · 2021/10/09(土) 16:19:52.75

sys.stdout.write()

**デフォルトの名無しさん** · 2021/10/09(土) 16:24:43.13

WindowsというかDOSの頃から内部は/でもパス区切りできて
バックスラッシュ要求するのはシェルや一部のアプリ
単体プログラムなら/で書いたほうがポータビリティある

**デフォルトの名無しさん** · 2021/10/09(土) 18:09:17.61

>>121
Path.globでイテレータを作成した後に追加・削除されたファイルやディレクトリは
イテレーションに含まれるか含まれないかは不定なので
それでも困らないような使い方じゃなければ使い方が悪い

>例外で取得できるのは問題のないディレクトリにアクセスするときの間違ったファイル名です
問題のないディレクトリなのに間違ったファイル名なのか・・・・
全部読んでないからかよくわからん

**デフォルトの名無しさん** · 2021/10/09(土) 19:07:55.16

統合環境？総合環境？
おすすめの教えて
winでもマックでもリヌクスでもいいです

**デフォルトの名無しさん** · 2021/10/09(土) 19:13:36.12

eric4

**デフォルトの名無しさん** · 2021/10/09(土) 19:19:03.79

>>126
書き方があいまいでしたね
イテレータを作成する前に追加してます

**デフォルトの名無しさん** · 2021/10/09(土) 21:23:39.35

>>127
Jupyter Notebook、Notebookの後継であるJupyterLab、
VSCode, Google Collaboratory

YouTube などで、よく紹介されているのは、Google Collaboratory

他には、WSL2, Linux, Docker

多言語のversion manager なら、asdf とか、
日本人が作った、バージョンマネージャーのanyenv とか

anyenvでは、19言語を統一された方法で、
nodenv, phpenv, pyenv, rbenv, goenv, jlenv などを使う。
Python ならpyenv、Julia ならjlenv

Python標準では、venv

多くの言語で、version manager の使い方を統一したいのなら、asdf, anyenv

**デフォルトの名無しさん** · 2021/10/09(土) 23:27:09.55

>>130
ありがとう
参考にしてそれぞれ入れてみて稼働確認？動作軽いのか？とかやってみます。

**130** · 2021/10/10(日) 00:15:53.95

プロ用では、anyenv から、Docker へ移行していくだろう

**デフォルトの名無しさん** · 2021/10/10(日) 05:07:59.49

tkinterにドラッグアンドドロップつける
tkinterDnD2というやつ

dnd_root.bind(<Drop>, callback)
callback(ev):
__files = dnd_root.splitlist(ev.data)

みたいに書きます
このevてdndEventクラスで
http://tkinterdnd.sourceforge.net/TkinterDnD.html#DnDEvent
にあるように、いくつかの属性にアクセスできるんだけど
この属性のそれぞれが何を意味してるのかっていうのは、どこに書いてあるんでしょうか
ドキュメント的なものを探してるんだけど、見当たらなくて

**デフォルトの名無しさん** · 2021/10/10(日) 08:00:27.46

>>133
https://www.ellogon.org/petasis/index.php/tcltk-projects/tkdnd/tkdnd-man-page#lbAI
TkinterDnD.pyは読んでる前提

**デフォルトの名無しさん** · 2021/10/10(日) 09:09:58.87

>>134
おー助かりました

**デフォルトの名無しさん** · 2021/10/10(日) 09:10:27.91

>>127
統合開発環境ね
パイチャームかVisualStudioかインテリj

**デフォルトの名無しさん** · 2021/10/10(日) 11:33:12.15

私の開発環境はIDLEとGVIMだわ、大したことやってないし

**デフォルトの名無しさん** · 2021/10/10(日) 12:39:25.44

importで頭が混乱してきました
https://pastebin.com/tRafMmRt

sample0.pyのimport sample2で、sample2内のsample1がimportされると思ったのですが
結果、importはされませんでした
そう判断したのは、sample0→sample2でのsample1のimportで
printもされず、BASEのランダムも生成されなかったからです

これは、sample0.pyでsample1をすでにimportしているので
sample2内のsample1のimportは省略というか、
sample0でのsample1のimportを引き継いだ
みたいなことでいいのでしょうか・・？

**デフォルトの名無しさん** · 2021/10/10(日) 13:16:40.64

>>138
そう
あちこちにあるimport sys他が都度走るのはいやだし

https://docs.python.org/ja/3/reference/import.html
他の動作も可能だけれどフレームワーク実装とか特殊なケースでなければ
モジュール側でうまく対応した方が良い。

**デフォルトの名無しさん** · 2021/10/10(日) 13:24:05.94

>>139
なるほど・・
どうもimportするたびに新規発行されるみたいなイメージが強くなってしまって・・
＞あちこちにあるimport sys他が都度走る
たしかにそうですよね
ありがとうございました

**デフォルトの名無しさん** · 2021/10/10(日) 14:08:59.72

>>114
>>122

for x in range(500000):
p_err_files = p_err_files_org.copy()
for i in p_err_files:
for j in p_err_files:
if str(i).replace("/", "\\").startswith(str(j).replace("/", "\\")):
if len(str(i)) > len(str(j)):
p_err_files.remove(i)
７秒

for x in range(500000):
p_err_files = p_err_files_org.copy()
for i in p_err_files:
p_err_files = [j for j in p_err_files if not j.match(str(i/'*'))]
97秒

p_err_filesの内容によってどう変わるかわかりませんがかなり遅いです
綺麗な書き方だけにどうにかしたい
報告です。質問じゃないです

**デフォルトの名無しさん** · 2021/10/10(日) 15:13:50.14

>>141
ふむ、matchが遅いのだろうね、、じゃあ二人の良いところをドッキングしよう
for x in range(500000):
____p_err_files = p_err_files_org.copy()
____for i in p_err_files:
________i = str(i).replace("/", "\\") + '\\' #replaceのせいで見にくいからあえて別にしてみました
________p_err_files = [j for j in p_err_files if not str(j).replace("/", "\\").startswith(i)]
これは3秒いっちゃうんじゃない？

ところで/と\\って混在するの？　pathlib.Pathをstr変換するとOSに合わせた区切り文字で文字列化しない？
replaceいらないんじゃない？　いや、私も昔混在しててエラーになった経験があるんだけども
それって文字列化してから自分でスラッシュを足して混在させてたような気がしてきた
今適当にやってみても混在しないし・・さ

**デフォルトの名無しさん** · 2021/10/10(日) 16:01:08.25

>>142
4秒になりました、内包表記早い
最近も混在してエラーになりました。詳しく調べてないです
気になるときは.replace("/", "\\")つけてます

**デフォルトの名無しさん** · 2021/10/10(日) 16:15:29.74

混在するのいやだから自分でつなぐときos.path.join使ってます
今ソース確認したけど"/"使ってない

**デフォルトの名無しさん** · 2021/10/10(日) 16:23:35.36

>>143
ttps://docs.python.org/ja/3/library/pathlib.html#operators
パスオブジェクトの文字列表現はそのシステム自身の Raw ファイルシステムパス (ネイティブの形式、
例えば Windows では区切り文字がバックスラッシュ) になり、
文字列としてファイルパスを取るあらゆる関数に渡すことができます
↑
ほらほら、仕様的にWindowsでstr変換すると\\になるよん

>>144
ふーん、ちなみにpathlib.Pathにもjoinpathがあるからそっちの方がいいかも

**デフォルトの名無しさん** · 2021/10/10(日) 17:00:09.47

取得したばかだから混在はないですね
最終形
for x in range(500000):
____p_err_files = p_err_files_org.copy()
____for i in p_err_files:
________p_err_files = [j for j in p_err_files if not str(j).startswith(str(i) + os.sep)]

**デフォルトの名無しさん** · 2021/10/10(日) 17:10:38.07

>>146
う、美しい、、os.sepもエレガント

**デフォルトの名無しさん** · 2021/10/10(日) 20:43:45.45

ありゃ、バグってたかも（最終形じゃないやつ）

新コード 14秒

for x in range(5000):
____p_err_files = [str(p) for p in p_err_files_org]
____for i_idx, i in enumerate(p_err_files[:-1]):
________for j in p_err_files[i_idx + 1:]:
____________if j.startswith(i + os.sep):
________________p_err_files.remove(j)
____p_err_files = [pathlib.Path(p) for p in p_err_files]

最終形って書いたコード 56秒

新コードがバグってないかよくテストしなければ

**デフォルトの名無しさん** · 2021/10/10(日) 21:08:00.05

最初のデータだと
新コード 14秒
最終形って書いたコード 4秒
件数が多いと新コードが早い

**デフォルトの名無しさん** · 2021/10/10(日) 21:41:11.57

for x in range(5000):
____p_err_files = p_err_files_org.copy()
____for i in p_err_files:
________if i.is_dir():
____________i = str(i) + os.sep
____________p_err_files = [j for j in p_err_files if not str(j).startswith(i)]

最速のコード・・できました、、これは2秒台かもしれん
最後がドットのディレクトリでis_dir()ができるのか知りませんが

**デフォルトの名無しさん** · 2021/10/10(日) 22:14:56.87

>>150
衝撃の結果　最初のデータ（件数の少ないやつ）
新コード 14秒
最終形って書いたコード 4秒
isdir 167秒
コードを見ると一見早そうに見えるんだけど

**デフォルトの名無しさん** · 2021/10/10(日) 22:25:50.37

件数の多いデータ loop回数減らしてます
新コード 2秒
最終形って書いたコード 11秒
isdir 60秒

**デフォルトの名無しさん** · 2021/10/10(日) 22:53:16.01

＞　お前は毎朝起きるたびに俺に負けたことを思い出すよ＾＾

あー、ホンッとに思い出すなあ（笑）
キチガイの嘘つきの低レベルFランの、
朝鮮ゴキブリBot君は、
チョン独特の「なにもできないけど俺のほうがジャップより偉い！」的な
ことはよーくわかったよ。
ホントなにもできない朝鮮ゴキブリBot君！

クソチョンｗ

**デフォルトの名無しさん** · 2021/10/10(日) 23:14:16.55

is_dir()はos.stat(fstat)つかってそうだし遅いだろうね
事後処理多すぎるしos.walk()のが適当かも

**デフォルトの名無しさん** · 2021/10/10(日) 23:25:00.22

for x in range(5000):
____p_err_files = p_err_files_org.copy()
____for idx, i in enumerate(p_err_files[:-1], start=1):
________i = str(i) + os.sep #これは出した方が速いの？変わらない？
________p_err_files = [j for j in p_err_files[idx:] if not str(j).startswith(i)]
界王拳3倍だぁああああ

**デフォルトの名無しさん** · 2021/10/10(日) 23:36:40.30

やっぱ>>155は無し
このp_err_files[:-1]やp_err_files[idx:]ってダメな気がする
途中でp_err_filesの要素抜くからバグる気がするんだけど・・
新コードと最終形の結果同じなんだよね？

**デフォルトの名無しさん** · 2021/10/10(日) 23:50:06.43

>>155
最初のデータ（件数の少ないやつ）
新コード 14秒
155のやつ　2秒

件数の多いデータ 466件
新コード 28秒
155のやつ　32秒

件数の多いほうほぼ互角ですね

>________i = str(i) + os.sep #これは出した方が速いの？変わらない？
圧倒的に速いです

**デフォルトの名無しさん** · 2021/10/10(日) 23:51:21.86

>>156
新コードと最終形の結果は同じです
古いコードはバグってました

**デフォルトの名無しさん** · 2021/10/10(日) 23:57:12.93

for x in range(5000):
____p_err_files = p_err_files_org.copy()
____for i in p_err_files:
________if i in p_err_files:
____________i = str(i) + os.sep
____________p_err_files = [j for j in p_err_files if not str(j).startswith(i)]

はい、これ最後にするわｗ　inで抜いた要素の場合は処理を飛ばすです
is_dir()みたいに遅いかも？　お疲れっした！

**デフォルトの名無しさん** · 2021/10/11(月) 00:00:41.38

>>155

155は結果がおかしいです

**デフォルトの名無しさん** · 2021/10/11(月) 07:20:20.01

出来ました、これが本当の最後！　globで作られるリストでは先にディレクトリが並び、
後にそのディレクトリ内のファイルが並ぶことを利用して
消えるのは常にidxの後ろのファイルであることを考慮したものです

for x in range(5000):
____p_err_files = p_err_files_org.copy()
____for idx in range(len(p_err_files)):
________try:
____________i = str(p_err_files[idx]) + os.sep
________except IndexError:
____________break
________p_err_files = [j for j in p_err_files if not str(j).startswith(i)]
見てくださいこのカッコイイボディー、1秒台を叩き出すポテンシャルが伺えます

**デフォルトの名無しさん** · 2021/10/11(月) 14:30:12.13

最新コードです
メインループはリスト、サブループは集合
リストは長さでソート
集合で in を高速にし、内包表記で削除するデータを集め差集合を求める
件数が多い場合に焦点を当ててます

for x in range(5000):
____p_err_files = p_err_files_org.copy()
____p_err_list = sorted([str(p) for p in p_err_files], key = len)
____p_err_set = set(p_err_list)
____for i in p_err_list:
________if i in p_err_set:
____________i += os.sep
____________p_err_set -= {j for j in p_err_set if j.startswith(i)}
____p_err_files = [pathlib.Path(p) for p in p_err_set]

測定結果は後ほど

**デフォルトの名無しさん** · 2021/10/11(月) 15:03:13.08

p_err_files_orgを含めてideoneあたりに貼ってくれんかな

**デフォルトの名無しさん** · 2021/10/11(月) 15:04:52.03

最初のデータ（件数の少ないやつ） 500,000ループ
最新コード 14秒
新コード 13秒
最終形って書いたコード 4秒
159 3秒
161 3秒

件数の多いデータ 466件 5,000ループ
最新コード 4秒
新コード 14秒
最終形って書いたコード 54秒
159 28秒
161 13秒

巨大ディレクトリテスト 122496件 1ループ
最新コード 223秒
新コード 277秒
最終形って書いたコード測定不能ギブアップ
159 ギブアップ
161 ギブアップ

**デフォルトの名無しさん** · 2021/10/11(月) 15:38:36.71

> ID:PpP5FnLO, ID:ykpYSE0z
そろそろやめてもらっていいですか

**デフォルトの名無しさん** · 2021/10/11(月) 15:38:47.81

>>164
ブラボー、集合速い!

ちなみに最新コードのsetで順番が変わった結果は、これで戻せると思います
____p_err_files = sorted([pathlib.Path(p) for p in p_err_set] , key=p_err_files_org.index)

**デフォルトの名無しさん** · 2021/10/12(火) 00:09:42.22

>>165
ガイジに話が通じると思ってる奴もガイジ

**デフォルトの名無しさん** · 2021/10/12(火) 13:14:04.41

uuid含む辞書のリストの検索って
やっぱ内包表記が一番早いですか？
item = [d for d in db if d[id] == _id][0]

**デフォルトの名無しさん** · 2021/10/12(火) 14:22:16.90

>>168
それだと遅延評価されずに全走査してから[0]を解決するから
リストが長いと不利

**デフォルトの名無しさん** · 2021/10/12(火) 17:12:16.40

>>169
こうですか？
item = next(filter(lambda d: d[id] == _id, db))

**デフォルトの名無しさん** · 2021/10/12(火) 18:55:46.32

線形探索に変わりはないから本質的には変わらない
規模と目的にもよるが事前にハッシュテーブルを作成するなりしたらいいんじゃない？

**デフォルトの名無しさん** · 2021/10/12(火) 19:05:49.73

>>170
最初の1つを取得したいなら素直にfor文で回して見つけ次第breakすればいいんじゃない？

**デフォルトの名無しさん** · 2021/10/12(火) 19:27:30.01

>>172
検索速度を速くするために内包表記、全走査せず見つけたら止まるようにジェネレータを使うので
item = next(filter(lambda d: d[id] == _id, db))
もしくは、
item = next(d for d in db if d[id] == _id)

>>171
ハッシュテーブル使うならこうですか？
item = eval(' | '.join([f'db[{i}]' for i in range(len(db))]))[id]

**デフォルトの名無しさん** · 2021/10/12(火) 19:48:08.27

謎のなりすましｗ

**デフォルトの名無しさん** · 2021/10/12(火) 20:14:27.30

tkinterとMVCを勉強中なんですが
view用のtkvarってmodel(db)に置くんですか？
view側が持つのですか？

**デフォルトの名無しさん** · 2021/10/12(火) 20:38:17.90

>>174
答えは見つかりましたか？

**デフォルトの名無しさん** · 2021/10/13(水) 00:27:53.69

>>173
内包表記使わないと死ぬ病気なの？
いつ、何故内包表記が速くなるか勉強した方がいい
ネットに落ちているサンプルコードのように繰り返しappendする訳でもないのだから大して変わらん

**デフォルトの名無しさん** · 2021/10/13(水) 04:42:48.68

>>175

view
ウィジェットとtkvar(表示(view)に関わる)

model
変数(データ実体)

controller
view.widget.tkvar.set(mode.var)

おれの認識

**デフォルトの名無しさん** · 2021/10/13(水) 08:21:06.00

>>177
内包表記みるとﾌｧﾋﾞｮっちゃう病気なの？
内包表記が速くなるだけじゃないことを勉強した方がいい
ネットに落ちてるサンプルコードのように単純な処理のだから内包表記を使わない手はない

**デフォルトの名無しさん** · 2021/10/13(水) 08:46:20.82

内包表記ってなんですか？

**デフォルトの名無しさん** · 2021/10/13(水) 10:54:11.99

[_ for _ in (1,2,3)]

**デフォルトの名無しさん** · 2021/10/13(水) 12:56:21.92

どんなに複雑なコードでも内包表記で書こうとするような奴はPython向いてないとは思う

**デフォルトの名無しさん** · 2021/10/13(水) 13:38:38.75

馬鹿の一つ覚え

**デフォルトの名無しさん** · 2021/10/13(水) 14:17:57.86

next filterは見た目いいけどそのままだと例外飛ぶからdefault指定すべき
あとid検索をしょっちゅうやるつもりなら171の言う通りidをキーに持つハッシュテーブルにしたほうがいい

**デフォルトの名無しさん** · 2021/10/13(水) 15:04:27.22

ネストする時は内包表記でもインデントしてね

**デフォルトの名無しさん** · 2021/10/13(水) 15:48:08.21

>>184
お、褒められたｗ　default指定か、なるほど、、じゃあこう
item = next(filter(lambda d: d[id] == _id, db), None)

ハッシュテーブルって辞書のことですよね？

**デフォルトの名無しさん** · 2021/10/14(木) 08:52:02.98

>>178
Viewは簡単に生き死にするから、変数(データ実体) をtkvarにしてModelに持たせる方がいいと思うよ。
形式変換などが必要なときは、Modelにそれ用のアクセサを付ければいい。
ControllerがModelとViewのインスタンスを持ち、ViewはControllerだけを参照する。
Modelは基本的にController、Viewの参照をどっちも持たない。

**デフォルトの名無しさん** · 2021/10/14(木) 09:10:49.38

作り方にもよるけど
tkinterをqtに変えようとか、移植に伴ってツールキットを交換することを考えると
modelをtkverのデータ置きにすると全面的な書き直しがいると思うつーか、そうなった

ので俺は最近modelには一般の変数とロジックだけ置く
viewには可能な限りtkinter固有の全部を置く。vcmdとかも
で全操作をcontrollerに書く。コイツが全部の発信源
よくviewがmodel見る三角形図あるけど、個人的にはviewの影響を限定的にしたい

https://i.imgur.com/a7HUCYH.png

**デフォルトの名無しさん** · 2021/10/14(木) 09:42:03.64

確かに、tkinterのVarはデータバインディング（しかも双方向可能）の考え方そのものなので、
MVCに少しそぐわない（ViewModelっていうんだっけ？）。
どっちにしろ、データベースやネットワークサービスがデータソースになる場合は、Varは単なるバスみたいな使い方になるし。

**デフォルトの名無しさん** · 2021/10/14(木) 11:40:53.17

まあ移植性を捨てればtkvarはdbに置いて
bindingと最小限のイベントハンドラをcontrollerに置いて
あとはm-v間でやってくれぇ～というのが一番書きやすいだろう

真面目にやるとcontroller薄くなりすぎるはずなのでc-vとmに分けるっていうのも良いと思う。わしはこれが好き
GUI(tk.Tk):
_super().__init__()
云々
GUI.mainloop()するやつ

**デフォルトの名無しさん** · 2021/10/15(金) 16:12:08.85

PythonでLZ4を使うと、lz4.frame,lz4.block,lz4.streamっていうのがあるみたいなのですが
それぞれ何がどう違うのでしょうか
検索すると英語の情報が多いのですが、アホなので分かりません

**デフォルトの名無しさん** · 2021/10/15(金) 16:25:20.62

質問ですが、defaultdictに対して.getを使った場合、値が存在しない場合でもメモリを使ってしまうのですか？

**デフォルトの名無しさん** · 2021/10/15(金) 18:54:50.40

>>192
https://docs.python.org/ja/3/library/collections.html#collections.defaultdict.__missing__
> もし default_factory 属性が None でない場合、このメソッドは引数なしで呼び出され、与えらえた key に対応するデフォルト値を提供します。この値は、辞書内に key に対応して登録され、最後に返されます。

なんでデフォルト値の分消費する。(各種オーバーヘッドは未考慮)

>>> help(collections.defaultdict)
困ったらhelp
同じことが書かれてる

**デフォルトの名無しさん** · 2021/10/15(金) 19:07:39.63

>>193
ありがとうございます。

**デフォルトの名無しさん** · 2021/10/16(土) 23:48:05.88

>>321
youtube-dl --skip-download --dateafter now-3days --get-title --get-id --get-description --get-duration -i "チャンネルURL"

**デフォルトの名無しさん** · 2021/10/17(日) 14:11:08.72

Mike Python

**デフォルトの名無しさん** · 2021/10/17(日) 17:37:19.17

＞　お前は毎朝起きるたびに俺に負けたことを思い出すよ＾＾

あー、ホンッとに思い出すなあ（笑）
キチガイの嘘つきの低レベルFランの、
朝鮮ゴキブリBot君は、
チョン独特の「なにもできないけど俺のほうがジャップより偉い！」的な
ことはよーくわかったよ。
ホントなにもできない朝鮮ゴキブリBot君！

クソチョンｗ

**デフォルトの名無しさん** · 2021/10/17(日) 19:55:12.60

Python3.9で、souted()とラムダ式を勉強しているところです
sorted()のkeyに指定するラムダで、戻り値にマイナスを付けるコードがあり、
これは何だろうと思って以下のリストを作成してsorted()にかけて出力してみました
(コメント行として書いている箇所が出力結果です)

li = [('a', 1), ('b', 200), ('c', 50), ('e', -3), ('h', -55000), ('d', 10)]

print(sorted(li, key=lambda x: x[0]))
# [('a', 1), ('b', 200), ('c', 50), ('d', 10), ('e', -3), ('h', -55000)]

print(sorted(li, key=lambda x: -x[0]))
# TypeError bad operand type for unary -: 'str'

print(sorted(li, key=lambda x: x[1]))
# [('h', -55000), ('e', -3), ('a', 1), ('d', 10), ('c', 50), ('b', 200)]

print(sorted(li, key=lambda x: -x[1]))
# [('b', 200), ('c', 50), ('d', 10), ('a', 1), ('e', -3), ('h', -55000)]

出力結果を見るに、マイナスを付けるとreverse=Trueを指定したときと
同じ結果が得られるということなのかなと思ったのですが
1つだけTypeErrorになってしまいました
これは何故なのでしょうか

**デフォルトの名無しさん** · 2021/10/17(日) 20:06:53.96

sorted関係ないしエラーメッセージがまんま理由

>>> -'a'
…
TypeError: bad operand type for unary -: 'str'

**デフォルトの名無しさん** · 2021/10/17(日) 20:42:04.88

>>199
ありがとうございます

戻り値が'a'というstr型なのに負の値にしようとして怒られてるってことでしょうか
key=lambda x: -x[N] という書き方は、reverseオプションの代替ではなく
戻り値に-1を掛けている…という認識であってますか？
(そのため結果として逆順にソートされたように見える)