スクレイピングしようとbs4でしたところ
URL:http---.jpgがあってそのままだと吸い出せず
そのあとにつづく.netでした
けれどの\sや\nなどでやっても結合できず
置き換えでやったところprintで見ると.netの部分が空白行になってました
要素か何か別々になってるような感じで、、、
初心者過ぎてよく分かりません
soup = BeautifulSoup(res.text, "html.parser")
[tag.extract() for tag in soup(string='n')]
elems = soup. find_all("img", class_="ほにゃらら")
for elems in elems:
elems = elems.get("data-src")
elems = elems.replace('.net','')
elems = elems.replace('jpg','jpg.net')
elems = elems.replace('png','png.net')
if elems.startswith("http") and (elems.endswith('')):
printした時こうなります
http jpg.net
http jpg.net
http jpg.net
改行のようではなかったのでどのように結合させて
ファイルを1.jpgから順に書き出すにはどうしたらいいですか?
Pythonのお勉強 Part70
■ このスレッドは過去ログ倉庫に格納されています
308デフォルトの名無しさん (スププ Sdbf-u+Oh)
2023/05/27(土) 08:52:36.37ID:kNCRj74ed■ このスレッドは過去ログ倉庫に格納されています