スクレイピングの練習をしているのですが、
やりたい作業の方法が思いつかないので教えてください。
下記はコジマの商品一覧ページです。
作業はseleniumとlxml.htmlで行っています。
htmlを取得し、48商品すべてのポイントをスクレイピングしようと下記を実行しました。
u='1UMto4'
driver.get(u)
html = driver.page_source
html = lxml.html.fromstring(html)
css_pt = '#fwCms_wrapper > div > div > div.layoutGrid > div.fwCms_box.frame_MB > div.ProductList.MK2PFRDL010_01 > div > ul > li > p.point.small.mt1 > span.number'
pt = [int(pt.text_content().replace(",","").strip()) for pt in html.cssselect(css_pt)]
ポイントの記載がない商品は、0として値を取得したいのですが、
上記方法だとポイントがある商品しか値を取得できません。
そこでhtmlにp.point.small.mt1 > span.numberが記載されていない商品にもp.point.small.mt1 > span.numberhtmlを追記してポイント0を加えた上で、
css_pt = '#fwCms_wrapper > div > div > div.layoutGrid > div.fwCms_box.frame_MB > div.ProductList.MK2PFRDL010_01 > div > ul > li > p.point.small.mt1 > span.number'
pt = [int(pt.text_content().replace(",","").strip()) for pt in html.cssselect(css_pt)]
を実行するようにしてみたいです。
何かいい方法ありますか
探検
【まず1嫁】くだすれPython(超初心者用) その58
■ このスレッドは過去ログ倉庫に格納されています
562デフォルトの名無しさん
2023/02/18(土) 23:14:23.54ID:kBeBEpAv■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 首相官邸筋「私は核を持つべきだと思っている」 オフレコ非公式取材にて発言 [パンナ・コッタ★]
- 《いつかこの子がドレスを着るまで生きたい》サウナ閉じ込め…専門家が指摘する月額39万円サウナの“論外な構造” [パンナ・コッタ★]
- 女子高生が初の司法試験合格 予備ルートの慶応女子高3年「企業法務の弁護士になりたい」 [ぐれ★]
- 官邸の安保担当「日本は核保有すべきだ」 政府内の検討は否定 [蚤の市★]
- 松本人志「DOWNTOWN+」に非吉本から売り込み殺到 加入者50万人突破で [Ailuropoda melanoleuca★]
- 【高市首相】「日本人が日本各地を旅行するのも大切」 中国からの渡航自粛巡り ★7 [ぐれ★]
- 【日帝しぐさ】中国「高市は事態をつくり出し、間近から挑発することで、自国の軍備拡張や海外での軍事展開に口実を与えようとしている」 [979264442]
- 【吉報】玉木×高市の「年 収 の 壁」撤廃の減税額、マジのガチですごすぎるwmwmwmwmwmwmw [517459952]
- 🏡☢核兵器使用推進スレ☢🏡
- 【速報】高市首相「最低賃金引き上げします。来年検討します!!」キタ━━━━(゚∀゚)━━━━‼ [921362874]
- 【画像】この子のアソコ舐めたい?
- 日本政府「日本は核兵器を保有すべき」 [793187428]
