スクレイピングの練習をしているのですが、
やりたい作業の方法が思いつかないので教えてください。
下記はコジマの商品一覧ページです。
作業はseleniumとlxml.htmlで行っています。
htmlを取得し、48商品すべてのポイントをスクレイピングしようと下記を実行しました。
u='1UMto4'
driver.get(u)
html = driver.page_source
html = lxml.html.fromstring(html)
css_pt = '#fwCms_wrapper > div > div > div.layoutGrid > div.fwCms_box.frame_MB > div.ProductList.MK2PFRDL010_01 > div > ul > li > p.point.small.mt1 > span.number'
pt = [int(pt.text_content().replace(",","").strip()) for pt in html.cssselect(css_pt)]
ポイントの記載がない商品は、0として値を取得したいのですが、
上記方法だとポイントがある商品しか値を取得できません。
そこでhtmlにp.point.small.mt1 > span.numberが記載されていない商品にもp.point.small.mt1 > span.numberhtmlを追記してポイント0を加えた上で、
css_pt = '#fwCms_wrapper > div > div > div.layoutGrid > div.fwCms_box.frame_MB > div.ProductList.MK2PFRDL010_01 > div > ul > li > p.point.small.mt1 > span.number'
pt = [int(pt.text_content().replace(",","").strip()) for pt in html.cssselect(css_pt)]
を実行するようにしてみたいです。
何かいい方法ありますか
探検
【まず1嫁】くだすれPython(超初心者用) その58
■ このスレッドは過去ログ倉庫に格納されています
562デフォルトの名無しさん
2023/02/18(土) 23:14:23.54ID:kBeBEpAv■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 立憲・原口議員がキレキレ「日本にレアアース来なければ中国は精製できない」「“旧敵国条項”明らかなやりすぎ」 [少考さん★]
- 【滋賀】不良グループのメンバーの「タイマン」で17歳重体 殺人未遂容疑で岐阜市の19歳を逮捕 頭蓋骨骨折や脳挫傷、急性硬膜下血腫 ★2 [ぐれ★]
- 「おこめ券知られていない」農水省が説明会実施へ 「税金でおこめ券配ると、発行2団体に利益集中するのでは?」記者の問いに鈴木農水大臣 [ぐれ★]
- 【プロ野球】巨人 オコエ瑠偉外野手が自由契約 [あずささん★]
- 長瀬智也 インスタで“意味深”連続投稿 「どうなるのかもわかっている」 [muffin★]
- 登山中の男性死亡、クマ被害か 顔や首に傷 新潟 [どどん★]
- 【衝撃】去年の自民党総裁戦、高市は宣伝費に約8400万円もの巨額を使っていた ※この時勝利した石破は約40万円 [597533159]
- 中国「日本は高市発言を“言及しない”ことで誤魔化そうとしてるが、所詮その場しのぎの言い訳」 [834922174]
- 【んな🏡】華金✨のんなたん🍬んなんなスレッドなのらよ🏰【ホロライブ】
- なんか、ネトウヨの必死さが怖くね?高市政権が終われば自分の人生も終わるかのように考えてる [805596214]
- お茶会聯合自治政府
- 【悲報】浜崎あゆみさんの上海コンサートが前日に急きょ中止 [452836546]
