0694デフォルトの名無しさん
2019/06/22(土) 00:38:53.50ID:sUTyEXDJこれは、一番近い先祖のID からの、パスになっていない!
'//div[@class="tpcHeader_thumb"]/p/@src'
Chrome の開発者ツールで、右クリックメニューから、XPath, CSS Selector を取得すると、
//*[@id="tpcHeader"]/div[2]
#tpcHeader > div.tpcHeader_thumb
CSS Selector で、
#tpcHeader > div.tpcHeader_thumb > p.tpcHeader_thumb_img
XPath で、p の直下ではない!
p要素のsrc 属性だろ
Ruby で、selenium-webdriver, nokogiri で、作った
driver.navigate.to "https://news.yahoo.co.jp/pickup/6327568" # ニュース
doc = Nokogiri::HTML( driver.page_source )
# at_css で、該当する最初の1つだけを取得する
element = doc.at_css( "#tpcHeader > div.tpcHeader_thumb > p.tpcHeader_thumb_img" )
url = element.attr( "src" )
puts url #=> 画像のURL