▲点击蓝色“刘大白的跨境日记”▲
继前面得内容过后今天完善了这个upc爬虫,没有看过的可以先看看前面的内容
今天有视频,有点吵,身边没有耳机,用的笔记本自带的话筒,见谅。
爬取的页面是这个
https://www.dsw.com/en/us/category/womens-sandals/N-1z141jrZ1z128ugZ1z141ju
今天先简单得爬取,只在单页面点击后,爬取里面得内页得标题,价格和upc,
我们打开网站,然后按F12 ,选择web scraper
如果不在底下,需要调整一下位置
像这样
输入域名,和爬虫名,这里需要多页面爬取得时候用到,明天说
{"_id":"dsw11","startUrl":["https://www.dsw.com/en/us/category/womens-sandals/N-1z141jrZ1z128ugZ1z141ju"],"selectors":[{"id":"items","parentSelectors":["_root"],"type":"SelectorLink","selector":"a.product-tile--link","multiple":true,"delay":0},{"id":"title","parentSelectors":["items"],"type":"SelectorText","selector":"[itemprop='name'] span","multiple":false,"delay":0,"regex":""},{"id":"price","parentSelectors":["items"],"type":"SelectorText","selector":"span#price","multiple":false,"delay":0,"regex":""},{"id":"upc","parentSelectors":["items"],"type":"SelectorText","selector":"#tabpanel-pdp-product-description-accordion > div > div > div.description > ul > li:nth-child(2)","multiple":false,"delay":0,"regex":""}]}
这是我爬虫得代码,你们可以直接导入
复制进去就可以
有什么问题再问我
END
都看到这里了,你不关注一下嘛???。
本文由“壹伴编辑器”提供技术支持
今天是持续日更公众号第89/1000天
如果你的朋友也在每天追求知行合一,
欢迎转发分享给TA,
感谢你的慷慨~
文章评论