catchProductsTaobaoTmall
JS抓取淘宝和天猫店铺的商品信息(需在Tampermonkey上使用)
引用Jquery简化代码操作,以img为中心抓取;支持淘宝与天猫的category和search页
写在前面
大概写了3天,起初因为是要给商城类毕设填充数据,所以写了个脚本把淘宝天猫店铺的商品信息扒下来再充上去。
以后有时间的话写多页版(大概)
如有大佬路过,欢迎提出建议或指正。
环境需求
注意事项
- 该脚本仅用于抓取单页数据
- 天猫店铺抓取时会移除本店内推荐区域,以免混淆
- 因为天猫的商品图片用的数据流,所以抓取时会自动下拉滚动条
- 抓取失败仅输出提示信息,不输出数据
- 抓取失败一般是搜索为空,如有其它bug请联系反馈
操作步骤
1. 打开店铺所有宝贝页,点击页面左侧中间数据抓取按钮开始
2. 抓取提示
- 成功,输出json数据到console
- 失败
3. 抓取成功可点击确认下载文件data.json
抓取信息说明
1. 结构一览
|
|
2. 信息说明
- info(店铺及搜索条件信息)
元素 | 类型 | 说明 |
---|---|---|
shopname | string | 店铺名称 |
type | string | 网站类型 |
pageNo | int | 当前页码 |
pageAll | int | 总页码 |
orderType | string | 排序方式 |
lowPrice | float | 最低价格 |
highPrice | float | 最高价格 |
keyword | string | 关键字 |
vip | bool | 店铺VIP商品(天猫) |
- data(商品信息)
元素 | 类型 | 说明 |
---|---|---|
id | int | 序号 |
proid | string | 商品编号 |
title | string | 商品名称 |
img | string | 商品主图地址 |
pric | string | 商品价格 |
开源协议
MIT License