Featured image of post JS抓取淘宝和天猫店铺的商品信息

JS抓取淘宝和天猫店铺的商品信息

catchProductsTaobaoTmall

JS抓取淘宝和天猫店铺的商品信息(需在Tampermonkey上使用)
引用Jquery简化代码操作,以img为中心抓取;支持淘宝与天猫的category和search页

点击前往仓库

写在前面

大概写了3天,起初因为是要给商城类毕设填充数据,所以写了个脚本把淘宝天猫店铺的商品信息扒下来再充上去。 以后有时间的话写多页版(大概)
如有大佬路过,欢迎提出建议或指正。

环境需求

Tampermonkey

注意事项

  1. 该脚本仅用于抓取单页数据
  2. 天猫店铺抓取时会移除本店内推荐区域,以免混淆
  3. 因为天猫的商品图片用的数据流,所以抓取时会自动下拉滚动条
  4. 抓取失败仅输出提示信息,不输出数据
  5. 抓取失败一般是搜索为空,如有其它bug请联系反馈

操作步骤

1. 打开店铺所有宝贝页,点击页面左侧中间数据抓取按钮开始

2. 抓取提示

  • 成功,输出json数据到console

  • 失败

3. 抓取成功可点击确认下载文件data.json

抓取信息说明

1. 结构一览

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
  {
    "info": [
      {
        "shopname": "",
        "type": "",
        "pageNo": "",
        "pageAll": "",
        "orderType": "",
        "lowPrice": "",
        "highPrice": "",
        "keyword": "",
        "vip": "",
      }
    ],  
    "data": [
      {
        "id": "",
        "proid": "",
        "title": "",
        "img": "",
        "pric": "",
      }
    ]
  }

2. 信息说明

  • info(店铺及搜索条件信息)
元素 类型 说明
shopname string 店铺名称
type string 网站类型
pageNo int 当前页码
pageAll int 总页码
orderType string 排序方式
lowPrice float 最低价格
highPrice float 最高价格
keyword string 关键字
vip bool 店铺VIP商品(天猫)
  • data(商品信息)
元素 类型 说明
id int 序号
proid string 商品编号
title string 商品名称
img string 商品主图地址
pric string 商品价格

开源协议

MIT License