本经验介绍如何采集京东商城商品发卖数据
步调一:下载安装,并注册登录
1、点此打开官网,下载并安装爬虫软件
2、点击注册登录,注册新账号然后登录
步调二:新建采集使命
1、复制网页(需要搜刮成果页的网址,而不是首页的网址)
2、新建智能模式采集使命
您可以在软件上直接新建采集使命,也可以经由过程导入法则来建立使命。
在智能识此外过程中,有时辰识此外不长短常精确,这时辰我们可以按照提醒手动设置识别。
步调三:设置装备摆设采集法则
1、设置提取数据字段
在智能模式下,我们输入网址后软件即可主动识别出页面上的数据并生当作采集成果,每一类数据对应一个采集字段,我们可以右击字段进行相关设置,包罗点窜字段名称、增减字段、处置数据等。
在列表页上,我们需要采集京东商城商品的商品题目、商品链接、店肆名称、商品本家儿图、价钱、累计评价及选购指数,字段设置结果如下:
2、利用深切采集功能提取详情页数据
在列表页上只展示出了京东商城商品的部门信息,若是需要商品的具体信息,我们需要右击商品链接利用“深切采集”功能,跳转到详情页进行采集。
在详情页面我们可以看到商品名称、容量、功率及合用人数等信息,我们可以点击“添加字段”添加采集字段,字段设置结果如下:
步调四:设置并启动采集使命
1、设置采集使命
完当作了采集数据添加,我们可以起头启动采集使命了。在启动之前我们需要对采集使命进行一些设置,从而提高采集的不变性和当作功率。
点击“设置”按钮,在弹出的运行设置页面中我们可以进交运行设置和防屏障设置,这里我们勾选“跳过继续采集”,设置“2”秒请求期待时候,勾选“不加载网页图片”,防屏障设置就按照系统默认设置,然后点击保留。
2、启动采集使命
点击“保留并启动”按钮,可在弹出的页面中进行一些高级设置,包罗按时启动、主动入库和下载图片,本次示例中未利用到按时采集及主动入库功能,勾选下载图片到当地的功能后,点击“启动”运行爬虫东西。
【温馨提醒】免费版本可以利用非周期性按时采集功能,下载图片功能是免费的。小我专业版及以上版本可以利用高级按时功能和主动入库功能。
3、运行使命提取数据
使命启动之后便起头主动采集数据,我们从界面上可以直不雅的看到法式运行过程和采集成果,采集竣事之后会有提醒。
步调五:导出并查看数据
数据采集完当作后,我们可以查看和导出数据,后羿采集器撑持多种导出体例(手动导出到当地、手动导出到数据库、主动发布到数据库、主动发布到网站)和导出文件的格局(EXCEL、CSV、HTML和TXT),我们选择本身需要体例和文件类型,点击“确认导出”。
【温馨提醒】:所有手动导出功能都是免费的。小我专业版及以上版本可以利用发布到网站功能。
步调六:发布结果
0 篇文章
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!