每周一数丨商标数据怎么采?往下看!(标库网数据免费送)

2019-12-06 15:01:47 浏览:4149
采集网址:

https://www.tmkoo.com/

QQ截图20191206145656.png

采集目标:
 获取网站里的所有内容 
使用工具:
火车采集器
采集成果:

QQ截图20191206145723.png


第一步:打开火车官网 www.locoy.com 下载最新版火车采集器并安装


QQ截图20191206145742.png

第二步: 确定一下起始网址,需要采集1673这个栏目

QQ截图20191206145827.png


第三步:我们点击进去可以看到点击下一页的时候网址是不变化的,而且下一页实际就是下一个商标,那么我们就需要用fiddler抓取真实的商标地址了,右边的是我们要采集的注册号网址信息。

注意:这个注册号是登录后才可以看到的,所以采集这个网站需要注册登录后才可以。

QQ截图20191206145853.png


上图我们已经抓到了这个网页的地址,这个page后面的id实际就是第几个商标的id,这里面的链接实际就是每个注册号的地址,我们打开看下,我们把这个网址放到起始地址中,从源码中采集他的a链接。



QQ截图20191206145915.png

第四步:测试一下看看实际采集数据,需要注意的是,如果采集不到把网站获取的cookie放到采集器里。

QQ截图20191206145938.png


然后我们打开任意一个内容页地址,里面就会有我们采集的一些字段。


QQ截图20191206145955.png

第五步: 后到内容采集里面,从源码中截取这些你需要值的前后字段

QQ截图20191206150016.png


测试看下效果


QQ截图20191206150032.png

第六步: 最后整体运行看下数据。

QQ截图20191206150053.png


采集成功,得到了标库网中的数据。

以上就是用小采来采集标库网数据的文档教程了,当然,采集数据往下看,免费送!


每周一数数据领取时间为2019/12/05日发文后5个工作日内。


数据领取资格:火车采集器/火车浏览器/触控精灵商业版软件用户(服务年限内),如果您不是商业用户或者已经过了服务年限,但也想参与活动的话,可以新购软件或者升级续费,这样就能参与活动啦!


数据领取方式:

第一步:扫码添加火车运营微信号,火车运营助手会拉你进入活动群。

微信图片_20191024173419.jpg

第二步:进群后添加数据咨询客服.雅的微信号,经客服验证为服务年限内商业用户身份后,即可领取。


好啦,本期的“每周一数”就到这里了。如果您还有想要获取更多的数据资源以及采集器规则的话,可以在文章下方或是公众号后台留言,小采会综合大家的意见选择下一期赠送数据的主题哦!



每周一数丨生病如何快速确定病因并及时治疗?小采送你一份健康数据(附带教程)

速看|火车采集器V9.11版本更新

旅游网站数据爬取(赠送数据+规则)

双十一优惠券采集(附送数据+规则)

触控精灵功能讲解之微信通讯录的备份

触控精灵实战教程——微信公众号文章的采集与发布

触控精灵实战教程——网站发布篇


扫码关注微信