admin

用户名:admin

注册于:2018-01-24

主题数: 1     回贴数: 13

网站:

介绍:

最后活动于2018-11-24
回复了主题  › 亚马逊商品小图片怎么抓

可以实现,把颜色按钮当作下一页,手动设置分页xpath。

前提是需要对XPath熟悉

«  2018-11-24
回复了主题  › 淘宝网无法采集

点击暂停,然后在网页中,拖动验证滚动条(可能需要多试几次,偶尔出现无效情况)。

通过之后,点击恢复,继续采集

«  2018-10-14
回复了主题  › 新人咨询几个问题 准备入手

可以发布到discuz

«  2018-10-12
回复了主题  › 瀑布分页没应

测试了下这个网址,应该是浏览器兼容问题。

不过可以使用JSON方式来采集。

地址:https://www.amazon.cn/profilewidget/timeline/visitor?nextPageToken=&filteredContributionTypes=productreview&directedId=amzn1.account.AGAZI45J6W2NDCWHZNOLY2VFSNEQ


如何设置分页:

首先新建一个字段,比如next ,然后设置jsonp

«  2018-10-09
回复了主题  › 携程酒店信息捞不出来

携程的分页比较特殊,建议使用使用批量设置网址参数的方式来采集分页。

参考 http://www.51pashanhu.com/Docs/urls/

«  2018-10-05
回复了主题  › 是不是有个小bug,急求帮助!!!

具体的列表页地址发出来,我们测试一下。

«  2018-09-24
回复了主题  › 采集器一直跳转首页,无法采集数据页内容

尝试清楚cookie和缓存

«  2018-09-12
回复了主题  › 怎么设置自动循环下一页?

参考 http://www.51pashanhu.com/docs/pages/

«  2018-09-12
回复了主题  › 深入连接采集数据,页面卡死

可能是浏览器兼容问题,请把网址提供下我们测试。

«  2018-09-08
回复了主题  › 二个问题: 内部网能不能使用?能不能打开EXCEL操作?

更新:内网版已经开发完成,如果需要联系客服

«  2018-07-23
回复了主题  › 怎么制作json抓包格式;通过采集器,

一般都是通过Fiddler,或者是浏览器自带的开发者工具(F12)来实现。

找到对应的json数据的网址。 


类似参考:http://www.51pashanhu.com/detail/141


先占坑,后续完善


«  2018-07-03
回复了主题  › 首先要解决如何导出,没人会用.txt文件作数据库吧

目前免费版本只能导出 txt 格式,需要导出更多格式,可以升级到更高版本。

«  2018-06-25
回复了主题  › 二个问题: 内部网能不能使用?能不能打开EXCEL操作?

内网版本,目前已经开发计划中。

目前软件只能从txt中读取数据,建议你可以转换下。


从您的描述看,应该可以完成需求

«  2018-04-11
创建了主题  › Hello world~

Hello world~ 

«  2018-01-24
信息栏
请大家在发帖提问时,选择对应的话题标签