test11

用户名:test11

注册于:2018-01-24

主题数: 0     回贴数: 8

网站:

介绍:

最后活动于2019-01-16
回复了主题  › 内容详情页抓取不全

如果多个内容页的结构不一样的话,可以使用多条XPath。 

手动设置字段XPath,一行一个。

«  2019-01-16
回复了主题  › 大众点评评论内容爬取不全

大众点评的部分评论文字是用的css技术做了加密,这个需要通过开发插件来解决。


不过插件功能只能在企业版下使用。

«  2019-01-16
回复了主题  › 执行任务会重新采集所有信息吗?会记录采集状态,下次执行时继续上次采集位置继续采集吗?

不会记录采集状态,不过可以设置增量更新,通过设置字段不得重复。

参考 http://www.51pashanhu.com/docs/incr_update/

«  2018-07-09
回复了主题  › 输入网址希望能支持从数据库或其他方式读取

目前可以从文本中导入网址。

后期可以考虑加入从数据库读取

«  2018-07-07
回复了主题  › 导出的时候 下一步 点不了 是什么情况?

应该是网页卡了,等一会试试。


或者看看界面有没有提示问题

«  2018-07-07
回复了主题  › 大家好欢迎来到本论坛

来来来~

«  2018-01-25
回复了主题  › Hello world~
«  2018-01-24
创建了主题  › x'x'x

fs

«  2018-01-24
信息栏
请大家在发帖提问时,选择对应的话题标签