QQ客服

微信客服

官方微信

微信号:smartcrawler_net

客服电话
4009668069
在线客服
返回顶部
当前位置: 首页 > 实时采集爬虫 > 其它数据 > 网站网页-实时采集爬虫

网站网页-实时采集爬虫/实时抓取API/实时爬取服务/实时采集程序-版本:2021-07-01_01

多节点并发请求、超时熔断、多站点数据聚合,1秒内响应、定制开发

  • 商品价格:

    0.01

  • 数据提供方式: Http接口调用

  • 产品发货说明:注册帐户充值后直接调用,每个爬虫可免费调用10次用于调试

  • 在线调试说明:用户登录成功后,可在线对爬虫进行调试

请选择要调试的功能

立即试用 在线咨询 电话咨询 客服电话:4009668069
其它用户感兴趣的商品
商品详情

网站网页-实时采集爬虫/实时抓取API/实时爬取服务/实时采集程序

多节点并发请求、超时熔断、多站点数据聚合,1秒内响应、定制开发
作者:灵智爬虫 时间:2021-10-28 15:20:51

网站网页-实时采集爬虫定制化开发,依据用户需求,实时采集相应的网站网页的数据并返回给用户,满足用户实时获取数据的需求。定制类产品的标价非卖价,在确认需求后,依据相应的工作量才能确定相应的价格,一般三个工作日内完成相应爬虫程序开发与上线,以最快的速度采集、清洗数据,高效的响应您的数据需求。

网站网页数据离线采集爬虫更多介绍--点击此处

基本功能介绍

网站网页-实时采集爬虫是在收到用户请求后,爬虫系统创建相应的采集任务,向相应的采集节点推送相应的任务,数据采集节点收到爬虫任务后;从资源池中获取相应的系统资源立即发起请求,向目标网站采集相应的数据,同时并发的启动数据清洗器,并依据相应的数据清洗规则清洗数据。在数据完成采集之后,向服务端返回相应的结果。为了保证能以最快的速度采集数据,系统将把采集任务向各个运营商的采集网络节点推送任务,同步发起网络请求。保证始终能使用到最优的网络节点,以最快的速度采集到相应的数据。

网站网页-实时采集爬虫支持对html,json,pdf,xml,图片,csv,excel,word等各类数据进行提取、清洗操作。灵智爬虫将借助第三方的OCR服务,完成图片中文本数据的识别;并且为了提高识别的准确率,可以对图片进行相应的切割操作,根据不同的文本类型进行相应的识别。

计费规则说明

网站网页-实时采集爬虫赠送10次免费调试次数,帮助用户完成爬虫的调试。实时采集爬虫调用之前,用户必须保证帐户有足够的余额,如果余额不足,接口调用无法成功。用户可以在用户中心,为自已的帐户进行相应的充值。

网站网页-实时采集爬虫单次调用费用由以下部分组成:执行费用(包含免费的数据条数)+ 单条数据费用x数据条数(超出免费数据条数的数据量)。

产品特点说明

网站网页-实时采集爬虫支持超时熔断,用户在请求接口时,可以指定超时熔断的时间,如果在指定时间内未返回结果的话,请求将会中断,将相应的错误码返回用户。防止用户长时间等待请求。

网站网页-实时采集爬虫支持相应的数据缓存,用户在请求时,可以指定是否使用缓存与缓存的超时时间。

网站网页-实时采集爬虫支持多网站的数据聚合,一次请求,可以将多个网站的结果聚合到一起,合并成更全面、完整的数据。

网站网页-实时采集爬虫支持多种数据状态的采集,包括查询(表示数据未发生任何更改)、新增、删除、修改;修改状态支持字段值变化、新增字段、删除字段、字段数据类型变化(Schema变化)。以上的监控类型,仅支持JSON格式,目前爬虫返回的数据格式基本都是JSON。

网站网页-实时采集爬虫请求参数说明

参数名 说明
userRisInvoke.userId 用户Id
userRisInvoke.risWpsId 爬虫编号
userRisInvoke.risRecordItemId 爬虫功能编号
userRisInvoke.timestamp 请求的时间戳
userRisInvoke.token HmacSha256算法,使用字段:userId,risWpsId,timestamp,traceId相拼接成的字符串,通过用户的key加密生成
userRisInvoke.traceId 请求的追踪编号,用于跟踪数据,使用uuid,不能重复,并去掉中杠【-】,所有的字母转换为大写。
userRisInvoke.extractTypes 提取的数据类型,支持:create(新数数据),query(查询数据),update(更新数据),delete(删除数据)
userRisInvoke.executeParameter 执行的参数,用户输入要查询数据的网址,多个网址之间用分号分隔
实时采集爬虫请求参数字段说明
在线DEBUG
在线调试
请求日志
请求日志
响应报文
响应报文

关于灵智爬虫

灵智爬虫是上海智殊商务咨询有限公司旗下专业做数据采集、清洗、分析专业软件平台,支持对各类数据进行抓取。

更多介绍+

联系我们

  • 淘宝旗舰店: https://smartcrawler.taobao.com
  • 客服QQ:1771414463
  • 客服微信:smartcrawler_net
  • 客服电话:4009668069
  • 公司地址:上海市宝山区沪太路8885号6幢

2020-2030 上海智殊商务咨询有限公司 版权所有

备案号 :沪ICP备16039378