收藏
0有用+1
0

八爪鱼采集器

网页采集软件
八爪鱼采集器(软著登字00547832号,2014SR149170)是深圳数阔信息技术有限公司研发的一款业界领先的网页采集软件,具有使用简单,功能强大等诸多优点。
软件名称
八爪鱼采集器 [1]
软件平台
windows [1]
最近更新时间
2021年6月23日 [3]
软件语言
JavaScript ,C# [3]
开发商
深圳数阔信息技术有限公司
软件版本
版本:8.3.2 [1] [3]
软件大小
56.2 MB [3]
创始人
刘宝强 [2]

简介

播报
编辑
八爪鱼采集器是一款全网通用的互联网数据采集器,模拟人浏览网页的行为,通过简单的页面点选,生成自动化的采集流程,从而将网页数据转化为结构化数据,存储于EXCEL或数据库等多种形式。并提供基于云计算的大数据云采集解决方案,实现数据采集。是数据一键采集平台。 [1]
八爪鱼采集器以分布式云计算平台为核心,结合智能识别算法,可视化的操作界面。从不同的网站或者网页获取标准化数据。帮助需要从网页获取信息的客户,数据自动化标准化采集、导出,提高效率 [3] [3]
八爪鱼采集器作为数据收集工具,服务于国内企业/单位。是一个四种语言版本的采集软件,覆盖汉语,英语,日语,西班牙语。 [3]

产品功能

播报
编辑
操作界面
01. 采集全行业、全场景、全类型数据
采集可存储的任务数无上限,实现全行业、全场景、全类型的互联网数据采集。
全行业:电商、新闻、社交媒体、招投标、金融、房产等全行业的互联网数据采集。行业网站已做好可用的模板。
全场景:列表页、详情页、搜索页、瀑布流页、登录、多层点击、下拉框、IP切换、验证码自动识别等场景采集。
全类型:支持文字、链接、图片、视频、音频、Html源码、Json格式等多种数据类型的采集。
02. 高速采集大规模数据
使用高性能的云服务集群,提供多节点高并发采集能力,能够完成大规模数据的采集。
高性能:企业版可使用独立的、高性能的云服务集群,无需排队即可开始数据采集。
快速度:提供30/100云节点高并发采集能力,能完成大规模数据的采集。如果当前云节点不够用,还可扩容。
03. 实时采集新增数据
支持设置灵活的定时采集策略+多节点高并发采集+自动去重/条件触发等功能,实时采集各个数据源的新增数据。
定时采集策略:按照网站更新频率和单次更新数据量,设置合理的定时策略,支持极高频率的定时。同时相同更新频次的网站可归为一组,进行分组定时。
多节点高并发:根据定时策略,将账号内的云节点合理分配给数据源,以完成每个数据源新增数据的采集。
自动去重/条件触发:新采集到的数据自动与原来采集到的数据对比去重和设置采集触发条件,满足条件的数据才会被采集,实现采集新增数据。
04. 提供API接口,采集结果同步
提供高负载高吞吐的API接口,可将采集结果秒级同步到企业数据库或内部系统中。除了API外,提供自动入库功能。
数据导出API:提供高负载吞吐灵活的API接口,支持边采集边导出,将采集结果同步数据到企业的数据库或内部系统中。
自动入库:除了API调用数据外,还提供数据自动入库功能,几步设置即可实现数据自动入库。
任务控制API:提供任务控制API接口,无需启动客户端即可控制任务启停、修改任务参数。
05. 支持SaaS版本与私有化部署版本
提供线上SaaS版本的软件服务,下载客户端即可使用。同时支持将整套采集系统部署到企业本地,搭建企业自己的大数据采集系统
线上SaaS版本:在官网下载客户端,登录账号后即可使用。软件的各项功能与官网实时同步更新,使用过程中需联网运行。
采集任务与数据均存储在云端服务器,可随时查询、导出,或运行新的采集任务。
私有化部署版本:企业私有化部署,可部署在隔离内网环境。提供定制化部署方案,满足多种数据安全级别。支持软件OEM,去除八爪鱼Logo,定制品牌Logo,突出品牌信息
支持永久授权,区别于线上SaaS版按使用时长付费,私有化部署版一次授权,终身使用。
涵盖线上版本的全部功能。 具备多种管理权限:服务器集群资源管理、用户权限管理、任务调配管理,数据监控管理。 具备各种数据API和SDK接口。
支持二次开发,除成熟的采集功能外,还提供二次开发服务,包括但不限于系统集成数据清洗、数据全文检索数据可视化展示和数据分析应用。 [3]

产品服务

播报
编辑
全流程一对一服务
在合作的全流程中为用户提供一对一服务,帮助掌握八爪鱼相关技能,推进项目上线。
售前测试
售前客户经理一对一与用户确认采集需求、协助制作采集任务、测试采集效果、评估项目工作量等。
线上培训
提供一对一的个性化线上培训课程,帮助客户和客户的团队掌握八爪鱼相关技能,推进项目上线。
售后支持
客户经理为您提供一对一的售后支持,解决问题、为用户优化采集任务、响应用户需求 [3]