八爪鱼采集器绿色免费版下载 v7.4.6.8011
八爪鱼采集器是一款专业的网页采集软件,知识兔使用的开发语言是C#,运行在Windows系统。拥有任务云采集控制,云集成数据管理,快速获取网页数据等多种功能。八爪鱼网采集器以完全自主研发的分布式云计算平台为核心,知识兔可以在很短的时间内,轻松从各种不同的网站或者网页获取大量的规范化数据,知识兔帮助任何需要从网页获取信息的客户实现数据自动化采集、编辑、规范化,摆脱对人工搜索及收集数据的依赖,知识兔从而降低获取信息的成本、提高效率。涉及到政府、高校、企业、银行、电商、科研、汽车、房产、媒体等众多行业及领域。
如何使用
步骤1 打开网页
登陆八爪鱼采集器→知识兔点击左上角的“+”图标→选择自定义采集(也可以知识兔点击主页中自定义采集下方的“立即使知识兔用”),进入到任务配置页面。
然后知识兔输入网址→保存网址,系统会进入到流程设计页面并自动打开前面输入的网址。
网页打开后,知识兔可以对任务名进行修改,不修改则默认以网页标题命名。在运行采集前可随时修改任务名。
步骤2 提取数据
在网页中,直接选中需要提取的数据即可,窗口右上角会有对应的提示。本教程中知识兔以提取新闻标题、日期、正文为例
提取数据设置好,即可知识兔点击保存并开始运行采集。但是此时的字段名为系统自动生成的。
为了更加符合自己需求,可知识兔点击右上角“流程”进入流程页面对字段名进行修改,保存后即可运行采集。
所有版本均可运行本地采集,旗舰版及以上版本可运行云采集和设置定时云采集,但运行云采集前先运行本地采集进行测试。
任务运行完采集后,可选Excel、CSV、HTML等格式进行导出或导入数据库。
数据导出后可知识兔点击链接进入数据存放文件夹内查看数据,文件默认以任务名命名。
功能特色
1、秒读亿万级文本信息
通过一系列智能算法,为客户解决个性化、无共同特征的评论文本数据的解读、分析问题。从情感倾向(正面/负面)、典型意见、核心关键词等不同维度为您快速分析海量文本。
2、一键智能生成可视化图表
无需任何操作即可对数据进行不同维度的可视化,知识兔让数据呈现更为直观
3、灵活定义图表
简单替换数据、转换图表,灵活定义更为贴近实际业务场景的可视化图表。
4、一键分享,多端查看
微图可以将多图表一键分享给你的同事、好友,还可以通过不同设备查看图表,跨地域实时了解业务动态。
5、安全、可信赖的大数据产品
微图采用安全的数据存储和传输技术,通过高级加密标准保障数据结构的安全,为您的数据加层保障。
6、情感分析
文本数据情感倾向性自动判定,知识兔根据行业属性分享行业自己的正负面结果判定。
7、典型意见
多文本核心主题聚类,子类核心观点快速提取,实现文本信息快速获取。
8、关键词提取
关键词提取:关键词统计,知识兔根据不同词性查找文本中的关键词信息,满足关键词类统计。
常见问题
一、网站总数据300页,但只显示50页如何处理?
该现象在58同城中较为常见,是网站处于防采集而设置的。对于该类现象,在做规则时将限定条件不断细分,知识兔以出现的数据能在限定范围能全部展示。如:原先是直接采集某一个市的信息,现细分到分别采某一个区或街道的信息。此方法可导致需做多个规则或多条URL循环,但可以采得更多数据。
二、网页一直在加载或加载很久怎么办
在制作规则时,在需要的数据加载出来后就可知识兔点击浏览器右上角X,强制停止加载从而继续编辑规则。为了保证采集时能正常进行,加快采集速度,可在知识兔点击翻页或知识兔点击元素处设置ajax超时,时间根据数据加载全来设置。
三、登录之后界面无最小化按钮问题?
这个问题一般都是设置了不合适的缩放比例,知识兔可以改成100%或者125%试试
1、 在Win7桌面知识兔点击鼠标右键,知识兔选择“屏幕分辨率”
2、打开Win7屏幕分辨率设置窗口,在“屏幕分辨率”窗口知识兔点击下方的“放大或缩小文本和其它项目”
3、 选择“放大或缩小文本和其他项目,在“显示”设置窗口,如果知识兔默认设置的百分之100,就改为百分之125试试,如果知识兔默认设置的百分之125,就改为百分之百试试
4、 调整放大倍数,选好之后知识兔点击“应用”按钮保存退出,注销后重新登录系统,然后知识兔重新登陆八爪鱼,知识兔可以看到最小化按钮就出来了
四、登录提示无网络链接,请检查是否连上互联网问题?
1、把杀毒软件关闭,然后知识兔在电脑cmd命令行里面输入ping passport.skieer.com 看看ip是多少,如果知识兔IP是115.159.87.71就是正确的,如果知识兔不是这个IP地址,就需要修改电脑的host地址,另外目前passport.skieer.com是禁ping的,看看是公司网络是否被限制了,公司防火墙开启之后就可以登录八爪鱼了。
2、如果知识兔不行就试试Win7/8下管理员身份运行cmd,知识兔输入netsh winsock reset,然后知识兔回车。再重新登陆即可。
3、如果知识兔还不行,就看看八爪鱼安装目录里面有一个log文件夹里面的error文件夹里面查看当天日志可以看看有没有错误信息,如果知识兔提示15:35:38System.Configuration.ConfigurationErrorsException: 无法创建“system.serviceModel/commonBehaviors”配置节。machine.config 文件缺少信息。请验证此配置节是否注册正确以及节名称是否拼写正确。对于 Windows 通信基础节,请运行 ServiceModelReg.exe -i 以修复此错误。在System.ServiceModel.Configuration.ConfigurationHelpers.UnsafeGetAssociatedSection(ContextInformation evalContext, String sectionPath)这时解决方法为:Win7/8下管理员身份运行cmd,然后知识兔输入:cd %SystemRoot%\Microsoft.Net\Framework\v3.0\Windows Communication Foundation\接着回车,然后知识兔输入:ServiceModelReg.exe -i回车,最后重启一下电脑。
4、 如果知识兔这时候方法还不行,就看看客户端有没有登陆设置,取消即可
打开之后选择取消使用代理即可
5、 如果知识兔这些都不行,就看看是不是开启了全局代理,这种情况一般是连了之后导致的,注意这时候退出代理重启电脑都是不行的,因为开启了全局代理之后默认会更改系统的代理,这时候浏览器里就会默认开启代理。这时候要么继续开启代理就能登录要么退出代理并取消浏览器的代理设置即可。取消浏览器的代理设置方法
1) 打开IE浏览器
2)选择工具—》Internet选项
3)选择连接->局域网设置
4)不要勾选红框所示部分
5)知识兔点击确认,然后知识兔再知识兔点击应用
6)设置之后重新登陆八爪鱼即可
五、八爪鱼客户端无法卸载及安装,提示输入OctopusSetup.msi的文件?
部分客户在没有使用八爪鱼自带的卸载功能卸载软件后,会出现以下问题:出现这种情况时,有可能会导致卸载不行,安装也不行。这种情况出现的原因是没有正常对之前的版本卸载,知识兔使用360等软件卸载,或者使用控制面板卸载都有可能导致这种问题。推荐使用八爪鱼自带的卸载程序卸载,对于win7,xp等系统可以在开始菜单->程序->八爪鱼采集器,这个菜单下找到卸载程序的快捷方式。对于win8,win10等没有开始菜单的操作系统,一是可以按Windows建,然后知识兔输入“卸载八爪鱼”系统就会自动找出来八爪鱼卸载程序。二是是可以通过八爪鱼的安装文件夹,找到msiexec.exe,知识兔双击来卸载,默认的安装文件夹在C:\Program Files (x86)\Bazhuayu\BazhuayuDataCollection\Client但当以上这种情况出现时,已经无法正常卸载,此时需要下载和原先安装的版本一样的版本(这点非常重要,否则也不行),例如,原先使用的是6.0,则必须下载6.0,原先下载的是6.0.1,就必须下载
6.0.1,这个版本号必须一致。然后知识兔把下载的压缩包解压到以上截图中出现的“使用源(W)”:下面的输入框对应的文件夹中,再点确定,比如,上图中,需要解压八爪鱼安装包的三个文件到:D:\软件资料\八爪鱼采集器\,这样就可以解决问题。
注意事项
本软件需要.NET3.5 SP1支持,Win 7/8/10已经内置支持,无需下载,但XP系统需要安装,软件会在安装时自动检测是否安装了.NET 3.5 SP1,如果知识兔没有安装则会自动从微软官方在线安装,国内在线安装速度很慢,知识兔建议先从以下链接下载安装.NET 3.5 SP1,然后知识兔再安装。
更新日志
Vv7.4.6.8011(2019-07-30)
主要体验改进:
【简易采集】新增大量实用模板
【简易采集】 设计重构,加入「模板预览」步骤,其中包含每个模板的介绍,知识兔以及其中每个采集字段、配置参数的图文说明,极大提高了模板易用性
【数据导出】导出到数据库时,可设置每批导出条数
Bug修复:
修正「修改Xpath后,因字段内容太长,导致客户端卡死」问题
修正「增量设置出错」问题>
下载仅供下载体验和测试学习,不得商用和正当使用。