火车头采集器破解版|火车采集器v9免费版 v9.21全功能版下载
火车头采集器破解版(又名火车采集器)是一款可以采集互联网上任意网站的辅助工具,功能强大的网络数据/信息挖掘软件,它的功能真的十分强大,知识兔可以采集任何信息,并且知识兔可以把采集的文件保存在本地、数据库、网站发布等等,是信息采集人员和站长必备的一款工具。
火车头采集器破解版亮点:
程序支持远程下载图片文件,知识兔支持网站登录后的信息获取,检测文件的真实地址,知识兔支持代理,知识兔支持防盗链的收集,知识兔支持收集数据直接入库,模仿人工发布等多种功能特征。
列车收集器支持从任何类型的网站收集所需的信息,如各种新闻网站、论坛、电子商务网站、求职招聘网站等。
同时具有强大的网站登录采集、多页和分页采集、网站跨层采集、POST采集、脚本页采集、动态页采集等高级采集功能。
强大的php和c#插件支持,通过二次开发可以实现更强大的功能。
几乎所有网页都能采集
无论什么语言,
无论什么编码。
速度是普通采集器的7倍
火车采集器采用顶级系统配置,
反复优化性能,知识兔让采集速度快到飞起来!
和复制/粘贴一样准确
采集/发布如同复制/粘贴一样精准,
用户要的全都是精髓,怎能有遗漏!
网页采集的代名词
独具十年历练,成就业界领先品牌,
想到网页采集,就想到火车采集器!
火车头采集器软件特色
1.通用性强。
无论是新闻、论坛、视频、黄页、图片、知识兔下载类网站,只要通过浏览器可以看到的结构化内容,指定匹配规则,就可以收集必要的内容。
2.稳定高效。
五年磨一剑,软件不断更新进步,采集速度快,性能稳定,占有资源少。
3、扩展性强,适用范围广。
定制网站发布,定制主流数据库的保存和发布,定制本地php和.net外部编程接口处理数据,使数据能够为您使用。
火车头采集器功能介绍:
1.新建分组
新建一个任务分组,知识兔选择所属分组,确定分组名称和备注。
2.新建任务
确定所属分组,新建一个任务,填写任务名称并保存。
3.Web发布配置
Web发布配置定义了如何登陆一个网站以及向该网站提交数据。
主要涉及到登录信息的获取,网站编码设定,栏目列表的获取,知识兔以及使用数据测试发布效果。
4.Web发布模块
可以定义网站登录,获取栏目列表,获取网页随机值,内容发布参数,知识兔以及上传文件,构造发布数据等高级功能。
5.数据库发布配置
数据库发布配置定义了数据库链接信息的设置以及数据库模块的选择。
6.数据库发布模块
用于编辑数据库的发布模块,方便知识兔将数据发布到配置好的数据库中。
火车采集器可选mysql、sqlserver、oracle、access四种数据库类型,在文本输入框中填写sql语句
(需有数据库相关知识),并可使用标签替换相应数据。也可在采集器模块文件夹中加载某一模块进行编辑。
7.计划任务
设置列表中采集任务的启动计划,可每间隔、每天、每周、仅一次、或自定义Cron表达式,
(Cron表达式的写法可参考相关术语中的介绍)。保存设置后,任务即可按照设置执行。
8.插件管理
插件是可以用来扩展火车采集器功能的程序
火车采集器V9支持PHP源码、C#源码、C#类库三种类型的插件,
可用于扩展http请求、内容处理和文件下载的功能,并可以分别进行测试。
9.http二级代理
网络中的服务器,知识兔可以让网络用户去取得所需要的网络信息。
代理的功能有可以突破自身ip的访问限制访问国外站点,访问一些单位或团体内部资源,
突破电信的ip封锁和隐藏真实的ip等。
火车采集器V9支持http代理、socket4和socket5代理。
10.http模拟请求
可以设置如何发起一个http请求,知识兔包括设置请求信息,返回头信息。并具有自动提交的功能。
基本功能
1、规则定制-通过收集规则定义,知识兔可以搜索所有网站收集大部分类型的信息。
2、多任务,多线程-可以同时进行多个信息获取任务,每个任务可以使用多个线程。
3、所见即所得-任务收集过程所见即所得,过程中经历的链接信息、收集信息、错误信息等立即反映在软件界面上。
4、数据保存-数据一边收集一边自动保存在相关数据库中,数据结构可以自动适应,软件可以根据收集规则自动制作数据库,其中的表格和字段也可以通过导向库灵活地将数据保存在客户现有的数据库结构中。
5、断点连续采集-信息采集任务停止后,知识兔可以从断点继续采集,知识兔从此不用担心你的采集任务意外中断。
6、网站注册-支持网站Cookie,知识兔支持网站可视化注册,注册时需要验证代码的网站也可以收集。
7.计划任务-通过该功能,您的收集任务可以定期、定量或循环执行。
8、采集范围限制-可根据采集深度和网站标志限制采集范围。
9、文件下载-可以将收集的二进制文件(图像、音乐、软件、文件等)下载到当地磁盘或收集结果数据库。
10、结果更换-可以根据规则将收集的结果更换为定义的内容。
11、条件保存-可根据某些条件确定那些信息保存,那些信息过滤。
12.过滤重复内容-软件可以根据用户的设定和实际情况自动删除重复内容和重复网站。
13.特殊链接识别-使用该功能,知识兔可以识别使用JavaScript动态生成的链接或其他更奇怪的链接。
14.数据发布-可以通过定制接口将收集的结果数据发布到任何内容管理系统和指定数据库。目前支持的目标发布媒体包括数据库、sqlserver、mysql、oracle、静态htm文件。
15、预约编程接口-定义多个编程接口,用户可以在事件中利用PHP、C#语言进行编程,扩大收集功能。
特色功能。
1.支持所有站点代码:完美支持收集所有代码格式的站点,程序可以自动识别站点代码。
2、多种发布方式:支持当前所有主流和非主流的CMS、BBS等网站程序,通过系统发布模块可以实现收集器和网站程序之间的完美结合。
3、全自动:无人值守工作,配置程序后,程序根据您的设置自动运行,完全不需要人工干预。
4、当地编辑:当地可视化编辑收集的数据。
5、采集测试:这与其他类似的收集软件无法比拟。程序支持直接检查收集结果并测试发布。
6、管理方便:使用网站+任务方式管理收集节点,任务支持批量操作,更多的数据管理也很简单。
注意:安装火车采集器,要求电脑安装.NET4.0框架,下载地址:NET4.8下载|.NET Framework 4.8中文版安装包
下载仅供下载体验和测试学习,不得商用和正当使用。