火车头采集器官方版是一款功能强大且易于上手的专业采集软件,也是目前最受欢迎的网页数据采集软件,不仅可以灵活迅速地抓取网页上散乱分布的数据信息,还能够方便快捷的进行互联网上任何数据的获取、处理。
火车头采集器软件界面简洁,功能全面,配备了正文识别、中文分词识别、任意编码识别等多种识别系统,智能识别让操作更轻松,支持Access/MySQL/MsSQL/Sqlite/Oracle多种类型的数据库保存及发布,且不论是图片、压缩文件、视频等任意格式的文件都能轻松下载,还支持接口和插件扩展,满足用户各种采发需求,另外,火车采集器采用了分布式高速采集系统,多个服务端同时运作,解决工作学习中大量的数据下载及使用需求,让您能有更多时间做更多事。
软件亮点
1、几乎所有网页都能采集
无论什么语言,
无论什么编码。
2、和复制/粘贴一样准确
采集/发布如同复制/粘贴一样精准,
用户要的全都是精髓,怎能有遗漏!
3、速度是普通采集器的7倍
火车采集器采用顶级系统配置,
反复优化性能,让采集速度快到飞起来!
4、网页采集的代名词
独具十年历练,成就业界领先品牌,
想到网页采集,就想到火车采集器!
火车头采集器使用教程:
1、在本站下载解压,得到火车头采集器官方版软件包,双击运行"LocoyPlatform.exe"即可直接打开软件;
2、进入首界面之后,点击新建分组,名称和备注可随意写;
3、再点进刚才新建的分组,然后右键创建任务;
4、编辑任务名称,然后添加要采集的目标页面链接;
5、这里选择选择批量/多页采集;
6、网址采集的规则设置:
注意:采集的量根据自己的需求来改
7、点击添加采集规则;
8、然后来进行采集的第二部:内容规则的设置;
9、设置标题替换;
10、配置网站后台的登陆信息和要发布的栏目,然后保存配置 ,全部保存,就OK了,可以正式批量采集文章了。
特别提示:
1、火车头数据采集平台要求,您的电脑必须安装.net framework2.0或2.0以上框架.如果您的采集器打不开,请下载并安装该框架:
附windows .net framework 2.0
2、出现闪退的解决方案:
-火车头根目录有个文件名为AutoUpdate.exe的文件,把这个文件删除掉;
-打开C:\Windows\System32\drivers\etc,编辑hosts文件,添加以下内容:
(如果编辑hosts不生效请关闭安全卫士等软件)
功能特性
1、无限级多页采集,可以实现无限深度的采集
2、任务队列运行管理,支持Cron表达式
3、无限级分组任务管理,任务回收站功能
4、RSS地址采集功能
5、列表页分页采集获取功能
6、列表页附加参数获取功能
7、列表页及标签XPath可视化提取功能
8、标签纯正则替换功能
9、Http接口查看运行情况
10、导出记录为单个或多个Txt、html 文件
11、标签间自由组合功能
12、针对标签内容继续发送Http请求功能
13、无限级列表网址采集
14、从Http头信息中获取数据
15、标题内容正文提取功能
16、Aspx列表分页自识别
17、多网站站群式web发布
18、导出记录为Word格式
19、导出所有记录为Excel格式
20、使用随机二级代理服务器(支持Socket代理)
21、多扩展间数据交换功能
22、下载的图片自动加增强型水印功能
23、Ocr识别(图片转化为文字)
24、Http接口管理采集器运行
25、Mongodb数据库保存数据
26、主从服务器分布式采集
常见问题
1、火车采集器有什么功能?
火车采集器能够为您实现数据的采集发布、互联网数据挖掘、批量下载海量数据、舆情监控等多种功能,是助您充分利用网页数据的最佳工具。
2、什么是火车采集器的服务年限?
服务年限是指在相应的年限时间里可以免费升级到火车采集器发布的最新版本并享有VIP技术支持服务,购买火车采集器时可以依据个人需求选择服务年限为1年、2年、3年、5年,服务年限到期后用户可通过续费延长年限。
3、绑定机器码,可以随时更换吗?
免费版无需绑定机器码获得授权,基础版和旗舰版机器码版需绑定一台机器码,可免费更换一次;
旗舰版自动授权版绑定一台机器码,支持随时自动更换;
企业尊享版绑定三台机器码,可免费更换三次。另附赠两个加密狗,不限更换机器。
企业豪华版绑定六台机器码,不限更换次数。附赠四个加密狗,不限更换机器。
更新日志
v10.26版本
1、新增:文件上传支持华为云上传
2、新增:保存为本地TXT文件时,支持自定义扩展名,比如.ini,.py等等
3、新增:HTML标签过滤排除支持自定义过滤标签
4、新增:http请求头列表支持剪切板批量粘贴导入头信息设置
5、新增:POST分页设置支持日期参数[yyyyMMdd]
6、优化:火车采集器默认UA更新
7、优化:数据编辑SQL操作界面可随着编辑界面伸缩放大
8、修复:下载图片探测地址问题修复
9、修复:html标签过滤时部分标签不起效问题修复
10、修复:标签提取结果生僻字、繁体字不能查看问题修复
11、修复:数据获取中调用多个标签作为截取字符不起效问题的修复
12、修复:数据转换mysql编码设置无效问题修复
- 数据爬虫采集软件
- 数据采集软件
-
更多 (11个) >>电脑爬虫软件大全 在互联网信息时代,很多朋友们都会选择在网上收集自己需要的信息,想要快速的收集各种信息的话,就需要使用到相关爬虫工具了,通过爬虫软件我们就可以自动收集自己想要的数据信息,能够节约大量的手动时间,但是爬虫软件有哪些呢?小编今天就在此给大家提供了电脑爬虫软件大全,包括Python、杰灵采集器、火车头采集器等等,这里面的软件都是操作十分简单的,不需要用户会相关的技术就能够直接操作,无论是老手还是新手都适用,对此有兴趣的小伙伴们可以来下载体验。
-
-
火车头采集器 53.33M
查看/简体中文v10.26官方版 -
EditorTools(全自动无人值守采集软件) 19.15M
查看/简体中文v3.6.12官方版 -
python最新版本2024 25.2M
查看/简体中文v3.12.3官方版 -
善肯网页TXT采集器 896K
查看/简体中文v1.0绿色版 -
News File Grabber(新闻文件抓取器) 1.42M
查看/简体中文v4.6.0.4官方版 -
杰灵采集器 2.76M
查看/简体中文v20190708官方版 -
深维全能信息采集软件 2.25M
查看/简体中文v2.5.3.9官方版 -
网页信息收集器 1.04M
查看/简体中文v1.0绿色版 -
捷豹数据采集软件 3.01M
查看/简体中文v1.0.0.1官方版 -
BalanceLink(数据采集工具) 10.91M
查看/简体中文v4.1.1官方版 -
熊猫智能采集软件 12.04M
查看/简体中文v3.5
-
发表评论
0条评论软件排行榜
热门推荐
- EditorTools(全自动无人值守采集软件) v3.6.12官方版19.15M / 简体中文
- 熊猫关键词工具 v3.1.0.0官方版2.89M / 简体中文
- SEO SpyGlass(网站seo分析工具) v6.55.12官方版381.18M / 英文
- rank tracker(网站关键词分析工具) v8.48.4官方版562.16M / 英文
- 中英文长尾词猎手(长尾词挖掘工具) v2.2.0官方版94K / 简体中文
- 石青建站养站大师 v1.9.4.1官方版5.03M / 简体中文
- 爱链换链神器 v1.3.35.0官方版11.52M / 简体中文
- 蜗牛精灵seo工具(网站seo优化工具) v5.2.0.936.65M / 简体中文
- 淘词大师3.0官方版 872K / 简体中文
- seo智能伪原创工具 v2.6绿免费版553K / 简体中文