软件下载
联系客服:0551-62864156
客服QQ:800019423
更新下载
-
2025-09-08
- 火车采集器V10.29版
-
1.升级:NET Framework至4.8。请确认系统版本支持4.8后再升级
2.升级:sftp文件上传升级优化
3.升级:mysql支持版本升级
4.升级:批量导入数据中支持的excel版本升级
5.修复:支持webp格式图片添加水印
6.修复:word发布img标签图片问题处理
7.增加:http第三方请求支持编码设置
8.增加:云规则数据支持选定电脑删除
-
2025-05-07
- 火车采集器V10.28版
-
1.新增:数据处理新增人工智能DeepSeek。http://faq.locoy.com/q-1357.html
2.新增:json提取数据支持任意层级数据提取。http://faq.locoy.com/q-1358.html
3.新增:web发布支持批量域名添加。http://faq.locoy.com/q-1359.html
4.新增:针对部分https地址不能访问增加第三方服务。http://faq.locoy.com/q-1360.html
5.新增:水印转换图片格式支持webp格式。
6.新增:边采集边发布新增发布失败标记未采选项。
7.优化:超多任务同时运行造成客户端卡顿的部分情况优化。http://faq.locoy.com/q-1361.html
8.优化:拼音简繁转换升级优化。
9.优化:表格智能提取数据支持分隔符连接。
10.修复:自动分词数字和英文问题。
-
2025-01-03
- 火车采集器V10.27版
-
1.表名加单引号或方括号导致文章编号获取不到自增ID。
2.优化升级计划任务类库BUG。
-
2024-11-05
- 火车采集器V10.26版
-
1.新增:文件上传支持华为云上传
2.新增:保存为本地TXT文件时,支持自定义扩展名,比如.ini,.py等等
3.新增:HTML标签过滤排除支持自定义过滤标签
4.新增:http请求头列表支持剪切板批量粘贴导入头信息设置
5.新增:POST分页设置支持日期参数[yyyyMMdd]
6.优化:火车采集器默认UA更新
7.优化:数据编辑SQL操作界面可随着编辑界面伸缩放大
8.修复:下载图片探测地址问题修复
9.修复:html标签过滤时部分标签不起效问题修复
10.修复:标签提取结果生僻字、繁体字不能查看问题修复
11.修复:数据获取中调用多个标签作为截取字符不起效问题的修复
12.修复:数据转换mysql编码设置无效问题修复
-
2024-03-18
- 火车采集器V10.25版
-
1.增加:标签文件下载支持添加图片水印。
2.增加:数据处理中的HTTP请求可以调用请求头信息。
3.增加:下载增加是否设置Referer为空配置。
4.增加:批量网址支持文本导入。
5.增加:水印文字可以调用标签。
6.增加:获取cookie超时时间。
7.修复:标签提取结果和下载文件名不一致。
8.修复:图片地址识别错误导致下载失败。
9.修复:列表页标签提取结果有空格时不显示。
10.修复:正则提取时组合结果重复。
11.修复:数据转换mysql支持修改编码。
12.优化:远程管理采集数据接口优化。
13.优化:插件.NET Framework升级到4.6。
14.优化:网址库支持手动填写与选择。
-
2023-08-10
- 火车采集器V10.24版
-
1.修复:点击欢迎页空白地方页面打不开。
2.新增:任务批量处理,导入数据支持PageUrl字段导入。
3.优化:内置浏览器内核升级。
4.修复:起始网址添加向导中批量网址地址格式显示错误。
5.新增:任务右键菜单高级操作增加“标记采集状态为已采”。
6.优化:远程管理自动启动无需在菜单工具栏手动点击。
7.修复:标签引用“列表页”标签时提取无效。
8.修复:不排重时列表页重复内容被自动过滤。
9.新增:对指定标签内容进行AI对话:http://faq.locoy.com/q-1356.html
10.优化:自动更新cookie丢失的请求重新采集。
-
2023-03-10
- 火车采集器V10.23版
-
1.新增:腾讯云cos上传附件功能,教程见:http://faq.locoy.com/q-1354.html
2.新增:七牛云SDK更新,支持更多区域
3.新增:支持win11最新系统使用
4.新增:探测下载增加:不探测直接下载模式,提高下载速度优化下载配置
5.修复:部分自动转化拼音无效问题处理
6.修复:strong标签过滤无效问题处理
7.修复:处理水印切图有边线问题
8.修复:部分简繁互转无效问题处理
9.修复:xpath提取缺少标签问题
10.修复:二级代理http类型账号密码使用问题
-
2022-10-12
- 火车采集器V10.22版
-
1.优化:升级内置微型浏览器内核到谷歌浏览器
2.优化:Win11中部分采集器无法兼容问题修复
3.新增:二级代理支持手动填写规则获取代理列表,可以更灵活获取多种格式IP
4.新增:加入去除图片水印功能平台插件:http://faq.locoy.com/q-1353.html
5.新增:web发布模块http头信息支持选择生效步骤,提高灵活性,支持更多类型发布网站
6.修复:部分下载提示未将对象引用至实例
7.修复:循环时随机数据相关问题
8.优化:部分ssl3最新https网站的相关兼容性
-
2022-05-30
- 火车采集器V10.21版
-
1.新增:ftp支持七牛云上传,http://faq.locoy.com/q-1351.html
2.新增:标签过滤新增内容日期过滤,http://faq.locoy.com/q-1352.html
3.新增:文件下载中保存目录和保存格式增加“[从X开始自增ID]”
4.新增:点击运行管理列表“状态”列可按任务运行状态排序,便于排查任务状态
5.提升:mysql支持8.0版本
6.修复:批量网址补0预览无效问题
7.修复:插件管理器文件下载插件模板增加操作方法
8.修复:同url文件再次下载时没有入库,导致发布缺少文件问题
9.修复:设置http请求头refer时文件探测下载生效,正式下载无效问题
10.修复:web发布模块登录验证码显示不全问题
11.修复:单次替换和批量替换中的“忽略大小写”设置无效问题
12.修复:勾选数据管理“已采”时,更改“已发”为勾选问题
-
2022-02-28
- 火车采集器V10.2版
-
1.新增:User-Agent支持从文本读取并随机切换。教程:http://faq.locoy.com/q-1348.html。
2.新增:自动识别手机号功能支持14、15、16、17、19开头的新号段。
3.优化:文件下载完毕插件接口优化。
4.优化:探测文件下载时正式下载文件,提升下载速度。
5.修复:http请求头“Header或设置名”以数字开头的名称报错的问题修复。
6.修复:发布到word文档,如果数据包含特殊字符或本地图片异常会导致发布失败问题修复。
7.修复:拷贝任务时,任务备注未拷贝问题修复。
8.修复:标签引用支持调用“列表页”标签。
9.修复:json提取时如果json对象的“键”是整型导致提取有误。
10.优化:网址解析替换html问题。
11.修复:get、post分页问题处理。
12.修复:生成固定格式的数据中“系统时间”选中“06-16”生成时间格式“yyyy-MM”
13.新增:数据库发布模块支持replace into语句。
-
2021-10-08
- 火车采集器V10.1版
-
1.修复:添加了HTTP请求的头信息之后,再添加多页,头信息的所属页会全部清空。
2.新增:表格类型数据自动分析,自动添加字段,也可以删除字段。自动勾选循环。
3.修复:复制规则之后,规则排重库处为空白,无法建立新的排重库。
4.完善:删除任务的时候,同时删除该任务的所有数据,并且在提示信息框加上提示信息。
5.修复:文件下载jpeg格式自动转换jpg。
6.优化:提取json时若提取表达式里面属性不存在导致其他数据提取失败。
-
2021-07-05
- 火车采集器V10.0版
-
1.数据获取中支持调用其他标签的值作为截取条件。
2.数据获取支持CSS selector,很多网页的css 的属性唯一,此功能更利于批量从网页中提取数据。
3.增加关联区域功能,可以截取网页中指定区域内容进行采集处理。
4.批量网址增加区间变化的网址增加方式,适应更多的网页地址变化方式。
5.批量设置增加新增加功能的批量设置。
6.运行统计日志设置添加默认关闭功能,可在设置中选择开启或关闭。
7.oss相关问题修复。
8.网址空格问题导致列表页标签错误问题修复。
9.下载相关问题修复。
10.修复“任务数据批量处理”中删除为空记录无效的问题。
11.文件下载插件增加文件下载后处理接口。
-
2021-03-15
- 火车采集器V9.30版
-
1.优化标签数据处理中字符替换。
2.对文件探测无效导致文件下载失败问题优化。
3.处理用户名包含特殊符号不能登录问题。
4.修复数据管理批量操作数据有异常弹窗提示。
5.修复二级代理卡死问题。
6.完善自动获取cookie失败问题。
7.发布到word,自动转义"<"、">"为"<"、">"。
8.修复:勾选发布选项,采集最大数无效。
9.修复oracle链接问题。
10.支持oss存储。
11.修复:下载地址后面有斜杠,下载文件时无后缀名。
-
2020-09-07
- 火车采集器V9.21版
-
1: 自动获取cookie功能优化
2: 数据库发布增加事务,优化数据库发布速度
3: 数据转换速度优化(针对Mysql和SqlServer数据库的导入), 同时去除网址库的清空逻辑
4: html标签处理错误问题处理
5: json提取关于数字转换为科学计数法问题处理
6: 发布测试时,图片上传无效的问题处理
7: 采集内容页处理错误时,增加对于当前出错标签的提示,以便快速定位出错标签
8: 任务批量编辑,增加可操作范围
9: 循环匹配匹配空格问题处理
10: 刷新分组中增加统计数据的刷新
11: post分页处理
12: 部分功能逻辑优化
-
2020-06-15
- 火车采集器V9.20版
-
1: IE浏览器内核升级
2: Post分页逻辑优化调整
3: 火车采集器中各个输入框支持“双击”查看详情,便于操作
4: 下载逻辑对于图片和附近同时勾选时的逻辑优化
5: 图片探测请求增加对于插件的支持
6: 增加自动更新采集cookie功能来更新cookie以及ua(旗舰(自动授权)及以上版本支持)
7: 发布模块在图片不存在时发布错误的问题修复,以及相应的提示内容调整
8: 将数据标记为未采时,同时将图片下载信息重新标记
9:代理定量设置未生效的bug修复。
-
2020-03-23
- 火车采集器V9.13版
-
1: 新增数据库导入where条件筛选设置功能
2: 日志打印相关问题修复
3: 下载问题修复
4: 发布模块请求头相关问题修复
5: 列表页标签相关问题修复
6: 发布最大超时时间增加
7: 已生成的网址库修改后则下次不显示问题修复
8: 未能分析主机名修复
9: 其他已知问题修复
-
2019-12-26
- 火车采集器V9.12版
-
1: 二级代理页面、功能全面优化调整。
2: 修复SqlServer数据库下载图片记录错误的问题。
-
2019-11-21
- 火车采集器V9.11版
-
1: 列表页新增“地址处理”功能
2: 新增“请求失败数”的预警条件设置。
3: 下载图片命名,新增[记录自增Id]格式
4: 修复图片下载误判断问题
5: 修复计划任务中“每天调度”,起始运行时间配置未生效的问题。
6: 修复PHP插件,对于循环记录的处理报错的问题。
7: 修复拼音首字母对于一些错误字符的判断问题。
8: 任务批量编辑,修复“发布”中“多网站乱序发布”未能复制的问题
9: 修改“循环添加新记录”配置后,修复数据格式选择错误的问题。
10:修复循环记录中列表页标签被多次处理的问题
11:修复对于一些302跳转地址,无法正确跳转的问题。
12:修复一些网址无法正确请求的问题
-
2019-09-05
- 火车采集器V9.10版
-
1.二级代理重大修改并增加了商业代理支持
2.post获取网址POST页码增加递增数值
3.修复php和python插件不支持cookie的问题
4.当成功失败标识都为空时认为是发布成功
5.调整发布和入库模块界面大小和操作bug
6.修复web发布不登录时不发UA的问题
7.修复web发布测试时超时不起效的问题
8.修复Web发布时特殊情况下死循环问题
-
2019-05-07
- 火车采集器V9.9版
-
1.优化效率修复运行大量任务时运行卡顿问题
2.修复大量代理时配置文件锁死程序退出问题
3.修复部分情况下mysql链接不上问题
4.修复极少云规则规则显示不了的问题
5.修复ie版本号显示不正常的问题
6.修复多页处理&问题
7.搜索增加按任务id搜索功能
8.修复下载文件filename*=的bug处理
9.其它界面和功能优化
-
2018-12-27
- 火车采集器V9.8版
-
1: “远程管理” 正式升级为 “私有云”,全面优化调整。
2: 发布模块增加自定义头信息的增加。
3: 采集线程间隔调整,增加自定义区间设置。
4:长时间使用后的运行卡顿问题修复。
5: 二级代理,IP输入框修改为普通TextBox。增加代理免验证的功能。
6: 分组丢失、死循环问题修复。
7: ftp上传,增加超时处理。
-
2018-10-29
- 火车采集器V9.7.1版
-
1: Web发布模块,对于登陆数据,增加自定数据的格式。
2: html标签处理,增加“排除其他标签”的处理方式。
3: 标签的编辑,增加“多选”模式,实现批量的复制、删除操作,按住ctrl键,即可选择多个标签。
4: 本地数据库为sqlite时,数据库清空时,增加数据库的压缩操作。
5: 修复采集器长时间行后导致的程序卡顿问题。
6: 当有分页的时候,对于标签增加设置提示。
7: 对于Post分页中的【文本】,增加自定义转义的设置。
8: 修复同步云端规则,在使用数据库为Mysql或者SqlServer时,未能建立对应规则本地数据库的问题。
9: 修复循环匹配与添加为新记录的冲突问题。
10: 修复当登陆参数有随机值,无法自动登陆的问题。
11: 修复使用Python插件时,空格变成+的问题。
12: 修复批量复制下,“最大循环次数”未复制的问题,增加起始网址的复制。
13:修复任务、分组无法拖动到根目录下的问题。
-
2018-07-19
- 火车采集器V9.7版
-
1: 添加“重新采集上次请求失败的列表页”功能。
2: 优化任务发布方式,站群式发布添加支持顺序、倒序发布。
3: 列表页独立标签,增加“从网址中获取”的选型。
4: 优化图片地址匹配方式,一些原来无法匹配的图片可以正确匹配了。
5: 同义词替换,增加对于html标签替换的支持。
6: 循环采集模式,增加循环次数限制。
7: 数据发布,增加自定义数据发布模式。
8: 修复删除列表页时,未能删除对应列表页标签的问题。
9: 修复使用图片水印时,未选择保存格式导致的水印错误的bug。
10:Json工具,修复长Json处理时的卡顿问题。
11:修复采集标签过多导致的任务无法运行的错误。
12:修复自定义插件编译错误的问题。
13:修复PHP插件对于循环采集标签处理时的错误问题。
-
2018-04-09
- 火车采集器V9.6.5版
-
1: 文本导出时,增加导出文件的编码选择。
2: 批量导入任务以及导入任务分组时,添加任务导入结果反馈,修复由于一个错误任务导致的全部出错的问题。
3: 批量内容替换,增加文本导入的功能。
4: 二级代理自动更换代理优化,在无任务使用二级代理时,不进行代理的自动更换。
5: 请求头信息,增加适用于全部页面的选择。
6: HttpPost分页,添加对于[文本]与[分页]进行组合的支持。
7: 修复清空网址库时,对应的压缩数据未能删除的问题。
8: 修复图片添加水印时,水印覆盖错误的问题。
9: 修复批量编辑任务时,内容页“其他设置”未能复制的问题。
10:存储过程sql验证优化,防止一些正确语句被错误提示的问题。
-
2018-02-02
- 火车采集器V9.6.4版
-
1.修复分页采集请求出错的问题
-
2018-01-26
- 火车采集器V9.6.3版
-
1: 修复使用PHP插件,无法获取请求cookie的问题。
2: 批量网址处理中,时间格式增加转换为“时间戳”的功能。
3: 修复“智能提取电话”功能意外变为“智能提取邮箱”的bug。
4: 无限极列表页采集,是否由于重复数据而停止修改为可配置(原为自动停止采集)。
5: 修复老板键设置为空之后,会默认变成 CtrL+Alt的bug。
6: 修复由于没有水印配置,导致的程序批量复制出错的问题。
7: 修复由于多页未能获取到,导致由多页获取数据的标签丢失的bug。
8: 发布模块,数据库的编码增加utf8mb4格式支持。
9: 修复分页循环匹配时,组合标签仅获取第一页的bug
10:优化批量网址处理中,由于数据量太多而导致程序卡顿的问题。
-
2017-12-12
- 火车采集器V9.6.2版
-
1:图片水印,添加全覆盖的需求。
2:发布配置页面,增加配置项的复制、黏贴的功能。
3:发布规则配置界面,在导入规则后,增加定位跳转功能。
4:修复文件名自增时,赋值错误的问题。
5:修复发布页面,列表的滚动条定位的错误问题。
6:修复先上传,后发布时,本地图片不删除。
7:修复任务批量编辑时,水印规则未复制的问题。
8:修复在云端规则获取出错的问题。
9:修复在某些时候,规则标签配置不生效的问题。
10:修复自动拨号未实现的问题。
-
2017-10-26
- 火车采集器V9.6.1版
-
1: 修复火车采集器与Win10(1709)版本的兼容性问题。
2: 修复循环添加新纪录时,边采集边发布只发布一条数据的问题。
3: 修复网址Post参数从文本导入时,由于转义导致的导入出错问题。
4: 修复代理正则匹配失败,导致的程序退出问题。
-
2017-09-09
- 火车采集器V9.6版
-
1: 多级网址列表,对于列表名增加重命名功能以及上下调整的功能。
2: 修复SqlServer数据库格式下,未能正确显示采集数量的问题。
3: 修复在新增标签时,若上一个编辑为固定格式数据,则新增的标签显示内容错误的问题。
4: 修复数据包登录中,若登录失效,未能自动重新登录的问题。
5: 修复FTP上传失败后,本地数据也被删除的问题。
6: 修复边采集边发时,文件上传FTP失败的问题。
7: 优化Excel保存时,对于ID,PageUrl显示列的位置。
8: 修复任务不能多选操作的问题。
9: 边采集边发布时,最大发布数的功能调整(原:最大发布数无效。 现:最大发布数生效,且在任务完成后,不会将以前的未发布数据再次发布)
10:修复对于存储过程语句,当数据为空值时,意外判断为“语句错误”的问题。
11:二级代理功能,修复定时拨号失效的问题。
12:二级代理功能,定时获取API功能优化,重新获取时,会自动删除上一批数据。
13:批量网址增加数据库导入的模式
14:导出到文件时,对于不合理的错误命名增加提示。
15:导出规则时,对于规则名称过长的规则,增加提示的功能。
16:规则编辑时,对于“包含”、“不包含”数据,复制粘贴多行时,会自动区分为多个数据。
17:添加对于芝麻代理的合作支持。
18:数据库导入批量网址
-
2017-06-21
- 火车采集器V9.5版
-
1: 调整列表页排重的方式,现在仅会在同级列表页之间进行排重。
2: 增加对于任务运行完毕之后的运行统计的预警功能(Email邮件预警)【旗舰版功能】
3: 新增支持对于一些请求返回码不为200时,仍然进行采集的配置。
4: 新增支持将下载地址保存为html文件的功能。
5: 二次代理服务,增加导入的时候配置代理类型,同时修复对于用户名密码的显示错误问题。
6: 发布配置页面,默认仅显示当前选择配置,加快任务加载时间。
7: 修复命令行控制,closeapp参数无法自动关闭程序的问题。
8: 修复在未选择图片水印时,无法进行图片剪裁的问题。
9: 优化开始界面加载方式,解决初始化界面卡顿的问题。
10:修复在配置多行连接符包含“|”导致的无法探测图片下载的问题。
11:修复Excel导出数据时,列的顺序与字段顺序不一致的问题。
12:修复Excel导出数据时,一些包含数字的字段的导出数据错误问题。
13:修复任务批量编辑时,Json采集表达式未能复制的问题。
-
2017-03-02
- 火车采集器V9.4版
-
1、修复Win10系统无法登陆采集器的问题。
2、 修复Https页面无法采集的问题。
3、修复Mysql数据库,增加标签时,数据库字段不得为空导致的采集数据失败的问题。
4、修复在任务运行中编辑任务,可能会导致的编辑结果保存失败问题。
5、 二级代理,通过网页API获取代理,增加定时获取、自动验证的功能。
6、增加智能提取电话号码的功能。
-
2016-11-04
- 火车采集器V9.3版
-
1,任务增加备注说明,并且可以显示于任务列表中
2,增加任务完成提示音
3,Http服务增加单条数据修改api,并且可以于http页面内编辑数据
4,修复任务编辑时,《保存退出》无效的问题
5,批量编辑网址中,现在可以支持两个参数同步变化的功能
-
2016-06-02
- 火车采集器V9.2版
-
1.修复使用时分页请求间隔无效的问题
2.修复使用access入库时因系统驱动没安装测试点击没有反应的问题
3.修复批量复制规则任务的时候多个勾选的问题
4.Xpath的属性增加Alt,Src等属性
-
2015-12-14
- 火车采集器V9.1版
-
*支持多页的分页采集
*添加已采字段
*采内容进度算法调整
*web获取列表使用分类名+id显示
*优化实时数据、文件下载数据量显示不全问题
*修复php插件被当做C#插件禁止使用问题
*修复POST文本文件路径无法保存问题
*修复不得包含的多个词的逻辑问题
*修复本地数据编辑字段过多时无法查看全的问题
*修复url #之后的内容补全问题
*修复安装在C盘,管理员权限的问题
*修复url #之后的内容补全问题
-
2015-09-17
- 火车采集器V9.0版
-
1.全新界面,更好的UI及用户体验
2.新架构、新内核,使用9年的.NET2.0框架升级到.NET4.0框架
3.支持最新的Win10系统中运行
4.二级代理服务器新增Socks代理
5.优化采集流程,大幅提升采集及入库速度
6.任务运行过程中可修改线程数等参数,实时调节运行速度
7.支持SSH(SFTP文件)上传
8.内容提取新增JSON提取方式,提取JSON数据更加简单。
9.新增C#源码类型插件,可以直接编辑插件源码,实时生效。
10.软件闪退,支持保存未完成的任务进度
11.任务运行合并到统一界面,添加“实时数据”查看和“任务详情”统计
12.列表页,分页,多页自定义任意Header请求头等功能
13.批量修改任务规则细节参数,批量修改Web发布配置
14.起始网址批量网址的地址格式可添加多个地址参数,支持自定义列表参数
15.标签数据来源更细致化,可设置从默认页,分页,多页的源码,URL地址及返回头信息中提取
16.标签数据处理新增统计标签字符串长度、批量替换功能
17.修改原有的无限级列表页网址获取模式,无限级配置更加简单
-
2015-03-23
- 火车采集器V8.6版
-
1.增加任务自动读取外部cookie功能
2.采网址部分增加按大小写提取功能
3.修复导出Word时特殊情况下内容丢失的问题
4.修复html过滤时ui,li后半部分匹配不正确的问题
5.增加了同义词实时监控修改功能
6.修复二级代理部分代理无效的问题
7.其它bug修复
-
2014-12-10
- 火车采集器V8.5版
-
1.修改软件启动界面,使用更为友好
2.增加插件异常处理,方便调试插件
3.运行日志增加任务id
4.修复非管理员开机启动失败问题
5.修复任务批量处理非内容标签复制问题
6.修复“如果为空再次提取”的bug
7.WECenter的UBB转化功能完善
8.随机插入功能改进
9.修复ul,ol等标签带style时无法过滤问题
10.官方插件模块接口等资源更新
-
2014-06-18
- 火车采集器V8.4版
-
1.修复高dpi下采集器登录界面错位的问题
2.修复中文分词存在的问题
3.修复任务完成后不能关机的问题
4.生成Word和Excel可选2007和2003格式
5.增加任务规则异常报警功能
6.添加了批量关闭已完成任务窗口功能
7.修复文件下载中存在的一些问题
8.修复边采集边发布为excel 无内容的bug
9.修复二级代理 Session中url的组合错误
10.升级插件内核心,增加伪原创等插件
-
2014-04-09
- 火车采集器V8.3版
-
1.采集器完全支持64位操作系统
2.更改程序安装方式,使用安装包
3.使用用户名判断免费版和商业版本
4.软件不再需要使用管理员权限启动
5.任务运行完增加数据增量导出功能
6.删除内置中文英翻译功能
7.开放Sqlite存储功能给免费版用户
-
2014-02-24
- 火车采集器V8.2版
-
1.增加自助授权版本,不再绑定一台电脑
2.修复部分退出问题,软件稳定性提高
3.修复部分2003系统下输入法异常的问题
4.增加智能提取时间功能
5.如果内容为空,则不补全单个网址
6.修复语法日期表达式中的错误
-
2013-12-12
- 火车采集器V8.1版
-
1.修复部分情况下双击任务不能编辑的bug
2.修复复制粘贴任务只有一次的bug
3.修复导入标签时导入错误标签名的问题
4.修复暂停任务后,右击菜单无法开始的bug
5.任务数据批量处理工具中数据清理添加分组
6.优化大批量文件下载
-
2013-09-18
- 火车采集器V8.0版
-
1、增加发布扩展功能,开发了很多CMS的发布扩展
2.增加获取更新远程采集规则功能,用户可以自建规则服务器,向自己客户提供采集规则
3.增加更多应用扩展,如E商统计,极速搜索,论坛采集器,微博数据助手等
4.二级代理增加页面缓存功能,方便短时间内对同一网页进行采集
5.起始网址添加自定义语法,可以生成更多复杂网址
6.将google,bing,有道翻译集成到汉译英翻译模块中
7.本地库转换时增加了保留数据选项
8.POST采集网址部分增加了文本导入搜索词功能
9.增加网盘上传功能,一个文本可以同时上传多个网盘
10.增加将EXCEL数据导入采集器功能
11.POST获取网址部分增加了一个修改header功能
12.支持下载ftp中的文件
13.标签处理中加了一个运行C#代码功能
14.任务搜索功能中增加分组搜索
15.修改测试发布,增加入库以及应用扩展测试发布
16.入库和web发布添加了个复制配置右键菜单
17.系统托盘增加显示当前程序运行目录功能
18.本地替换增加可选操作整个数据库的选项
19.火车采集器任务右键菜单增加shift键功能
-
2013-04-10
- 火车采集器V7.7版
-
1.gif的图片不再加水印,修复加水印文字时没有判断加水印条件的问题
2.增加了迅雷快传,YunFile,千脑,金山网盘文件上传功能
3.增加了用户可以选择删除记录时是否删除下载文件的选项
4.增加了日志记录,通过上传文件功能
5.增加了批量导入数据导入网址功能
6.添加了发布时使用代理功能
7.修复当使用一般采一边发方式时保存为本地excel不起作用的bug
8.文件保存格式中支持[标签:ID],可以将记录的id做为目录的一部分了
9.处理了一个将$编码错误的问题
10.增加若干个错误检查,防止采集器退出
11.更换汉字转拼音词库,汉字增加到1万8
12.更新自动补全链接中迅雷地址补全不对的问题
-
2013-01-14
- 火车采集器V7.6版
-
1.修复使用一边采一边发时不执行采集完成后操作的bug
2.增加了使用mssql做本地数据库时给id加了索引
3.批量处理中添加了“当所有的发布方式中所有配置都发布成功才标记数据为已发”
4.生成txt或html文件时,处理了个别情况下在记事本中显示小黑块的问题
5.修复探测文件下载时,单条地址的必须包含选项没有生效的BUG
6.修复补全网址时,遇到thunder://这种情况的处理不正确的问题
7.增加多页提取的限时
-
2012-07-25
- 火车采集器V7.5版
-
1.对计划任务进行了修改
2.ftp上传失败时,增加了一次重试
3.修复命令行启动采集器时的bug
4.修复简繁互转中的bug
5.修复正文提取中提取成的bug
6.web发布配置中增加了超时和Accept-language
7.修复了当图片为压缩传输时文件加水印有误的bug
-
2012-06-01
- 火车采集器V7.4版
-
1.修复当使用mysql为本地数据库时新添字段编码有误的bug
2.修复分页识别时baseherf没有处理导致分页地址错误的bug
3.增加列表页中不允许标签的检测,防止用户误操作
4.如果xpath中含有tbody的标签会解析不了的bug
5增加了对个别服务器下载文件时Content-Disposition格式不规范的处理
6.分页合并符循环时的一些处理
7.让固定值也可以参加循环
8.增加一个设置,可以让用户添加某些禁止head方法的网站
9.修复一个CheckSpier的错误
10.处理mysql不兼容引起ncorrect arguments to RAND的问题
-
2012-04-16
- 火车采集器V7.3版
-
1.增加了对于用户添加不得重复标签时,如果原数据库有数据则提示的功能
2.增加了web发布配置部分可以多选
3.导入任务时,如果原任务有发布配置也一并导入没有做判断的bug
4.修复标签合并后有列表页标签时没有对数据处理进行处理的bug
5.修复发布失败时对失败标识符判断错误提示发布未知的bug
6.修复了在使用插件时对不符合条件判断次序错误的bug
7.修复一个自动提取抓取的数据包时的一个错误
8.修复本地编辑文件无法查看图片的bug
9.修改同义词替换为从上往下依次替换
10.修改了任务添加web发布配置时可以多选添加和删除
11.修复了使用mysql作数据库时去掉标签不得重复功能时出错的bug
12.添加了导出任务时将同义词也一并导出功能
13.修复了当多级网址中有重复时程序给跳过采集的bug
14.添加了当所有的发布方式中所有配置都发布成功才标记数据为已发
15.解决了当用户规则非常多的情况下新建编辑任务非常卡的bug
16.解决了部分情况下当循环添加为新记录时因循环中不包含而导致原正确记录被删除的bug
17.增加了标签替换功能中对标签值的简单替换
18.允许多次粘贴任务
-
2012-03-20
- 火车采集器V7.2版
-
1.修复版本升级和规则导入时对文本网址没有导入的bug
2.修复分页链接符和循环连接符的[换行]问题
3.修复php插件无法操作保存时的bug
4.修复保存为word文档时没有换行问题
5.修复列表页获取网址时没有处理htmldecode导致部分网址重复的问题
6.增加删除网址和数据的时候增加了提示
7.修复多站点完全乱序发布没有完全乱序的bug
8.增加了web发布错误后的错误文件如果大于500k,删除它,方便用户查看。
9.修复发布模块设置的密码在再次编辑后没有保存密码的bug
10.修复SqlServer中手动更新内容出现N前缀的bug
11.修复测试采集时小猴子图片不动的bug
12.修改当用户设置列表页标签不得重复时提示方式
13.修复Sqlserver中导入0级文本网址出现错误的bug
14.增加测试发布完成后几秒关闭窗口的功能
15.修复了多级post时使用插件而随机值没有从插件返回代码中提取的bug.
16.修复ftp上传时对部分ftp返回结果没有进行大小写处理而导致550错误的提示bug.
17.去掉了同义词替换时对相同词替换进行合并的处理。
18.更改了复制任务时保存数据没有处理到网址库的bug
19.处理了包含和不得包含条件中对|的转义问题,可以使用\|来代表|本身
20.修改了在用户对标签编辑保存后不再对内容进行清空。
21.增加了对于户在任务编辑处设置了每页显示条数据保存用户配置
-
2011-05-30
- 火车采集器V2010SP3版
-
1.优化C#插件,插件执行效率更高
2.添加了更多的错误处理,防止程序意外退出
3.修正一个入库时的bug
4.修复文件下载时出现StartIndex不能小于0的bug
5.修复部分情况下因表前缀为大写导致入库失败的bug
6.修复使用随机文件名时反义无效的问题
7.对生成csv添加了选项,可生成utf8和gbk两种csv
8.对入库时如出错,将会重试一次,减少了入库失误率
9.修改了入加模块中有子查询时表数量获取不正确的问题
10.修改了获取网址时插件值未传入的一个bug
11.修改了任务中网址测试时2级网址有误的问题
12.更新了一个获取文本网址时没去掉 ,可能导致插件处理发生错误的问题
13.修改了一个实际采集时采集采集页地址为测试页的小bug
14.cookieGet和cookiePost可能为null值的一个bug
15.修改了一个如果使用蜘蛛后发送useragent不正确的问题
16.增加sql语句错误时打印出sql语句的功能方便用户调试入库规则
17.更新了分词组件
18.对于500错误但仍输出正确代码的网站进行了处理
19.增加了保存文件的默认目录名
20.更新自动升级程序
注:旧版本升级为新版,是将网站上完整包下载后解压,将其中的exe和dll文件覆盖掉旧版本对应文件。
-
2009-09-01
- 火车采集器V2009SP4版
-
1.修正了部分文件下载成功后数据库标记不正确的问题(间接导致Ftp上传文件个数不正确)
2.修正了开启自动更新时偶尔出现的Hashtable被修改导致自动更新错误的问题
3.使用了SQLite数据库连接池,保证在多线程下Sqlite的稳定操作
4.修正了在多任务同时更新时,同任务不断增加,导致界面上任务数越来越多的问题
5.状态栏小提示同完成提示音一起,可以关闭显示
6.去掉了内置PHP插件内默认每次加载很影响处理速度的php_mysql.dll
7.标准版在使用access数据库生成0级网址时可能会退出的一个bug
8.修复了标签智能提取只能从默认模块文件夹提取的问题,其它目录的模块现在也可以提取
9.添加了一个生成时间网址的功能,可以生成具有时间参数的网址
10.修复了本地编辑数据时出现的“数据库在使用中”的bug
11.去掉了测试规则时自动补全网址的功能
注:旧版本升级为新版,是将网站上完整包下载后解压,将其中的exe和dll文件覆盖掉旧版本对应文件。
X
使用
人数最多的采集软件,免费版申请、商业版购买及其他数据采集问题请与我们
联系咨询!
立即咨询