火车头内容采集器教程

火车头采集器菜单项介绍

  火车采内容集器(LocoySpider) 的菜单栏包括:

1:采集器操作

开始采集:当选择好任务后,点击此处开始采集任务。
   停止采集:当任务正在进行点,点击此处终止采集任务。
   继续采集:当进行的任务处于占停状态时,点击此处继续完成未完成任务。
   计划任务 - 任务调度器:任务自动更新启动及手工开始任务调度查看器。
   退出程序:关闭火车头内容采集器。
2:站点选项

新建站点:点击打开新建站点窗口,设置站点的基本属性 (站点基本信息,整站内容规则)。
   编辑站点:在任务列表栏选择已有站点,点击打开编辑站点窗口,编辑站点基本属性 (站点基本信息,整站内容规则)。
   删除站点:要任务列表栏选择已有站点,点击删除站点  !!! 删除站点前,需要删除站点以下所有任务。
   导入站点:从火车头站点规则文件 (*.lsite) 中将站点规则导入到火车头内容采集器。
   导出站点:在任务列表栏选择已有站点,将站点规则导出到火车头站点规则文件 (*.lsite) 。
   导入任务:在任务列表栏选择已有站点,将火车头任务规则文件 (*.ljob) 导入到此选择站点目录之下。
3:任务选项

新建任务:点击打开新建任务窗口,设置任务的基本属性 (采集网址,内容规则,数据发布方式)。
   编辑任务:在任务列表栏选择已有任务,点击打开编辑任务窗口,编辑任务的基本属性 (采集网址,内容规则,数据发布方式)。
   删除任务:在任务列表栏选择已有任务,点击删除任务。
   任务高级设置:在任务列表栏选择已有任务,点击打开任务高级属性设置 (附件储存位置等)。
   复制任务:在任务列表栏选择已有任务,点击将此任务复制到剪贴板。
   粘贴任务:复制任务完毕,在任务列表栏选择其它站点,将复制好的任务粘贴到此站点目录下。
   导出任务:在任务列表栏选择已有任务,将任务规则导出到火车头任务规则文件 (*.ljob) 。
   导入任务:选择上级站点,从火车头任务规则文件 (*.ljob) 中将任务规则导入到此站点目录下。
4:系统设置

系统全局设置:点击打开系统全局设置窗口,设置系统全局属性。
   代理设置:设置采集内容与发布内容是否使用代理及具体代理选项设置。
   风格皮肤:火车头采集器提供默认几款不同风格的皮肤,此用用于更换不同的界面风格。
5:数据发布

导出到本地数据库:将从网上上面采集的内容导出到火车头程序的数据库内,数据库为Access (*.mdb)。
   Web 在线发布到网站:将火车头采集器通过不同的采集内容发布模块将采集所得到的内容直接发布到网站上。
   数据库直接入库:火车头采集器支持Access;Mssql;Mysql等数据库直接入库的功能,点击设置数据库类型;连接方式及入库规则等。具体执行方式请在新建或编辑任务时,在数据库发布方式页面选择试四:导入到自定意数据库。
   导出为SQL文件运行:将火车头采集器所采集的内容导出为 (*.sql) 文件,直接保存到本地。具体执行方式请在新建或编辑任务时,在数据发布方式页面选择方式五:保存为SQL文件(INSERT语句)。
   导出为本地文件|CSV|HTML文件:将火车头采集器所采集的内容导出为(*.csv ;*.html)文件,直接保存到本地。具体执行方式请在新建或编辑任务时,在数据发布方式页面选择方式二:保存为本地文件。
6:辅助工具

共享任务规则:将自己编辑好的任务规则快速的发布到火车头采集器官方论坛。
   共享模块:将自己编辑好的模块快速的发布到火车头采集器官方论坛。
   批量水印工具:将本地的图片文件快速的添加统一水印。
   清空全部地址库:火车头采集器为了防止重复采集,会将已经采集过的网址存于火车头的系统数据库内,点击删除此数据库里面的所有网址。
   清空单个任务网址:在任务列表栏选择已有任务,点击清空此任务里面的防重复采集网址。
   内存优化:在运行火车头采集器时,会占用一定的内存,点击整理优化内存。
7:帮助

程序帮助文档:火车头内容采集器使用教程及其它帮助文档。
   模块开发人员手册:火车头内容采集器发布模块的制作教程。
   技术支持:火车头采集器提供强大的技术支持。
   常见问题:火车头采集器使用中经常遇到的问题及解决方法。
   关于:火车头采集器版本说明,版权说明及声明。