星期八免费文档批量下载工具说明书解析.docx
- 文档编号:317785
- 上传时间:2022-10-08
- 格式:DOCX
- 页数:22
- 大小:1.27MB
星期八免费文档批量下载工具说明书解析.docx
《星期八免费文档批量下载工具说明书解析.docx》由会员分享,可在线阅读,更多相关《星期八免费文档批量下载工具说明书解析.docx(22页珍藏版)》请在冰豆网上搜索。
星期八免费文档批量下载工具说明书解析
星期八免费文档批量下载工具说明书
V1.0
一、功能简介
1、具有强大的文档搜索采集功能
本软件具有多种搜索方式,能根据关键词进行一般的搜索,更可以利用搜索地址与地址过滤功能进行各种灵活的快速搜索采集,如采集文档分类列表、采集个人全部文档等。
还可以直接利用文库原有的搜索功能进行更复杂的搜索。
注:
搜索地址和地址过滤组合搜索功能建议充分学习使用以便达到最佳的文档采集效果。
2、具有强大的文档下载功能
本软件目前可以下载网站上几乎所有免费资料,但是一个IP一段时间限制仅能下载50到100个,需要切换IP清除Cookie才能继续下载。
3、具有无限数量的账号切换下载功能
通常一个账号所能下载的文档数量网站都做了限制,超过限制的此账户一般要等待第二天才能重新正常下载。
为了不间断进行文档下载,一个账号下载超过网站限制后可以切换到下一个账号继续下载。
这就保证了下载可以无人值守自动进行,理想条件下只要具有一定数量的账号,软件就能一直进行下载。
如果没有账号,可以使用软件的自动创建账号功能,这样不需要预先有账号列表,限制后可以自动创建账号继续下载。
4、具有重新拨号下载功能
网站不仅对账号设置有限制,对用户IP也有限制,因此用户即使切换了账号也可能无法进行下载。
这时候可以利用宽带重新拨号改变用户IP结合账号切换继续进行下载。
5、具有强大的列表管理功能
本软件提供下载列表导出,导入等功能,可定时自动对文档列表进行保存,避免重复下载。
可对用户特别挑选的文档链接文件进行导入下载,可对文档下载状态进行设置等。
可以按需要对列表进行排序操作,例如按照文档财富值进行升序排列或者按照文档大小按照升序排列等。
二、界面介绍
1、主界面
2、搜索设置界面
3、下载设置界面
三、使用说明
1、快速使用说明
1)添加关键词
点击菜单项【参数管理】—【搜索参数设置】如图
弹出如2.2所示的搜索参数界面
在关键字编辑框中输入关键词,然后点击添加按钮把关键词添加到关键词列表中,如图:
也可以点击选择文件按钮,选择关键词文件进行批量添加关键词,然后点击打开按钮,如图所示
关键词文件为txt文本文件,文件格式为一行一个关键词。
注:
不要在一行输入两个关键词而以空格分开,一行中所有内容将被认为是一个关键词。
关键词文件示例如下。
添加关键词后,会在软件所在目录下的Config目录生成一个名为key.list的关键词列表,下次启动将自动加载此列表。
因此也可以直接编辑修改此文件进行关键词的添加。
2)设置搜索条件
搜索条件设置可对文档标题、共享时间、文档下载者等作出限制。
●不搜索指定用户
如果不想搜索某些用户下载的文档,可以设置此项,在不搜索指定用户下拉框中输入不想搜索的用户名,然后点击添加即可。
也可选择某个用户名进行删除,默认此项不设置即可。
如图:
●文档标题字数
可设置搜索的文档标题的字数,一般设置为0,可达到最大化搜索效果。
●搜索时不匹配关键词列表
按关键词搜索或者按其他方式搜索时,且关键词列表中存在关键词,如果匹配关键词列表,则每搜索到一个文档都要将其标题和关键词列表中关键词匹配,如果标题存在关键词列表中任何一个关键词,则此文档符合搜索要求,否则将忽略该文档。
所以不匹配关键词将会最大化的搜索到相关文档,例如:
搜索测试关键词时,文档标题中含有检测字样的也可能是用户希望得到的。
默然应该打钩此项。
●文档共享时间
设置此项可搜索指定文档下载时间范围的文档,建议使用默认值,如图
●发散搜索设置
所谓发散搜索是指:
软件根据首个符合要求的一个网址A分析出所有合符要求的网址,并把所有这些符合要求的网址存放到一个列表中,如果允许发散搜索,则软件对从A中分析出来的符合要求的网址继续进行搜索,否则忽略这些网址。
此项设置表示当所有这些符合要求的待分析的网址超过设置数目时,将自动停止发散搜索,设置为0表示一直发散搜索。
默认设置为0即可
3)搜索文档
设置好搜索参数后,点击确定保存参数,然后点击下图中的搜索按钮即可启动搜索过程。
观察软件底部的状态栏,可见搜索已经在进行中,一段时间后,即可在下载列表中出现所搜索的文档,如下图:
如果希望停止搜索过程,可以点击上图中的停止搜索按钮,即可停止搜索过程。
注:
在发散条件下一般不会自动停止搜索,需要用户在搜索文档达到一定数量时手动点击停止搜索按钮进行停止搜索。
4)保存下载列表
当搜索文档时,应该立即导出文档列表进行保存以免搜索结果丢失,可点击下图的导出按钮进行导出文档,具体操作见下面的列表操作说明。
保存下载列表后,软件可定时自动对列表进行保存并且退出时会自动保存列表。
5)设置用户密码
在下图所示位置输入用户名和密码后,点击登录按钮,登录成功后会自动获取此用户目前所拥有的积分值。
注意:
如果在下载参数中选中了
,则会自动创建账号注册,而不是用设置的登录。
6)设置下载参数
点击菜单项【参数管理】—【下载参数设置】如图
弹出如2.3所示的下载参数界面。
●文档保存路径设置
点击上图右边的选择按钮进行文件夹选择,也可以直接复制文件夹路径到此编辑框中。
请注意文件夹所在的盘空间是否足够,空间不足可能导致软件出现异常错误。
●文档存在则覆盖
当搜索的文档较多时,肯定会出现同名的文档,如果在文档存在则覆盖前打勾,则同名的文档会下载并且覆盖之前的文档,如果不打勾则同名的文档会下载失败。
见上图。
●下载间隔设置
每个文档下载超时时间应该根据用户网络实际情况设置,如果网络较快,可以设置此值为一个较小的值,如果网上较慢则应该设置为一个较多的值,建议设置5分钟以上。
每个文档下载时间间隔也应该根据用户网络实际情况设置,建议设置为5秒以上。
这是因为网站下载间隔时间是有限制的,如果下载频率过快,会导致无法下载。
具体设置时间用户可根据网速调节,但不建议设置为0秒。
●下载错误时的处理设置
当用户由于下载太过频繁或其他系统原因造成的下载失败时,或用户设置了如下参数时
则当连续下载失败文档个数达到设置条件时也将进入失败处理流程。
注:
此种由于网站原因造成的失败是不会立即恢复的。
选择切换账号或IP选项的意义可参考下面切换账号、IP说明。
默认选择第一个选项:
下载错误等待指定秒数后再下载,秒数可以自己设置,建议设置一个较大的数值,不然可能等待时间过后仍然无法恢复正常下载。
当由于上述网站原因造成的系统错误而导致下载失败时,如果设置重试下载次数大于0,则会尝试重新下载当前失败的文档,否则会直接跳到下一个文档下载。
如果设置下载错误每次增加延时大于0时,则当连续下载失败个数超过2个时会额外延时所设置的秒数*(失败次数-1)。
级当失败2次时将延时5秒(如图设置)连续失败3次时延时10秒,如此类推。
下载参数设置完后请点击确定保存参数。
7)下载文档
点击软件主界面右下角的开始下载按钮即可启动下载过程,如下图:
观察界面的底部状态栏,可看到当前文档下载进度和下载过程中输出的信息。
8)停止下载
点击上图右下角的停止按钮,可将正在进行的下载过程停止。
2、搜索方式说明
本软件支持多种搜索方式,软件自身的关键词搜索方式上面已经做了介绍,此处只介绍其他的操作方式。
这里所介绍的搜索方式均是通过上图的搜索地址和地址过滤结合进行搜索。
为了方便用户搜索某个指定用户的全部文档,软件可通过或搜索用户以及搜用户文档结合进行搜索。
再次提醒用户注意:
使用以下的搜索方式时,请注意把软件搜索参数设置中的关键词列表清空!
为便于用户理解,有必要对地址过滤编辑框的作用以及两者配合使用的意义说明一下。
搜索地址作为启动搜索过程的第一个网页地址,在此网页采集到的所有网页链接,经过地址过滤后剩下那些用户想要的有效的网页地址,然后对这些剩下的网址地址再逐个分析采集其所有网址地址并再经过地址过滤进行过滤,如此往复,直到所有符合地址过滤所匹配的地址都采集完。
1)搜索指定用户的所有文档
参照前面的快速使用说明一节中的搜索参数设置,此时应把关键词列表清空,参数中仅
参数是相关的,其他参数对此搜索方式是无效的。
设置完此些参数后,在或搜索用户编辑框中输入所要采集的用户ID,如:
中的84724再点击搜用户文档按钮即可,如下图:
注:
上图中搜索地址编辑框和地址过滤编辑框中出现的内容是用户点击搜用户文档按钮后自动添加的,搜用户文档简约方式也是借助此两个地方结合完成的。
此种搜索方式也可以通过在搜索地址中输入如下字符串
注:
地址过滤编辑框可输入多个过滤条件,每个过滤条件以,逗号分隔,其关系是或的关系。
Un=xuana57,pn=0则网址地址只需符合其中一个就能满足要求。
2)搜索分类列表
在网站中找到想要采集的分类列表,并点击打开,如下图所示:
在浏览器地址栏中把该分类列表的网址
点击搜索按钮后,软件立即开始采集该列表的文档。
如下图所示:
3)搜索专辑分类列表
在网站中找到想要采集的分类列表,并点击打开,如下图所示:
在浏览器地址栏中把该分类列表的网址
点击搜索按钮后,软件立即开始采集该列表的文档。
如下图所示:
3、账号切换说明
账号切换可以通过账号列表或者选中自动创建账号
选中自动创建账号后,不需要设置账号列表,也不需要填写用户名和密码,点击登录即可自动创建账号下载,并且切换账号时重新创建账号,创建的账号会形成列表记录到文件user.txt中。
如果有大量账号,也可以通过置账号列表来切换账号,在下载参数设置中找到如下设置,如下图所示:
此时点击下面的选择按钮,如图:
选择用户账户所在文本文件(注:
要求是txt文件),点击打开按钮即可。
此时账户已经全部添加到账户列表中,账户所在的txt文件路径也出现在选择按钮右边的编辑框中,此路径将会用于下次打开程序时直接加载此账户列表。
账户txt文件格式
文件格式正如上面所说,是每行一个,如下格式:
账号$密码
4、IP切换说明
有时单单是切换账号可能继续正常下载,这时需要同时切换IP才能继续下载文档。
切换IP可以由重新拨号(如果装有宽带,所在电脑可以控制拨号)进行。
如果上图的宽带连接框中没有出现任何内容,证明您的上网方式并不是直接拨号进行的(或者说你并非直接控制宽带拨号),可以跳过此步了设置了。
注:
装有宽带并且直接控制的,可在网络邻居属性中查看到如下图(名称可能不一样)
选择相应的连接名称(如果有多个的话)填写好账号密码后即可,如下图
5、其他参数说明
1)自动导入上次列表
此设置表示,程序退出时自动记录当前下载列表(必须先保存该文档列表),当下次启动后,自动导入此保存的文档列表。
2)启动自动下载失败文档
此项设置表示,当导
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 星期 免费 文档 批量 下载工具 说明书 解析
![提示](https://static.bdocx.com/images/bang_tan.gif)