生活大爆炸第十一季04:WebZip问题

来源:百度文库 编辑:查人人中国名人网 时间:2024/04/28 11:49:58
我想下载新华网资料里的所有链接 在这里:http://news.xinhuanet.com/ziliao/2004-11/04/content_2177717.htm
可我不知道用哪种类型下载
1.保存文章 - 由下列链接和文本包含 (<, >, Back, Next, 1,2,3,4,5...)
2.保存网页(本页) - 完全
3.保存网页 + - 所有页的链接 (保持在站点内)
4.保存网页 + - 所有页的链接 (无论何处)
5.保存网页 + - 所有页直到 2 链接深从这页 (保持在站点内)
6.保存网页 + - 所有页直到 2 链接深从这页 (无论何处)
7.保存目录(所有层) - 网页 - 完全
8.保存站点 - 网页 - 完全
9.保存站点 - 保存全站 - 包含所有文件
各位我亲亲的偶像,Please give me a hand!感激!^_^

离线浏览器WebZIP2.61

WebZIP只是种类繁多的离线浏览器的一种。由于其功能较为完善,所以比较普及。你可以在很多工具光盘上找到它的踪影,也可以在www.spider-soft.com/downloads.htm 中下载它的最新版本。目前是5月5日刚出版的webzip2.75,大小为1.28MB。WebZIP的安装非常简单,一路按下Agree、Next就可搞定。准备好了吗?Follow me !
如果你执行的是默认安装,启动“开始—程序—WebZIP—WinZIP”即可进入WebZIP2.61的启动画面。上面将提醒你,在没有注册的情况下,你可以试用30天,右边的五个按钮依次是:Continue (继续) 、Exit (退出) 、Register (注册) 、Purchase (购买) 、Help(帮助)。
按下Continue进入主界面,你可以看到WebZIP 的界面非常花哨,具有典型的浏览器特色。第一次进入,建议你等待一分钟,看看会出现什么情况?它将自动连接到WebZIP的老家——www.spider-soft.com/WebZIP/home.htm。如果单击地址栏左边的房子图标,你将看到熟悉的IE默认门户页面,这就是webzip的一大特色。它的内置浏览器与IE完全兼容。并可脱离其它浏览器单独工作,不信,输入个熟悉的网址看看结果吧。
好了,我们要开始尝试下载网站了,按下Tasks(任务)按钮,将出现WebZIP的任务管理核心。菜单栏主菜单与其他软件没什么区别,不过其中的View(查看)栏和Task(任务)栏值得我们研究。在接下来的两个输入栏中,第一个是任务配置栏,按向下箭头我们可以看到WebZIP为我们提供了7种任务配置方式,具体如何配置,我们将稍后介绍。第二栏是地址栏,接受需浏览或下载的网页地址,这一区有八个圆形图标,左边三个含义分别是:新任务建立、搜寻、下载目录查看。右边四个含义分别是:设置默认模式为压缩模式、设置默认模式为建立内部模拟网模式、将下载任务添加到选定压缩包中、帮助。GO图标的意义当然是任务开始。任务管理核心部分的左边,WebZIP已为你准备好了预设类目,方便你对任务的分类管理;右边就是我们将要经常使用的主操作区了。
我们有多种方式建立任务,可以直接按下F7,可以在File菜单中选择“New-Download Task”,可以在地址栏上直接输入任务网址,随后按GO键等等。无论使用哪种方法,都将出现任务建立对话框。
在Task Name中为我们即将进行的下载任务取个名字,比如说:“硬件知识”,在Category(类目栏)中选择Education(教育),Profile中选择默认的Custom,在Starting URL中输入飞翔鸟硬件资讯站的网址:http://birds.east.net.cn/,按GO将任务添加到任务栏,再按Run,过半个小时,就可以将飞翔鸟网站的内容全部拉到你的硬盘上。
有的读者可能要问:如果我只想了解关于CPU的内容,难道非要我把整个网站全部下载回来吗?不错,离线浏览器虽然好,可毕竟会占用相当的网络资源。将想要的东西拉回来,将不想要的东西拒之门外,才能真正体现离线浏览器的优势,达到省时省钱的目的。别担心,WebZIP2.61想到了这一点,可以为您解决这一问题。

精确制导,决不浪费
任务建立对话框左边为用户设立了8个设置选项,依次是:开始地址设定,保存地址设定,文件类型设定,跟随连接设定,跟随连接高级设定,网址过滤设定,连接转换设定,预定时间设定,下面我们将对其一一解释。
首先要提出的是,在任务管理核心栏中,选择view菜单的profiles Editor项将得到一个更为直观的任务设置对话框,强力推荐大家熟练掌握WinZIP后使用该对话框。现在,我们首先进行了解。
前两项starting address和save to不用介绍,大家一定熟悉,不会告诉我你没装过游戏吧。不过须要指出的是,WebZIP提供了两种储存方式,一种是不进行压缩的内部虚拟网络存储,一种是网站压缩包存储。如果你的硬盘不是小得可怜,如果你并不打算将网站资料长期保存,建议你采取第一种方式。
第三项 Filetypes较为重要,你将选择在这次下载中所需要的文件类型,如果没有特殊要求,建议大家选择HTML和Images,而不要选择软件默认的ALL。如果你只需要文字,干脆Images都可以不选,这样可以大大地节省money。
第四项 Followed Li-nks是请你选择WebZIP下载网页内容时限定的最大层次,以及在网站和目录中要限制的连接。就我个人习惯而言,在这层次这一项中我不会做过多限制,必竟,我所需要的资料不一定都会在某一层之上。
下面两栏连接定位应该按软件默认设置,也就是定位于包含当前目录和当前地址的连接,否则天晓得会不会把全世界服务器的资料给你搜寻一遍!
第五栏Follwoed Links (Adv)的意思是是否让WebZIP强行分析脚本代码并跟随连接,鉴于WebZIP不能解释Javasc-ript或VBScr-ipt,这项我们一般不选,即不进行强行分析。
第六栏 VRL Filters可能是大家最感兴趣的一栏:网址按关键字设定,左边一栏是设定下载的连接必须包含某些关键字,点ADD(添加)出现菜单,依次询问是对哪种连接作限制,选项有所有连接、网页连接、源件连接,我个人一般选所有连接,注意可以添加多个单词或短语,但要用逗号分隔开。右边一栏则是要求下载的页面不能包含哪些内容,要求与左栏一样。现在我们单击ADD,为所有连接输入CPU,则只下载包含“CPU”三个字符的连接。
第七栏 Link Conversion连接变换,一般使用软件默认即可,这样可使你下载的资料在离线阅读时感觉与在线一样方便。
第八栏 Schedule 时间表请你指定该任务的开始运行时间。可选现在运行、指定时间运行和不进行时间安排,一般我们选第三项,不安排。
好了,全部设定完毕,现在按OK退出任务设定,一个任务就绪了。点击 Run就可以看到任务开始运行,飞翔鸟的CPU将飞到你的硬盘!主界面将以多种方式向你报告下载工作的进行状况,你可以按Connections 查看各连接的下载状况,一般WebZIP默认10个连接同时下载,你可以移动左边的滑标进行调整。右边的滑标是选择倾向于优先下载网页还是倾向于优先下载其它媒体文件。如果你觉得速度不令人满意,只需在任务栏中将叉改成箭头或单击Stop即可。不要觉得可惜,WebZIP支持“断点续传”,这次没下载完下次继续!

离线浏览
下载为的是离线浏览,下载完了吗?左键单击你想浏览的网站,你可以看到任务栏下的一排菜单有几个变成黑色,点击Browse(这个Browse与任务栏上方的Browse不同,前者浏览网页,后者浏览下载下来的文件目录),WebZIP首先将打包压缩的网站文件解压到一个临时目录,随后调节器用系统默认的浏览器进行浏览,也可以在主菜单中选择“Task-Browse-Offline”预定浏览器进行浏览。由于WinZIP内置浏览器与IE兼容,看起来的感觉和在线是完全一样的。可以慢慢欣赏而不用考虑money。
WebZIP2.61支持Skin功能,如果你愿意,可以自己设置界面,想不想试一试呢?在“View-option”下选择Select Skin 试一试,看看有什么情况发生吧。

离线浏览器WebZip2.01的使用

由于目前国内的Internet使用费用仍然比较昂贵,可怜的网虫们在浏览网页时总不
能尽兴,而要采取各种手段来尽量缩短使用时间以节省费用。无奈速度再快,看一个网
页总需要一定时间,更何况许多外文站点看起来费时更多。于是离线浏览越来越流行,
许多人使用cache浏览器, 它可以查看已经浏览过的网页, 但在上网时依然需要用
Navigator、Internet Explorer等浏览器一个网页接一个网页地“浏览”一遍,这时真
正是浏览, 根本不看内容,将网页传到cache中就行,这种方法速度仍然不够快,因为
一次只能传送一个网页。另有一种离线浏览器,将网页下载到硬盘中断线后慢慢看,比
起cache浏览器, 它可以同时下载多个网页,而且可以将网站原封不动地下载下来,如
果要做镜像站,就方便多了。离线浏览器中比较有特色的,是笔者要介绍的WebZIP2.01
(下简称WebZIP)。
WebZIP不仅可以将网站的全部或部分文件下载过来, 而且可以自动压缩成为zip文
件, 浏览时再自动解压到一个临时目录, 节省了硬盘空间。 比起经典的离线浏览器
Teleport,它内置与Internet Explorer兼容的浏览器,可以不需要浏览器就单独工作。
WebZIP的界面很花哨,而且支持Skin,如果你愿意,可以自己设置界面。必须老实
交待的是, WebZIP的使用和它的界面一样的烦琐, 我们一步步来吧。 界面感觉与
Outlook有点像, 左边的滚动条上有数个按钮,集中了所有的功能,按动不同的按钮,
界面也会随之改变。

下载任务综合管理
按动Tasks按钮,出现WebZIP的管理核心(见图1)。首先我们来建立一个下载任务
(Task),至少有六种方法:1.在File菜单中选择New命令中的Web Zip子命令;2.在
Tasks菜单中选择New命令; 3. 在Zip菜单中选择New命令中的Web Zip子命令; 4.在
Schedule Tasks栏处单击鼠标右键, 在弹出的快捷菜单中选择New命令;5.在Address
栏中输入网址,随后按Go按钮;6.按New Tasks按钮。无论使用哪种方法,都将出现图
2所示对话框。
新建任务采取 “向导” 的形式, 输入希望下载的网站网址, 如http: //www.
garfield.com(卡通形象“加菲猫”的官方网站),为任务取个名,按Next按钮;随后
是选择下载目录, 用默认的即可;接着是选择下载方法(Download Method),这很重
要,你可以选择是下载指定网站的全部文件还是只下载网站的文本和图片文件,亦或只
下载指定页、目录的文件,建议大家慎用下载网站全部文件,因为有的网站包含可以下
载的软件, 往往是数十M大小;最后选择是立即下载还是定时下载。至此一个任务建立
完毕。
建立完的任务会出现在Schedule Tasks栏中,用鼠标选定一个任务,可以看到上面
有数个按钮可用。 Run是立即开始下载,Stop是停止下载,Browse是离线浏览已下载内
容, Explore是查看下载的文件,Edit是对任务设置进行修改,Schedule是设置定时下
载,Delete自然是删除任务罗。

下载网站内容
选定任务按Run按钮, 亦或你设置了定时下载,到时WebZIP会自动下载。下载的时
候我们按滚动条上Connection按钮查看一下状况,如图3所示。
在中间一栏中可以看到当前建立的连接,默认是同时连接10个文件进行下载,可以
通过Connections滑标进行调整。 靠右的滑标是选择倾向于优先下载网页还是倾向于优
先下载其它文件资源。在最下方的状态栏中,显示了总共连接的时间(由于任务可以分
数次进行,这里显示的是总时间)、已经下载的文件量、下载速度等等。如果你感觉速
度不爽的话, 随时可以按有个叉的Stop键停止下载, 各位网友敬请放心,WebZIP支持
“断点续传”,这次没下载完下次继续努力!WebZIP在任务停止后会自动将下载的内容
打包成为一个zip文件。
离线浏览
下载为的是什么?为了离线浏览。下载完毕后,点滚动条上的Browse按钮,WebZIP
首先将打包压缩的网站文件解压到一个临时目录,随后调用系统默认的浏览器进行浏览,
也可以事先选定浏览器,方法是选择Task后在Tasks菜单中选择Browse命令中的Offline
子命令,会弹出个小菜单供你选择是用Navigator、Internet Explorer还是内置浏览器。
内置浏览器是与Internet Explorer兼容的,效果还不错,如图4所示。
浏览的感觉和在线浏览一模一样,并且可以慢慢地欣赏,碰到满屏的英文也不用急
了。 不过有几点还是要说一下,内置的浏览器是和Internet Explorer兼容的,这里就
有一个html文件兼容性的问题,有时用Navigator看是好好的,用Internet Explorer或
内置浏览器就有问题,相反的情况也可能出现,因此如果出现什么问题,先不要怀疑编
主页的人水平次,换个浏览器试试(不会有什么网虫只用一种浏览器吧)。另外还要十
分难过地告诉大家一个bug, 下载的网站最好是以前没有用浏览器上网看过的,其实就
是在浏览器的cache中不要存有这个网站的有关内容, 否则WebZIP下载过来的网页会与
cache中的内容混淆, 直接表现就是所有的链接指向不是硬盘中的内容而是Internet上
的内容。因此使用WebZIP之前先用cache浏览器清除cache中有关这个网站的内容,或者
干脆清空整个cache!如果已经出现这种悲剧事件,笔者会在后面教你怎么解决。
查看下载内容
对于下载过来的内容进行检查是必要的,因为这是我们修正WebZIP某些错误的唯一
机会。按滚动条上的Explore按钮,WebZIP列出所有下载的文件,如图5所示。
注意每个文件的前面都有一个标记(Mark),下载完毕的文件都是以勾号标记,后
面的Status栏是Parsed。如果下载过来的文件出错,就可以命令WebZIP下次重新下载它。
方法是用鼠标选择该文件, 单击鼠标右键,在弹出的菜单中选择Mark for update,这
时文件前的标记改变, 下次WebZIP会记着更新这个文件。如果因为WebZIP的bug使得下
载过来的网页无法离线浏览,就可以用这种办法补救。
编辑功能
WebZIP可以对下载过来的网页(html文件)进行编辑,按动滚动条上的Editor按钮,
就会出现一个html编辑器, 如果你自以为是高手,可以试着手工修改由于WebZIP的bug
造成的网页链接错误。
其它功能
按动滚动条上的Zip Properties按钮可以查看文件压缩情况,由于WebZIP的压缩与
解压工作都是自动完成, 而且不易出错,因此尽管提供了手工建立、修改zip文件的功
能,其实用处也不大。按动Quick Start会出现“日积月累”式的提示,不过全是英文。
好啦!就说这么多!其它的使用方法让网虫们自己摸吧。不过要说一声,下载网站
再离线浏览的方法不要多用(特别是以下载全部文件的方式),除非是你十分喜欢的网
站或是为做镜像站,根本原因是许多网站都太大了,像笔者,前后用了一个多小时还未
将“加菲猫”的官方站点下载完哩!真正要达到节省时间和金钱的目的,应该将普通浏
览器、cache浏览器和离线浏览器结合使用,方有效果

来源:http://www.lyinfo.net.cn/software/webzip.html