东莞大快活:如何使用TxtEasy文本转换器

来源:百度文库 编辑:查人人中国名人网 时间:2024/04/29 10:25:59

http://www.mdjtj.gov.cn/tjxy/dnzs/wjk/syjs/tool/to110.htm
使用HTML2TXT这个软件(下载地址:[url]http://www.hanzify.org/?Go=Show::List&ID=6655)[/url],你可以批量转换htm或html文件为txt文件,并可以保持原来的格式基本不变。这样,你就不用再吃力地看一些在线阅读的网页了,把它们转换为txt文件后,下载到MP3播放机里,到哪儿都可以看,方便多了。这个软件是完全免费的,它不仅可以移除标记,并且可以重新定义文本格式以获取更可读的结果。

使用HTML2TXT软件后你可能会发现,有一部分网页(比如说论坛网页)的标记转换为文本文件后仍然没有被移除,怎么办呢?这里推荐一款软件Actual Search & Replace,它可以批量把这些没有移除的标记从文本文件中删除(汉化新世纪[url]http://www.hanzify.org[/url]有它的汉化版本下载)。
[/quote]
[quote]相信不少网友的机子里保存了大量从网上下载的HTML文件。由于编辑的要求,许多人需要将它们转换为TXT文本文件。可如果你直接把它们转换为TXT文件时,(如采用另存为),你会发现转换的TXT文件保留了HTML文件的特殊格式以及一些控制符,如果还要手工删除它们,那可真是麻烦。TxtEasy这个文本转换器可以轻松进行文本转换,而上述问题也不会出现了。它提供的其它小功能也十分实用。下面我们就来看看TxtEasy的使用方法吧:

(一)HTML文件转换为TXT文本文件

从文件类型中选择*.HTML,*.HTM,再指定要转换的HTML文件所在位置,单击“单个HTML文件转换为TXT文本”功能按钮,便可以进行转换。如果选择“批量HTML文件转换为TXT文本”这个功能按钮,则TxtEasy会自动转换选定文件夹下的所有HTML文件。如果在转换前选择了“转换时备份原始文件”,则在TxtEasy的/data/backup下对转换前的文件进行备份。

(二)智能分段

当将HTML文件转换为TXT文本文件后,你会发现某些文本文件显示时,字体之间会有空格,空行或硬回车,这也是由于HTML文件的原因。此时你只要选定这个文本文件,单击“单个GB文本文件智能分段”功能按钮即可,经过转换的文本文件便没有这些多余的空格了。同样“批量GB文本文件智能分段”功能按钮能实现对指定文件夹下所有文本文件进行智能分段。

(三)内码转换

这个功能对HTML文件,TXT文件都能采用。选定要转换内码的文件,再在TXT或HTML文件内码选择栏中选择当前文件内码是GB码还是Big5。之后根据实际情况选择Big5-->GB或GB-->Big5即可。同样,内码转换这个功能支持批量转换。

(四)拷贝功能:

当你需要将某个目录下的所有HTML文件或TXT文件拷贝到某个目录下,在9的操作窗口下利用批量拷贝功能即可实现。先在“设置路径下”选择拷贝的目的地。之后选定目标文件夹,再单击“批量拷贝”功能钮即可。

(五)文件合并

这是一个十分使用的功能,我们有时从网上下载的HTML文件,保存文件名有时是有顺序的。例如我们下载电子小说时,不同章节的HTML文件往往是shediao001.html,shediao002.html,一直到shediao0XX.html。当我们利用TxtEasy进行文本转换后,文件名称并没有发生变化,只是文件后缀变为了.txt。此时我们很希望将这些文件合并成为一个文件,这样就不必要看一章要打开一个文件了。使用时单击“合并文件”功能按钮,在弹出的设置窗口中的“文件名前缀字符”框中输入文件名中不带数字的那一部分,如前面的例子就输入shediao,而不要输入shediao001。输入后TxtEasy会自动搜索并在“起始序号”与“终止序号”显示包含shediao这个字符的文件名的文件中后缀的最小数字与最大数字。如果你想只合并其中几个文件,可手工修改这两个数字。最后输入你想合并后的文件名(不需扩展名), 并选择是否合并后删除原文件。点击 "合并文件" 按钮变完成了文件合并了。
TxtEasy是一个很实用的工具,你可以在[url]http://hotjava.yeah.net[/url]下载它。它是一个免费软件。