各工具在查找替换时可使用的正则表达式或通配符各有不同,可考虑使用的工具及特点有:
1 word,有丰富的查找替换选项;
2 notepad,可打开多个文档操作;
2 dreamweaver,较好支持正则表达式及多行查找操作;
4 python,使用正则表达式做查找替换时,功能强大;
如相同功能存在的一些细微区别:
<p>(\d*[.]{1}\d*)(\s.)(.*?)</p>
[.]{1} 是指匹配英文句点.。
.*? 是指匹配除任意换行符以外的任意多字符。
可以直接作用多行文本:
4 python
当然,较复杂或需要完成较多的较固定的查找替换时,可以写一个简单的小程序,编程语言对于字符串操作支持都是其最基本的功能,而较容易使用的编程语言就是python了。
import sysimport osimport rerInit = open('init.txt','rU',encoding='UTF-8')wTemp = open('temp.txt','w',encoding="UTF-8")nfn = str(rInit.readline()) # 第一行用作标题nfn =nfn.replace("<p>","")nfn =nfn.replace("</p>","")s = rInit.read() # 整个文本文件作为一个字符串返回s = s.replace(' ','') # 处理全角空格s = s.replace("<<","<<")s = s.replace("#include <","#include <")s = s.replace("#include<","#include<")#s = s.replace(">",">")s = s.replace(',?' , ',”')s = s.replace('.?' , '.”')s = s.replace('\n\r' , '\n')s = s.replace('\r\n' , '\n')s = s.replace(' ' , '\n\n')s = re.sub(r'</div><div class="\w\d*">', '<p></p>', s)rejiu =re.compile(r'<\S{,8}九\S{,22}</\S{,5}>') s = rejiu.sub("", s)wTemp.write(nfn) # 标题写回wTemp.write("\n")wTemp.write(s)rInit.close()wTemp.close()-End-
