专注前端,专注网页设计分享 - (网页制作/模板制作/设计)755150799 织梦模板 | 网页特效 | 网站模板 | 建站教程 | Tag标签 | 联系站长

Notepad++ 使用正则表达式

时间:2019-08-31 10:24:00来源:学技巧网站制作 作者:学技巧网页制作 阅读:0次 【 点评一下

最近在写论文,使用notepad++处理一些文本数据,想要匹配一些特定的汉字,但是人工去看太麻烦了,于是想到了用正则表达式。
 
notepad++中正则表达式的语法如下:
 
\ 转义字符 如:要使用 “\” 本身, 则应该使用“\”
 
\t Tab制表符 注:扩展和正则表达式都支持
 
\r 回车符CR 注:扩展支持,正则表达式不支持
 
\n 换行符LF 注:扩展支持,正则表达式不支持
 
. 匹配任意字符
 
^ 其右边的表达式被匹配在行首。如:^A匹配以“A”开头的行
 
其左边的表达式被匹配在行尾。如:e其左边的表达式被匹配在行尾。如:e匹配以“e”结尾的行
 
| 或运算符,匹配表达式左边和右边的字符串。如:ab|bc匹配“ab”或“bc”
 
[] 匹配列表中任意单个字符。如:[ab]匹配“a”或“b”;[0-9]匹配任意单个数字
 
[^] 匹配列表之外的任意单个字符。如:[^ab]匹配“a”和“b”以外的单个字符;[^0-9]匹配任意单个非数字字符
 
其左边的字符被匹配任意次(0次或多次)。如:be*匹配“b”,“be”或“bee”
 
其左边的字符被匹配至少一次(1次或多次)。如:be+匹配“be”或“bee”,但不匹配“b”
 
? 其左边的字符被匹配0次或者1次。如:be?匹配“b”或“be”,但不匹配“bee”
 
() 影响表达式匹配的顺序(类似C++的小括号会影响表达式运算顺序),并且用作表达式的分组标记(标记从1开始)注:看下文的示例
 
\d 匹配一个数字字符。等价于:[0-9]
 
\D \d取反,匹配一个非数字字符。等价于:[^0-9]
 
\s 匹配任意单个空白字符:包括空格、制表符等(注:不包括换车符和换行符)。等价于:[ \t]
 
\S \s取反的任意单个字符。
 
\w 匹配包括下划线的任意单个字符。等价于:[A-Za-z0-9_]
 
\W \w取反的任意单个字符。等价于:[^A-Za-z0-9_]
 
跟JavaScript中的一样。
 
今天我想要得到的是,某两个词在同一行出现的频次,比如 “世界”和“和平”在1000行文本中共同出现的频次,做法如下: 
ctrl+F,打开如下界面: 
选中 正则表达式,然后写匹配字符串就可以了 
要匹配 世界和平则 匹配字符串如下: 
世界[\x{4e00}-\x{9fa5} ]*和平
 
这样,世界和平,世界是和平的,世界真的是和平的,就都能匹配出来了

  • 用微信  “扫一扫”

    将文章分享到朋友圈。

    关注公众号:xue-jiqiao

本文版权归原作者所有,转载请注明原文来源出处,学技巧网站制作感谢您的支持!