想使用正则表达式来获取一段文本中的任意字符。于是很随意得就写出如下匹配规则:
(.*) 结果运行之后才发现,无法获得换行之后的文本。
查了一下手册,发现正则表达式中,. (点符号)匹配的是除了换行符\n 以外的所有字符。同时,手册上还有一句话:要匹配包括 '\n' 在内的任何字符,请使用像'[.\n]' 的模式。
于是将正则表达式的匹配规则修改如下: ([.\n]*) ,当然,如果程序中直接写到话,需要改为([.\\n]*) 结果再次运行程序,发现什么内容也取不到了。
又将其修改为如下规则: ([.|\n]*) 以及([\n.]*) 结果还是不行,什么内容都取不到。
但是查出了一个解决办法,经过一试,果然可以匹配包括换行符在内的任意字符,以下为正确的正则表达式匹配规则: ([\s\S]*) 同时,也可以用“([\d\D]*)” 、“([\w\W]*)” 来表示。
在文本文件里, 这个表达式可以匹配所有的英文:[ -~]
这个表达式可以匹配所有的非英文(比如中文): [^ -~]
|