正则表达式w可以匹配汉字吗,python正则表达式中\w居然能匹配汉字,请问是怎么一回事???

2020-11-18 13:34:58 字数 2932 阅读 7353

1楼:匿名用户

\w可以匹配到汉字,其他语言的文字也行,包括但不限于英语,法语,俄语,日语==

python正则表达式中\w居然能匹配汉字,请问是怎么一回事???

2楼:匿名用户

\w匹配的是能组成单词的字符,在python3 中re默认支持的是unicode字符集,当然也支持汉字

如果要让\w仅支持英文,加个re.a标志

print(re.findall(r"\w",s,re.a))这样就不会匹配汉字了

易语言正则表达式问题。 为什么易语言正则表达式 [\w]+ 能匹配大多数汉字

3楼:深秋桔叶

[\w\w]+用这个

4楼:匿名用户

注意字母w的大小写,经测试asd阿桑地方成功。

5楼:匿名用户

这个就不知道了,我用正则工具测过,都可以匹配上的,可能是易语言的一个bug

你可以[\u4e00-\u9fa5]来匹配中文,换一种方式也许就行了

正则表达式中\w+ 和[\w]+ 有区别么?

6楼:檸蜜紅茶

你理解错了吧...

w前面加了反斜杠,是\w,与[a-za-z0-9_]等价也就是包含下划线以下的所有字母和数字

而后面的加号,则是匹配紧跟其前面那个字符的 一次或多次中括号表示匹配其中任意字符

所以,你说的[\w./]+就是一或多次匹配 任何数字,字母,下划线,斜杠,还有英文的句号(一个点)

所以,那个表达式可以匹配****forta.***p.s.正确来说,[\w./]+这个式子里的那个点,应该加个反斜杠

7楼:匿名用户

以我的理解,没有。

不, 内的字符可以以任意次序出现。

后有了+,内的字符可以取任意多个。于是内的字符可以以任意次序出现任意多次,直到遇到第一个非内的字符。

如[ab]+ 既可以匹配aaabbb又可以匹配bbbaaa babaaaba等,不是一定要a....b....的次序。

8楼:匿名用户

[\w./]+

是匹配\w 或 . 或 / 这三者之一的字符,也就是说在中括号里的点,不是任意字符的意思,就是匹配它自己,在中括号里,点可以不用加反斜杠

正则表达式:.和\w有区别吗 ?

9楼:匿名用户

\w匹配任意的非单词字符(包括字母、数字、下划线和汉字)。

.表示任意一个字符除了换行符

正则表达式 只能输入字母数字汉字

10楼:夜晚或白天

/^[a-za-z0-9\u4e00-\u9fa5]+$/

其实[a-za-z0-9]可以用\w来代替,只是\w还可以匹配一个下划线,如果必须要求只有数字和字母那还是用[a-za-z0-9]这个好了

11楼:匿名用户

[\u4e00-\u9fa5] //匹配中文字符^[1-9]\d*$ //匹配正整数^[a-za-z]+$ //匹配由26个英文字母组成的字符串^[a-z]+$ //匹配由26个英文字母的大写组成的字符串

^[a-z]+$ //匹配由26个英文字母的小写组成的字符串

^[a-za-z0-9]+$ //匹配由数字和26个英文字母组成的字符串

12楼:

[a-za-z0-9\u4e00-\u9fa5]

java正则表达式求解:\\d \\w \\w分别代表什么呢?

13楼:匿名用户

\w匹配字母或数字或下划线

或汉字,\d表示匹配数字

\w和\w的区别

\w :匹配包括下划线的任何单词字符,等价于 [a-z a-z 0-9_]

\w :匹配任何非单词字符,等价于 [^a-z a-z 0-9_]前面之所以加上了两个\因为是字符中使用第一个\代表转义哈

14楼:

\\d 代表匹配数字

\\w 代表匹配一个词

这类东西,在官方文档里有,你去看pattern的帮助文档就好了

15楼:匿名用户

\\d表示非数字

\\w表示非单词

\\w表示单词

正则表达式如何匹配汉字?

16楼:匿名用户

去掉 ^ 和 $ 试试 [\u4e00-\u9fa5]

\u数字,在perl、pcre中要改为:

[\x-\x]

17楼:匿名用户

按.***的标准,\w本来就是可以匹配:汉字,字母,数字,下划线。的所以一般\w可以满足需求了。

如果需要排除字母数字的话,可以这样:

(?![a-za-z0-9_])\w

>_>这样写估计效率不高

所以一般来说还是直接匹配指定的unicode码\unnnn unicode**中十六进制**为nnnn的字符汉字(字符) [\u4e00-\u9fa5]中文及全角标点符号(字符) [\u3000-\u301e\ufe10-\ufe19\ufe30-\ufe44\ufe50-\ufe6b\uff01-\uffee]

匹配带汉字用户名的正则表达式

18楼:匿名用户

var reg = /^[\u4e00-\u9fff\w]$/;

19楼:匿名用户

c#:^[a-za-z0-9_\u4e00-\u9fa5]$